Standardavvikelse

Mått på hur mycket observationerna i ett material i genomsnitt avviker från medelvärdet.

Standardavvikelse är ett spridningsmått som beskriver den genomsnittliga avvikelsen från medelvärdet för en samling observationer. En låg standardavvikelse innebär att de flesta observationer ligger förhållandevis nära medelvärdet, medan en hög standardavvikelse innebär det motsatta: att observationerna i genomsnitt befinner sig relativt långt ifrån medelvärdet. Det kan även uttryckas som att spridningen kring medelvärdet är liten respektive stor.

Beräkning av standardavvikelse

Det finns två olika tillvägagångssätt för att beräkna standardavvikelse. Vilket tillvägagångssätt du ska använda beror på vilken typ av data du har. Beräkning av standardavvikelse i en population sker enligt en formel, och uppskattning av densamma med hjälp av stickprov sker enligt en annan formel. Skillnaden beräkningarna emellan är förvisso inte speciellt stor, men har visat sig ha betydelse. Om du vill beräkna standardavvikelsen för ditt datamaterial ska du således först avgöra i vilken av följande två situationer du befinner dig:

  1. Du har tillgång till data för hela populationen, och vill med hjälp av dessa data beräkna standardavvikelsen.
  2. Du har tillgång till ett stickprov som är slumpmässigt draget ur en population, och vill med hjälp av detta uppskatta standardavvikelsen i den population som stickprovet är draget.

Beräkning av standardavvikelse i en population

Standardavvikelsen i en population beräknas genom att först beräkna differensen mellan samtliga mätvärden och medelvärdet. Kvadrera sedan var och en av differenserna och summera ihop dem. Dividera med antalet observationer och beräkna slutligen kvadratroten av kvoten. Standardavvikelsen, som i en population brukar betecknas med den grekiska bokstaven sigma (\sigma), beräknas således enligt:

\sigma =  \sqrt{ \frac{ \sum (x_i - \mu )^2 }{N} }

Låt oss exemplifiera. Tio skolelever skriver ett prov och antalet poäng fördelar sig enligt { 8, 10, 16, 12, 14, 10, 9, 11, 9, 11 }. För att beräkna standardavvikelsen måste vi först beräkna medelvärdet, eftersom det ingår som en del av formeln ovan.

\mu = \frac{8 + 10 + 16 + 12 + 14 + 10 + 9 + 11 9 + 11}{10} = 11

Medelvärdet är 11 poäng. Nästa steg är att beräkna differensen mellan medelvärdet och var och ett av mätvärdena. Dessa differenser ska sedan kvadreras för att slutligen summeras. Dessa steg utförs med fördel med hjälp av en tabell.

x\mux - \mu(x - \mu)^2
811-39
1011-11
1611525
121111
141139
1011-11
911-24
111100
911-24
111100
Summa054

Summan av de kvadrerade differenserna är 54. Notera också att summan av de okvadrerade differenserna alltid är 0. Nu när vi känner till summan av de kvadrerade differenserna behöver vi bara dividera med antalet observationer, och sedan beräkna kvadratroten av detta värde. Anledningen till att vi avslutar med att beräkna kvadratroten är för att standardavvikelsen observationerna ska få samma enhet.

\sigma = \sqrt{ \frac{54}{10} } = \sqrt{5,4}  \approx 2,32

Uppskattning av standardavvikelse med hjälp av stickprov

Tyvärr har man sällan tillgång till data för en hel population. Men med hjälp av inferentiell statistik är det dock möjligt att uppskatta en parameter i en population, utan att behöva ha tillgång till samtliga enheter i populationen. Detta är möjligt genom att dra ett slumpmässigt stickprov ur populationen och utföra beräkningar på stickprovet istället. När det kommer till standardavvikelse så skiljer sig som sagt beräkningarna något åt, beroende på om de sker med populations- eller stickprovsdata. Den tyska matematikern Friedrich Bessel har nämligen visat att det ger en bättre uppskattning av populationens standardavvikelse om summan av de kvadrerade differenserna i stickprovet divideras med n -1 istället för n. Standardavvikelsen i ett stickprov, som brukar beteckna som s, beräknas således enligt:

\sigma =  \sqrt{ \frac{ \sum (x_i - \bar{x} )^2 }{n - 1} }

    Hänvisa hit

    Frisk, Emil. 2018. Statistisk ordbok. Hämtat från https://www.statistiskordbok.se/ord/standardavvikelse/ den 2019-09-12.

    Senast uppdaterad 8 september, 2018