Normalfördelning

En vanlig och mycket central sannolikhetsfördelning inom statistiken, där de flesta värdena återfinns kring medelvärdet.

Normalfördelning är en viktig sannolikhetsfördelning inom många centrala delar av statistiken. Fördelningen kännetecknas av att de flesta observationer ligger kring medelvärdet och att antalet observationer minskar med ökat avstånd från medelvärdet. Kort och gott: många observationer är samlade kring medelvärdet, få observationer är belägna långt ifrån medelvärdet och knappt några observationer hittas väldigt långt ifrån medelvärdet.

Viktigt att poängtera är att normalfördelningen är en teoretisk modell, som i sin renaste form i regel aldrig erhålls vid riktiga mätningar. Däremot tycks många mätbara fenomen i naturen och samhället fördela sig enligt en approximativ normalfördelning, det vill säga att fördelningen är nära normal. Om du till exempel går ut och mäter alla äppelträd du ser, så kommer mätvärdena troligen fördela sig enligt en ungefärlig normalfördelning. Detsamma gäller exempelvis vikten på nyfödda barn och vuxna personers skostorlek. Det vill säga: de flesta vuxna personer har en skostorlek som ligger nära medelvärdet, medan väldigt få personer har en storlek som ligger långt ifrån medelvärdet.

Normalfördelningens egenskaper

Om ett material är normalfördelat så medför det vissa matematiska egenskaper som är mycket användbara i statistiska sammanhang. Det första vi kan konstatera om vi tittar på den normalfördelade kurvan i Figur 1 är att den är klockformad, varför den ibland också kallas för klockkurva. Att fördelningen är klockformad innebär att de flesta observationer finns samlade kring materialets medelvärde, och att antalet observationer gradvis minskar ju längre ifrån medelvärdet vi förflyttar oss. En annan viktig egenskap hos normalfördelningen är dess symmetri. Att normalfördelningen är symmetrisk kan vi se i Figur 1 nedan, genom att notera att den vänstra sidan av figuren är en spegelbild av den högra sidan. Symmetri innebär således att kurvan beter sig på samma sätt på båda sidorna av medelvärdet. Eftersom en symmetrisk fördelning förutsätter att medelvärdet är i centrum, kan vi konstatera att medelvärdet och medianen har samma värde i ett normalfördelat material.

 

Normalfördelning
Figur 1. En normalfördelad kurva.

Som sagt är de flesta observationer samlade kring medelvärdet i ett normalfördelat material, och få observationer går att hitta långt ifrån medelvärdet. En användbar egenskap som normalfördelningen bär på är att vi kan beräkna hur stor andel av alla observationer som finns inom ett visst antal standardavvikelser från medelvärdet. Vi vet till exempel att 34,13 % av alla observationer finns samlade mellan medelvärdet (μ) och en standardavvikelse över medelvärdet (μ + σ). Eftersom fördelningen är symmetrisk finns en lika stor andel av värdena mellan μ och μ – σ. Vi kan således säga att ungefär 68,26 % av alla observationer i en normalfördelning finns samlade inom en standardavvikelse från medelvärdet, 34,13 % åt vardera riktning. På samma sätt ryms cirka 95,44 % av observationerna inom två standardavvikelser från medelvärdet, och 99,72 % inom tre standardavvikelser.

    Hänvisa hit

    Frisk, Emil. 2019. Statistisk ordbok. Hämtat från https://www.statistiskordbok.se/ord/normalfordelning/ den 2019-09-13.

    Senast uppdaterad 24 mars, 2019