Uppslagsord

Dummyvariabel

En dummyvariabel är en variabel som indikerar från- eller närvaro av en viss egenskap. En dummyvariabel kan bara anta värdena 0 och 1, där 0 indikerar frånvaro av egenskapen och 1 indikerar närvaro av densamma. Värdena 0/1 kan ses som nej/ja eller av/på. I tabellen nedan visas några exempel på dummyvariabler. Undersökta enheter Variabel Möjliga […]

Extremvärde

Ett extremvärde (engelska: outlier) är ett värde som ligger långt ifrån övriga värden. Extremvärden kan förekomma i ett stickprov till följd av slumpfaktorer, men kan också vara ett tecken på felinmatning. Det är svårt att säga exakt vad som är att betrakta som ett extremvärde, då det inte finns någon matematisk definition. En vanlig metod är att […]

Klassisk sannolikhetsdefinition

Den klassiska sannolikhetsdefinitionen säger att sannolikheten för en händelse är lika med kvoten mellan antalet gynnsamma utfall och antalet möjliga utfall. Sannolikheten för händelsen E kan således betecknas:     Den klassiska sannolikhetsdefinitionen gäller bara om utfallen är fördelade enligt en likformig sannolikhetsfördelning, det vill säga att sannolikheten är lika stor för samtliga utfall.

Korrelation

Korrelation är inom statistiken en term som används för att beskriva sambandet mellan två variabler. Vid en korrelationsanalys undersöker vi alltså om två variabler samvarierar – alltså om ett visst läge på den ena variabeln förknippas med ett visst läge på den andra variabeln. Ett exempel på en korrelation är en persons vikt och längd. […]

Lägesmått

Ett lägesmått är en uppskattning av ett typiskt värde i ett datamaterial. Det finns flera olika lägesmått, varav de vanligaste är medelvärde, median och typvärde. De olika lägesmåtten passar bra att använda i olika situationer. Bland annat är det viktigt att känna till variabelns fördelning och vilken skalnivå variabeln är mätt på för att avgöra vilket […]

Medelvärde

Ett medelvärde används för att beskriva ett genomsnittligt värde i en dataserie. Medelvärdet, eller mer korrekt det aritmetiska medelvärdet, beräknas genom att summera alla värden i serien, för att sedan dividera summan med antalet observationer. Matematiskt definieras medelvärdet som: Vilket kan utläsas som ”medelvärdet () är lika med summan av värdena x1–xn, dividerat med antalet […]

Median

Median är ett lägesmått som erhålls genom att rangordna en serie data i storleksordning och sedan ta det värde som är i mitten. Om datamaterialet innehåller ett jämnt antal värden så finns det inget värde som är precis i mitten. Då beräknas medelvärdet av de två mittersta värdena. Tänk att vi samlar in data om hur ett […]

Parameter

En parameter är en storhet som representerar en egenskap i en population. Eftersom parametrar sällan är kända, används ofta stickprov för att uppskatta dem. Vanliga parametrar är standardavvikelse (betecknas med den gemena grekiska bokstaven sigma, σ) och medelvärde (betecknas med gemena my, μ).

Pivottabell

En pivottabell (även pivåtabell, engelska: pivot table) är en tabell som används för att sammanställa och presentera numerisk data. Medan en traditionell tabell har en fast uppsättning med kolumner och rader, kan en pivottabell växla mellan hur data ska grupperas. Funktionen är inbyggd i många kalkylprogram och databashanterare. Det är vanligt att använda en pivottabell […]