Föreläsning 5: Att generalisera

Introduktion
Föreläsning 5: Att generalisera
Olika sorters
generalisering
Statistisk
inferens
Pär Nyman
[email protected]
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
4 september 2015
-1-
Generaliseringar
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
Generalisering innebär att vi drar slutsatser om någonting
annat än det vi har studerat.
Vi använder djurförsök som en indikation på hur samma
preparat fungerar på människor.
En opinionsundersökning avslöjar – med viss felmarginal –
den svenska befolkningens åsikter.
En tillämpning
Avslutning
Vi kan utgå från all tidigare forskning för att på förhand
beräkna effekten av en planerad reform.
-2-
Generaliseringar
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Varför är generaliseringar viktigt?
Påstående: Vi bör huvudsakligen intressera oss för
generella teorier och stora populationer.
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
-3-
Generaliseringar
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Varför är generaliseringar viktigt?
Påstående: Vi bör huvudsakligen intressera oss för
generella teorier och stora populationer.
Eftersom vi sällan kan genomföra en totalundersökning –
och aldrig direkt studera abstrakta fenomen eller teorier –
måste vi generalisera.
-3-
Generaliseringar
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
”Varje situation är unik”
Sant i en trivial mening: två situationer är aldrig identiska.
Det kan ändå finnas mycket som förenar.
Konfidensintervall
Räkneexempel
Slutsats 1: Generalisering är aldrig något binärt.
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Slutsats 2: Ju godare förutsättningar att generalisera,
desto bättre.
Slutsats 3: Utforma teorier så att de kan appliceras på
många fall.
-4-
Generaliseringar
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Exempel: Hur ska vi förklara valresultat?
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
Fokusera på det som särskiljer valen? Säldöd,
valstugereportage, Lars Leijonborg-effekten, etc.
Mitt bud: fokusera på mer allmängiltiga förklaringar.
En tillämpning
Avslutning
-5-
Generaliseringar
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Procent av rösterna för sittande present
Hibbs (2000) samband mellan valresultat och
inkomstutveckling
65
1972 1964
1984
1956
60
55
50
45
1996
1960
1976
1992
1980
1988
1968
1952
40
−1
0
1
2
3
4
Genomsnittlig förändring i disponibel inkomst (procent)
-6-
Generaliseringar
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Procent av rösterna för sittande present
Hibbs (2000) samband mellan valresultat och
inkomstutveckling
65
1972 1964
1984
1956
60
55
50
45
1996
1960
1976
1992
1980
1988
1968
1952
40
−1
0
1
2
3
4
Genomsnittlig förändring i disponibel inkomst (procent)
-6-
Generaliseringar
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Procent av rösterna för sittande present
Hibbs (2000) samband mellan valresultat och
inkomstutveckling
65
1972 1964
1984
1956
60
55
50
45
1996
1960
1976
1992
1980
1988
1968
Vietnam
1952
Korea
40
−1
0
1
2
3
4
Genomsnittlig förändring i disponibel inkomst (procent)
-6-
Generaliseringar
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Hibbs slutsats: Stödet för presidenten beror nästan enbart
på inkomstutvecklingen och antalet amerikanska soldater
som dött i krig.
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Verkligheten är så komplex att såhär starka och
allmängiltiga samband är mycket ovanliga.
Exemplet visar att vi inte bör avfärda generalisering på
förhand utan tvärtom anstränga oss för att förbättra
möjligheterna till generalisering.
-7-
Disposition för eftermiddagen
Introduktion
Olika sorters
generalisering
Statistisk
inferens
1
Introduktion
2
Olika sorters generalisering
3
Statistisk inferens
4
Strategiska urval
5
Avslutning
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
-8-
Generaliseringar
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Vi generaliserar i två dimensioner
Till en högre abstraktionsnivå. T&S kallar detta för
teoretisk generalisering.
Till andra situationer. T&S kallar detta för empirisk
generalisering.
I regel ägnar vi oss åt båda typerna av generalisering, även
om vi sällan uttrycker oss i termer av teoretisk och
empirisk generalisering.
-9-
Generaliseringar
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Teoretisk generalisering
Vi generaliserar från det vi observerat tillbaka till de
teoretiska begreppen.
Liknas ibland vid att ersätta egennamnen med mer
abstrakta begrepp.
Uttrycks ofta med frågan ”vad är det här ett fall av?”.
Styrkan i den teoretiska generaliseringen beror på
validiteten i operationaliseringen.
- 10 -
Generaliseringar
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
Teoretisk generalisering
Anta att vi studerat den ekonomiska krisen och funnit att
inställningen till både en höjning av den kommunala
inkomstskatten och ersättningsgraden i
arbetslöshetsförsäkringen har blivit mer positiv i de
kommuner där arbetslösheten steg mest.
En tillämpning
Avslutning
En teoretisk generalisering är att upplevd risk innebär ett
ökat stöd för ekonomisk omfördelning.
- 11 -
Generaliseringar
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Empirisk generalisering innebär att dra slutsatser om
andra situationer än de vi studerat.
Från urval till population: SCB intervjuar några tusen
svenskar för att beräkna arbetslösheten i hela landet.
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Från fall till fall: Eftersom en dörrknackningskampanj
ökade antalet Hollanderöster i presidentvalet 2012
fungerar dörrknackning i ett svenskt riksdagsval.
Från ”population” till ”urval”: Eftersom man minns
bättre när man antecknar för hand gäller det även dig.
- 12 -
Generaliseringar
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Det vi vill uttala oss om skiljer sig ofta med avseende på
Variabler (val av utfall, definition, källa)
Räkneexempel
Superpopulationer
Strategiska
urval
Analysenheter (exempelvis andra personer)
Kontext (tid, plats och sammanhang)
En tillämpning
Avslutning
- 13 -
Generaliseringar
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Flera faktorer påverkar förutsättningarna
I vilka avseenden skiljer sig din studie från den population
du vill uttala dig om eller fallet du jämför med?
Räkneexempel
Superpopulationer
Strategiska
urval
Hur bör dessa skillnader påverka resultaten?
Hur stora skillnader kan det orsaka?
En tillämpning
Avslutning
I vilken riktning förväntar vi oss dessa skillnader?
- 14 -
Generaliseringar
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Fundera på generalisering tidigt
Vanligt att dessa resonemang kommer först i slutsatserna.
Bättre att motivera tidigt, både i uppsatsen och
forskningsprocessen:
• Vad är det för fenomen eller population du är intresserad
av? Vad är fallet ett ”fall av”?
• Varför bör vi då studera just ditt fall/urval?
• Kommer studien erbjuda tillräckliga förutsättningar för
generalisering?
- 15 -
Generaliseringar
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Summering: Olika sorters generalisering
Teoretisk generalisering
Empirisk generalisering
• Från urval till population
I Statistisk inferens
I Strategiska fall
• Från fall till fall
• Från ”population” till ”urval”
- 16 -
Generaliseringar
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Summering: Olika sorters generalisering
Teoretisk generalisering
Empirisk generalisering
• Från urval till population
I Statistisk inferens
I Strategiska fall
• Från fall till fall
• Från ”population” till ”urval”
- 16 -
Från urval till population
Urval
Introduktion
Olika sorters
generalisering
Slutsats
Statistisk
inferens
Population
Normalfördelningen
Konfidensintervall
Generalisering
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
1
Först fastställer vi den population vi är intresserade av.
2
Därefter väljer vi fall som maximerar möjligheten till
generalisering.
3
När vi dragit slutsatser om urvalet försöker vi generalisera
dessa.
- 17 -
Statistisk inferens
Introduktion
Olika sorters
generalisering
Statistisk
inferens
När vi använder statistiska metoder för att dra slutsatser
om en större population än den vi har studerat kallas det
för statistisk inferens.
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 18 -
Statistisk inferens
Introduktion
Olika sorters
generalisering
Statistisk
inferens
När vi använder statistiska metoder för att dra slutsatser
om en större population än den vi har studerat kallas det
för statistisk inferens.
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Om urvalet är slumpmässigt och alla analysenheter i
populationen har samma sannolikhet för att inkluderas i
urvalet så kommer våra urval i genomsnitt att återspegla
populationen. Vår enda felkälla är slumpen.
Avslutning
- 18 -
Statistisk inferens
Introduktion
Olika sorters
generalisering
Statistisk
inferens
När vi använder statistiska metoder för att dra slutsatser
om en större population än den vi har studerat kallas det
för statistisk inferens.
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Om urvalet är slumpmässigt och alla analysenheter i
populationen har samma sannolikhet för att inkluderas i
urvalet så kommer våra urval i genomsnitt att återspegla
populationen. Vår enda felkälla är slumpen.
Samma tekniker kan användas när vi har andra typer av
urval, men då tillkommer andra felkällor.
- 18 -
Statistisk inferens
Introduktion
Olika sorters
generalisering
Statistisk
inferens
När vi studerar ett urval från en population kan vi enkelt
beräkna medelvärden och proportioner i urvalet. Dessa
värden kallas punktestimat och är ofta vår bästa gissning
om populationens egenskaper.
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 19 -
Statistisk inferens
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
När vi studerar ett urval från en population kan vi enkelt
beräkna medelvärden och proportioner i urvalet. Dessa
värden kallas punktestimat och är ofta vår bästa gissning
om populationens egenskaper.
Det finns alltid en viss osäkerhet när vi utifrån ett urval vill
generalisera till en hel population. Ett sätt att hantera den
osäkerheten är med hjälp av så kallade konfidensintervall.
En tillämpning
Avslutning
- 19 -
Statistisk inferens
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
När vi studerar ett urval från en population kan vi enkelt
beräkna medelvärden och proportioner i urvalet. Dessa
värden kallas punktestimat och är ofta vår bästa gissning
om populationens egenskaper.
Det finns alltid en viss osäkerhet när vi utifrån ett urval vill
generalisera till en hel population. Ett sätt att hantera den
osäkerheten är med hjälp av så kallade konfidensintervall.
Innan vi kommer till att beräkna och tolka
konfidensintervall vill jag introducera normalfördelningen.
- 19 -
Statistisk inferens
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
När vi studerar ett urval från en population kan vi enkelt
beräkna medelvärden och proportioner i urvalet. Dessa
värden kallas punktestimat och är ofta vår bästa gissning
om populationens egenskaper.
Det finns alltid en viss osäkerhet när vi utifrån ett urval vill
generalisera till en hel population. Ett sätt att hantera den
osäkerheten är med hjälp av så kallade konfidensintervall.
Innan vi kommer till att beräkna och tolka
konfidensintervall vill jag introducera normalfördelningen.
Det jag säger om normalfördelningen examineras inte på
kursen, men det är en viktig bakgrund för att bättre förstå
konfidensintervall.
- 19 -
Normalfördelningen
Introduktion
Vi kan i regel anta att medelvärdet i alla möjliga urval
följer en normalfördelning (eller t-fördelning).
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 20 -
Normalfördelningen
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Vi kan i regel anta att medelvärdet i alla möjliga urval
följer en normalfördelning (eller t-fördelning).
Det innebär bland annat att sannolikheten för ett
punktestimat nära populationens medelvärde är högre än
sannolikheten för ett kraftigt avvikande punktestimat.
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 20 -
Normalfördelningen
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Vi kan i regel anta att medelvärdet i alla möjliga urval
följer en normalfördelning (eller t-fördelning).
Det innebär bland annat att sannolikheten för ett
punktestimat nära populationens medelvärde är högre än
sannolikheten för ett kraftigt avvikande punktestimat.
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Jag kommer inte härleda detta antagande, men illustrera
det med ett exempel.
Strategiska
urval
En tillämpning
Avslutning
- 20 -
Normalfördelningen
Introduktion
Olika sorters
generalisering
Anta att vi undersöker en population där hälften röstar
på något av de rödgröna partierna och hälften röstar på
ett annat parti.
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 21 -
Normalfördelningen
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Anta att vi undersöker en population där hälften röstar
n=1
på något av de rödgröna partierna
och hälften röstar på
ett annat parti.
Om vi drar ett urval där n = 1 kommer punktestimatet
av andelen rödgröna vara antingen 0 eller 100 procent.
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
0
50
Andel rödgröna i urvalet
- 21 -
100
Normalfördelningen
n=2
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
0
50
Andel rödgröna i urvalet
- 21 -
100
Normalfördelningen
n=10
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
0
50
Andel rödgröna i urvalet
- 21 -
100
Normalfördelningen
n=25
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
0
50
Andel rödgröna i urvalet
- 21 -
100
Normalfördelningen
n=25
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
0
50
Andel rödgröna i urvalet
- 21 -
100
Normalfördelningen
n=50
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
0
50
Andel rödgröna i urvalet
- 21 -
100
Normalfördelningen
n=100
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
0
50
Andel rödgröna i urvalet
- 21 -
100
Normalfördelningen
n=100
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
0
50
Andel rödgröna i urvalet
- 21 -
100
Normalfördelningen
Medelvärde: 50.
Standardavvikelse: 5.
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Medelvärde: 50.
Standardavvikelse: 10.
Avslutning
0
50
Andel rödgröna i urvalet
- 21 -
100
Normalfördelningen
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
-3
-2
-1
0
1
2
3
Antal standardavvikelser från medelvärdet
- 21 -
Normalfördelningen
Introduktion
90 procent av urvalen har ett punktestimat inom 1.65
standardavvikelser från populationsvärdet.
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
-3
-2
-1
0
1
2
3
Antal standardavvikelser från medelvärdet
- 21 -
Normalfördelningen
Introduktion
Olika sorters
generalisering
90 procent av urvalen har ett punktestimat inom 1.65
standardavvikelser från populationsvärdet.
95 procent av urvalen har ett punktestimat inom 1.96
standardavvikelser från populationsvärdet.
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
-3
-2
-1
0
1
2
3
Antal standardavvikelser från medelvärdet
- 21 -
Normalfördelningen
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
90 procent av urvalen har ett punktestimat inom 1.65
standardavvikelser från populationsvärdet.
95 procent av urvalen har ett punktestimat inom 1.96
standardavvikelser från populationsvärdet.
99 procent av urvalen har ett punktestimat inom 2.58
standardavvikelser från populationsvärdet.
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
-3
-2
-1
0
1
2
3
Antal standardavvikelser från medelvärdet
- 21 -
Normalfördelningen
Introduktion
Olika sorters
generalisering
Eftersom populationens medelvärde i regel är okänt vet vi
inte om punktestimatet i vårt urval ligger nära eller långt
ifrån populationens medelvärde.
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
-3
-2
-1
0
1
2
3
Antal standardavvikelser från medelvärdet
- 21 -
Normalfördelningen
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Eftersom populationens medelvärde i regel är okänt vet vi
inte om punktestimatet i vårt urval ligger nära eller långt
ifrån populationens medelvärde.
Men om vi beräknar en felmarginal runt punktestimatet
på 1.65 standardavvikelser vet vi att för 90 procent av
urvalen kommer populationsmedelvärdet befinna sig inom
detta intervall.
Strategiska
urval
En tillämpning
Avslutning
-3
-2
-1
0
1
2
3
Antal standardavvikelser från medelvärdet
- 21 -
Normalfördelningen
Introduktion
Olika sorters
generalisering
Statistisk
inferens
1.65, 1.96 och 2.58 kallas för kritiska värden och vi
kommer snart att återkomma till dem. I vår notation
kallas de zkv .
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 22 -
Normalfördelningen
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
1.65, 1.96 och 2.58 kallas för kritiska värden och vi
kommer snart att återkomma till dem. I vår notation
kallas de zkv .
Students t-fördelning påminner om normalfördelningen.
Vid stora urval har de båda fördelningarna samma kritiska
värden, men vid små urval är värdena något större för
t-fördelningen. Vi benämnar dessa värden tkv .
En tillämpning
Avslutning
- 22 -
Normalfördelningen
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
1.65, 1.96 och 2.58 kallas för kritiska värden och vi
kommer snart att återkomma till dem. I vår notation
kallas de zkv .
Students t-fördelning påminner om normalfördelningen.
Vid stora urval har de båda fördelningarna samma kritiska
värden, men vid små urval är värdena något större för
t-fördelningen. Vi benämnar dessa värden tkv .
På kursen används normalfördelningen när vi beräknar
konfidensintervall runt en proportion och t-fördelningen
när vi beräknar konfidensintervall runt ett medelvärde eller
runt en regressionskoefficient.
- 22 -
Konfidensintervall
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
När vi studerar ett urval från en population kan vi enkelt
beräkna medelvärden och proportioner i urvalet. Dessa
värden kallas punktestimat och är ofta vår bästa gissning
om populationens egenskaper.
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 23 -
Konfidensintervall
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
När vi studerar ett urval från en population kan vi enkelt
beräkna medelvärden och proportioner i urvalet. Dessa
värden kallas punktestimat och är ofta vår bästa gissning
om populationens egenskaper.
Det kan tyckas vanskligt, men sådana punktestimat
används hela tiden för att beskriva populationen!
En tillämpning
Avslutning
- 23 -
Konfidensintervall
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
När vi studerar ett urval från en population kan vi enkelt
beräkna medelvärden och proportioner i urvalet. Dessa
värden kallas punktestimat och är ofta vår bästa gissning
om populationens egenskaper.
Det kan tyckas vanskligt, men sådana punktestimat
används hela tiden för att beskriva populationen!
Man bör i så fall ange ett intervall i vilket vi är ganska
säkra på att medelvärdet eller proportionen i populationen
befinner sig. Det kallas konfidensintervall eller
intervallestimat.
- 23 -
Konfidensintervall
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Vi sätter en säkerhetsnivå, oftast 95 procent men även 90
och 99 procent är vanligt.
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 24 -
Konfidensintervall
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Vi sätter en säkerhetsnivå, oftast 95 procent men även 90
och 99 procent är vanligt.
Med detta menar vi att om vi drog ett oändligt antal urval
från populationen, skulle 95 procent av urvalen täcka in
populationens medelvärde eller proportion.
Strategiska
urval
En tillämpning
Avslutning
- 24 -
Konfidensintervall
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Vi sätter en säkerhetsnivå, oftast 95 procent men även 90
och 99 procent är vanligt.
Med detta menar vi att om vi drog ett oändligt antal urval
från populationen, skulle 95 procent av urvalen täcka in
populationens medelvärde eller proportion.
Inte samma sak som att sannolikheten för att
populationsvärdet ligger i intervallet är 95 procent. I
stället för ”med 95 procents sannolikhet...” säger vi ”vid
95 procents säkerhetsnivå...”.
- 24 -
Konfidensintervall
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Konfidensintervall utgörs av ett punktestimat omgivet av
en felmarginal åt varje håll.
Dessa felmarginaler beräknas som ett kritiskt värde –
vilket beror på vår säkerhetsnivå – multiplicerat med en
uppskattning av standardavvikelsen i populationen av
urval.
- 25 -
Konfidensintervall
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Konfidensintervall runt ett medelvärde
s
x̄ ± tkv × √
n
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 26 -
(1)
Konfidensintervall
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Konfidensintervall runt ett medelvärde
s
x̄ ± tkv × √
n
Normalfördelningen
Konfidensintervall
Räkneexempel
Urvalets medelvärde (x̄ )
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 26 -
(1)
Konfidensintervall
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Konfidensintervall runt ett medelvärde
s
x̄ ± tkv × √
n
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
Urvalets medelvärde (x̄ )
Ett kritiskt värde (tkv ) som beror på säkerhetsnivån
En tillämpning
Avslutning
- 26 -
(1)
Konfidensintervall
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Konfidensintervall runt ett medelvärde
s
x̄ ± tkv × √
n
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Urvalets medelvärde (x̄ )
Ett kritiskt värde (tkv ) som beror på säkerhetsnivån
Urvalets standardavvikelse (s)
Avslutning
- 26 -
(1)
Konfidensintervall
Introduktion
Konfidensintervall runt ett medelvärde
Olika sorters
generalisering
s
x̄ ± tkv × √
n
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Urvalets medelvärde (x̄ )
Ett kritiskt värde (tkv ) som beror på säkerhetsnivån
Urvalets standardavvikelse (s)
Urvalets storlek (n)
- 26 -
(1)
Konfidensintervall
Introduktion
Konfidensintervall runt ett medelvärde
Olika sorters
generalisering
s
x̄ ± tkv × √
n
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Urvalets medelvärde (x̄ )
Ett kritiskt värde (tkv ) som beror på säkerhetsnivån
Urvalets standardavvikelse (s)
Urvalets storlek (n)
Den sista termen ( √sn ) är vår uppskattning av
populationens standardavvikelse.
- 26 -
(1)
Konfidensintervall
Introduktion
Konfidensintervall runt en proportion
Olika sorters
generalisering
Statistisk
inferens
s
p ± zkv ×
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 27 -
p(1 − p)
n
(2)
Konfidensintervall
Introduktion
Konfidensintervall runt en proportion
Olika sorters
generalisering
Statistisk
inferens
s
p ± zkv ×
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
Proportionen i urvalet (p)
En tillämpning
Avslutning
- 27 -
p(1 − p)
n
(2)
Konfidensintervall
Introduktion
Konfidensintervall runt en proportion
Olika sorters
generalisering
Statistisk
inferens
s
p ± zkv ×
Normalfördelningen
p(1 − p)
n
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Proportionen i urvalet (p)
Ett kritiskt värde (zkv ) som beror på säkerhetsnivån
Avslutning
- 27 -
(2)
Konfidensintervall
Introduktion
Konfidensintervall runt en proportion
Olika sorters
generalisering
Statistisk
inferens
s
p ± zkv ×
Normalfördelningen
p(1 − p)
n
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Proportionen i urvalet (p)
Ett kritiskt värde (zkv ) som beror på säkerhetsnivån
Urvalets storlek (n)
- 27 -
(2)
Konfidensintervall
Introduktion
Konfidensintervall runt en proportion
Olika sorters
generalisering
Statistisk
inferens
s
p ± zkv ×
Normalfördelningen
p(1 − p)
n
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Proportionen i urvalet (p)
Ett kritiskt värde (zkv ) som beror på säkerhetsnivån
Urvalets storlek (n)
q
Den sista termen ( p(1−p)
) är vår uppskattning av
n
standardavvikelsen i populationen.
- 27 -
(2)
Konfidensintervall
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Vi kan också beräkna konfidensintervall för en skillnad
mellan två urval.
Vi tänker oss att urvalen är dragna ur två olika
populationer och att vi vill veta skillnaden mellan de två
populationerna.
• Är förändringen statistiskt säkerställd?
• Röstar fler män än kvinnor på moderaterna?
Om konfidensintervallet omfattar noll kan vi inte vara
säkra på att populationerna är olika.
- 28 -
Konfidensintervall
Konfidensintervall för skillnad mellan medelvärden
Introduktion
Olika sorters
generalisering
s
x̄1 − x̄2 ± tkv
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 29 -
s12
s2
+ 2
n1 n2
(3)
Konfidensintervall
Konfidensintervall för skillnad mellan medelvärden
Introduktion
Olika sorters
generalisering
s
x̄1 − x̄2 ± tkv
Statistisk
inferens
s12
s2
+ 2
n1 n2
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Medelvärde i urval ett (x¯1 ) och två (x¯2 )
Strategiska
urval
En tillämpning
Avslutning
- 29 -
(3)
Konfidensintervall
Konfidensintervall för skillnad mellan medelvärden
Introduktion
Olika sorters
generalisering
s
x̄1 − x̄2 ± tkv
Statistisk
inferens
s12
s2
+ 2
n1 n2
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
Medelvärde i urval ett (x¯1 ) och två (x¯2 )
Ett kritiskt värde (tkv ) som beror på säkerhetsnivån
En tillämpning
Avslutning
- 29 -
(3)
Konfidensintervall
Konfidensintervall för skillnad mellan medelvärden
Introduktion
Olika sorters
generalisering
s
x̄1 − x̄2 ± tkv
Statistisk
inferens
s12
s2
+ 2
n1 n2
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Medelvärde i urval ett (x¯1 ) och två (x¯2 )
Ett kritiskt värde (tkv ) som beror på säkerhetsnivån
Urvalens respektive standardavvikelse (s1 och s2 )
Avslutning
- 29 -
(3)
Konfidensintervall
Konfidensintervall för skillnad mellan medelvärden
Introduktion
Olika sorters
generalisering
s
x̄1 − x̄2 ± tkv
Statistisk
inferens
s12
s2
+ 2
n1 n2
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Medelvärde i urval ett (x¯1 ) och två (x¯2 )
Ett kritiskt värde (tkv ) som beror på säkerhetsnivån
Urvalens respektive standardavvikelse (s1 och s2 )
Urvalens respektive storlek (n1 och n2 )
- 29 -
(3)
Konfidensintervall
Konfidensintervall för skillnad mellan medelvärden
Introduktion
Olika sorters
generalisering
s
x̄1 − x̄2 ± tkv
Statistisk
inferens
s12
s2
+ 2
n1 n2
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Medelvärde i urval ett (x¯1 ) och två (x¯2 )
Ett kritiskt värde (tkv ) som beror på säkerhetsnivån
Urvalens respektive standardavvikelse (s1 och s2 )
Urvalens respektive storlek (n1 och n2 )
r
s2
s2
Den sista termen ( n11 + n22 ) är vår uppskattning av
populationens standardavvikelse.
- 29 -
(3)
Konfidensintervall
Introduktion
Konfidensintervall för skillnad mellan proportioner
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
s
p1 − p2 ± zkv
p1 (1 − p1 ) p2 (1 − p2 )
+
n1
n2
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
Proportionerna i de två urvalen (p1 och p2 )
En tillämpning
Avslutning
- 30 -
(4)
Konfidensintervall
Introduktion
Konfidensintervall för skillnad mellan proportioner
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
s
p1 − p2 ± zkv
p1 (1 − p1 ) p2 (1 − p2 )
+
n1
n2
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Proportionerna i de två urvalen (p1 och p2 )
Ett kritiskt värde (zkv ) som beror på säkerhetsnivån
Avslutning
- 30 -
(4)
Konfidensintervall
Introduktion
Konfidensintervall för skillnad mellan proportioner
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
s
p1 − p2 ± zkv
p1 (1 − p1 ) p2 (1 − p2 )
+
n1
n2
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Proportionerna i de två urvalen (p1 och p2 )
Ett kritiskt värde (zkv ) som beror på säkerhetsnivån
Urvalens storlek (n1 och n2 )
- 30 -
(4)
Konfidensintervall
Introduktion
Konfidensintervall för skillnad mellan proportioner
Olika sorters
generalisering
Statistisk
inferens
s
p1 − p2 ± zkv
Normalfördelningen
p1 (1 − p1 ) p2 (1 − p2 )
+
n1
n2
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Proportionerna i de två urvalen (p1 och p2 )
Ett kritiskt värde (zkv ) som beror på säkerhetsnivån
Urvalens storlek (n1 och n2 )
q
1)
2)
Den sista termen ( p1 (1−p
+ p2 (1−p
) är vår
n1
n2
uppskattning av standardavvikelsen i populationen.
- 30 -
(4)
Konfidensintervall
Introduktion
Konfidensintervall för skillnad mellan proportioner
Olika sorters
generalisering
Statistisk
inferens
s
p1 − p2 ± zkv
Normalfördelningen
p1 (1 − p1 ) p2 (1 − p2 )
+
n1
n2
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Proportionerna i de två urvalen (p1 och p2 )
Ett kritiskt värde (zkv ) som beror på säkerhetsnivån
Urvalens storlek (n1 och n2 )
q
1)
2)
Den sista termen ( p1 (1−p
+ p2 (1−p
) är vår
n1
n2
uppskattning av standardavvikelsen i populationen.
- 30 -
(4)
Räkneexempel
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Anta att vi har studerat månadsinkomst i ett urval av
1 000 svenskar och vill beskriva den genomsnittliga
månadsinkomsten för hela den svenska befolkningen.
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 31 -
Räkneexempel
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Anta att vi har studerat månadsinkomst i ett urval av
1 000 svenskar och vill beskriva den genomsnittliga
månadsinkomsten för hela den svenska befolkningen.
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Anta vidare att medelinkomsten i urvalet är 23 000 kr och
standardavvikelsen är 5 700 kr. Vår bästa gissning är att
medelinkomst i populationen är 23 000 kr, men hur stor är
osäkerheten?
Avslutning
- 31 -
Räkneexempel
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Anta att vi har studerat månadsinkomst i ett urval av
1 000 svenskar och vill beskriva den genomsnittliga
månadsinkomsten för hela den svenska befolkningen.
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Anta vidare att medelinkomsten i urvalet är 23 000 kr och
standardavvikelsen är 5 700 kr. Vår bästa gissning är att
medelinkomst i populationen är 23 000 kr, men hur stor är
osäkerheten?
Vi beräknar ett konfidensintervall för att ta reda på det!
Fyra bra steg att komma ihåg (nästa bild).
- 31 -
Räkneexempel
1
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Vi väljer säkerhetsnivån 95 procent. Det innebär att om
man skulle göra ett oändligt antal urval från populationen
så skulle 95 av 100 konfidensintervall beräknade på detta
sätt innesluta det faktiska populationsmedelvärdet. Det
kritiska t-värdet blir 1,96.
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 32 -
Räkneexempel
1
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
2
Vi väljer säkerhetsnivån 95 procent. Det innebär att om
man skulle göra ett oändligt antal urval från populationen
så skulle 95 av 100 konfidensintervall beräknade på detta
sätt innesluta det faktiska populationsmedelvärdet. Det
kritiska t-värdet blir 1,96.
Beräkna(?) och stoppa in urvalsmedelvärde (x̄ = 23000),
urvalsstandardavvikelse (s = 5700) och urvalsstorlek
(n = 1000) i ekvationen. Vi erhåller då ett undre (22 647)
och ett övre (23 353) värde för intervallet.
En tillämpning
Avslutning
s
5700
x̄ ±tkv × √ = 23000±1, 96× √
= 23000±353 (5)
n
1000
- 32 -
Räkneexempel
1
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
2
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
Vi väljer säkerhetsnivån 95 procent. Det innebär att om
man skulle göra ett oändligt antal urval från populationen
så skulle 95 av 100 konfidensintervall beräknade på detta
sätt innesluta det faktiska populationsmedelvärdet. Det
kritiska t-värdet blir 1,96.
Beräkna(?) och stoppa in urvalsmedelvärde (x̄ = 23000),
urvalsstandardavvikelse (s = 5700) och urvalsstorlek
(n = 1000) i ekvationen. Vi erhåller då ett undre (22 647)
och ett övre (23 353) värde för intervallet.
En tillämpning
s
5700
x̄ ±tkv × √ = 23000±1, 96× √
= 23000±353 (5)
n
1000
Avslutning
3
Detta uttrycker vi som att vid 95 procents säkerhetsnivå,
ligger den genomsnittliga månadsinkomsten för
yrkesarbetande boende i Sverige någonstans mellan 22 647
och 23 353 kr.
- 32 -
Räkneexempel
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
I en Sifo-undersökning (augusti 2013) uppgav 30,5 procent
av de tillfrågade att de skulle rösta på Socialdemokraterna
om det var val idag. Antalet intervjuade var 1 916. För att
kunna uttala oss om partiets popularitet i hela landet
måste vi beräkna ett konfidensintervall.
Strategiska
urval
En tillämpning
Avslutning
- 33 -
Räkneexempel
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
I en Sifo-undersökning (augusti 2013) uppgav 30,5 procent
av de tillfrågade att de skulle rösta på Socialdemokraterna
om det var val idag. Antalet intervjuade var 1 916. För att
kunna uttala oss om partiets popularitet i hela landet
måste vi beräkna ett konfidensintervall.
Liksom tidigare väljer vi en säkerhetsnivå på 95 procent.
Eftersom vi kan anta en normalfördelning i detta fall
innebär ett kritiskt värde (zkv ) på 1,96 oavsett urvalets
storlek.
- 33 -
Räkneexempel
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Urvalet bestod av 1 916 personer (n = 1916), varav 30,5
procent var socialdemokrater (p = 0, 305), och vi
använder 95 procents säkerhetsnivå (zkv = 1, 96).
s
= p ± zkv ×
p(1 − p)
n
Räkneexempel
s
Superpopulationer
Strategiska
urval
= 0, 305 ± 1, 96 ×
En tillämpning
Avslutning
= 0, 305 ± 0, 02
- 34 -
0, 305(1 − 0, 305)
1916
(6)
Räkneexempel
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Urvalet bestod av 1 916 personer (n = 1916), varav 30,5
procent var socialdemokrater (p = 0, 305), och vi
använder 95 procents säkerhetsnivå (zkv = 1, 96).
s
= p ± zkv ×
p(1 − p)
n
Räkneexempel
s
Superpopulationer
Strategiska
urval
= 0, 305 ± 1, 96 ×
0, 305(1 − 0, 305)
1916
(6)
En tillämpning
Avslutning
= 0, 305 ± 0, 02
Med andra ord sträcker sig intervallet från 0,285 till 0,325.
Vi drar då slutsatsen att vid 95 procents säkerhetsnivå
skulle mellan 28,5 procent och 32,5 procent av svenskarna
rösta på Socialdemokraterna om det var val idag.
- 34 -
Superpopulationer
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Vi behandlar ofta totalundersökningar som om de vore
urval.
Ofta beräknar vi konfidensintervall, trots att vi kanske har
undersökt alla Sveriges kommuner.
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Med regressionsanalys gör vi alltid signifikanstest, även vid
totalundersökningar.
Och vi lär bara ut den formel för standardavvikelsen som
antar att det inte är en totalundersökning (n − 1 i stället
för n).
- 35 -
Superpopulationer
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Skälet: Vi är intresserade av ett fenomen eller en
underliggande process, snarare än den population vi kan
observera.
Anta att vi studerat alla svenska kommuner och noterat
att andelen som personröstar är större i stora kommuner
än i små kommuner.
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Vi vet detta om populationen. Men hur vet vi att det inte
bara råkade bli så? Är vi säkra på att befolkningsstorleken
påverkar ens benägenhet att personrösta?
Genom att beräkna ett konfidensintervall för skillnaden
mellan små och stora kommuner kan vi kvantifiera de
skillnader som slumpen ger upphov till och därmed
säkerställa att skillnaden är för stor för att (bara) bero på
slumpen.
- 36 -
Superpopulationer
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Samma resonemang kan uttryckas på olika sätt
(överkurs)
I samplingslitteraturen pratar man om superpopulationer,
vilket kan vara alla människor som någonsin kommer
existera.
Inom andra traditioner pratar man i stället om en
datagenererande process (ung. de komplexa processer som
producerar existerande populationer och våra
observationer av dessa).
Teorell och Svensson (s. 215–218) beskriver detta i termer
av epistemologisk probabilism.
- 37 -
Strategiska urval
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Några möjligheter när vi väljer fall
Totalundersökning - sällan möjligt
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 38 -
Strategiska urval
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Några möjligheter när vi väljer fall
Totalundersökning - sällan möjligt
Slumpmässigt urval - extensiva studier
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 38 -
Strategiska urval
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Några möjligheter när vi väljer fall
Totalundersökning - sällan möjligt
Slumpmässigt urval - extensiva studier
Strategiskt urval
Strategiska
urval
En tillämpning
Avslutning
- 38 -
Strategiska urval
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
Några möjligheter när vi väljer fall
Totalundersökning - sällan möjligt
Slumpmässigt urval - extensiva studier
Strategiskt urval
• Representativa fall
En tillämpning
Avslutning
- 38 -
Strategiska urval
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Några möjligheter när vi väljer fall
Totalundersökning - sällan möjligt
Slumpmässigt urval - extensiva studier
Strategiskt urval
• Representativa fall
• Kritiska fall
Avslutning
- 38 -
Strategiska urval
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Några möjligheter när vi väljer fall
Totalundersökning - sällan möjligt
Slumpmässigt urval - extensiva studier
Strategiskt urval
• Representativa fall
• Kritiska fall
I Most likely
- 38 -
Strategiska urval
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Några möjligheter när vi väljer fall
Totalundersökning - sällan möjligt
Slumpmässigt urval - extensiva studier
Strategiskt urval
• Representativa fall
• Kritiska fall
I Most likely
I Least likely
- 38 -
Strategiska urval
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Ett most likely-fall är ett fall som i alla avseenden har en
maximal sannolikhet för att hypotesen ska stämma.
Används för att förkasta hypoteser.
Least likely-fall är ett fall som i alla avseenden har en
minimal sannolikhet för att hypotesen ska stämma.
Används för att ge stöd åt hypoteser.
Båda fallen används minst lika ofta i förklarande studier.
- 39 -
Strategiska urval
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Inte begränsat till kvalitativa studier
Det vi vill uttala oss om skiljer sig ofta med avseende på
analysenheter, kontext och hur variablerna är mätta.
Även om vi kan dra ett slumpmässigt urval av
analysenheter, kan vi sällan göra samma sak med variabler
eller kontexter.
Därför är statistisk inferens aldrig tillräckligt.
- 40 -
Strategiska urval
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Ofta kombinerar vi flera typer av generalisering. I en studie av
dörrknackningens effekter på valdeltagande generaliserar jag:
Från tidigare forskning till mitt fall för att skapa
förväntningar.
Med statistisk inferens beräknar jag osäkerheten i effekten.
Från mitt fall till populationen av tidigare studier för att
bidra till litteraturen.
Från mitt fall till dörrknackning i riksdagsvalet.
- 41 -
Strategiska urval
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Låt oss anta att vi vill testa medianväljarteoremet på en svensk
kommun. Vilken ska vi välja?
Representativt: Normalmånga partier och maktskiften?
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 42 -
Strategiska urval
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Låt oss anta att vi vill testa medianväljarteoremet på en svensk
kommun. Vilken ska vi välja?
Representativt: Normalmånga partier och maktskiften?
Superpopulationer
Strategiska
urval
Most likely: Stockholm.
En tillämpning
Avslutning
- 42 -
Strategiska urval
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Låt oss anta att vi vill testa medianväljarteoremet på en svensk
kommun. Vilken ska vi välja?
Representativt: Normalmånga partier och maktskiften?
Superpopulationer
Strategiska
urval
En tillämpning
Most likely: Stockholm.
Least likely: Överkalix.
Avslutning
- 42 -
Strategiska urval
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Andra sätt att resonera om extrema fall: Seawright och Gerring
(2008) Case Selection Techniques in Case Study Research.
Strategiska
urval
En tillämpning
Avslutning
- 43 -
Några centrala begrepp
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Skalnivå: Ett sätt att kategorisera variabler efter hur deras
variabelvärden förhåller sig till varandra. Skalnivån säger
vad vi kan använda för metoder.
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 44 -
Några centrala begrepp
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Skalnivå: Ett sätt att kategorisera variabler efter hur deras
variabelvärden förhåller sig till varandra. Skalnivån säger
vad vi kan använda för metoder.
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
Centralitetsmått: En typ av mått som anges för att visa
på vilket det typiska värdet för en variabel är.
En tillämpning
Avslutning
- 44 -
Några centrala begrepp
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Skalnivå: Ett sätt att kategorisera variabler efter hur deras
variabelvärden förhåller sig till varandra. Skalnivån säger
vad vi kan använda för metoder.
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Centralitetsmått: En typ av mått som anges för att visa
på vilket det typiska värdet för en variabel är.
Spridningsmått: En typ av mått som mäter hur olika våra
analysenheter är med avseende på en viss variabel, dvs hur
stor spridning denna variabel har.
- 44 -
Några centrala begrepp
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Nivåskattningar: Att avgöra huruvida något är att
betrakta som högt eller lågt, stort eller litet, dvs. att sätta
det i relation till något annat.
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 45 -
Några centrala begrepp
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Nivåskattningar: Att avgöra huruvida något är att
betrakta som högt eller lågt, stort eller litet, dvs. att sätta
det i relation till något annat.
Förändringsstrategin: Jämför med andra tidpunkter.
Strategiska
urval
En tillämpning
Avslutning
- 45 -
Några centrala begrepp
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Nivåskattningar: Att avgöra huruvida något är att
betrakta som högt eller lågt, stort eller litet, dvs. att sätta
det i relation till något annat.
Förändringsstrategin: Jämför med andra tidpunkter.
Referenspunktsstrategin: Jämför med en allmänt
vedertagen empirisk referenspunkt.
Avslutning
- 45 -
Några centrala begrepp
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Nivåskattningar: Att avgöra huruvida något är att
betrakta som högt eller lågt, stort eller litet, dvs. att sätta
det i relation till något annat.
Förändringsstrategin: Jämför med andra tidpunkter.
Referenspunktsstrategin: Jämför med en allmänt
vedertagen empirisk referenspunkt.
Populationstrategin: Jämför med hela populationen.
- 45 -
Några centrala begrepp
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Generalisering: Att utifrån ett urval uttala oss om den
större mängd analysenheter som vi egentligen vill studera.
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 46 -
Några centrala begrepp
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
Generalisering: Att utifrån ett urval uttala oss om den
större mängd analysenheter som vi egentligen vill studera.
Punktestimat: Ett tal som används för att, med
utgångspunkt i ett urval, gissa sig till (medel-)värdet i en
population.
En tillämpning
Avslutning
- 46 -
Några centrala begrepp
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Generalisering: Att utifrån ett urval uttala oss om den
större mängd analysenheter som vi egentligen vill studera.
Punktestimat: Ett tal som används för att, med
utgångspunkt i ett urval, gissa sig till (medel-)värdet i en
population.
Konfidensintervall: Det intervall inom vilket man, med en
viss säkerhet, tror att ett populationsvärde ligger.
- 46 -
Några centrala begrepp
Totalundersökning: Att studera alla fall
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 47 -
Några centrala begrepp
Totalundersökning: Att studera alla fall
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Strategiskt urval: Att generalisera genom att välja ett fall
som gör på grund av sina specifika karaktäriska gör det
möjligt att dra vissa generella slutsatser
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 47 -
Några centrala begrepp
Totalundersökning: Att studera alla fall
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Strategiskt urval: Att generalisera genom att välja ett fall
som gör på grund av sina specifika karaktäriska gör det
möjligt att dra vissa generella slutsatser
Typiska fall: Representativa för andra fall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 47 -
Några centrala begrepp
Totalundersökning: Att studera alla fall
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Strategiskt urval: Att generalisera genom att välja ett fall
som gör på grund av sina specifika karaktäriska gör det
möjligt att dra vissa generella slutsatser
Typiska fall: Representativa för andra fall
Most likely case: Ett kritiskt fall med gynnsamma
omständigheter (om teorin inte får stöd här, får den
sannolikt inte stöd någon annanstans heller. Man gör det
lätt för teorin.)
- 47 -
Några centrala begrepp
Totalundersökning: Att studera alla fall
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
Strategiskt urval: Att generalisera genom att välja ett fall
som gör på grund av sina specifika karaktäriska gör det
möjligt att dra vissa generella slutsatser
Typiska fall: Representativa för andra fall
Most likely case: Ett kritiskt fall med gynnsamma
omständigheter (om teorin inte får stöd här, får den
sannolikt inte stöd någon annanstans heller. Man gör det
lätt för teorin.)
Least likely case: Ett kritiskt fall med ogynnsamma
omständigheter (om teorin får stöd här får den sannolikt
stöd även under mindre ogynnsamma omständigheter.
Man gör det svårt för teorin. )
- 47 -
Avslutning
Introduktion
Olika sorters
generalisering
Statistisk
inferens
Normalfördelningen
Konfidensintervall
Räkneexempel
Tack för idag!
Superpopulationer
Strategiska
urval
En tillämpning
Avslutning
- 48 -