Document

Förhandlaren – enkelsidiga och dubbelsidiga test
Grobarheten påstås vara 70%. Om vi vill testa eventuella belägg för
avvikelse från detta uppåt eller nedåt ska vi göra en dubbbelsidig
test:
H0: P=0.7
H1: P≠ 0.7
Om vi bara är intresserade av att upptäcka ev. avvikelser nedåt – alltså
en sämre grobarhet – gör vi enkelsidigt test med
H0: P ≥ 0.7
H1: P < 0.7
Typ I- och typ II-fel (α- och β-fel) illustrerat med
Fröhandlaren
Fröhandlaren fråga 4 illustrerar β och statistisk styrka. Den
statistiska styrkan (sannolikheten att förkasta en falsk H0) är i
detta fall 1-β=0.8986 och då blir sannolikheten för typ II-fel (βfel) 0.1014 det vill säga sannolikheten att acceptera H0 fast den
är falsk (sannolikheten att begå typ II-fel genom att acceptera
H0 om grobarhet 0.7 fast den bara är 0.5).
Fröhandlaren sid 1 (n=10) kan illustrera α. Antag att
fröhandlaren har rätt. Sannolikheten att vi begår ett α-fel (typ Ifel) är där 0.047349 (enkelsidigt). Och sannolikheten att vi inte
begår något fel om fröhandlaren har rätt är 1-0.047..=0.9526.
P-värde
P=probability
Sannolikhetsvärde som är resultat av en
statistisk test. Anger sannolikheten för att
göra den observation vi har gjort eller ett
”sämre”/”mer extremt” utfall om H0 är
sann.
UPPGIFT:
ANVÄND LÄMPLIGA BINOMIALFÖRDELNINGAR I FRÖHANDLARHÄFTET OCH BESVARA FÖLJANDE FRÅGA
•
Vi har ett mynt som vi tror är schysst och ger 50% krona och
50% klave när det kastas. Antag att sanningen är att myntet är
felaktigt och att sannolikheten att få krona i själva verket är
70%. Vilken är sannolikheten att upptäcka detta om myntet
kastas 50 gånger?
Formulera hypotesen, ställ upp nollhypotesen och använd
binomial-fördelningen för att svara på frågan.
Hypotes: Myntet är schysst och ger 50% krona och 50% klave
Experiment: Myntet kastas 50 gånger
H0: P(krona) = 0.5
H1: P(krona) ≠ 0.5
Osannolika utfall om H0 är sann erhålls ur Bin(50, 0.5). Vi kommer att förkasta H0 om vi
får osannolikt få eller osannolikt många krona.
Osannolikt få krona representeras av fördelningens vänstra ”svans” på 2.5 procent och
osannolikt många krona representeras av fördelningens högra ”svans” på 2.5 procent.
I detta fall med endast 50 kast hamnar vi inte exakt på någon 2.5 procentsgräns utan
vi får nöja oss med utfallet 17 eller färre krona (vänstra ”svansen” där P=0.01642) och
33 eller fler krona (högra ”svansen” där P=0.01642). Den totala sannolikheten för
något av dessa utfall är P=2*0.01642= 0.03284
Vi förkastar alltså H0 om vi får 17 eller färre krona alternativt om vi får 33 eller fler
krona. Sannolikheten för att göra denna observation om sanningen är att
sannolikheten för krona är 0.7 erhålls ur Bin(50, 0.7) och är:
P(17 eller färre krona)=0.00000
P(33 eller fler krona) = 1-0.217807=0.782193
Sannolikheten att förkasta den falska H0 är i detta fall knappt 80% (0.782193). Testet
har en hög "statistisk styrka" (power) eftersom sannolikheten att förkasta den falska
nollhypotesen är hög.
Vilken är sannolikheten att vi gör ett typ II-fel i detta fall? Svar på nästa bild
Typ II-fel eller β-fel är sannolikheten att acceptera en H0 fast den är falsk.
I vårt exempel är testets statistiska styrka – det vill säga sannolikheten att förkasta H0
om den är falsk (vilket den ju var i vårt exempel) 0.782193. Sannolikheten att vi
förkastar den falska H0 är alltså ≈ 0.78 och sannolikheten att vi gör fel och accepterar
den falska H0 är 1–0.782193 = 0.217807 alltså ca 22%.
Vi har en ursprungspopulation/-fördelning med medelvärde µ.
Population
mean = μ
SD = σ
µx
De ”kritiska gränserna” i fördelningen:
Population
2.5%
2.5%
-1.96σx
µx
+1.96σx
mean = μx
SD = σx
Vi drar många stickprov ur populationen och räknar ut medelvärdet i alla stickprov.
σx
µx
Vi drar många stickprov ur populationen och räknar ut medelvärdet i alla stickprov.
Vi får en fördelning av stickprovsmedelvärden – en samplingsfördelning
σx
µx
x = µx =µ
Variansen och standardavvikelsen i samplingsfördelningen för medelvärden är lägre än i
ursprungspopulation. Ju större stickprov, desto lägre varians.
Standardavvilkelsen i samplingsfördelningen för medelvärden kallas
STANDARD ERROR (S.E.)
σx
µx
σx
σx = n
Standard error = S.E.
x = µx =µx
Antag en population av kungsboa i ett
område i Panama som är ganska
kortvuxen. Populationen är isolerad och
mycket välstuderad. Kroppslängden är
normalfördelad med μ=100 cm,
standardavvikelsen (σ)=36 cm.
Vi upptäcker kungsboa i ett närliggande
område där kungsboan ej upptäckts
tidigare. Kan det vara samma population?
Vi samlar in ett stickprov i området och
mäter längden. Vi hittar 16 individer som i
genomsnitt är 81 cm långa.
Är det troligt att det rör sig om samma
population?
Om σ är okänd skattas
standard error, S.E från
s
n
Men vi kan då inte använda normalfördelningen utan vi måste
använda t-fördelningen.
Om σ är känd används normalfördelningen och z
Om σ inte är känd utan skattas den via s och t-fördelning används
t-fördelningen
t-fördelningen liknar normalfördelningen men är plattare. Ju lägre
stickprovsstorlek (n) desto plattare kurva. När n ökar närmar sig tfördelningen normalfördelningen.
Det finns en t-fördelning för varje antal s.k. frihetsgrader. Antalet
frihetsgrader är kopplat till stickprovets storlek. Ju större stickprov
desto fler frihetsgrader.
Frihetsgrader – degrees of freedom, df
Svårt begrepp men kan betraktas som en matematisk restriktion
som måste användas då vi skattar parametrar från stickprov.
Antalet värden i den slutliga beräkningen av en statistika som är
fria att variera.
Icke-statistisk illustration:
Antag att vi har 100 kronor att dela ut till fyra olika barn som var och en knackar
på hemma hos oss för att önska glad påsk. Om vi ger
30 kronor till barn 1,
20 till barn 2
40 till barn 3
så är vi låsta till att ge det fjärde barnet 10 kronor eftersom totalsumman inte kan
överstiga 100 kronor. De tre första summorna är vi fria att variera men de sista är
låst av att totalbeloppet inte får överstiga 100 kronor. Vi har 4-1=3 frihetsgrader.
Test av medelvärde när
är okänd
- den sanna populationens standardavvikelse skattas
från standardavvikelsen i stickprovet - s
Standard error (S.E.) skattas från
s
n
och z ersätts med t
Vikt hos 5 veckor gamla vargvalpar
n
Antal obseravtioner
Stickprov
3
3.2
4.2 5.2
4.4
3.6
4.9
3.9
5.2
5.2
3.2 4.3
x
= 4.3
Median = 4.3
3.2
Typvärde = 5.2
= 0.7668
3.6
3.9
4.2
4.3
4.4
4.9
5.2
Vikt
visades på tavlan
0.60
Standardavvikelsen = s =
s2
1
0
Observerade
vikter
Data från exempel
från dag 1:
3.2
t-test för
μ=4.0 och 95%-konfidensintervall
3.6
3.9
2
Variansen
=
s
=
4.2
4.3
(xi-x)2
4.4
= 0.588 
4.9
n-1
5.2

2
 0.80
Konfidensintervall
Ett intervall som med en viss sannolikhet täcker den parameter
vi är intresserade av att skatta (t.ex. µ).
Ett 95% konfidensintervall täcker med 95% sannolikhet
populationens µ.
Med hjälp av konfidensintervall kan vi med viss
säkerhet fastställa medelvärdet för populationen
Beräkningen av konfidensintervall bygger på centrala gränsvärdessatsen.
Den centrala gränsvärdessatsen möjliggör användande av normalfördelningen
för att skapa konfidensintervall för populationsmedelvärdet.
Den centrala gränsvärdessatsen säger att om stickprov av en given storlek dras
ur en population så kommer fördelningen av stickprovsmedelvärdena
(samplingsfördelningen) att likna en normalfördelning. Denna fördelning blir
mer lik normalfördelningen ju större stickprovet det är.
Om stickprovet är litet används t-fördelningen som liknar normalfördelningen
men justerar för små stickprov (se t-tabellen).