Förhandlaren – enkelsidiga och dubbelsidiga test Grobarheten påstås vara 70%. Om vi vill testa eventuella belägg för avvikelse från detta uppåt eller nedåt ska vi göra en dubbbelsidig test: H0: P=0.7 H1: P≠ 0.7 Om vi bara är intresserade av att upptäcka ev. avvikelser nedåt – alltså en sämre grobarhet – gör vi enkelsidigt test med H0: P ≥ 0.7 H1: P < 0.7 Typ I- och typ II-fel (α- och β-fel) illustrerat med Fröhandlaren Fröhandlaren fråga 4 illustrerar β och statistisk styrka. Den statistiska styrkan (sannolikheten att förkasta en falsk H0) är i detta fall 1-β=0.8986 och då blir sannolikheten för typ II-fel (βfel) 0.1014 det vill säga sannolikheten att acceptera H0 fast den är falsk (sannolikheten att begå typ II-fel genom att acceptera H0 om grobarhet 0.7 fast den bara är 0.5). Fröhandlaren sid 1 (n=10) kan illustrera α. Antag att fröhandlaren har rätt. Sannolikheten att vi begår ett α-fel (typ Ifel) är där 0.047349 (enkelsidigt). Och sannolikheten att vi inte begår något fel om fröhandlaren har rätt är 1-0.047..=0.9526. P-värde P=probability Sannolikhetsvärde som är resultat av en statistisk test. Anger sannolikheten för att göra den observation vi har gjort eller ett ”sämre”/”mer extremt” utfall om H0 är sann. UPPGIFT: ANVÄND LÄMPLIGA BINOMIALFÖRDELNINGAR I FRÖHANDLARHÄFTET OCH BESVARA FÖLJANDE FRÅGA • Vi har ett mynt som vi tror är schysst och ger 50% krona och 50% klave när det kastas. Antag att sanningen är att myntet är felaktigt och att sannolikheten att få krona i själva verket är 70%. Vilken är sannolikheten att upptäcka detta om myntet kastas 50 gånger? Formulera hypotesen, ställ upp nollhypotesen och använd binomial-fördelningen för att svara på frågan. Hypotes: Myntet är schysst och ger 50% krona och 50% klave Experiment: Myntet kastas 50 gånger H0: P(krona) = 0.5 H1: P(krona) ≠ 0.5 Osannolika utfall om H0 är sann erhålls ur Bin(50, 0.5). Vi kommer att förkasta H0 om vi får osannolikt få eller osannolikt många krona. Osannolikt få krona representeras av fördelningens vänstra ”svans” på 2.5 procent och osannolikt många krona representeras av fördelningens högra ”svans” på 2.5 procent. I detta fall med endast 50 kast hamnar vi inte exakt på någon 2.5 procentsgräns utan vi får nöja oss med utfallet 17 eller färre krona (vänstra ”svansen” där P=0.01642) och 33 eller fler krona (högra ”svansen” där P=0.01642). Den totala sannolikheten för något av dessa utfall är P=2*0.01642= 0.03284 Vi förkastar alltså H0 om vi får 17 eller färre krona alternativt om vi får 33 eller fler krona. Sannolikheten för att göra denna observation om sanningen är att sannolikheten för krona är 0.7 erhålls ur Bin(50, 0.7) och är: P(17 eller färre krona)=0.00000 P(33 eller fler krona) = 1-0.217807=0.782193 Sannolikheten att förkasta den falska H0 är i detta fall knappt 80% (0.782193). Testet har en hög "statistisk styrka" (power) eftersom sannolikheten att förkasta den falska nollhypotesen är hög. Vilken är sannolikheten att vi gör ett typ II-fel i detta fall? Svar på nästa bild Typ II-fel eller β-fel är sannolikheten att acceptera en H0 fast den är falsk. I vårt exempel är testets statistiska styrka – det vill säga sannolikheten att förkasta H0 om den är falsk (vilket den ju var i vårt exempel) 0.782193. Sannolikheten att vi förkastar den falska H0 är alltså ≈ 0.78 och sannolikheten att vi gör fel och accepterar den falska H0 är 1–0.782193 = 0.217807 alltså ca 22%. Vi har en ursprungspopulation/-fördelning med medelvärde µ. Population mean = μ SD = σ µx De ”kritiska gränserna” i fördelningen: Population 2.5% 2.5% -1.96σx µx +1.96σx mean = μx SD = σx Vi drar många stickprov ur populationen och räknar ut medelvärdet i alla stickprov. σx µx Vi drar många stickprov ur populationen och räknar ut medelvärdet i alla stickprov. Vi får en fördelning av stickprovsmedelvärden – en samplingsfördelning σx µx x = µx =µ Variansen och standardavvikelsen i samplingsfördelningen för medelvärden är lägre än i ursprungspopulation. Ju större stickprov, desto lägre varians. Standardavvilkelsen i samplingsfördelningen för medelvärden kallas STANDARD ERROR (S.E.) σx µx σx σx = n Standard error = S.E. x = µx =µx Antag en population av kungsboa i ett område i Panama som är ganska kortvuxen. Populationen är isolerad och mycket välstuderad. Kroppslängden är normalfördelad med μ=100 cm, standardavvikelsen (σ)=36 cm. Vi upptäcker kungsboa i ett närliggande område där kungsboan ej upptäckts tidigare. Kan det vara samma population? Vi samlar in ett stickprov i området och mäter längden. Vi hittar 16 individer som i genomsnitt är 81 cm långa. Är det troligt att det rör sig om samma population? Om σ är okänd skattas standard error, S.E från s n Men vi kan då inte använda normalfördelningen utan vi måste använda t-fördelningen. Om σ är känd används normalfördelningen och z Om σ inte är känd utan skattas den via s och t-fördelning används t-fördelningen t-fördelningen liknar normalfördelningen men är plattare. Ju lägre stickprovsstorlek (n) desto plattare kurva. När n ökar närmar sig tfördelningen normalfördelningen. Det finns en t-fördelning för varje antal s.k. frihetsgrader. Antalet frihetsgrader är kopplat till stickprovets storlek. Ju större stickprov desto fler frihetsgrader. Frihetsgrader – degrees of freedom, df Svårt begrepp men kan betraktas som en matematisk restriktion som måste användas då vi skattar parametrar från stickprov. Antalet värden i den slutliga beräkningen av en statistika som är fria att variera. Icke-statistisk illustration: Antag att vi har 100 kronor att dela ut till fyra olika barn som var och en knackar på hemma hos oss för att önska glad påsk. Om vi ger 30 kronor till barn 1, 20 till barn 2 40 till barn 3 så är vi låsta till att ge det fjärde barnet 10 kronor eftersom totalsumman inte kan överstiga 100 kronor. De tre första summorna är vi fria att variera men de sista är låst av att totalbeloppet inte får överstiga 100 kronor. Vi har 4-1=3 frihetsgrader. Test av medelvärde när är okänd - den sanna populationens standardavvikelse skattas från standardavvikelsen i stickprovet - s Standard error (S.E.) skattas från s n och z ersätts med t Vikt hos 5 veckor gamla vargvalpar n Antal obseravtioner Stickprov 3 3.2 4.2 5.2 4.4 3.6 4.9 3.9 5.2 5.2 3.2 4.3 x = 4.3 Median = 4.3 3.2 Typvärde = 5.2 = 0.7668 3.6 3.9 4.2 4.3 4.4 4.9 5.2 Vikt visades på tavlan 0.60 Standardavvikelsen = s = s2 1 0 Observerade vikter Data från exempel från dag 1: 3.2 t-test för μ=4.0 och 95%-konfidensintervall 3.6 3.9 2 Variansen = s = 4.2 4.3 (xi-x)2 4.4 = 0.588 4.9 n-1 5.2 2 0.80 Konfidensintervall Ett intervall som med en viss sannolikhet täcker den parameter vi är intresserade av att skatta (t.ex. µ). Ett 95% konfidensintervall täcker med 95% sannolikhet populationens µ. Med hjälp av konfidensintervall kan vi med viss säkerhet fastställa medelvärdet för populationen Beräkningen av konfidensintervall bygger på centrala gränsvärdessatsen. Den centrala gränsvärdessatsen möjliggör användande av normalfördelningen för att skapa konfidensintervall för populationsmedelvärdet. Den centrala gränsvärdessatsen säger att om stickprov av en given storlek dras ur en population så kommer fördelningen av stickprovsmedelvärdena (samplingsfördelningen) att likna en normalfördelning. Denna fördelning blir mer lik normalfördelningen ju större stickprovet det är. Om stickprovet är litet används t-fördelningen som liknar normalfördelningen men justerar för små stickprov (se t-tabellen).
© Copyright 2024