TAMS65 - Föreläsning 12 Test av fördelning Martin Singull MAI - LiU Linköping 19 maj, 2015 1 / 36 Innehåll I Grundläggande χ2 -test I Test av given fördelning I Homogenitetstest 2 / 36 Det grundläggande χ2 -testet Ett slumpmässigt försök kan ge resultaten A1 , . . . , Ak . Vid n oberoende upprepningar inträffade Ai totalt Ni gånger, i = 1, 2, . . . , k. Vi vill pröva H0 : P(Ai ) = pi för i = 1, . . . , k, där p1 , . . . , pk är givna kända tal, mot H1 : P(Ai ) 6= pi för minst ett i bland 1, . . . , k. 3 / 36 Det grundläggande χ2 -testet, forts. Teststorhet: Q= k X (Ni − npi )2 npi i=1 som ofta skrivs Pk i=1 (oi − ei )2 ei ! Avvikelse från H0 visar sig genom stora Q-värden. H0 förkastas alltså om Q > c. 4 / 36 Det grundläggande χ2 -testet, forts. Bakgrunden är, att den k-dimensionella stokastiska variabeln (N1 , . . . , Nk ), då H0 är sann, har multinomialfördelning med parametrarna n, p1 , . . . , pk , och då gäller speciellt att Ni ∼ Bin(n, pi ). I teststorheten jämför vi alltså Ni med dess väntevärde då H0 är sann d.v.s. E(Ni ) = npi . Låga Q-värden tyder på god överensstämmelse mellan Ni och E(Ni ) = npi och då finns det ingen anledning att betvivla nollhypotesen. Man kan visa att den s.v. Q är approx χ2 (k − 1) om H0 är sann. 5 / 36 6 / 36 Det grundläggande χ2 -testet, forts. Förlusten av 1 frihetsgrad beror på att de s.v. N1 , . . . , Nk är Pk beroende 1 Ni = n . χ2 (k − 1) . Den kritiska gränsen c ges alltså i χ2 (k − 1)-tabell. α :::: ::::::: ::::::::::: ::;::::::::: Villkor: Approximationen med χ2 -fördelning fungerar tillfredsställande om npi > 5. Om npi < 5 får man ”slå ihop” fall, se exempel nedan. 7 / 36 Exempel En maskin tillverkar enheter som klassas i fyra kategorier nämligen topkvalitet (T ), hög kvalitet (H), god kvalitet (G ) och dålig kvalitet (D). Av lång erfarenhet vet man att P(T ) = 0.4, P(H) = 0.3, P(G ) = 0.2 och P(D) = 0.1. En ny maskin som tillverkar samma sorts enheter har köpts och 500 enheter tillverkade av denna maskin har fått följande klassningar T 220 H 129 G 91 D 60 Kan man med någon säkerhet hävda att den nya maskinen har en annan fördelning över kvalitetsklasserna än den gamla? Genomför ett lämpligt χ2 -test på nivån 0.05. 8 / 36 Exempel, forts. 9 / 36 Test av en given fördelning Vid test av given fördelning får vi skilja på fallen med diskret respektive kontinuerlig fördelning. Test av en given diskret fördelning Då blir händelserna Ai i allmänhet {X = i}, men vissa Ai måste man slå ihop till större händelser. Viktigt: Alla tänkbara värden på X måste finnas med i någon händelse. 10 / 36 Test av en given fördelning, forts. Test av given kontinuerlig fördelning Man har n observationer x1 , . . . , xn och vill undersöka nollhypotesen H0 att en täthetsfunktion f (x) passar till datamaterialet. Man delar in tallinjen i k stycken intervall (tumregel: antalet intervall ≈ antalet observationer/10), ... ... ai−2 ai−1 ai ai+1 ai+2 räknar hur många observationer som finns i de olika intervallen och får de observerade frekvenserna N1 , . . . , Nk . 11 / 36 Test av en given fördelning, forts. Låt Ai vara händelsen att en observation hamnar i ]ai−1 , ai ] och Z ai pi = f (x)dx, ai−1 där f (x) är täthetsfunktionen som ska prövas. Observera att intervallen måste täcka in hela det område där f (x) 6= 0. Därför kan man behöva intervall av typen (−∞, a1 ] och ]ak−1 , ∞). 12 / 36 Test av en given fördelning, forts. I både fallen ovan gäller att om sannolikhetsfunktionen respektive täthetsfunktionen innehåller okända parametrar, så måste dessa skattas innan man beräknar pi . OBS Man förlorar en frihetsgrad i Q:s χ2 -fördelning för varje skattad parameter i nollhypotesens sannolikhetsfunktion respektive täthetsfunktion. 13 / 36 Exempel I ett datamaterial med 160 observationer har man stickprovsmedelvärdet x̄ = 2.27 och stickprovsstandardavvikelsen s = 2.12. Vi vill undersöka om datamaterialet kan vara normal- fördelat, d.v.s. H0 : Xj ∼ N(µ, σ) mot H1 : Normalfördelningen passar inte. Mätvärdena är givna med en decimal. Genom att utnyttja två decimaler i klassgränserna undviker man problemet att någon observation hamnar precis på klassgränsen. 14 / 36 Exempel, forts. Indelning i fack: Fack ] − ∞, 1.35] ]1.35, 2.75] ]2.75, 4.15] ]4.15, 5.55] ]5.55, 6.95] ]6.95, ∞[ Obs. frekv. Ni 65 52 15 15 9 4 Vi skattar parametrarna i normalfördelningen med µ̂ = x̄ = 2.27 och σ̂ = s = 2.12 för att veta vilken normalfördelning som vi vill jämföra mot. 15 / 36 Exempel, forts. Vi har då följande sannolikheter för de olika facken Xj − µ 1.35 − µ 1.35 − µ ≤ =Φ , p1 = P (Xj ≤ 1.35) = P σ σ σ 1.35 − 2.27 p1 ≈ Φ = Φ(−0.43) = 0.3336, 2.12 Xj − µ 2.75 − µ 1.35 − µ p2 = P (1.35 < Xj ≤ 2.75) = P < ≤ σ σ σ 2.75 − µ 1.35 − µ =Φ −Φ , σ σ 2.75 − 2.27 1.35 − 2.27 −Φ = Φ(0.23) − Φ(−0.43) p2 ≈ Φ 2.12 2.12 = 0.5910 − 0.3336 = 0.2574. 16 / 36 Exempel, forts. Vidare har vi att 4.15 − 2.27 2.75 − 2.27 p3 ≈ Φ −Φ 2.12 2.12 = Φ(0.89) − Φ(0.23) = 0.8133 − 0.5910 = 0.2223, p4 ≈ 0.9394 − 0.8133 = 0.1261, p50 ≈ 0.9864 − 0.9394 = 0.0470 och p60 ≈ 1 − 0.9864 = 0.0136. 17 / 36 Exempel, forts. Vi har nu följande indelning i fack. Fack ] − ∞, 1.35] ]1.35, 2.75] ]2.75, 4.15] ]4.15, 5.55] ]5.55, 6.95] ]6.95, ∞[ Obs. frekv. Ni 65 52 15 15 9 4 Skattad slh. pi ≈ 0.3336 0.2574 0.2223 0.1261 0.0470 0.0136 Förv. frekv. 160pi ≈ 53.4 41.2 35.6 20.2 7.5 2.2 18 / 36 Exempel, forts. Vi måste slå ihop de två sista klasserna och får då observerad frekvens 13 samt p5 ≈ 0.0606 med förväntad frekvens 9.7. Teststorhet: Q= 5 X (Ni − 160pi )2 ≈ 19.73 160pi i=1 Den s.v. Q är approx χ2 (5 − 1 − 2) om H0 är sann, eftersom vi till slut bara har fem klasser och skattade två parametrar. För α = 0.01 får vi den kritiska gränsen 9.22 ur χ2 (2)-tabell. 19.73 > 9.22. Alltså kan H0 förkastas. Datamaterialet kommer med stor sannolikhet inte från normalfördelning. 19 / 36 Anm. Det finns flera andra, ofta effektivare, metoder för att testa normalfördelningsantagandet, men den här metoden bygger direkt på iden att jämföra histogrammet med täthetsfunktionen för normalfördelningen. 20 / 36 Något om att välja sannolikhetsfördelning Om man vill undersöka om en viss sannolikhetsfunktion eller täthetsfunktion passar till ett datamaterial kan man 1a i det diskreta fallet göra ett stolpdiagram och jämföra med den aktuella sannolikhetsfunktionen; 1b i det kontinuerliga fallet göra ett histogram och jämföra med den aktuella täthetsfunktionen, se den inledande föreläsningen; 2 göra χ2 -test av fördelning, men vara försiktig med tolkningen (att H0 inte kan förkastas behöver tex. inte innebära att H0 är sann); 3 utnyttja Kolmogorov-Smirnovs test; 4 använda ”fördelningspapper” (probability plotting) om man har observationer från en kontinuerlig fördelning (detta ingår inte i kursen, men det finns i många datorprogram). 21 / 36 Kolmogorov-Smirnovs test - Ett stickprov Den empiriska fördelningsfunktionen för ett stickprov x1 , . . . , xn ges av n 1X Fn (x) = I{xi ≤x} , n i=1 där I{xi ≤x} ( 1 = 0 om xi ≤ x, annars. Om man vill undersöka om en viss fördelningsfunktion, F (x), passar ett stickprov är det av intresse att titta på differensen |Fn (x) − F (x)| och då speciellt Kolmogorov-Smirnov teststorheten D = maxx |Fn (x) − F (x)|. 22 / 36 Kolmogorov-Smirnovs test, forts. 23 / 36 Kolmogorov-Smirnovs test, forts. För stora värden på n har vi approximativt att P √ ∞ X 2 2 nD ≤ c ≈ 1 − 2 (−1)k−1 e −2k c = H(c). k=1 Ofta ger första termen i serien tillräckligt god approximation av Kolmogorov-Smirnovs test, som leder till följande approximativa test. Förkasta H0 , d.v.s. likhet i fördelning, på nivån α om r 1 α D ≥ − ln . 2n 2 Om man måste skatta parametrar, så fungerar inte denna approximation och man måste använda andra metoder. Det finns tabeller för t.ex. normal- och exponentialfördelning. 24 / 36 Kolmogorov-Smirnovs test - Två stickprov Man kan även testa om två stickprov kommer från samma fördelning med Kolmogorov-Smirnovs test. Beräkna den empiriska fördelningen för de båda stickproven, Fn (x) och Gm (x), och teststorheten D = maxx |Fn (x) − Gm (x)|. Man kan då visa att r P mn D≤t m+n ≈ H(t) och det approximativa testet. Förkasta H0 , d.v.s. likhet i fördelning, på nivån α om r m + n α D≥ − ln 2mn 2 25 / 36 Kolmogorov-Smirnovs test - MATLAB KSTEST Single sample Kolmogorov-Smirnov goodness-of-fit hypothesis test. H = KSTEST(X,CDF,ALPHA,TYPE) performs a Kolmogorov-Smirnov (K-S) test to determine if a random sample X could have the hypothesized, continuous cumulative distribution function CDF. CDF is optional: if omitted or empty, the hypothetical c.d.f is assumed to be a standard normal, N(0,1). ALPHA and TYPE are optional scalar inputs: ALPHA is the desired significance level (default = 0.05); TYPE indicates the type of test (default = ’unequal’). H indicates the result of the hypothesis test: H = 0 => Do not reject the null hypothesis at significance level ALPHA. H = 1 => Reject the null hypothesis at significance level ALPHA. KSTEST2 Two-sample Kolmogorov-Smirnov goodness-of-fit hypothesis test. H = KSTEST2(X1,X2,ALPHA,TYPE) performs a Kolmogorov-Smirnov (K-S) test to determine if independent random samples, X1 and X2, are drawn from the same underlying continuous population. 26 / 36 Test om normalfördelning För att testa normalfördelning kan man använda I Lilliefors test (h = lillietest(x)) - modifiering av Kolmogorov-Smirnovs test med skattade parametrar, eller andra test som man kan visa är bättre (d.v.s. har bättre styrka) t.ex. I Shapiro-Wilks test, I Anderson–Darlings test. 27 / 36 Homogenitetstest Vi vill testa om r försöksserier är homogena i meningen att P(Ai ) för varje i är lika stor för samtliga försöksserier, se boken och formelsamlingen. Tillämpning: Man kan undersöka om r stickprov kommer från samma fördelning. Anm. Det finns också ett så kallat oberoendetest. Det har praktiken samma teststorhet som homogenitetstestet, men den skrivs annorlunda och tolkningen är inte heller densamma. 28 / 36 Exempel - Homogenitetstest TABLE - Sample results of cell phone preferences for male and female users (observed frequencies). Sex Male Female Total Cell phone preferences Android iPhone Windows 20 40 20 30 30 10 50 70 30 Total 80 70 150 H0 : Kvinnor och män föredrar ”Android” med samma sannolikhet p1 , ”iPhone” med samma sannolikhet p2 och ”Windows” med samma sannolikhet p3 . H1 : Skillnad finns i fråga om preferenser. Nivå på testet 0.05. 29 / 36 Exempel - Homogenitetstest, forts. 30 / 36 Exempel - Homogenitetstest, forts. 31 / 36 Exempel - Homogenitetstest I en studie ville man undersöka om inositol (ett ämne som finns i modersmjölk) minskar risken för ögonskador hos för tidigt födda barn, (New England Journal of Medicine, 1992). Studien omfattade 220 för tidigt födda barn som slumpmässigt delades in i två grupper med 110 i varje. Den ena gruppen fick intravenös tillförsel av inositol, medan den andra fick standardbehandlingen. Antalet barn med ögonskador var 14 i inositolgruppen och 29 i den andra. Låt p1 och p2 beteckna riskerna för ögonskador i de båda grupperna. Det är rimligt att anta att barnen får ögonskador oberoende av varandra. Kan man med någon säkerhet hävda att p1 6= p2 ? Besvara frågan med hjälp av ett lämpligt test på nivån 5% eller ett konfidensintervall med konfidensgraden 95% Här kan man konstruera Ip1 −p2 eller göra ett homogenisitetstest. 32 / 36 Exempel, forts. 33 / 36 Hemuppgift 34 / 36 Hemuppgift J F M A M J J A S O N D S:a Ish.sp. 31 24 36 22 19 14 17 19 19 19 10 10 240 Samtl. 61-65 8.1 7.8 9.6 9.7 9.3 8.3 8.2 7.9 8.2 7.8 7.5 7.6 100% Pröva H0 : Ishockyspelarnas födelsedagar har samma fördelning över årets månader som den övriga befolkningens. på nivån 0.01. Svar: Q = 25.75 > 24.72; d.v.s. H0 förkastas. 35 / 36 Fler kurser i Matematisk Statistik I TAMS46 - Sannolikhetslära, fortsättningskurs I TAMS17 - Statistisk teori, fortsättningskurs I TAMS39 - Multivariat statistik I TAMS38 - Försöksplanering och biostatistik I TAMS32 - Stokastiska processer I TAMS29 - Stok. processer för finansmarknadsmodeller Se www.mai.liu.se för mer information. 36 / 36
© Copyright 2024