TAMS65 - Föreläsning 7 Hypotesprövning forts. Martin Singull MAI - LiU Linköping 24 april, 2015 1 / 31 Innehåll Fö7 I Repetition I Två exempel I Allmänna fallet - Ett stickprov I Allmänna fallet - Två eller flera stickprov 2 / 31 Repetition I Vi prövar en nollhypotes H0 : θ = θ0 med hjälp av en teststorhet t(x1 , . . . , xn ). Vi har med hänsyn till mothypotesen H1 tagit fram ett kritiskt område C och H0 förkastas om t(x1 , . . . , xn ) ∈ C . I Signifikansnivån α = P(H0 förkastas om H0 är sann.) I Styrkan för θ1 är h(θ1 ) = P(H0 förkastas om θ1 är det sanna värdet). 3 / 31 Repetition Styrkan är direkt kopplad till risken för fel av typ II β(θ1 ) = P(H0 inte förkastas om θ1 är det sanna värdet) = 1 − h(θ1 ). Vi kommer att diskutera styrka oftare än risken för fel av typ II. I Styrkefunktionen h(θ) = P(H0 förkastas om θ är det sanna värdet) 4 / 31 Exempel - Skruvar En maskin tillverkar skruvar med diametern 2.0 mm. Varje timme tar man ut 16 skruvar slumpmässigt och mäter deras diametrar, vilket ger observationer x1 , . . . , x16 med vars hjälp man skall kontrollera maskininställningen. Skruvarna får inte bli för tjocka. Modell: xi är observation av Xi = µ + εi , där εi ∼ N(0, 0.2), de s.v. X1 , . . . , X16 är oberoende. Här bygger värdet σ = 0.2 på gammal erfarenhet. 5 / 31 Exempel forts. - Skruvar Då följer att Xi ∼ N(µ, 0.2). Man prövar H0 : µ = 2.0 (Maskinen är rätt inställd.) H1 : µ > 2.0 (Maskinen ger för tjocka skruvar.) mot Beslutsregel: H0 förkastas och maskinen justeras om x̄ > 2.1. Detta bygger på gammal erfarenhet. Notera att µ̂ = x̄. a) Vilken signifikansnivå har man? b) Bestäm styrkefunktionen. 6 / 31 Exempel forts. - Skruvar 7 / 31 Exempel forts. - Skruvar 8 / 31 Exempel forts. - Skruvar 1 0,8 1 N(2.1, 0.05) N(2.0, 0.05) 0,6 0,6 0,4 0,4 0,2 0 1,8 N(2.2, 0.05) N(2.0, 0.05) 0,8 0,2 1,9 2 x 2,1 2,2 2,3 0 1,8 1,9 2 x 2,1 2,2 2,3 Figurerna ovan visar täthetsfunktioner för 0.2 b M = X̄ ∼ N µ, = N(µ, 0.05) 16 och åsködliggör signifikansnivån (svart område) samt styrkan (prickigt område) för de två olika µ-värdena i respektive figur. 9 / 31 Exempel - Bensen Bensen används vid plasttillverkning och frigörs också från olika sorters oljeprodukter. Man har funnit att personer som exponeras för bensen under mer än fem år löper avsevärt högre risk att drabbas av leukemi. Mot denna bakgrund sänktes gränsvärdet i USA från 10 ppm till 1 ppm för ett antal år sedan. I en fabrik exponeras arbetarna för bensen dagligen och hälsovårdsmyndigheterna har därför genomfört mätningar av bensenhalten i luften under en månad och fått 20 mätvärden med medelvärde ȳ = 2.1 ppm och stickprovsstandardavvikelse s = 1.7 ppm. Kan man med någon säkerhet hävda att företaget bryter mot miljöbestämmelserna. Genomför ett test på nivån 0.01. 10 / 31 Exempel forts. - Bensen Lösning: Vi måste först göra en modell för hur variationen i datamaterialet har uppstått. Vi har observationer y1 , . . . , y20 där yi är observation av oberoende s.v. Yi = µ + εi där εi ∼ N(0, σ). Vi vill pröva H0 : µ = 1 (egentligen µ ≤ 1) mot H1 : µ > 1 på nivån 0.01. 11 / 31 Exempel forts. - Bensen Vi har att b = Ȳ ∼ N µ, √σ µ̂ = x̄ = 2.1; och den s.v. M . 20 Det är rimligt att förkasta H0 till förmån för H1 om µ̂ är ”tillräckligt mycket större” än 1. Vad som är ”tillräckligt mycket” beror på variationen d.v.s. på σ 2 och på signifikansnivån. Problemet nu jämfört med det förra exemplet är att variansen σ 2 är okänd. Då går det inte att använda Ȳ som teststorhet. 12 / 31 Exempel forts. - Bensen Teststorhet: t= 2.1 − 1 ȳ − 1 √ = √ = 2.89, s/ 20 1.7/ 20 där 1 är nollhypotesens µ-värde. H0 förkastas om t > a där a ges av 0.01 = P(H0 förkastas om H0 sann) = P(T > a om µ = 1). 13 / 31 Exempel forts. - Bensen σ √ och Då µ = 1 gäller att Ȳ ∼ N 1, 20 T = Ȳ − 1 √ ∼ t(19). S/ 20 Tabell ger a = 2.54. Vi har nu att 2.54 < 2.89. Alltså kan H0 förkastas d.v.s. med felrisk < 1% vågar man påstå att µ > 1. 14 / 31 Exempel forts. - Bensen 15 / 31 Allmänna fallet - Ett stickprov (i) Vi har observationer x1 , . . . , xn av oberoende s.v. X1 , . . . , Xn , där Xi = µ + εi och εi ∼ N(0, σ) H0 : µ = µ0 mot H1 : µ 6= µ0 på nivån α. Vi har en skattning µ̂ = x̄. Det verkar rimligt att jämföra µ̂ och µ0 . σ b = X̄ ∼ N µ0 , √ då H0 är sann. Vi vet att den s.v. M n 16 / 31 Allmänna fallet - Ett stickprov a) σ känd. Teststorhet: z= x̄ − µ0 √ σ/ n Den s.v. Z ∼ N(0, 1) om H0 är sann. H0 förkastas om z < −a eller z > a. Tvåsidigt test pga. H1 . N(0,1) α/2 -a α/2 a 17 / 31 Allmänna fallet - Ett stickprov Om H0 är sann, så är risken att teststorheten av en ren slump hamnar i det kritiska området |z| > a lika med α. Anm. 1 På grund av centrala gränsvärdessatsen använder man z med σ ersatt av s då n ≥ 30, om X1 , . . . , Xn är oberoende med E (Xi ) = µ, men inte normalfördelade. Anm. 2 Då σ 2 är känd kan man också använda x̄ som teststorhet, se exempel ovan. 18 / 31 Allmänna fallet - Ett stickprov b) σ okänd. Teststorhet: t= x̄ − µ0 √ s/ n Den s.v. T ∼ t(n − 1) om H0 är sann. H0 förkastas om t < −b eller t > b. t(n-1) α/2 -b α/2 b Ofta kan man pröva H0 med hjälp av ett konfidensintervall, vars ”utseende” (ensidigt eller tvåsidigt) bestäms av H1 . 19 / 31 Allmänna fallet - Ett stickprov c) H0 : σ 2 = σ02 (där σ02 är ett givet tal) Teststorhet: n 1 X s = (xi − x̄)2 n−1 2 1 Villkoret för att förkasta H0 beror dels på signifikansnivån α dels på mothypotesen H1 . Tex. om vi har H1 : σ 2 > σ02 , så förkastas H0 då s 2 > c. För att bestämma c utnyttjar man att α = P S 2 > c om H0 är sann och (n − 1)S 2 ∼ χ2 (n − 1) om H0 är sann. σ02 20 / 31 Allmänna fallet - Ett stickprov Detta ger att α=P där (n − 1)S 2 (n − 1)c > om H0 är sann , σ02 σ02 (n − 1)c fås ur χ2 (n − 1)-tabell. σ02 Man kan också testa med hjälp av konfidensintervall. Konstruera i så fall ett konfidensintervall för σ 2 med konfidensgrad 1 − α och förkasta H0 om σ02 6∈ Iσ2 . Ensidigt eller tvåsidigt intervall beroende på H1 . 21 / 31 Allmänna fallet - Två eller flera stickprov (ii) Vi har x1 , . . . , xn1 och y1 , . . . , yn2 som är observationer från Xi ∼ N(µ1 , σ1 ) resp. Yj ∼ N(µ2 , σ2 ). a) Om vi vill pröva H0 : µ1 = µ2 ⇐⇒ µ1 − µ2 = 0 så kan vi konstruera ett konfidensintervall för µ1 − µ2 (se Fö4) och förkasta H0 om 0 6∈ Iµ1 −µ2 . Ensidigt eller tvåsidigt intervall beror på H1 . Flera stickprov - jmf. konfidensintervall. Man kan också konstruera en teststorhet på liknande sätt som vid ett stickprov. 22 / 31 Allmänna fallet - Två eller flera stickprov 23 / 31 Allmänna fallet - Två eller flera stickprov b) Jämförelse av varianser. Vi vill pröva H0 : σ12 = σ22 = σ 2 (alternativt σ1 = σ2 = σ). Teststorhet: v= s12 s22 Den s.v. V = (n1 −1)S12 /(n1 σ2 2 (n2 −1)S2 /(n2 σ2 − 1) ∼ F (n1 − 1, n2 − 1) − 1) om H0 är sann, se Fö4. Ensidigt eller tvåsidigt test beror återigen på H1 . 24 / 31 Exempel - Två stickprov Man har två mätserier x1 , . . . , x8 från N(µ1 , σ1 ) och y1 , . . . , y11 från N(µ2 , σ2 ) där samtliga parametrar är okända. Man har beräknat stickprovsstandardavvikelserna och fått s1 = 2.48 och s2 = 5.16. Man vill pröva H0 : σ12 = σ22 mot H1 : σ12 6= σ22 , på nivån 0.05. 25 / 31 Exempel, forts. 26 / 31 Ytterligare synpunkter på hypotesprövning I Observera att hypoteserna ska formuleras innan man sett mätresultaten. Detta leder till att tvåsidiga test är vanligast eftersom man i förväg ofta inte vet ”på vilket håll” man kan tänkas ha skillnad, men kom ihåg (som vi kommer att se) att χ2 -testen senare samt F -testen i regressionsanalysen alltid är ensidiga. I Notera också att signifikant skillnad inte behöver betyda en skillnad som har praktisk betydelse. Om man har mycket stora datamaterial får man ofta ”signifikant avvikelse från nollhypotesen”, men avvikelsen kan vara försumbar ur praktisk synvinkel. Konfidensintervall ger mera nyanserad information. 27 / 31 Exempel I kvalitetsarbetet inom tillverkningsindustrin genomförs en mängd mätningar med vars hjälp man kan avgöra om olika kvalitetskrav är uppfyllda. För en viss kvalitetsvariabel samlar man under en dag in tjugofem oberoende mätvärden x1 , . . . , x25 . Man har undersökt att det är rimligt att anta att de stokastiska variablerna X1 , . . . , X25 är oberoende och att Xi ∼ N(µ, 1.2), där målvärdet är µ = 30. Man prövar på nivån 0.05 H0 : µ = 30 mot H1 : µ > 30. a) Man har fått x̄ = 30.35. Genomför hypotesprövningen. b) För vilka µ-värden är testets styrka minst 0.75? c) Hur många mätvärden borde vi ta om vi vill pröva H0 mot H1 på nivån på nivån 0.05 och om man vill förkasta H0 med en sannolikhet på 0.90 om µ = 31? 28 / 31 Exempel, forts. 29 / 31 Exempel, forts. 30 / 31 Exempel, forts. 31 / 31
© Copyright 2025