TAMS65 - Föreläsning 7 Hypotesprövning forts.

TAMS65 - Föreläsning 7
Hypotesprövning forts.
Martin Singull
MAI - LiU
Linköping
24 april, 2015
1 / 31
Innehåll Fö7
I
Repetition
I
Två exempel
I
Allmänna fallet - Ett stickprov
I
Allmänna fallet - Två eller flera stickprov
2 / 31
Repetition
I
Vi prövar en nollhypotes H0 : θ = θ0 med hjälp av en
teststorhet t(x1 , . . . , xn ). Vi har med hänsyn till mothypotesen H1 tagit fram ett kritiskt område C och H0
förkastas om t(x1 , . . . , xn ) ∈ C .
I
Signifikansnivån
α = P(H0 förkastas om H0 är sann.)
I
Styrkan för θ1 är
h(θ1 ) = P(H0 förkastas om θ1 är det sanna värdet).
3 / 31
Repetition
Styrkan är direkt kopplad till risken för fel av typ II
β(θ1 ) = P(H0 inte förkastas om θ1 är det sanna värdet)
= 1 − h(θ1 ).
Vi kommer att diskutera styrka oftare än risken för fel av typ II.
I
Styrkefunktionen
h(θ) = P(H0 förkastas om θ är det sanna värdet)
4 / 31
Exempel - Skruvar
En maskin tillverkar skruvar med diametern 2.0 mm. Varje timme
tar man ut 16 skruvar slumpmässigt och mäter deras diametrar,
vilket ger observationer x1 , . . . , x16 med vars hjälp man skall
kontrollera maskininställningen.
Skruvarna får inte bli för tjocka.
Modell: xi är observation av Xi = µ + εi , där εi ∼ N(0, 0.2), de
s.v. X1 , . . . , X16 är oberoende.
Här bygger värdet σ = 0.2 på gammal erfarenhet.
5 / 31
Exempel forts. - Skruvar
Då följer att Xi ∼ N(µ, 0.2).
Man prövar
H0 : µ = 2.0
(Maskinen är rätt inställd.)
H1 : µ > 2.0
(Maskinen ger för tjocka skruvar.)
mot
Beslutsregel: H0 förkastas och maskinen justeras om x̄ > 2.1.
Detta bygger på gammal erfarenhet. Notera att µ̂ = x̄.
a) Vilken signifikansnivå har man?
b) Bestäm styrkefunktionen.
6 / 31
Exempel forts. - Skruvar
7 / 31
Exempel forts. - Skruvar
8 / 31
Exempel forts. - Skruvar
1
0,8
1
N(2.1, 0.05)
N(2.0, 0.05)
0,6
0,6
0,4
0,4
0,2
0
1,8
N(2.2, 0.05)
N(2.0, 0.05)
0,8
0,2
1,9
2
x
2,1
2,2
2,3
0
1,8
1,9
2
x
2,1
2,2
2,3
Figurerna ovan visar täthetsfunktioner för
0.2
b
M = X̄ ∼ N µ,
= N(µ, 0.05)
16
och åsködliggör signifikansnivån (svart område) samt styrkan
(prickigt område) för de två olika µ-värdena i respektive figur.
9 / 31
Exempel - Bensen
Bensen används vid plasttillverkning och frigörs också från olika
sorters oljeprodukter. Man har funnit att personer som exponeras
för bensen under mer än fem år löper avsevärt högre risk att
drabbas av leukemi. Mot denna bakgrund sänktes gränsvärdet i
USA från 10 ppm till 1 ppm för ett antal år sedan.
I en fabrik exponeras arbetarna för bensen dagligen och hälsovårdsmyndigheterna har därför genomfört mätningar av bensenhalten i luften under en månad och fått 20 mätvärden med
medelvärde ȳ = 2.1 ppm och stickprovsstandardavvikelse
s = 1.7 ppm. Kan man med någon säkerhet hävda att företaget
bryter mot miljöbestämmelserna.
Genomför ett test på nivån 0.01.
10 / 31
Exempel forts. - Bensen
Lösning: Vi måste först göra en modell för hur variationen i datamaterialet har uppstått. Vi har observationer y1 , . . . , y20 där yi är
observation av oberoende s.v.
Yi = µ + εi där εi ∼ N(0, σ).
Vi vill pröva
H0 : µ = 1 (egentligen µ ≤ 1)
mot
H1 : µ > 1
på nivån 0.01.
11 / 31
Exempel forts. - Bensen
Vi har att
b = Ȳ ∼ N µ, √σ
µ̂ = x̄ = 2.1; och den s.v. M
.
20
Det är rimligt att förkasta H0 till förmån för H1 om µ̂ är
”tillräckligt mycket större” än 1.
Vad som är ”tillräckligt mycket” beror på variationen d.v.s. på σ 2
och på signifikansnivån. Problemet nu jämfört med det förra
exemplet är att variansen σ 2 är okänd.
Då går det inte att använda Ȳ som teststorhet.
12 / 31
Exempel forts. - Bensen
Teststorhet:
t=
2.1 − 1
ȳ − 1
√ =
√ = 2.89,
s/ 20
1.7/ 20
där 1 är nollhypotesens µ-värde.
H0 förkastas om t > a där a ges av
0.01 = P(H0 förkastas om H0 sann) = P(T > a om µ = 1).
13 / 31
Exempel forts. - Bensen
σ
√
och
Då µ = 1 gäller att Ȳ ∼ N 1,
20
T =
Ȳ − 1
√ ∼ t(19).
S/ 20
Tabell ger a = 2.54.
Vi har nu att 2.54 < 2.89. Alltså kan H0 förkastas d.v.s. med
felrisk < 1% vågar man påstå att µ > 1.
14 / 31
Exempel forts. - Bensen
15 / 31
Allmänna fallet - Ett stickprov
(i) Vi har observationer x1 , . . . , xn av oberoende s.v. X1 , . . . , Xn ,
där Xi = µ + εi och εi ∼ N(0, σ)
H0 : µ = µ0 mot H1 : µ 6= µ0 på nivån α.
Vi har en skattning µ̂ = x̄. Det verkar
rimligt
att jämföra µ̂ och µ0 .
σ
b = X̄ ∼ N µ0 , √
då H0 är sann.
Vi vet att den s.v. M
n
16 / 31
Allmänna fallet - Ett stickprov
a) σ känd.
Teststorhet:
z=
x̄ − µ0
√
σ/ n
Den s.v. Z ∼ N(0, 1) om H0 är sann.
H0 förkastas om z < −a eller z > a.
Tvåsidigt test pga. H1 .
N(0,1)
α/2
-a
α/2
a
17 / 31
Allmänna fallet - Ett stickprov
Om H0 är sann, så är risken att teststorheten av en ren slump
hamnar i det kritiska området |z| > a lika med α.
Anm. 1 På grund av centrala gränsvärdessatsen använder man z
med σ ersatt av s då n ≥ 30, om X1 , . . . , Xn är oberoende med
E (Xi ) = µ, men inte normalfördelade.
Anm. 2 Då σ 2 är känd kan man också använda x̄ som teststorhet,
se exempel ovan.
18 / 31
Allmänna fallet - Ett stickprov
b) σ okänd.
Teststorhet:
t=
x̄ − µ0
√
s/ n
Den s.v. T ∼ t(n − 1) om H0 är sann.
H0 förkastas om t < −b eller t > b.
t(n-1)
α/2
-b
α/2
b
Ofta kan man pröva H0 med hjälp av ett konfidensintervall, vars
”utseende” (ensidigt eller tvåsidigt) bestäms av H1 .
19 / 31
Allmänna fallet - Ett stickprov
c) H0 : σ 2 = σ02
(där σ02 är ett givet tal)
Teststorhet:
n
1 X
s =
(xi − x̄)2
n−1
2
1
Villkoret för att förkasta H0 beror dels på signifikansnivån α dels
på mothypotesen H1 .
Tex. om vi har H1 : σ 2 > σ02 , så förkastas H0 då s 2 > c.
För att bestämma c utnyttjar man att
α = P S 2 > c om H0 är sann
och
(n − 1)S 2
∼ χ2 (n − 1) om H0 är sann.
σ02
20 / 31
Allmänna fallet - Ett stickprov
Detta ger att
α=P
där
(n − 1)S 2
(n − 1)c
>
om H0 är sann ,
σ02
σ02
(n − 1)c
fås ur χ2 (n − 1)-tabell.
σ02
Man kan också testa med hjälp av konfidensintervall.
Konstruera i så fall ett konfidensintervall för σ 2 med konfidensgrad 1 − α och förkasta H0 om σ02 6∈ Iσ2 . Ensidigt eller tvåsidigt
intervall beroende på H1 .
21 / 31
Allmänna fallet - Två eller flera stickprov
(ii) Vi har x1 , . . . , xn1 och y1 , . . . , yn2 som är observationer från
Xi ∼ N(µ1 , σ1 ) resp. Yj ∼ N(µ2 , σ2 ).
a) Om vi vill pröva
H0 : µ1 = µ2 ⇐⇒ µ1 − µ2 = 0
så kan vi konstruera ett konfidensintervall för µ1 − µ2 (se Fö4) och
förkasta H0 om 0 6∈ Iµ1 −µ2 .
Ensidigt eller tvåsidigt intervall beror på H1 .
Flera stickprov - jmf. konfidensintervall.
Man kan också konstruera en teststorhet på liknande sätt som vid
ett stickprov.
22 / 31
Allmänna fallet - Två eller flera stickprov
23 / 31
Allmänna fallet - Två eller flera stickprov
b) Jämförelse av varianser. Vi vill pröva
H0 : σ12 = σ22 = σ 2 (alternativt σ1 = σ2 = σ).
Teststorhet:
v=
s12
s22
Den s.v.
V =
(n1 −1)S12
/(n1
σ2
2
(n2 −1)S2
/(n2
σ2
− 1)
∼ F (n1 − 1, n2 − 1)
− 1)
om H0 är sann, se Fö4.
Ensidigt eller tvåsidigt test beror återigen på H1 .
24 / 31
Exempel - Två stickprov
Man har två mätserier x1 , . . . , x8 från N(µ1 , σ1 ) och y1 , . . . , y11
från N(µ2 , σ2 ) där samtliga parametrar är okända. Man har
beräknat stickprovsstandardavvikelserna och fått s1 = 2.48 och
s2 = 5.16. Man vill pröva
H0 : σ12 = σ22
mot
H1 : σ12 6= σ22 ,
på nivån 0.05.
25 / 31
Exempel, forts.
26 / 31
Ytterligare synpunkter på hypotesprövning
I
Observera att hypoteserna ska formuleras innan man sett
mätresultaten. Detta leder till att tvåsidiga test är vanligast
eftersom man i förväg ofta inte vet ”på vilket håll” man kan
tänkas ha skillnad, men kom ihåg (som vi kommer att se) att
χ2 -testen senare samt F -testen i regressionsanalysen alltid är
ensidiga.
I
Notera också att signifikant skillnad inte behöver betyda en
skillnad som har praktisk betydelse. Om man har mycket stora
datamaterial får man ofta ”signifikant avvikelse från nollhypotesen”, men avvikelsen kan vara försumbar ur praktisk
synvinkel.
Konfidensintervall ger mera nyanserad information.
27 / 31
Exempel
I kvalitetsarbetet inom tillverkningsindustrin genomförs en mängd
mätningar med vars hjälp man kan avgöra om olika kvalitetskrav är
uppfyllda. För en viss kvalitetsvariabel samlar man under en dag in
tjugofem oberoende mätvärden x1 , . . . , x25 . Man har undersökt att
det är rimligt att anta att de stokastiska variablerna X1 , . . . , X25 är
oberoende och att Xi ∼ N(µ, 1.2), där målvärdet är µ = 30. Man
prövar på nivån 0.05
H0 : µ = 30
mot H1 : µ > 30.
a) Man har fått x̄ = 30.35. Genomför hypotesprövningen.
b) För vilka µ-värden är testets styrka minst 0.75?
c) Hur många mätvärden borde vi ta om vi vill pröva H0 mot H1
på nivån på nivån 0.05 och om man vill förkasta H0 med en
sannolikhet på 0.90 om µ = 31?
28 / 31
Exempel, forts.
29 / 31
Exempel, forts.
30 / 31
Exempel, forts.
31 / 31