TAMS38 - Föreläsning 3 Enfaktorförsök, Parvisa jämförelser

TAMS38 - Föreläsning 3
Enfaktorförsök, Parvisa jämförelser
Kursansvarig/examinator: Martin Singull
Föreläsningar: Jolanta Pielaszkiewicz
Matematisk statistik - Matematiska institutionen
Linköpings universitet
”An approximate answer to the right problem is worth a good deal more than
an exact answer to an approximate problem.” - John Tukey
10 november, 2015
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Innehåll
Bedömning av modell
Simultan konfidensgrad
Linjär kombinationer av µi
Parvisa jämförelser
t-intervall
Scheffé’s metod
Tukeys metod
Tukey-Kramers metod
Exempel - Strontiumhalter, Plåttillverkning
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Bedömning av modellen
3
Vi återvänder till det fallet med fixa effekter och observationer
yil där de sv.
Yil = µ + τi + εil = µi + εil
för i = 1, . . . , a, l = 1 . . . , ni , där µ, τi och µi betecknar fixa
okända parametrar och den s.v. εil ∼ N (0, σ).
Fitted value: Det skattade väntevärdet för varje nivåkombination µ
bi = ȳi· kallas för fitted value.
Residualerna: De skattade felen eil = yil − ȳi· = yil − µ
bi kallas
för residualerna och approximerar εil . Med hjälp av dem kan
man på olika sätt bedöma om förutsättningarna i modellen
verkar vara uppfyllda.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Exempel - Plåttillverkning, forts.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
4
Bedömning av modellen, forts.
Då vi vill bedöma om εil har samma standardavvikelse för alla
stickproven, kan vi plotta residualerna mot nummer på stickprovet, se datautskrift. För lika stora stickprov ska residualerna
ligga i ett horisontellt, jämnbrett band, om σ är konstant.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
5
Bedömning av modellen, forts.
I FÖ 1 såg vi hur man kan jämföra två varianser med hjälp av
F -test. Om man gör många sådana jämförelser måste man ha
en låg signifikansnivå i de enskilda testen för att få en acceptabel simultan nivå.
Det finns också övergripande test av lika varianser: Bartletts
test och Levenes test, se boken. Dessa finns också i Minitab.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
6
Bedömning av modellen, forts.
Då vi vill bedöma om normalfördelningsantagandet är uppfyllt,
kan vi göra histogram eller en normalfördelningsplott.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
7
Bedömning av modellen, forts.
Då vi vill bedöma om normalfördelningsantagandet är uppfyllt,
kan vi göra histogram eller en normalfördelningsplott.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
7
Normalfördelningsplott
8
Låt x1 , . . . , xN vara observationer från N (µ, σ). Ordna dem i
storleksordning x(1) ≤ x(2) ≤ . . . ≤ x(N ) . Man kan visa att
X(j) − µ
j
=
E Φ
σ
N +1
Normalfördelningsplotten bygger på idén att
x(j) − µ
x(j) − µ
j
j
−1
Φ
≈
⇔ Φ
≈
σ
N +1
N +1
σ
dvs. att sambandet mellan x(j) och Φ−1 N j+1 är
approximativt linjärt.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Normalfördelningsplott, forts.
I stället för ”normal score” = j/(N + 1) använder boken
(j − 0.5)/N och Minitab (j − 3/8)/(N + 1/4).
I en normalfördelningsplott plottas punkterna
−1 j − 0.5
x(j) , Φ
N
(eller annan normal score) och om de sv. Xj ∼ N (µ, σ) ska
punkterna ligga ungefär på en rät linje.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
9
Bedömning av modellen, forts.
Residualerna kan också plottas mot µ
bi , dvs. mot ”fitted value”.
Om man får en strutform, dvs. större residualer för stora
skattade väntevärden, kan det vara aktuellt att logaritmera
värdena innan de analyseras eller utnyttja någon annan
transformation.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
10
Transformationer
11
Ibland är det ganska uppenbart att förutsättningen om
konstant varians inte är uppfylld.
Det är inte ovanligt att det finns en koppling mellan
storleken på µi och storleken på σi .
Man kan ibland hitta en lämplig transformation genom att
studera sambandet mellan µ
bi och si , se vidare avsnitt 3.4.3
i boken samt kap 15.1, Box-Cox-metoden.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Simultan konfidensgrad
12
Man genomför ofta enfaktorförsök för att jämföra a metoder. De
observerade värdena yil är observationer av sv.
Yil = µ + τi + εil = µi + εil ,
där värdet µi är karakteristiskt för metod nr. i.
Om man med ett F-test visat att µi -värdena med stor
sannolikhet är olika, vill man ofta fastlägga vilken metod som är
bäst. Då gör man parvisa jämförelser mellan olika µi .
Det blir a2 = a(a−1)
dvs. ofta ganska många jämförelser. Man
2
måste ha kontroll över den totala säkerheten i slutsatserna, tex.
den simultana konfidensgraden. (simultan=samtidig)
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Simultan konfidensgrad, forts.
13
Först antar vi att vi har I1 , . . . , I10 som är oberoende
konfidensintervall för θ1 , . . . , θ10 vart och ett med konfidensgrad
0.95. Den simultana konfidensgraden för I1 , . . . , I10 är då
P (θk ∈
Ik
för k = 1, . . . , 10) = 0.9510 ≈ 0.60
stok gränser
ober
Låg säkerhet!
OBS I våra tillämpningar är de olika intervallen oftast inte
oberoende.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Simultan konfidensgrad, forts.
14
Låt I1 och I2 vara beroende konfidensintervall för θ1 och θ2 ,
vart och ett med konfidensgraden 1 − α. Då är den simultana
konfidensgraden
A1
A2
z }| {
z }| {
6 I2 )
P (θ1 ∈ I1 och θ2 ∈ I2 ) = 1 − P (θ1 6∈ I1 eller θ2 ∈
= 1 − P (A1 ∪ A2 ) ≥ 1 − (P (A1 ) + P (A2 )) = 1 − 2α
enligt Bonferronis olikhet: P (A1 ∪ A2 ) ≤ P (A1 ) + P (A2 )
'$
'$
A1
A2
&%
&%
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Simultan konfidensgrad, forts.
Låt I1 , . . . , Ir vara konfidensintervall för θ1 , . . . , θr vart och ett
med konfidensgraden 1 − α. Då har I1 , . . . , Ir den simultana
konfidensgraden
1 − αsim = P (θk ∈ Ik för k = 1, . . . , r) ≥ 1 − rα
enligt Bonferronis olikhet.
Den totala risken att något intervall missar sin parameter är
αsim ≤ rα. Alltså väljer man α = αsim /r.
Exempel Vi skall göra fem konfidensintervall och vill ha
simultan konfidensgrad minst 0.95. Då väljer vi som enskild
konfidensgrad 1 − 0.05
5 = 0.99.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
15
Linjärkombinationer av µi
16
Vi har skattningsvariabler
µ
bi = Y i· ∼ N
σ
µi , √
ni
,
samt σ 2 -skattningen
SS E
N −a
P
med frihetsgrader N − a, där N = a1 ni .
s2 =
Pa
Ofta
Pa studerar man linjära kontraster dvs. 1 ci µi där
1 ci = 0.
P
Vi har då punktskattningen a1 ci ȳi· med skattningsvariabeln
v


u a
a
a
X
X
uX σ 2
ci Y i· ∼ N 
ci µi , t
c2i  .
ni
1
1
Singull, Pielaszkiewicz, MAI - LiU
1
TAMS38 - FÖ 3
17
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
18
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Scheffé’s metod
19
Scheffé’s metod:
Samtliga intervall
v


u a
a
X
p
uX
IPa1 ci µi = 
ci ȳi· ∓ st
c2i /ni · (a − 1)Fα (a − 1, N − a)
1
1
har simultan konfidensgrad minst 1 − α.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Scheffé’s metod, forts.
20
Värdet på Fα (a − 1, N − a) hämtas ur F -tabell enligt
∼ F (a − 1, N − a)
α
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Scheffé’s metod, forts.
21
Notera att skattningsvariabeln
standardavvikelsen
d
a
X
Pa
1 ci Y i·
!
ci Y i·
1
har den skattade
v
u a 2
uX ci
= st
ni
1
som direkt påverkar intervallängden.
Läs om fördelarna i boken. Nackdel: långa intervall.
OBS Normalt måste man välja de intressanta kontrasterna
innan man sett försöksresultatet, men det behövs inte för
Scheffé’s metod.
Om man bara är intresserad av enstaka intervall, kan man
göra t-intervall på vanligt sätt.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Parvisa jämförelser
22
Ofta är man intresserad av parvisa jämförelser, dvs. att jämföra
behandlingsmetoderna två och två. Det gör man genom att
konstruera konfidensintervall för de olika differenserna µi − µj .
Punktskattning: µ
bi − µ
bj = ȳi· − ȳj·
q 2
Den sv. Y i· − Y j· ∼ N µi − µj , σni +
Y i· =
1 Pni
Yik ,
ni k=1
Yik ∼ N (µi , σ) ,
σ2
nj
eftersom
Y i. ∼ N µi , √σni ,
E Y i· − Y j· = E Y i· − E Y j· = µi − µj
och
σ2 σ2
V ar Y i· − Y j· = V ar Y i· + V ar Y j· =
+ .
ni
nj
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Metod 1: t-intervall
23
Antag,att vi är intresserade av alla parvisa skillnader µi − µj
dvs. a2 st.
Vi har som tidigare σ 2 -skattningen s2 =
SSE
.
N −a
Metod 1: t-intervall
t-intervall med Bonferroniuppskattning av konfidensgraden.
Y i· − Y j· − (µi − µj )
q
Hjälpvariabler:
∼ t(N − a).
S n1i + n1j
Man konstruerar med hjälp av de här t-fördelade hjälpvariablerna Iµi −µj vart och ett med konfidensgraden 1 −
α
(a2)
Då blir den simultana konfidensgraden för alla intervallen
≥ 1 − α.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
.
Metod 2: Scheffé’s
24
Man kan också anpassa Scheffé’s metod till det här fallet.
Metod 2: Scheffé’s metod
Intervallen blir
s
Iµi −µj =
ȳi· − ȳj· ∓ s
!
1
1p
(a − 1)Fα (a − 1, N − a)
+
ni nj
som har simultan konfidensgrad ≥ 1 − α.
Notera att för metod 1 och metod 2 är det
s
1
1
d Y i· − Y j· = s
+
ni nj
som direkt påverkar intervallängden.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Tukey-fördelningen
25
Vi övergår nu till att diskutera Tukeys metod för parvisa jämförelser. Då måste vi anta att n1 = n2 = . . . = na = n, dvs. att
stickproven är lika stora. Metoden baseras på
Tukey-fördelningen (Studentized range):
Låt ξ1 , . . . , ξa och η vara oberoende sv. sådana att ξi ∼ N (0, 1)
för i = 1, . . . , a och η ∼ χ2 (f ). Sätt
ζ=
max |ξi − ξj |
i<j
p
η/f
Då har ζ Tukey-fördelning med parametrarna a och f . Jfr.
Gossets sats och t-fördelning.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Tukey-fördelningen, forts.
26
Tukeyes metod för parvisa jämförelser av µi bygger på den sv.
Y j· −µj −µi
max Y i· √
√ −
σ/ n
σ/ n
Y i· − Y j· − (µi − µj ) = i<j
√
max i<j
S/σ
S/ n
som har Tukey-fördelning och som bara beror av parametrarna
a = antalet ξi
(här antalet Y i· )
f = antalet frihetsgrader hos S
(här N − a),
Y i· − µi
√
är oberoende och N (0, 1) och även
σ/ n
r
r
S
f S2
SSE
oberoende av den sv. =
/f =
/f där
2
σ
σ
σ2
SSE
∼ χ2 (f ); f = N − a här.
σ2
eftersom de sv.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Metod 3: Tukey
27
Genom att utnyttja den Tukeyfördelade hjälpvariabeln ovan och
kvantiler qα (a, f ), som ges i Tukey-tabell, får vi
Metod 3: Tukeys metod
De a2 intervallen
Iµi −µj =
s
ȳi· − ȳj· ∓ qα (a, f ) √
n
har simultan konfidensgrad exakt 1 − α
Notera att det här är den skattade
standardavvikelsen för en
√
skattningsvariabel, dvs. d Y i· = s/ n, som direkt påverkar
intervallängden tillsammans med tabellvärdet.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
28
Resultatet följer av att
Y i· − Y j· − (µi − µj ) √
1 − α = P max < qα (a, f )
i<j
S/ n
=P
− qα (a, f ) <
Y i· − Y j· − (µi − µj )
√
< qα (a, f )
S/ n
!
för alla (i, j) : i < j)
S
S
= P Y i· − Y j· − qα (a, f ) √ < µi − µj < Y i· − Y j· + qα (a, f ) √
n
n
!
för alla (i, j) : i < j
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Metod 3’: Tukey-Kramers
29
OBS Tukeys metod kräver lika stora stickprov. För skilda
stickprovsstorlekar finns en modifiering.
Metod 3’: Tukey-Kramers metod
Intervallen
Iµi −µj =
s
!
1
qα (a, f )
1
·s
ȳi· − ȳj· ∓ √
+
ni nj
2
har simultan konfidensgrad ungefär 1 − α.
q
Notera faktorn d Y i· − Y j· = s n1i + n1j och justeringen vid
tabellvärdet. Metoden bör inte användas om stickprovsstorlekarna är alltför olika.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
30
Vad ska man välja?
• Lika stora stickprov: Välj Tukeys metod om du är intresserad
av alla intervallen och vill ha en hög simultan konfidensgrad.
(Tukeytabeller finns i formelsamlingen för α = 0.10, 0.05 0.01.)
Välj t-intervall med Bonferroniuppskattning av konfidensgraden
om du kan tänka dig en lägre konfidensgrad eller om du bara är
intresserad av vissa jämförelser.
Observera att man måste bestämma sig för vilka jämförelser
som är intressanta innan man sett sina data. (Ibland används
Duncans multipla test; denna metod rekommenderas inte.)
• Olika stora stickprov: Välj t-intervall med Bonferroniuppskattning av konfidensgraden, Schefféintervall eller om stickprovvstorlekarna inte är alltför olika Tukey-Kramers metod.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Exempel - Strontiumhalter från FÖ 2
Vi ska göra parvisa jämförelser av µi och väljer Tukeys metod
med simultan konfidensgrad 0.95.
Vi har σ 2 -skattningen
SSE
= 9.7652,
25
dvs. s = 3.125 med frihetsgrad: 25.
s
Iµi −µj = ȳi − ȳj ∓ q0.05 (5, 25) · √
6
3.125
= ȳi − ȳj ∓ 4.16 · √
= (ȳi − ȳj ∓ 5.307) .
6
Vi har
s2 =
ȳ1· = 32.083 ȳ2· = 40.233 ȳ4· = 41 · 100 ȳ3· = 44.083 ȳ5· = 58.300
Vattendrag nr. 1 har signifikant lägre strontiumhalt än de övriga
och nr. 5 har signifikant högre. Det finns inga signifikanta
skillnader mellan nr. 2, 4 och 3.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
31
Exempel - Strontiumhalter, forts.
One-way ANOVA: C6 versus C7
Source
C7
Error
Total
DF
4
25
29
S = 3.125
Level
1
2
3
4
5
N
6
6
6
6
6
SS
2193.44
244.13
2437.57
MS
548.36
9.77
R-Sq = 89.98%
Mean
32.083
40.233
44.083
41.100
58.300
StDev
3.205
2.530
3.081
3.666
3.036
F
56.15
P
0.000
R-Sq(adj) = 88.38%
Individual 95% CIs For Mean Based on
Pooled StDev
---+---------+---------+---------+-----(--*--)
(--*---)
(--*--)
(--*---)
(--*--)
---+---------+---------+---------+-----32.0
40.0
48.0
56.0
Pooled StDev = 3.125
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
32
Exempel - Plåttillverkning från FÖ 2
Vi har ȳ1· = 0.2675, ȳ2· = 0.2267, ȳ3· = 0.2300, ȳ4· = 0.2500 och
s2 =
SSE
44
= 0.001543, s = 0.0393 med frihetsgrader 44.
Vi ska göra parvisa jämförelser mellen laboratorierna och väljer
simultan konfidensgrad ungefär 0.95.
Största skillnaden mellan ȳi· och ȳj· är
ȳ1· − ȳ2· = 0.2675 − 0.2267 = 0.0408
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
33
Exempel - Plåttillverkning, forts.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
34
Exempel - Plåttillverkning, forts.
One-way ANOVA: C5 versus C6
Source
C6
Error
Total
DF
3
44
47
S = 0.03928
Level
A
B
C
D
N
12
12
12
12
SS
0.01301
0.06789
0.08090
MS
0.00434
0.00154
R-Sq = 16.08%
Mean
0.26750
0.22667
0.23000
0.25000
StDev
0.03388
0.04097
0.03438
0.04651
F
2.81
P
0.050
R-Sq(adj) = 10.36%
Individual 95% CIs For Mean Based on
Pooled StDev
--------+---------+---------+---------+(--------*--------)
(--------*--------)
(--------*--------)
(--------*--------)
--------+---------+---------+---------+0.225
0.250
0.275
0.300
Pooled StDev = 0.03928
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
35
Exempel - Plåttillverkning, forts.
36
t-intervall:
Det blir 42 = 6 jämförelser. Vi låter varje intervall ha
konfidensgraden 0.99. Då blir den simultana konfidensgraden
≥ 0.94.
r
Iµi −µj =
ȳi· − ȳj· ∓ 2.69 · s
1
1
+
12 12
!
= (ȳi· − ȳj· ∓ 1.098s) = (ȳi· − ȳj· ∓ 0.0432)
där t = 2.69 ges i t(44)-tabell av villkoret F (t) = 0.995.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Exempel - Plåttillverkning, forts.
37
Schefféintervall:
r
Iµi −µj =
ȳi· − ȳj· ∓ s
1
1 p
+
· (4 − 1) · 2.82
12 12
!
= (ȳi· − ȳj· ∓ 1.187s) = (ȳi· − ȳj· ∓ 0.0466)
där 2.82 = F0.05 (3, 44) med en simultan konfidensgrad ≥ 0.95.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
Exempel - Plåttillverkning, forts.
Tukey-intervall:
Iµi −µj
s
√
= ȳi· − ȳj· ∓
· 3.78
12
= (ȳi· − ȳj· ∓ 1.091s) = (ȳi· − ȳj· ∓ 0.0429)
där 3.78 = q0.05 (4, 44) med en simultan konfidensgrad exakt
0.95.
Då största skillnaden mellan två laboratorier är 0.0408
så kan inga signifikanta skillnader mellan laboratorierna
påvisas.
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
38
Exempel - Plåttillverkning, forts.
Tukey 95% Simultaneous Confidence Intervals
All Pairwise Comparisons among Levels of C6
Individual confidence level = 98.95%
C6 = A subtracted from:
C6
B
C
D
Lower
-0.08370
-0.08036
-0.06036
Center
-0.04083
-0.03750
-0.01750
Upper
0.00203
0.00536
0.02536
-+---------+---------+---------+-------(----------*----------)
(----------*---------)
(----------*---------)
-+---------+---------+---------+--------0.080
-0.040
0.000
0.040
C6 = B subtracted from:
C6
C
D
Lower
-0.03953
-0.01953
Center
0.00333
0.02333
Upper
0.04620
0.06620
-+---------+---------+---------+-------(----------*----------)
(----------*----------)
-+---------+---------+---------+--------0.080
-0.040
0.000
0.040
C6 = C subtracted from:
C6
D
Lower
-0.02286
Center
0.02000
Upper
0.06286
-+---------+---------+---------+-------(----------*----------)
-+---------+---------+---------+--------0.080
-0.040
0.000
0.040
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3
39
40
Singull, Pielaszkiewicz, MAI - LiU
TAMS38 - FÖ 3