TAMS38 - Föreläsning 3 Enfaktorförsök, Parvisa jämförelser Kursansvarig/examinator: Martin Singull Föreläsningar: Jolanta Pielaszkiewicz Matematisk statistik - Matematiska institutionen Linköpings universitet ”An approximate answer to the right problem is worth a good deal more than an exact answer to an approximate problem.” - John Tukey 10 november, 2015 Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Innehåll Bedömning av modell Simultan konfidensgrad Linjär kombinationer av µi Parvisa jämförelser t-intervall Scheffé’s metod Tukeys metod Tukey-Kramers metod Exempel - Strontiumhalter, Plåttillverkning Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Bedömning av modellen 3 Vi återvänder till det fallet med fixa effekter och observationer yil där de sv. Yil = µ + τi + εil = µi + εil för i = 1, . . . , a, l = 1 . . . , ni , där µ, τi och µi betecknar fixa okända parametrar och den s.v. εil ∼ N (0, σ). Fitted value: Det skattade väntevärdet för varje nivåkombination µ bi = ȳi· kallas för fitted value. Residualerna: De skattade felen eil = yil − ȳi· = yil − µ bi kallas för residualerna och approximerar εil . Med hjälp av dem kan man på olika sätt bedöma om förutsättningarna i modellen verkar vara uppfyllda. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Exempel - Plåttillverkning, forts. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 4 Bedömning av modellen, forts. Då vi vill bedöma om εil har samma standardavvikelse för alla stickproven, kan vi plotta residualerna mot nummer på stickprovet, se datautskrift. För lika stora stickprov ska residualerna ligga i ett horisontellt, jämnbrett band, om σ är konstant. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 5 Bedömning av modellen, forts. I FÖ 1 såg vi hur man kan jämföra två varianser med hjälp av F -test. Om man gör många sådana jämförelser måste man ha en låg signifikansnivå i de enskilda testen för att få en acceptabel simultan nivå. Det finns också övergripande test av lika varianser: Bartletts test och Levenes test, se boken. Dessa finns också i Minitab. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 6 Bedömning av modellen, forts. Då vi vill bedöma om normalfördelningsantagandet är uppfyllt, kan vi göra histogram eller en normalfördelningsplott. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 7 Bedömning av modellen, forts. Då vi vill bedöma om normalfördelningsantagandet är uppfyllt, kan vi göra histogram eller en normalfördelningsplott. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 7 Normalfördelningsplott 8 Låt x1 , . . . , xN vara observationer från N (µ, σ). Ordna dem i storleksordning x(1) ≤ x(2) ≤ . . . ≤ x(N ) . Man kan visa att X(j) − µ j = E Φ σ N +1 Normalfördelningsplotten bygger på idén att x(j) − µ x(j) − µ j j −1 Φ ≈ ⇔ Φ ≈ σ N +1 N +1 σ dvs. att sambandet mellan x(j) och Φ−1 N j+1 är approximativt linjärt. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Normalfördelningsplott, forts. I stället för ”normal score” = j/(N + 1) använder boken (j − 0.5)/N och Minitab (j − 3/8)/(N + 1/4). I en normalfördelningsplott plottas punkterna −1 j − 0.5 x(j) , Φ N (eller annan normal score) och om de sv. Xj ∼ N (µ, σ) ska punkterna ligga ungefär på en rät linje. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 9 Bedömning av modellen, forts. Residualerna kan också plottas mot µ bi , dvs. mot ”fitted value”. Om man får en strutform, dvs. större residualer för stora skattade väntevärden, kan det vara aktuellt att logaritmera värdena innan de analyseras eller utnyttja någon annan transformation. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 10 Transformationer 11 Ibland är det ganska uppenbart att förutsättningen om konstant varians inte är uppfylld. Det är inte ovanligt att det finns en koppling mellan storleken på µi och storleken på σi . Man kan ibland hitta en lämplig transformation genom att studera sambandet mellan µ bi och si , se vidare avsnitt 3.4.3 i boken samt kap 15.1, Box-Cox-metoden. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Simultan konfidensgrad 12 Man genomför ofta enfaktorförsök för att jämföra a metoder. De observerade värdena yil är observationer av sv. Yil = µ + τi + εil = µi + εil , där värdet µi är karakteristiskt för metod nr. i. Om man med ett F-test visat att µi -värdena med stor sannolikhet är olika, vill man ofta fastlägga vilken metod som är bäst. Då gör man parvisa jämförelser mellan olika µi . Det blir a2 = a(a−1) dvs. ofta ganska många jämförelser. Man 2 måste ha kontroll över den totala säkerheten i slutsatserna, tex. den simultana konfidensgraden. (simultan=samtidig) Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Simultan konfidensgrad, forts. 13 Först antar vi att vi har I1 , . . . , I10 som är oberoende konfidensintervall för θ1 , . . . , θ10 vart och ett med konfidensgrad 0.95. Den simultana konfidensgraden för I1 , . . . , I10 är då P (θk ∈ Ik för k = 1, . . . , 10) = 0.9510 ≈ 0.60 stok gränser ober Låg säkerhet! OBS I våra tillämpningar är de olika intervallen oftast inte oberoende. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Simultan konfidensgrad, forts. 14 Låt I1 och I2 vara beroende konfidensintervall för θ1 och θ2 , vart och ett med konfidensgraden 1 − α. Då är den simultana konfidensgraden A1 A2 z }| { z }| { 6 I2 ) P (θ1 ∈ I1 och θ2 ∈ I2 ) = 1 − P (θ1 6∈ I1 eller θ2 ∈ = 1 − P (A1 ∪ A2 ) ≥ 1 − (P (A1 ) + P (A2 )) = 1 − 2α enligt Bonferronis olikhet: P (A1 ∪ A2 ) ≤ P (A1 ) + P (A2 ) '$ '$ A1 A2 &% &% Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Simultan konfidensgrad, forts. Låt I1 , . . . , Ir vara konfidensintervall för θ1 , . . . , θr vart och ett med konfidensgraden 1 − α. Då har I1 , . . . , Ir den simultana konfidensgraden 1 − αsim = P (θk ∈ Ik för k = 1, . . . , r) ≥ 1 − rα enligt Bonferronis olikhet. Den totala risken att något intervall missar sin parameter är αsim ≤ rα. Alltså väljer man α = αsim /r. Exempel Vi skall göra fem konfidensintervall och vill ha simultan konfidensgrad minst 0.95. Då väljer vi som enskild konfidensgrad 1 − 0.05 5 = 0.99. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 15 Linjärkombinationer av µi 16 Vi har skattningsvariabler µ bi = Y i· ∼ N σ µi , √ ni , samt σ 2 -skattningen SS E N −a P med frihetsgrader N − a, där N = a1 ni . s2 = Pa Ofta Pa studerar man linjära kontraster dvs. 1 ci µi där 1 ci = 0. P Vi har då punktskattningen a1 ci ȳi· med skattningsvariabeln v u a a a X X uX σ 2 ci Y i· ∼ N ci µi , t c2i . ni 1 1 Singull, Pielaszkiewicz, MAI - LiU 1 TAMS38 - FÖ 3 17 Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 18 Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Scheffé’s metod 19 Scheffé’s metod: Samtliga intervall v u a a X p uX IPa1 ci µi = ci ȳi· ∓ st c2i /ni · (a − 1)Fα (a − 1, N − a) 1 1 har simultan konfidensgrad minst 1 − α. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Scheffé’s metod, forts. 20 Värdet på Fα (a − 1, N − a) hämtas ur F -tabell enligt ∼ F (a − 1, N − a) α Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Scheffé’s metod, forts. 21 Notera att skattningsvariabeln standardavvikelsen d a X Pa 1 ci Y i· ! ci Y i· 1 har den skattade v u a 2 uX ci = st ni 1 som direkt påverkar intervallängden. Läs om fördelarna i boken. Nackdel: långa intervall. OBS Normalt måste man välja de intressanta kontrasterna innan man sett försöksresultatet, men det behövs inte för Scheffé’s metod. Om man bara är intresserad av enstaka intervall, kan man göra t-intervall på vanligt sätt. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Parvisa jämförelser 22 Ofta är man intresserad av parvisa jämförelser, dvs. att jämföra behandlingsmetoderna två och två. Det gör man genom att konstruera konfidensintervall för de olika differenserna µi − µj . Punktskattning: µ bi − µ bj = ȳi· − ȳj· q 2 Den sv. Y i· − Y j· ∼ N µi − µj , σni + Y i· = 1 Pni Yik , ni k=1 Yik ∼ N (µi , σ) , σ2 nj eftersom Y i. ∼ N µi , √σni , E Y i· − Y j· = E Y i· − E Y j· = µi − µj och σ2 σ2 V ar Y i· − Y j· = V ar Y i· + V ar Y j· = + . ni nj Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Metod 1: t-intervall 23 Antag,att vi är intresserade av alla parvisa skillnader µi − µj dvs. a2 st. Vi har som tidigare σ 2 -skattningen s2 = SSE . N −a Metod 1: t-intervall t-intervall med Bonferroniuppskattning av konfidensgraden. Y i· − Y j· − (µi − µj ) q Hjälpvariabler: ∼ t(N − a). S n1i + n1j Man konstruerar med hjälp av de här t-fördelade hjälpvariablerna Iµi −µj vart och ett med konfidensgraden 1 − α (a2) Då blir den simultana konfidensgraden för alla intervallen ≥ 1 − α. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 . Metod 2: Scheffé’s 24 Man kan också anpassa Scheffé’s metod till det här fallet. Metod 2: Scheffé’s metod Intervallen blir s Iµi −µj = ȳi· − ȳj· ∓ s ! 1 1p (a − 1)Fα (a − 1, N − a) + ni nj som har simultan konfidensgrad ≥ 1 − α. Notera att för metod 1 och metod 2 är det s 1 1 d Y i· − Y j· = s + ni nj som direkt påverkar intervallängden. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Tukey-fördelningen 25 Vi övergår nu till att diskutera Tukeys metod för parvisa jämförelser. Då måste vi anta att n1 = n2 = . . . = na = n, dvs. att stickproven är lika stora. Metoden baseras på Tukey-fördelningen (Studentized range): Låt ξ1 , . . . , ξa och η vara oberoende sv. sådana att ξi ∼ N (0, 1) för i = 1, . . . , a och η ∼ χ2 (f ). Sätt ζ= max |ξi − ξj | i<j p η/f Då har ζ Tukey-fördelning med parametrarna a och f . Jfr. Gossets sats och t-fördelning. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Tukey-fördelningen, forts. 26 Tukeyes metod för parvisa jämförelser av µi bygger på den sv. Y j· −µj −µi max Y i· √ √ − σ/ n σ/ n Y i· − Y j· − (µi − µj ) = i<j √ max i<j S/σ S/ n som har Tukey-fördelning och som bara beror av parametrarna a = antalet ξi (här antalet Y i· ) f = antalet frihetsgrader hos S (här N − a), Y i· − µi √ är oberoende och N (0, 1) och även σ/ n r r S f S2 SSE oberoende av den sv. = /f = /f där 2 σ σ σ2 SSE ∼ χ2 (f ); f = N − a här. σ2 eftersom de sv. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Metod 3: Tukey 27 Genom att utnyttja den Tukeyfördelade hjälpvariabeln ovan och kvantiler qα (a, f ), som ges i Tukey-tabell, får vi Metod 3: Tukeys metod De a2 intervallen Iµi −µj = s ȳi· − ȳj· ∓ qα (a, f ) √ n har simultan konfidensgrad exakt 1 − α Notera att det här är den skattade standardavvikelsen för en √ skattningsvariabel, dvs. d Y i· = s/ n, som direkt påverkar intervallängden tillsammans med tabellvärdet. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 28 Resultatet följer av att Y i· − Y j· − (µi − µj ) √ 1 − α = P max < qα (a, f ) i<j S/ n =P − qα (a, f ) < Y i· − Y j· − (µi − µj ) √ < qα (a, f ) S/ n ! för alla (i, j) : i < j) S S = P Y i· − Y j· − qα (a, f ) √ < µi − µj < Y i· − Y j· + qα (a, f ) √ n n ! för alla (i, j) : i < j Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Metod 3’: Tukey-Kramers 29 OBS Tukeys metod kräver lika stora stickprov. För skilda stickprovsstorlekar finns en modifiering. Metod 3’: Tukey-Kramers metod Intervallen Iµi −µj = s ! 1 qα (a, f ) 1 ·s ȳi· − ȳj· ∓ √ + ni nj 2 har simultan konfidensgrad ungefär 1 − α. q Notera faktorn d Y i· − Y j· = s n1i + n1j och justeringen vid tabellvärdet. Metoden bör inte användas om stickprovsstorlekarna är alltför olika. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 30 Vad ska man välja? • Lika stora stickprov: Välj Tukeys metod om du är intresserad av alla intervallen och vill ha en hög simultan konfidensgrad. (Tukeytabeller finns i formelsamlingen för α = 0.10, 0.05 0.01.) Välj t-intervall med Bonferroniuppskattning av konfidensgraden om du kan tänka dig en lägre konfidensgrad eller om du bara är intresserad av vissa jämförelser. Observera att man måste bestämma sig för vilka jämförelser som är intressanta innan man sett sina data. (Ibland används Duncans multipla test; denna metod rekommenderas inte.) • Olika stora stickprov: Välj t-intervall med Bonferroniuppskattning av konfidensgraden, Schefféintervall eller om stickprovvstorlekarna inte är alltför olika Tukey-Kramers metod. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Exempel - Strontiumhalter från FÖ 2 Vi ska göra parvisa jämförelser av µi och väljer Tukeys metod med simultan konfidensgrad 0.95. Vi har σ 2 -skattningen SSE = 9.7652, 25 dvs. s = 3.125 med frihetsgrad: 25. s Iµi −µj = ȳi − ȳj ∓ q0.05 (5, 25) · √ 6 3.125 = ȳi − ȳj ∓ 4.16 · √ = (ȳi − ȳj ∓ 5.307) . 6 Vi har s2 = ȳ1· = 32.083 ȳ2· = 40.233 ȳ4· = 41 · 100 ȳ3· = 44.083 ȳ5· = 58.300 Vattendrag nr. 1 har signifikant lägre strontiumhalt än de övriga och nr. 5 har signifikant högre. Det finns inga signifikanta skillnader mellan nr. 2, 4 och 3. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 31 Exempel - Strontiumhalter, forts. One-way ANOVA: C6 versus C7 Source C7 Error Total DF 4 25 29 S = 3.125 Level 1 2 3 4 5 N 6 6 6 6 6 SS 2193.44 244.13 2437.57 MS 548.36 9.77 R-Sq = 89.98% Mean 32.083 40.233 44.083 41.100 58.300 StDev 3.205 2.530 3.081 3.666 3.036 F 56.15 P 0.000 R-Sq(adj) = 88.38% Individual 95% CIs For Mean Based on Pooled StDev ---+---------+---------+---------+-----(--*--) (--*---) (--*--) (--*---) (--*--) ---+---------+---------+---------+-----32.0 40.0 48.0 56.0 Pooled StDev = 3.125 Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 32 Exempel - Plåttillverkning från FÖ 2 Vi har ȳ1· = 0.2675, ȳ2· = 0.2267, ȳ3· = 0.2300, ȳ4· = 0.2500 och s2 = SSE 44 = 0.001543, s = 0.0393 med frihetsgrader 44. Vi ska göra parvisa jämförelser mellen laboratorierna och väljer simultan konfidensgrad ungefär 0.95. Största skillnaden mellan ȳi· och ȳj· är ȳ1· − ȳ2· = 0.2675 − 0.2267 = 0.0408 Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 33 Exempel - Plåttillverkning, forts. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 34 Exempel - Plåttillverkning, forts. One-way ANOVA: C5 versus C6 Source C6 Error Total DF 3 44 47 S = 0.03928 Level A B C D N 12 12 12 12 SS 0.01301 0.06789 0.08090 MS 0.00434 0.00154 R-Sq = 16.08% Mean 0.26750 0.22667 0.23000 0.25000 StDev 0.03388 0.04097 0.03438 0.04651 F 2.81 P 0.050 R-Sq(adj) = 10.36% Individual 95% CIs For Mean Based on Pooled StDev --------+---------+---------+---------+(--------*--------) (--------*--------) (--------*--------) (--------*--------) --------+---------+---------+---------+0.225 0.250 0.275 0.300 Pooled StDev = 0.03928 Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 35 Exempel - Plåttillverkning, forts. 36 t-intervall: Det blir 42 = 6 jämförelser. Vi låter varje intervall ha konfidensgraden 0.99. Då blir den simultana konfidensgraden ≥ 0.94. r Iµi −µj = ȳi· − ȳj· ∓ 2.69 · s 1 1 + 12 12 ! = (ȳi· − ȳj· ∓ 1.098s) = (ȳi· − ȳj· ∓ 0.0432) där t = 2.69 ges i t(44)-tabell av villkoret F (t) = 0.995. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Exempel - Plåttillverkning, forts. 37 Schefféintervall: r Iµi −µj = ȳi· − ȳj· ∓ s 1 1 p + · (4 − 1) · 2.82 12 12 ! = (ȳi· − ȳj· ∓ 1.187s) = (ȳi· − ȳj· ∓ 0.0466) där 2.82 = F0.05 (3, 44) med en simultan konfidensgrad ≥ 0.95. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 Exempel - Plåttillverkning, forts. Tukey-intervall: Iµi −µj s √ = ȳi· − ȳj· ∓ · 3.78 12 = (ȳi· − ȳj· ∓ 1.091s) = (ȳi· − ȳj· ∓ 0.0429) där 3.78 = q0.05 (4, 44) med en simultan konfidensgrad exakt 0.95. Då största skillnaden mellan två laboratorier är 0.0408 så kan inga signifikanta skillnader mellan laboratorierna påvisas. Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 38 Exempel - Plåttillverkning, forts. Tukey 95% Simultaneous Confidence Intervals All Pairwise Comparisons among Levels of C6 Individual confidence level = 98.95% C6 = A subtracted from: C6 B C D Lower -0.08370 -0.08036 -0.06036 Center -0.04083 -0.03750 -0.01750 Upper 0.00203 0.00536 0.02536 -+---------+---------+---------+-------(----------*----------) (----------*---------) (----------*---------) -+---------+---------+---------+--------0.080 -0.040 0.000 0.040 C6 = B subtracted from: C6 C D Lower -0.03953 -0.01953 Center 0.00333 0.02333 Upper 0.04620 0.06620 -+---------+---------+---------+-------(----------*----------) (----------*----------) -+---------+---------+---------+--------0.080 -0.040 0.000 0.040 C6 = C subtracted from: C6 D Lower -0.02286 Center 0.02000 Upper 0.06286 -+---------+---------+---------+-------(----------*----------) -+---------+---------+---------+--------0.080 -0.040 0.000 0.040 Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3 39 40 Singull, Pielaszkiewicz, MAI - LiU TAMS38 - FÖ 3
© Copyright 2024