Repetition Linjära modellen Föreläsning 10, Matematisk statistik för M Erik Lindström 27 april 2015 Erik Lindström - [email protected] FMS035 F10 1/12 Repetition Linjära modellen Repetition Två Stickprov Stickprov i par Linjära modellen Residualer Erik Lindström - [email protected] FMS035 F10 2/12 Repetition Linjära modellen Två Stickprov Stickprov i par Två Stickprov Antag att man vill jämföra medelvärden μx och μy , då data ges som observationer från X1 , . . . , Xnx ∈ N(μx , σ2 ) och Y1 , . . . , Ynx ∈ N(μy , σ2 ). Vi har att ! 2 2 sigma σ y ¯ − Ȳ ∈ N x̄ − ȳ, x + 6X nx ny Erik Lindström - [email protected] FMS035 F10 3/12 Repetition Linjära modellen Två Stickprov Stickprov i par Stickprov i par Vid många mätsituationer är det vanligt att man mäter före och efter en “behandling” på n inbördes olika föremål. Modell: Före: Xi ∈ N μi , σ21 Efter: Yi ∈ N μi + Δ, σ22 Vi vill nu skatta effekten av behandlingen (Δ). Bilda Zi = Yi − Xi ∈ N Δ, σ21 + σ22 . Erik Lindström - [email protected] FMS035 F10 4/12 Repetition Linjära modellen Residualer Linjär modell Standardmodellen ges av yi = α + βxi + εi = α + βxi + εi ± β x̄ (1) = α̃ + β x̃i + εi (3) = (α + β x̄) + β(xi − x̄) + εi Notera att P i x̃i (2) = 0. Erik Lindström - [email protected] FMS035 F10 5/12 Repetition Linjära modellen Residualer Anpassa parametrar Parametrar anpassas genom att minimera α̂, β̂ = arg min N X i=1 (yi − α − βxi )2 Formler i boken/formelsamplingen Sxx , Sxy , Syy Erik Lindström - [email protected] FMS035 F10 6/12 I detta avsnitt kommer vi illustrera teorin med hjälp av två dataset: mätningarna från Repetition Linjära modellen Residualer exempel 1.1 om bensinförbrukning hos bilar samt mätningar av SO2 -halt i luft. Exempel 2.1. Inom miljöövervakningsprogrammet EMEP har man under en Hoburgen data lång period mätt årsmedelhalter av SO (µg/m ) i Hoburgen på Gotland. I 3 2 figur 3 visas halterna under åren 1990-2001 (källa: IVL Svenska Miljöinstitutet AB, www.ivl.se). 1.8 1.6 1.4 SO2−halt 1.2 1 0.8 0.6 0.4 0.2 0 1990 1992 1994 1996 1998 2000 2002 år Figur 3: Mätningar vid Hoburgen på Gotland y = ”SO2 -halt” (µg/m3 ) är plottad mot x = ”år”. 2.1 Intressanta frågeställningar Det finns en mängd frågeställningar kring den beskrivna situationen som är intressanta: Erik Lindström - [email protected] FMS035 F10 7/12 Repetition Linjära modellen Residualer Bra residualer Residualer mot x 10 5 5 0 0 e e Residualer 10 −5 −5 −10 0 10 20 30 −10 0 1:n Erik Lindström - [email protected] 10 20 30 x FMS035 F10 8/12 Repetition Linjära modellen Residualer Mer bra residualer Probability Normal Probability Plot 0.99 0.98 0.95 0.90 0.75 0.50 0.25 0.10 0.05 0.02 0.01 −5 0 Data Erik Lindström - [email protected] 5 FMS035 F10 9/12 Repetition Linjära modellen Residualer Mindre bra residualer Residualer, kvadratisk trend Residualer mot x, variansen ökar med x 300 100 200 50 e e 100 0 0 −100 −50 0 10 20 30 −200 0 1:n Erik Lindström - [email protected] 10 20 30 x FMS035 F10 10/12 Repetition Linjära modellen Residualer Moores lag - Ingen linjära modell 8 5 x 10 Skattat samband: y = 5.13⋅10−301⋅ e0.35 x 4.5 4 Antal transistorer 3.5 3 2.5 2 1.5 1 0.5 0 1970 1980 1990 2000 Lanseringsår Erik Lindström - [email protected] 2010 FMS035 F10 2020 11/12 Repetition Linjära modellen Residualer Moores lag - Ingen linjära modell Antal transistorer hos Intelprocessorer 9 10 Intel® Itanium® 2 Intel® Itanium® 8 10 Intel® Pentium® 4 Intel® Pentium® III 7 Antal transistorer 10 Intel® Pentium® II Intel® Pentium® Intel486TM 6 10 Intel386TM 5 286 10 8086 4 10 3 10 8080 8008 4004 2 10 1970 1980 1990 2000 Lanseringsår Erik Lindström - [email protected] 2010 FMS035 F10 2020 12/12
© Copyright 2025