Föreläsning 10

Repetition Hypotesprövning Försöksplanering Faktorförsök
Matematisk statistik för
B, K, N, BME och Kemister
Föreläsning 10
Johan Lindström
30 september 2015
Johan Lindström - [email protected]
FMS086/MASB02 F10
1/22
FMS086/MASB02 F10
2/22
Repetition Hypotesprövning Försöksplanering Faktorförsök
Repetition — Inferens för diskret data
Konfidensintervall
Hypotesprövning
Tolkning av hypotesprövning
Försöksplanering
Statistiska undersökningar
Observationsstudier
Kontrollerade experiment
Faktorförsök
2 k-försök
2 2-försök
Exempel
Johan Lindström - [email protected]
Repetition Hypotesprövning Försöksplanering Faktorförsök
Intervall Test
Repetition — Inferens för diskret data
Konfidensintervall
Hypotesprövning
Tolkning av hypotesprövning
Försöksplanering
Statistiska undersökningar
Observationsstudier
Kontrollerade experiment
Faktorförsök
2 k-försök
2 2-försök
Exempel
Johan Lindström - [email protected]
FMS086/MASB02 F10
3/22
Repetition Hypotesprövning Försöksplanering Faktorförsök
Intervall Test
Konfidensintervall
(Kap. 9.1.2 & 9.2.2 & 9.3.2)
Ett konfidensintervall för en parameter θ täcker rätt värde på
θ med sannolikheten 1 − α.
1 − α kallas konfidensgrad. Vanliga värden är 0.95, 0.99 och
0.999.
Normalfördelad skattning, θ∗ ∈ N (θ, V(θ∗ ))
D(θ∗ ) känd:
D(θ∗ ) okänd:
Iθ = θ∗ ± λα/2 D(θ∗ )
Iθ = θ∗ ± tα/2 (f)d(θ∗ )
N (θ, V(θ∗ ))
Normalapproximation, θ∗ ∈
∼
D(θ∗ ) känd:
D(θ∗ ) okänd:
Iθ = θ∗ ± λα/2 D(θ∗ )
Iθ = θ∗ ± λα/2 d(θ∗ )
Johan Lindström - [email protected]
Repetition Hypotesprövning Försöksplanering Faktorförsök
(alltid λ-kvantil)
FMS086/MASB02 F10
2
x1 , . . . , xn observationer av Xi ∈ N μ, σ
Ett 1 − α konfidensintervall för σ2 ges av
=
(n − 1)s2
(n − 1)s2
,
χ2α/2 (n − 1) χ21−α/2 (n − 1)
Johan Lindström - [email protected]
Repetition Hypotesprövning Försöksplanering Faktorförsök
4/22
Intervall Test
Konfidensintervall för σ2 i N μ, σ2
Iσ2
(Ex: CGS)
(Kap. 8.1.2)
!
FMS086/MASB02 F10
5/22
Intervall Test
Hypotestest – Vilken metod?
I
I
Normalfördelad skattning.
σ känd: Vilken som helst.
σ okänd: Direktmetoden kräver t-fördelningens
fördelningsfunktion.
Fördelning där μ∗ = X̄ ∈ N (μ, V(μ∗ )) . . . enl. CGS.
I
I
Vilken som helst
∼
Bin, Po, . . . där D(θ∗ ) innehåller θ.
Direktmetoden Går alltid att använda, ibland med
normalapproximation.
Konfidensmetoden Fungerar inte.
Testkvantitet Kräver normalt normalapproximation.
Vid styrkefunktion är det naturligt att utgå från testkvantitet.
Johan Lindström - [email protected]
FMS086/MASB02 F10
6/22
Repetition Hypotesprövning Försöksplanering Faktorförsök
Intervall Test
Testkvantiter
Antag att vi vill testa H0 : θ = θ0 .
Model
Xi ∈ N μ, σ2
σ känd
Skattning
μ∗ = X̄
σ okänd
X ∈ Bin(n, p)
Xi ∈ Po(μ)
p =
∗
X
n
μ = X̄
∗
T(X)
μ∗ −μ0
D(μ∗ )
μ∗ −μ0
d(μ∗ )
p∗ −p0
D0 (p∗ )
μ∗ −μ0
D0 (μ∗ )
Notera:
D(θ∗ )/d(θ∗ )
√σ
n
√s
q n
p0 (1−p0 )
p μn0
n
kvantil
λ
t(f)
λ
λ
1. Standardavvikelse/medelfel räknas under H0 .
2. Bin och Po fallet kräver normalapproximation.
3. α-kvantil om ensidigt, α/2-kvantil om tvåsidigt.
Johan Lindström - [email protected]
FMS086/MASB02 F10
7/22
FMS086/MASB02 F10
8/22
Repetition Hypotesprövning Försöksplanering Faktorförsök
Repetition — Inferens för diskret data
Konfidensintervall
Hypotesprövning
Tolkning av hypotesprövning
Försöksplanering
Statistiska undersökningar
Observationsstudier
Kontrollerade experiment
Faktorförsök
2 k-försök
2 2-försök
Exempel
Johan Lindström - [email protected]
Repetition Hypotesprövning Försöksplanering Faktorförsök
Hypotestest — Tolkning
Årsmedelvärdet av kvävedioxid i utomhusluft bör inte
överstiga 40 μg/m3 (Miljökvalitetsnorm, 2006–01–01).
I en större svensk stad vill man undersöka om gränsvärdet
överskrids och ett antal mätningar av NO2 görs.
Gatukontoret (som måste vidta åtgärder om normen
överskrids) anser att man bör testa
H0 : μ = 40 μg/m3
mot
H1 : μ > 40 μg/m3
Miljöförvaltningen anser däremot att ett lämpligt test är
H0 : μ = 40 μg/m3
mot
Johan Lindström - [email protected]
H1 : μ < 40 μg/m3
FMS086/MASB02 F10
9/22
Repetition Hypotesprövning Försöksplanering Faktorförsök
Undersökningar Observationsstudier Experiment
Repetition — Inferens för diskret data
Konfidensintervall
Hypotesprövning
Tolkning av hypotesprövning
Försöksplanering
Statistiska undersökningar
Observationsstudier
Kontrollerade experiment
Faktorförsök
2 k-försök
2 2-försök
Exempel
Johan Lindström - [email protected]
Repetition Hypotesprövning Försöksplanering Faktorförsök
FMS086/MASB02 F10
10/22
Undersökningar Observationsstudier Experiment
Statistikteori – översikt
Punktskattning
Hur gör man en bra gissning av en okänd
storhet? Hur vet man att den är bra?
Intervallskattning
Hitta istället ett intervall som täcker den
okända storheten med en given (stor)
sannolikhet.
Hypotestest
Om gissningen blev 0.013, kan rätt värde på
den okända storheten ändå vara 0.01?
Regression
Hur vet vi om två variabler påverkar varandra?
Försöksplanering & Faktorförsök
Hur konstruerar man studier som på bäst sätt
(minst antal mätningar) undersöker effekten av
olika faktorer (behandlingar)?
Johan Lindström - [email protected]
Repetition Hypotesprövning Försöksplanering Faktorförsök
FMS086/MASB02 F10
11/22
Undersökningar Observationsstudier Experiment
Statistiska undersökningar
(Kap. 12.1)
Vi skiljer på två typer av statistiska undersökningar.
Deskriptiv undersökning
Syftar till att beskriva egenskaper hos en population.
Exempel:
I
Skattningar av medelvärde, varians
I
Konfidensintervall för medelvärde, sannolikheter, etc.
Analytisk undersökning
Syftar till att undersöka effekter av olika förklarande variabler
eller faktorer på en population. Exempel:
I
Stickprov i par
I
Regression
Johan Lindström - [email protected]
FMS086/MASB02 F10
13/22
Repetition Hypotesprövning Försöksplanering Faktorförsök
Undersökningar Observationsstudier Experiment
Problem med observationsstudier
1. Vid en undersökning av sjösäkerhet upptäcks ett
positivt samband mellan försäljning av rosevin och
antalet drunkningstillbud.
2. Man finner ett (positivt) samband mellan familjers
utbildningsnivå och risken för Downs syndrom hos
barnen.
3. Suppose you’re trying to help the military decide how
best to armor their planes for future bombing runs.
They let you look over the planes that made it back,
and you note that some areas get shot heavily, while
other areas hardly get shot at all. So, you decide to
increase the armor on the areas that get shot.
Johan Lindström - [email protected]
Repetition Hypotesprövning Försöksplanering Faktorförsök
FMS086/MASB02 F10
14/22
Undersökningar Observationsstudier Experiment
Kontrollerat experiment
(Kap. 12.1.5)
Det finns flera olika metoder för att uppnå ett så bra
experiment som möjligt:
Randomiseras för att förhindra systematiska fel
Homogen population Mindre varians för det lättare att
upptäcka effekter, men kan hindra generella
slutsatser.
Blockindela Dela upp experimentet i grupper och
randomisera inom grupperna.
Efterjustering Tar hänsyn till kovariater.
Replikat Minskar osäkerheten.
Flerfaktorförsök För att upptäcka samspelseffekter.
Johan Lindström - [email protected]
Repetition Hypotesprövning Försöksplanering Faktorförsök
FMS086/MASB02 F10
k
15/22
2
2 -försök 2 -försök Exempel
Repetition — Inferens för diskret data
Konfidensintervall
Hypotesprövning
Tolkning av hypotesprövning
Försöksplanering
Statistiska undersökningar
Observationsstudier
Kontrollerade experiment
Faktorförsök
2 k-försök
2 2-försök
Exempel
Johan Lindström - [email protected]
FMS086/MASB02 F10
16/22
2k -försök 22 -försök Exempel
Repetition Hypotesprövning Försöksplanering Faktorförsök
Faktorförsök
(Kap. 12.2–12.4)
Undersöker hur en responsvariabel påverkas av olika faktorer
när de varieras på olika nivåer.
Ex: Effekten av en kemiskreaktion som funktion av
temperatur och koncentration av en katalysator.
En faktor i taget
Samspelseffekter
1
Koncentration
Koncentration
1
0.5
0
0
25
50
75
Temperatur
0.5
0
100
Johan Lindström - [email protected]
Repetition Hypotesprövning Försöksplanering Faktorförsök
0
25
50
75
Temperatur
100
FMS086/MASB02 F10
17/22
2
k
2 -försök 2 -försök Exempel
2k -försök
(Kap. 12.2)
I ett 2k -försök har man k faktorer som alla kan varieras på 2
nivåer.
Det enklaste fallet är ett
22 -försök
(Kap. 12.3)
22 -försök
I ett
nivåer.
har man 2 faktorer som alla kan varieras på 2
Exempel 22 -försök:
Koncentration
Johan Lindström - [email protected]
Repetition Hypotesprövning Försöksplanering Faktorförsök
Hög
Låg
μ12
μ22
μ11
μ21
Låg Hög
Temperatur
FMS086/MASB02 F10
18/22
2
k
2 -försök 2 -försök Exempel
22 -försök
B
Hög
Låg
μ12
μ11
Låg
μ22
μ21
Hög
A
Enkel effekt Effekten av en faktor om den andra faktorn är
fix.
Huvudeffekt Effekten av en faktor för alla värden på den andra
faktorn.
Samspelseffekten Skillnaden mellan de enkla effekterna.
Johan Lindström - [email protected]
FMS086/MASB02 F10
19/22
Repetition Hypotesprövning Försöksplanering Faktorförsök
2k -försök 22 -försök Exempel
Teckenschema för 22 -försök
Försök
(1)
a
b
ab
A och B låg
A hög
B hög
A och B hög
Respons
μ11
μ21
μ12
μ22
μ
+
+
+
+
A
+
+
B
+
+
AB
+
+
Teckenschema för 23 -försök i formelsamlingen. För
22 -försök använd endast de rader och kolumer med (1), a,
b, och ab.
Johan Lindström - [email protected]
Repetition Hypotesprövning Försöksplanering Faktorförsök
FMS086/MASB02 F10
20/22
2
k
2 -försök 2 -försök Exempel
22 -försök – Effekter
60
60
B−
30
Respons
Respons
B+
B+
B−
B−
Respons
60
30
30
B+
0
−
0
+
−
A
60
Respons
Respons
Respons
−A
30
+
0
+
+
A
60
30
−
B
−
A
60
0
+
0
+
−
B
−A
+
30
0
+
−
B
−A
+
Om responsändringen för en faktor inte beror på nivån av
andra faktorn är faktorerna additiva, och det finns inget
samspel.
Johan Lindström - [email protected]
Repetition Hypotesprövning Försöksplanering Faktorförsök
FMS086/MASB02 F10
k
21/22
2
2 -försök 2 -försök Exempel
Exempel: 22 -försök
Man vill undersöka hur olika typer av konstgödsel påverkar
avkastningen från en vete-odling. Två olika gödsel, ett
kväve och ett fosfor baserat, testas och avkastningen
(ton/ha) mäts.
Ja
4.5
6
Kväve (N)
Nej
4
5
Nej Ja
Fosfor (P)
Bestäm
1. De enkla effekterna av fosfor
2. Huvudeffekterna
3. Samspelseffekterna
Johan Lindström - [email protected]
FMS086/MASB02 F10
22/22