TENTAMEN I SF1901, SF1905, SANNOLIKHETSTEORI OCH

Avd. Matematisk statistik
TENTAMEN I SF1901, SF1905, SANNOLIKHETSTEORI OCH STATISTIK,
MÅNDAGEN DEN 17:E AUGUSTI 2015 KL 8.00–13.00.
Kursledare: Tatjana Pavlenko, 08- 790 84 66
Tillåtna hjälpmedel : Formel- och tabellsamling i Matematisk statistik, Mathematics Handbook
(Beta), Hjälpreda för miniräknare, räknare.
Införda beteckningar skall förklaras och definieras. Resonemang och uträkningar skall vara så
utförliga och väl motiverade att de är lätta att följa. Numeriska svar skall anges med minst
två siffrors noggrannhet. Tentamen består av 6 uppgifter. Varje korrekt lösning ger 10 poäng.
Gränsen för godkänt är preliminärt 24 poäng. Möjlighet att komplettera ges för tentander med,
preliminärt, 22–23 poäng. Tid och plats för komplettering kommer att anges på kursens hemsida.
Det ankommer på dig själv att ta reda på om du har rätt att komplettera.
Tentamen kommer att vara rättad inom tre arbetsveckor från skrivningstillfället och kommer att
finnas tillgänglig på studentexpeditionen minst sju veckor efter skrivningstillfället.
Uppgift 1
a) En svart och en röd tärning kastas. Låt A vara händelsen att ögonsumman är 6 och B händelsen
att den svarta tärningen visar 2 ögon. Undersök om A och B är oberoende eller ej. Noggrann
motivering krävs.
(5 p)
b) För en viss region gäller följande: 20% av befolkningen är rökare. Sannolikheten att en rökare
får lungcancer är 10 gånger så hög som att en icke-rökare får lungcancer. Antag att sannolikheten
att få lungcancer för en slumpmässigt vald person är 0.006. Vad är då sannolikheten att en person
får lungcancer givet att personen i fråga är rökare?
(5 p)
Uppgift 2
Erik får i uppgift att addera 120 tal, vardera med 10 decimaler. Av lathet bryr sig Erik dock
inte om decimalerna vid additionen. Antag att decimaldelarna av de 120 talen kan uppfattas
som likformigt fördelade på enhetsintervallet (0, 1) och dessutom oberoende av varandra. Låt X
beteckna felet vid additionen som uppkommer på grund av strykningen av decimalerna (definierad
så att X ≥ 0).
Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50).
(10 p)
Uppgift 3
Man har två observationer, x från X ∈ Exp(1/a), och y från Y ∈ Exp(2/a) där a > 0. X och Y
är oberoende stokastiska variabler.
a) Härled minsta kvadrat-skattningenskattningen a∗M K av parametern a.
(3 p)
b) Härled maximum likelihood-skattningen a∗M L av a.
(3 p)
2
forts tentamen i SF1901, SF1905 2015-08-17
c) Undersök om skattningarna i a) och b) är väntevärdesriktiga. Undersök vidare vilken av a∗M K
och a∗M L som är effektivast? Svaret skall motiveras.
Om du inte har svarat på a) och b) så får du anta i del c) att a∗M K,obs. = 2x+y
och a∗M L,obs. =
2.5
x+2y
.
(4 p)
2
Uppgift 4
I en veckotidning beskrivs en bantningskur som påstås ge en viktminskning av ungefär 7 kg på 14
dagar. En grupp på åtta personer bestämmer sig för att pröva kuren. Deras vikter (i kg) före och
efter genomgången kur ges nedan:
Före
Efter
108 88 82 103 98 100 90 85
110 85 78 101 91 99 90 82
Vikterna kan anses vara observationer av oberoende normalfördelade stokastiska variabler. Det är
dock inte rimligt att anta att samtliga personer har samma förväntad vikt före kuren, eller att de
har samma förväntad vikt efter kuren.
a) Beräkna ett konfidensintervall av grad 95% för den förväntade viktminskningen efter genomgången kur.
(7 p)
b) Testa på signifikansnivån 5% hypotesen att den förväntade viktminskningen är 7 kg. Slutsatsen
av testet skall klart framgå.
(3 p)
Uppgift 5
Inom medicinsk forskning används den så kallade VAS-skalan (Visuell Analog Skala) för att mäta
smärta. Skalan är konstruerad som en 100 mm lång linje på vilken patienten får markera sin
upplevda smärtnivå, varpå resultaten kan analyseras statistiskt. För att undersöka smärtnivån
vid olika typer av kirurgi väljer en kirurg att dela upp VAS-skalan i tre kategorier: låg smärta
(≤ 25) mm, acceptabel smärta 26-74 mm samt hög smärta (≥ 75) mm. Vidare valde kirurgen
slumpmässigt ut 89 patienter vars smärta mättes 48 timmar efter en viss typ av operation. Av
de 89 patienter som valdes ut i stickprovet var 42 som opererades med titthålskirurgi, och resten
med traditionell kirurgi. Följande resultat erhölles.
Titthålskirurgi
Traditionell kirurgi
Låg smärta Accept. smärta Hög smärta
13
23
6
7
28
12
Kan man hävda att smärtnivå skiljer sig åt mellan olika typ av kirurgi? Svara på frågan med hjälp
av ett lämpligt statistiskt test på nivån 5%.
(10 p)
Uppgift 6
Den naturliga bakgrundsstrålningen (uttryckt som antalet registrerade pulser per sekund, Bq)
vid en viss mätpunkt har en intensitet av λ = 1 sek−1 och antalet registrerade pulser under ett
tidsintervall (t1 , t2 ) beskrivs med Poissonfördelning med väntevärde λ(t2 − t1 ). På grund av en
olycka i ett land misstänker man att intensiteten har ökat.
a) Antag att man mäter under 15 sek och därvid registrerar 20 pulser. Pröva hypotesen H0 : λ =
1 sek−1 med ett ensidigt test på nivån 5%.
(2 p)
b) Antag att intensiteten i själva verket har ökat till λ = 1.2 sek−1 . Hur länge skall man mäta för
att ha 50% chans att upptäcka detta om man gör ett approximativt test på nivån 5%.
(8 p)
Avd. Matematisk statistik
LÖSNINGSFÖRSLAG TENTAMEN I SF1901, SF1905, MATEMATISK STATISTIK.
MÅNDAGEN DEN 17:E AUGUSTI 2015 KL 8.00–13.00
Uppgift 1
a) Vi har 36 möjliga utfall, vardera med sannolikheten 1/36. Ur figuren fås: P (A) = 5/36, P (B) =
6/36 = 1/6 och P (A ∩ B) = 1/36. Detta ger att P (A ∩ B) 6= P (A) · P (B), så A och B är inte
oberoende.
Svar: A och B är inte oberoende.
b) Inför beteckningarna R = ”personen är rökare” resp. C = ”personen får cancer”.
Enligt texten är P (R) = 0.2, P (C) = 0.006 och P (C|R) = 10 · P (C|R∗ ).
Lagen om total sannolikhet ger
P (C) = P (C|R)P (R) + P (C|R∗ )P (R∗ )
dvs
0.006 = P (C|R) · 0.2 +
1
P (C|R) · (1 − 0.2) = 0.28 · P (C|R)
10
och således
P (C|R) =
0.006
≈ 0.021.
0.28
Svar: P (C|R) ≈ 0.021.
Uppgift 2
P
Strykningsfelen U1 , U2 , . . . , U120 är oberoende och U(0, 1). Det totala felet X = 120
k=1 Uk är enligt centrala gränsvärdessatsen approximativt normalfördelad med väntevärdet 120/2 = 60 och
variansen 120/12 = 10. Härav
√
P (X > 50) ≈ 1 − Φ((50 − 60)/ 10) = Φ(3.16) = 0.999.
Svar: P (X > 50) ≈ 0.999.
Uppgift 3
För X ∈ Exp(1/a) har vi E(X) = a och respektive för Y ∈ Exp(2/a) är E(Y ) = a/2, se FSM,
avsn. 4.
a) MK-skattningen minimerar Q(a) = (x − E(X))2 + (y − E(Y ))2 = (x − a)2 + (y − a/2)2 . Med
dQ(a)/da = −2(x − a) − 2 · 1/2 · (y − a/2) får man minimum för a = (2x + y)/2.5.
Svar: a∗M K,obs. = (2x + y)/2.5.
b) Likelihoodfunktionen blir
1 x 2 2y
L(a) = e− a · e− a
a
a
2
forts tentamen i SF1901, SF1905 2015-08-17
som ger
ln L(a) = −2 ln a + ln 2 −
x 2y
− .
a
a
Med
d ln L(a)
2
x
2y
=− + 2 + 2 =0
da
a a
a
får man maximum för a = (x + 2y)/2.
Svar: a∗M L,obs. = (x + 2y)/2.
c) Väntevärde och varians för Exp(λ) är 1/λ resp. 1/λ2 . Vi finner för MK-skattningen att
2X + Y
2a + a/2
E
=
= a.
2.5
2.5
För ML-skattningen har vi
E
X + 2Y
2
=
a + 2a/2
= a,
2
dvs både a∗M K och a∗M L är väntevärdesriktiga.
Man finner vidare för MK-skattningen att
17 2
2X + Y
1
2
2
= |X och Y är ober.| =
V
= a,
2 2a + (a/2)
2.5
25
2.5
och för ML-skattningen att
17
X + 2Y
a2
1 2
V
=
a + 4(a/2)2 = a2 = .
2
4
25
2
Svar: Både a∗M K och a∗M L är väntevärdesriktiga. Eftersom V (a∗M K ) > V (a∗M L ) så är a∗M L effektivast.
Uppgift 4
a) Beteckna person nr. i:s vikt före resp. efter genomgången kur med xi resp. yi , för i = 1, . . . , 8.
Vikterna är observationer av stokastiska variabler X1 , . . . , X8 resp. Y1 , . . . , Y8 , och lämpliga modellantaganden är att Xi ∈ N (µi , σ1 ) och Yi ∈ N (µi −∆, σ2 ), för i = 1, . . . , 8, där ∆ är den förväntade
viktminskningen, och alla parametrar är okända (modellen stickprov i par). Vi bildar de parvisa
differenserna Zi = Xi − Yi , och motsvarande observerade
värden zi = xi − yi , för i = 1, . . . , 8. Då
p
är zi en observation av Zi ∈ N (∆, σz ), där σz = σ12 + σ22 . De observerade värdena z1 , . . . , z8 är
−2 3 4 2 7 1 0 3
Eftersom σz är okänt så är
sz
I∆ = z̄ ± tα/2 (n − 1) √
n
ett konfidensintervall för ∆ av grad 1 − α. I vårt fall gäller
z = 2.25
sz = 2.7124
n=8
t0.025 (7) = 2.36
vilket ger
I∆ = 2.25 ± 2.36 ·
2.7124
√
= 2.25 ± 2.26 = (−0.01, 4.51).
8
3
forts tentamen i SF1901, SF1905 2015-08-17
Svar: I∆ = (−0.01, 4.51).
b) Eftersom 7 ∈
/ I∆ , så måste denna hypotes förkastas på nivån 5%.
Uppgift 5
Vi använder ett χ2 -oberoendetest för att pröva nollhypotesen att smärtnivån är oberoende av typ
av kirurgi.
Låt pij vara andelen av hela populationen av patienter som opererades med typ i av kirurgi (i = 1
för titthålskirurgi, i = 2 för traditionell kirurgi) som har upplevt typ j smärtnivån (j = 1 för låg
smärta, och j = 2, 3 för acceptabel resp. hög smärta). Nollhypotesen H0 är nu pij = pi· p·j där
pi· är andelen av hela populationen av patienter som opererades med typ i av kirurgi, och p·j är
andelen av samma hela population som har upplevt smärtnivån j enligt ovan. Mothypotesen H1
är pij 6= pi· p·j för något i och j.
Vi får
i=1
i=2
Totalt
j=1
13
7
20
j=2 j=3
23
6
28
12
51
18
Totalt
42
47
89
Teststorheten blir
(13 − 42 · 20/89)2 (23 − 42 · 51/89)2 (6 − 42 · 18/89)2
Q =
+
+
+
42 · 20/89
42 · 51/89
42 · 18/89
(7 − 47 · 20/89)2 (28 − 47 · 51/89)2 (12 − 47 · 18/89)2
+
+
+
= 4.02
47 · 20/89
47 · 51/89
47 · 18/89
Under H0 är detta en observation från en χ2 -fördelning med (2 − 1)(3 − 1) = 2 frihetsgrad, och
vi skall förkasta H0 för stora värden. Då χ20.05 (2) = 5.991 och 4.02 < 5.991 finns det inte stöd
(på signifikansnivån 5%) för slutsatsen att det finns ett beroende mellan smärtnivån och typ av
kirurgi.
Det går också utmärkt att använda funktionen χ2 -test på räknare, med ”det inre” av tabellen
ovan som indata. Vi får då teststorheten 4.02 som ovan, och p-värdet 0.059. Eftersom p-värdet är
> 0.05 så kan vi inte förkasta nollhypotesen om oberoende på nivån 5%.
Uppgift 6
Låt X(t) vara antalet registrerade pulser under (0, t), enligt uppgift är X(t) ∈ P o(λt).
a) Vi vill testa H0 : λ = 1 mot H1 : λ > 1. Om H0 är sann och t = 15 så är X(t) ∈ P o(15). x = 20
är en uttfall av X. Direktmetoden ger p-värde
P (X > 20|om H0 är sann) = P (X > 20|X ∈ P o(15)) = 1 − P (X ≤ 19) = 1 − 0.8752 = 0.1248.
Eftersom 0.1248 > α = 0.05 kan H0 inte förkastas.
forts tentamen i SF1901, SF1905 2015-08-17
4
√
b) Normalapproximation
ger
X(t)
∈
N
(λt,
λt), approximativt. Om H0 är sann så är X(t) ∈
√
N (t, t). Test: Förkasta H0 om
x(t) − t
√
> λ0.05 = 1.64.
t
Styrkan för λ = 1.2 ges av
X(t) − t
√
0.5 = h(1.2) = P (Förkasta H0 om λ = 1.2) = P
> λ0.05 |λ = 1.2 =
t
√
√
X(t) − 1.2t
λ0.05 t + t − 1.2t
√
√
=
>
P X(t) > t + λ0.05 t|λ = 1.2 = |standardisera| = P
1.2t
1.2t
√
λ0.05 t − 0.2t
√
.
1−Φ
1.2t
Detta ger vidare
√
λ0.05 t − 0.2t
√
0.5 = 1 − Φ
,
1.2t
vilket vi löser för t
√
λ0.05
λ0.05 − 0.2t
√
.
=0⇒ t=
0.2
1.2t
Vi får alltså t = 67.64 sek.