här

Avd. Matematisk statistik
TENTAMEN I SF1901, SANNOLIKHETSTEORI OCH STATISTIK,
ONSDAGEN DEN 28:E OKTOBER 2015 KL 8.00–13.00.
Kursledare: Tatjana Pavlenko, 08- 790 84 66, Björn Olof Skytt 08-790 86 49.
Tillåtna hjälpmedel : Formel- och tabellsamling i Matematisk statistik, Mathematics Handbook
(Beta), Hjälpreda för miniräknare, räknare.
Införda beteckningar skall förklaras och definieras. Resonemang och uträkningar skall vara så
utförliga och väl motiverade att de är lätta att följa. Numeriska svar skall anges med minst
två siffrors noggrannhet. Tentamen består av 6 uppgifter. Varje korrekt lösning ger 10 poäng.
Gränsen för godkänt är preliminärt 24 poäng. Möjlighet att komplettera ges för tentander med,
preliminärt, 22–23 poäng. Tid och plats för komplettering kommer att anges på kursens hemsida.
Det ankommer på dig själv att ta reda på om du har rätt att komplettera.
Poäng från kontrollskrivning och laborationer under kursomgång period 1 HT2015 tillgodoräknas.
Obs! Man måste på denna tentamen erhålla minst 20 poäng (av 60) utan medräknad bonus för
att bonuspoängen skall räknas med.
Tentamen kommer att vara rättad inom tre arbetsveckor från skrivningstillfället och kommer att
finnas tillgänglig på studentexpeditionen minst sju veckor efter skrivningstillfället.
Uppgift 1
a) Vid tillverkning av en viss typ av komponenter kan tre olika typer av fel inträffa, A, B och
C. Av erfarenhet vet man att P (A) = P (B) = P (C) = 0.1 Man vet vidare att felet A och felet
B inträffar oberoende av varandra. Det gäller även att felet A och felet C inträffar oberoende av
varandra. Man vet också att felet B och felet C inte kan inträffa samtidigt.
Vad är sannolikheten att inget av felen inträffar?
(5 p)
b) En förläggare skickar riktad reklam för en viss lärobok till 80% av alla skolor som ska undervisa
motsvarande ämne. 30% av skolorna som fick reklamen använde boken. Det gjorde även 10% av
de som inte fick reklamen.
Vad är sannolikheten att en slumpmässigt utvald skola som använde boken har fått den utskickade
reklamen?
(5 p)
Uppgift 2
Inom ett tunnelprojekt bestäms det att följa upp oplanerade driftstopp under tunneldrivningen.
Det har upprättats en definition av vad som menas med ett oplanerat driftstopp. Enligt definitionen skall minst en av följande saker inträffa: 1) tunneldrivningen stoppas på grund av brister i
säkerheten; 2) tunneldrivningen stoppas på grund av dåliga bergförhållanden; 3) tunneldrivningen
stoppas på grund av ett mekaniskt fel, i ett maskin eller annan utrustning.
Med den definitionen har det visat sig att antalet oplanerade driftstopp per månad inom projektet, betecknat med X, varierar mellan 0 och 3, och kan beskrivas med följande (ofullständiga)
sannolikhetsfördelning: P (X = 0) = 0.25, P (X = 1) = 0.35, P (X = 2) = 0.25.
2
forts tentamen i SF1901 2015-10-28
Antag att antalet driftstopp under en månad är oberoende av motsvarande antal under andra
månader. Bestäm approximativt sannolikheten att det inträffar fler än 100 oplanerade driftstopp
under en femårsperiod. Approximationen skall motiveras.
(10 p)
Uppgift 3
Antag att ytan för en sfär beskrivs av en exponentialfördelad stokastisk variabel X med täthetsfunktion
1
fX (t) = e−t/θ ,
θ
t≥0
där θ > 0 är väntevärdet, θ = E (X). För att skatta ytan θ görs upprepade bestämningar av
sfärens diameter y1 , . . . , yn . Dessa modelleras som utfall av oberoende och likafördelade stokastiska
variabler. (Förhållandet mellan yta och diameter är X = πY 2 .)
a) Visa att täthetsfunktionen för Y är
fY (t) =
2πt −πt2 /θ
e
,
θ
t ≥ 0.
Du förväntas visa dina uträkningar.
(4 p)
b) Baserat på observationerna y1 , . . . , yn tag fram ett uttryck för Maximum-likelihoodskattningen
av θ. Beräkna även denna numeriskt då y1 = 0.20, y2 = 0.25 och y3 = 0.18 centimeter.
(4 p)
c) Avgör om skattningen av θ är väntevärdesriktig?
Motivera svaret genom att visa dina uträkningar.
(2 p)
Uppgift 4
Man vill undersöka om utbytet av en viss kemisk reaktion blir detsamma om reaktionen sker vid
80◦ C i stället för 90◦ C. Man gör fem satser vid varje temperatur och får följande resultat:
Utbyte i procent
◦
80
90◦
49.96
49.62
49.14
50.54
49.30
50.28
52.21
51.28
48.76
48.58
Undersök om utbytet kan sägas skilja sig åt eller ej, när vi kan anta att variationen i utbyte mellan
satser vid respektive temperatur är normalfördelad med en varians som är densamma för de båda
temperaturerna. Välj signifikansnivån 5%. Ange tydligt vilka de uppställda hypoteserna är och
vad slutsatsen är.
(10 p)
Uppgift 5
Ett konsultföretag har konstruerat ett visst telefonkösystem som enligt upphandlarens önskemål
ska fungera på så sätt att när en person ringer upp så ska antalet samtal före i kön vara Poissonfördelat med väntevärdet 2.6. När systemet har varit i drift ett halvår så ringer man upp 200
gånger vid olika slumpmässigt valda tider och får följande resultat:
Antal samtal före i kön
Antal uppringda gånger
0
30
1
42
2
34
3 ≥4
28 66
3
forts tentamen i SF1901 2015-10-28
Testa på signifikansnivån 5% om antalet samtal före i kön kan anses vara Poisson-fördelat med
väntevärde 2.6. Ange tydligt vilka de uppställda hypoteserna är och vad slutsatsen är.
(10 p)
Uppgift 6
För att mäta radonkoncentrationen inom huset (uttryckt i Bq/m3 ) hängs det upp en film som
är känslig för alfa-partiklar. När filmen träffas av en partikel uppstår efter framkallning ett hål
i filmen. För att modellera antalet hål i en film, X, antas det att X följer en Poissonfördelning
med ett väntevärde som är proportionellt mot radonkoncentrationen γ. Antag att x = 27 är en
observation av X ∈ P o(γK) där K = 0.1 för den aktuella mätsituationen.
a) Testa nollhypotesen H0 : γ = 200 Bq/m3 mot H1 : γ > 200 Bq/m3 på den approximativa
signifikansnivån α = 0.05. Approximationen skall motiveras.
Ange tydligt om H0 förkastas eller ej och motivera svaret.
(4 p)
b) Bestäm styrkefunktionen h(γ) för testet i a).
(6 p)
Avd. Matematisk statistik
LÖSNINGSFÖRSLAG TENTAMEN I SF1901, MATEMATISK STATISTIK.
ONSDAGEN DEN 28:E OKTOBER 2015 KL 8.00–13.00
Uppgift 1
a) P(inget fel inträffar) = 1-P(minst ett fel inträffar) = 1-P (A ∪ B ∪ C)
P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B) − P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C)=
=[ Det gäller att A och B är oberoende samt att A och C är oberoende]=
=P (A) + P (B) + P (C) − P (A)P (B) − P (A)P (C) − P (B ∩ C) + P (A)P (B ∩ C)=
=[B och C är disjunkta]=P (A) + P (B) + P (C) − P (A)P (B) − P (A)P (C) − 0 + P (A) · 0) =
= 0.1 + 0.1 + 0.1 − 0.1 · 0.1 − 0.1 · 0.1 = 0.28
P(inget fel inträffar) blir då 1-0.28=0.72
Svar: P(inget fel inträffar) =0.72
b) Låt R beteckna händelsen att skolan fått den riktade reklamen för boken och låt A beteckna
händelsen att skolan använder boken i undervisningen. Då söker vi P (R|A).
P (R|A) =
=
P (R ∩ A)
P (R ∩ A)
=
=
P (A)
P (R ∩ A) + P (R ∩ A∗ )
0.3 · 0.8
24
P (A|R)P (R)
=
=
= 0.923
∗
∗
P (A|R)P (R) + P (A|R )P (R )
0.3 · 0.8 + 0.1 · 0.2
26
Svar: Den sökta sannolikheten är 0.923
Uppgift 2
X betecknar antal driftstopp per månad. För att få den fullständiga fördelningen av X behöver
vi pX (3) = P (X = 3). Detta fås genom
P (X = 3) = 1 − (P (X = 0) + P (X = 1) + P (X = 2)) = 0.15.
Låt nu Xi vara antal driftstopp under månad i, i = 1, . . . , 60. Det totala antalet driftstopp under en
femårsperiod, Y = X1 + X2 + · · · + X60 är då enligt centrala gränsvärdessatsen (många månader,
oberoende Xi med samma fördelning) approximativt Normalfördelad, N (E(Y ), D(Y )). För att
bestämma E(Y ) och D(Y ) behöver vi E(Xi ) och D(Xi ):
E(Xi ) = 0 · 0.25 + 1 · 0.35 + 2 · 0.25 + 3 · 0.15 = 1.3.
p
V (Xi ) = E(Xi2 ) − (E(Xi ))2 = 1.01, D(Xi ) = V (Xi ) = 1.005.
2
forts tentamen i SF1901 2015-10-28
√
Nu får vi den approximativa fördelningen för Y som N (60 · 1.3, 60 · 1.005) = N (78, 7.785). Den
sökta sannolikheten blir
!
!
60
60
X
X
100 − 78
P (Y > 100) = P
Xi > 100 = 1−P
Xi ≤ 100 ≈ 1−Φ
= 1−0.9976 = 0.0024.
7.785
i=1
i=1
Svar: P (Y > 100) ≈ 0.0024.
Uppgift 3
p
a) Med Y = X/π så har Y fördelningsfunktionen
p
FY (t) = P (Y ≤ t) = P
X/π ≤ t = P X ≤ πt2 = FX (πt2 )
dvs täthetsfunktionen
fY (t) =
d
d
2πt −πt2 /θ
FY (t) = FX (πt2 ) = fX (πt2 )2πt =
e
dt
dt
θ
för t ≥ 0.
b) ML-skattningen av θ är det värde som maximerar
L(θ) = fY1 (y1 ) · · · fYn (yn ) =
2πyn −πyn2 /θ (2π)n (y1 · · · yn ) − π Pni=1 yi2
2πy1 −πy12 /θ
e
···
e
=
e θ
.
θ
θ
θn
Det är samma värde som maximerar
ln(L(θ)) = ln((2π)n (y1 · · · yn )) − n ln(θ) −
n
πX 2
y .
θ i=1 i
Lösning av
"
#
n
n
d
n
π X 2 −n
πX 2
0=
ln(L(θ)) = − + 2
y = 2 θ−
y
dθ
θ θ i=1 i
θ
n i=1 i
P
ger ML-skattningen θ∗ obs = πn ni=1 yi2 .
För de tre observationerna y1 = 0.20, y2 = 0.25 och y3 = 0.18 fås skattningen
θ∗ obs =
Svar: θ∗ obs =
π
n
Pn
i=1
π
(0.202 + 0.252 + 0.182 ) = 0.14 cm2 .
3
yi2 , θ∗ obs = 0.14cm2
c) Nu är
n
θ∗ =
n
πX 2
1X
Yi =
Xi = X
n i=1
n i=1
där X1 , . . . , Xn är exponentialfördelade med väntevärde θ. Alltså är E (θ∗ ) = θ och skattningen
θ∗ obs är väntevärdesriktig.
Svar: θ∗ obs är väntevärdesriktig.
3
forts tentamen i SF1901 2015-10-28
Uppgift 4
Låt x1 , . . . , x5 och y1 , . . . , y5 vara de uppmätta utbytena hos satserna vid 80◦ C respektive 90◦ C.
Dessa är observationer av stokastiska variabler X1 , . . . , X5 respektive Y1 , . . . , Y5 (alla oberoende),
med fördelningar N(µX , σ) respektive N(µY , σ).
Detta är hypotesprövning med två oberoende stickprov. Vi ställer upp hypoteserna H0 och H1
H0 : µX = µY
H1 : µX 6= µY
Vi bildar konfidensintervallet
IµX −µY
r
1
1
= x̄ − ȳ ± tα/2 (nX + nY − 2) · s ·
+
nX nY
där
(nX − 1)s2X + (nY − 1)s2Y
.
nX + nY − 2
Med nX = nY = 5, x̄ = 49.87, ȳ = 50.06, sX = 1.376, sY = 1.0919, t0.025 (8) = 2.31 får vi
IµY −µX = (0.19 ± 1.77). Eftersom 0 ingår i konfidensintervallet kan man inte förkasta H0 på
signifikansnivån 5%. Detta innebär att man med 5% felrisk inte kan påstå att det föreligger
systematisk skillnad mellan de två temperaturerna vad gäller utbytet av den kemiska reaktionen.
Svar: En påvisbar skillnad kan inte styrkas på risknivån 5 %.
s2 =
Uppgift 5
Låt pi vara sannolikheten för att det är i samtal före i kön när man ringer upp, i = 0, . . . , 3, och
p4 = 1 − (p0 + · · · + p3 ). Vi vill testa
H0 : pi =
µi −µ
e , i = 0, . . . , 3, och p4 = 1 − (p0 + · · · + p3 )
i!
för µ = 2.6, ty väntevärdet för en Poissonfördelning är µ. Detta ger
Antal uppringda gånger, xi
Sannolikheter pi
Väntevärden npi
0
30
0.07427
14.854
Antal samtal före i kön
1
2
3
42
34
28
0.19311 0.25105 0.21757
38.622 50.210 43.514
≥4
66
0.26400
52.800
200
1
De observerade utfallen xi jämförs med väntevärdena npi med teststorheten
q=
4
X
(xi − npi )2
i=0
npi
= 15.444 + 0.295 + 5.176 + 5.531 + 3.300 = 29.75.
som om H0 är sann är ett utfall från en (approximativt) χ2 (5 − 1) = χ2 (4)-fördelad stokastisk
variabel. Notera att alla npi ≥ 5 så approximationen är tillåten. Ur χ2 (4)-tabell fås att testet som
förkastar H0 då q > χ20.05 = 9.49 har risknivå 5%. Vi observerar utfallet 29.75 > 9.49 och förkastar
H0 , dvs data är inte förenliga med att komma från en Poisson(2.6)-fördelning.
Svar: Data är inte förenliga med att komma från en Poisson(2.6)-fördelning.
4
forts tentamen i SF1901 2015-10-28
Uppgift 6
Ur uppgiftstexten vet vi att antalet hål, X, är Poissonfördelat, X ∈ P o(Kγ), där K = 0.1.
Normalapproximation
är tillåten under H0 eftersom 0.1 · 200 = 20 > 15. Vi har alltså att X ∈
√
N (20, 20) approximativt.
a) Testvariabeln Tobs. (x) =
förkastas.
27−20
√
20
= 1.5652. Eftersom Tobs. (x) = 1.5652 < λ0.05 = 1.64 kan H0 inte
Svar: H0 förkastas ej.
b) Testets styrka ges av
h(γ) = P (H0 förkastas|γ) = P
X − 20
√
≥ λ0.05 |γ
20
√
= P X > 20 + λ0.05 20|γ =
!
√
λ0.05 20 + 20 − 0.1γ
X − 0.1γ
√
√
|standardisera| = P
>
≈
0.1γ
0.1γ
!
!
√
√
0.1γ − λ0.05 20 − 20
λ0.05 20 + 20 − 0.1γ
√
√
=Φ
.
≈1−Φ
0.1γ
0.1γ
Svar: Styrkefunktionen ges av h(γ) = Φ
√
0.1γ−λ√
0.05 20−20
.
0.1γ