TENTAMEN I SF1901, SANNOLIKHETSTEORI OCH STATISTIK

Avd. Matematisk statistik
TENTAMEN I SF1901, SANNOLIKHETSTEORI OCH STATISTIK,
TISDAGEN DEN 9:E JUNI 2015 KL 14.00–19.00.
Kursledare: Tatjana Pavlenko, 08- 790 84 66
Tillåtna hjälpmedel : Formel- och tabellsamling i Matematisk statistik, Mathematics Handbook
(Beta), Hjälpreda för miniräknare, räknare.
Införda beteckningar skall förklaras och definieras. Resonemang och uträkningar skall vara så
utförliga och väl motiverade att de är lätta att följa. Numeriska svar skall anges med minst
två siffrors noggrannhet. Tentamen består av 6 uppgifter. Varje korrekt lösning ger 10 poäng.
Gränsen för godkänt är preliminärt 24 poäng. Möjlighet att komplettera ges för tentander med,
preliminärt, 22–23 poäng. Tid och plats för komplettering kommer att anges på kursens hemsida.
Det ankommer på dig själv att ta reda på om du har rätt att komplettera.
Poäng från kontrollskrivning och laborationer under kursomgång period 4 VT2015 tillgodoräknas.
Obs! Man måste på denna tentamen erhålla minst 20 poäng (av 60) utan medräknad bonus för
att bonuspoängen skall räknas med.
Tentamen kommer att vara rättad inom tre arbetsveckor från skrivningstillfället och kommer att
finnas tillgänglig på studentexpeditionen minst sju veckor efter skrivningstillfället.
Uppgift 1
(a) För två händelser, A och B, är följande sannolikheter kända
P (A ∪ B) = 0.92,
P (A ∪ B ∗ ) = 0.88,
P (A∗ ∪ B) = 0.68.
Avgör om A och B är oberoende händelser.
(5 p)
(b) Antag att i genomsnitt var tionde bil som passerar Häggvikavfarten på E6 kör för fort och att
olika bilar håller oberoende hastigheter. En polis mäter hastigheten på 15 bilar. Vad är sannolikheten att minst 3 bilar kör för fort?
(5 p)
Uppgift 2
(a) Låt X och Y vara normalfördelade och beroende stokastiska variabler med E(X) = V (X) = 1
och E(Y ) = V (Y ) = 1 samt korrelationskoefficient ρ = −1/4. Bestäm P (X + 2Y ) ≤ 2).
(3 p)
(b) Vid ett försök att bestämma jordaccelerationen g (enhet m/s2 ) vid en viss plats mätte man
hur lång tid det tog för föremål att falla olika kända sträckor. Man erhöll följande mätvärden
Fallsträcka (meter):
Falltid (sekunder):
0.25
0.23
0.50
0.32
0.75
0.39
1.00
0.45
2
forts tentamen i SF1901 2015-06-09
Den förväntade falltiden t och fallsträckan s är relaterade genom sambandet
s=
gt2
.
2
Härled och beräkna med minstakvadratmetoden skattningen av g baserad på ovanstående data
om vi betraktar falltiderna som utfall av oberoende stokastiska variabler med samma varians och
där de enskilda mätningarna av falltiderna saknar systematiska fel.
(7 p)
Uppgift 3
En ideell förening Den Gröna Jorden planerar en insamling för utökning av grönområden runt
fastigheterna. Föreningen skickar därför ett brev till var och en av de 1000 medlemmarna där man
ber om ett bidrag på 50 eller 100 kronor. Man vet från tidigare att 50 och 100 kronors bidrag är
lika vanliga och att 20% av medlemmarna inte ger något bidrag. Bestäm med hjälp en lämplig
och välmotiverad approximation, sannolikheten att föreningens sammanlagda insamling överstiger
58 000 kronor.
(10 p)
Uppgift 4
För att undersöka effekten av två olika rostskyddsmedel, M1 och M2 , behandlades 10 järnstavar
med medel M1 och ytterliggare 10 stavar med medel M2 . På var och en av 10 olika platser grävdes
därefter två stavar ned; en stav med varje behandling. Efter två månader togs alla stavar upp och
graden av rost mättes. Följande mätvärden (i lämplig enhet) erhölls:
Plats:
Medel M1 :
Medel M2 :
1
19.15
21.96
2
23.35
27.70
3
20.10
22.93
4
16.70
19.02
5
6
31.85 17.70
32.26 17.35
7
22.77
27.39
8
21.71
25.43
9
34.06
33.43
10
18.71
18.14
Ange en lämplig statistisk modell baserad på normalfördelning som beskriver data, och undersök
genom att testa en hypotes eller genom att dra slutsatser från ett konfidenintervall, om det finns
någon systematisk skillnad i grad av rost mellan de två rostskyddsmedlen. Välj signifikansnivån
α = 0.05.
(10 p)
Uppgift 5
Vid tillverkning av en viss detalj kan två typer av fel uppstå, A och B. Dessa fel kan dock ej
uppkomma bägge två på en och samma detalj.
I försäljningsspecifikationen för denna detalj står det angivet att fel A förekommer med sannolikheten 0.05, och fel B med sannolikheten 0.09. För att undersöka om dessa värden fortfarande är
aktuella så kontrollerades 150 enheter uttagna helt slumpmässigt. Av dessa befanns 12 st ha fel
A, 21 st ha fel B, och resten var felfria.
Utför ett statistiskt test på 5% signifikansnivå för att avgöra om försäljningsspecifikationen är
förenlig med data.
(10 p)
Uppgift 6
Vid tillverkning av gjutmassa för kakelugnar är det viktigt att viktprocent av ett visst ämne,
olivinsand, inte ligger allt för långt under 18%. Vid övervakning av tillverkningsprocessen tar man
forts tentamen i SF1901 2015-06-09
3
med jämna mellanrum slumpmässigt ut 5 prov ur den tillverkade massan och mäter viktprocenten
av olivinsand. De erhållna mätningarna är x1 , . . . , x5 . Om x̄, som man får från dessa mätningar,
understiger 18% alltför mycket, dvs x̄ < c, betraktar man detta som att tillverkningprocessen är
ur kontroll och slår larm. Man har studerat tillverkningen under längre tid och kommit fram till
att x1 , . . . , x5 kan anses som ett stickprov från en normalfördelning med väntevärde µ (vilket är
18 då tillverkningsprosessen är under kontroll) och standardavvikelse 1.1.
(a) Vid övervakning av tillverkningsprocessen löper man en viss risk att slå larm även om processen är under kontroll. Bestäm konstanten c så att denne felrisk (dvs testets signifikansnivå) blir
0.01.
(6 p)
(b) Antag att man använder den alarmgräns c som du har bestämt i del (a). Bestäm sannolikheten
att upptäcka att tillverkningsprocessen är ur kontroll då den verkliga viktprocenten av olivinsand
är 17%. Om du inte klarar del (a) så använd c = 16.3.
(4 p)
Avd. Matematisk statistik
LÖSNINGSFÖRSLAG TENTAMEN I SF1901 MATEMATISK STATISTIK.
TISDAGEN DEN 9:E JUNI 2015 KL 14.00–19.00
Uppgift 1
(a) A och B är oberoende om P (A ∩ B) = P (A)P (B). Vi har P (A ∪ B ∗ ) = 1 − P (A∗ ∩ B) och
P (A∗ ∪ B) = 1 − P (A ∩ B ∗ ). Vidare
P (A ∩ B) = P (A ∪ B) − P (A ∩ B ∗ ) − P (A∗ ∩ B) = 0.92 − (1 − 0.68) − (1 − 0.88) = 0.48.
P (A) = P (A ∪ B) − P (A∗ ∩ B) = 0.92 − (1 − 0.88) = 0.8.
P (B) = P (A ∪ B) − P (A ∩ B ∗ ) = 0.92 − (1 − 0.68) = 0.6.
Detta ger P (A)P (B) = 0.8 · 0.6 = 0.48 = P (A ∩ B).
Svar: A och B är oberoende.
(b) Låt X vara antalet bilar som kör för fort. Då gäller att X ∈ Bin(15, 0.1). Vi vill beräkna
P (X ≥ 3), (minst tre bilar kör för fort).
P (X ≥ 3) = 1 − P (X ≤ 2) = 1 − FX (2) = |tabell 6, fls| = 1 − 0.8159 = 0.1841.
Svar: P (X ≥ 3) = 0.1841.
Uppgift 2
p
√
(a) C(X, Y ) = ρ V (X) · V (Y ) = −1/4 1 · 1 = −1/4.
V (X + 2Y ) = V (X) + 22 V (Y ) + 2 · 2C(X, Y ) = 1 + 4 · 1 + 4 · (−1/4) = 4.
√
Vidare vet man att X + 2Y ∈ N (1 + 2, 4) = N (3, 2). Med hjälp av detta får vi
P (X + 2Y ≤ 2) = Φ (−0.5) = 1 − Φ (0.5) = 1 − 0.6915 = 0.3085.
Svar: P (X + 2Y ≤ 2 = 0.3085.
(b) Falltiden m(s) då fallsträckan är s uppfyller enligt texten
s=
g(m(s))2
2
p
som
ger
m(s)
=
2s/g. Låt Xi = falltiden då sträckan är si . Vi har alltså E(Xi ) = m(si ) =
p
2si /g. De observerade falltiderna x1 , · · · , x4 för fallsträckorna s1 , · · · , s4 är alltså utfall av
X1 , X2 , X3 , X4 som är oberoende med samma varians σ 2 och väntevärden m(si ), i = 1, 2, 3, 4.
2
forts tentamen i SF1901 2015-06-09
∗
Skattningen gobs
är alltså det g-värde som minimerar
Q(g) =
4 X
r
xi −
i=1
2si
g
2
.
Vi får
r
4
dQ X
2si √
1
1
=
2 xi −
2si · · g −3/2 = 3/2
dg
g
2
g
1
4
X
1
xi
√
4
1 X
2si
2si − √
g 1
!
.
Minimum då dQ/dg = 0 ger
!2
P
2 41 si
.
P4 √
x
2s
i
i
1
∗
=
gobs
Med insatta numeriska värden erhålls
∗
gobs
=
5
1.597
2
= 9.80.
∗
Svar: gobs
= 9.80.
Uppgift 3
Låt Xi beteckna bidrag från medlem nr i, i = 1, . . . , 1000. XiPär oberoende av varandra med
samma fördelning. Vi vill bestämma P (Y > 58000) där Y = 1000
i=1 Xi är sammanlagt bidrag.
Eftersom antal medlemmar är tillräkligt stort kan vi använda Centrala Gränsvärdessatsen vilket
ger att Y är approximativt N (E(Y ), D(Y ))-fördelad, där
! 1000
1000
X
X
E(Y ) = E
Xi =
E(Xi ) = 1000E(Xi ),
i=1
V (Y ) = V
1000
X
i=1
!
Xi
= |ober. Xi | =
i=1
1000
X
V (Xi ) = 1000V (Xi ),
i=1
och
D(Y ) =
√
1000D(Xi ).
För att bestämma E(Xi ) och D(Xi ) måste vi först ta fram fördelningen för Xi . Från uppgift vet
vi att P (Xi = 50) = P (Xi = 100) och att P (Xi = 0) = 0.20. Eftersom sannolikheterna måste
summeras till ett får vi p + p + 0.20 = 1 vilket ger p = 0.4. Med detta ges fördelningen för Xi av
k
pX (k)
Nu får man
E(Xi ) =
3
X
k=1
0
0.2
50
0.4
100
0.4
kpX (k) = 0 · 0.2 + 50 · 0.4 + 100 · 0.4 = 60.
3
forts tentamen i SF1901 2015-06-09
Vidare
E(Xi2 )
=
3
X
k 2 kX (k) = 5000
k=1
vilket ger
V (Xi ) = E(Xi2 ) − (E(Xi ))2 = 5000 − 602 = 1400
p
√
√
√
och D(Xi ) = V (Xi ) = 1400 = 37.42. Nu har man att Y ∈ N (1000 · 60, 1400 · 1000) =
N (60000, 1183.2), approximativt. Detta ger
58000 − 60000
= 1−Φ(−1.69) = Φ(1.69) = 0.9545.
P (Y > 58000) = 1−P (Y ≤ 58000) ≈ 1−Φ
1183.2
Svar: P (Y > 58000) ≈ 0.9545.
Uppgift 4
Typsituation för modellen stickprov i par: Xi ∈ N (µi , σ1 ) och Yi ∈ N (µi + ∆, σ2 ), i = 1, . . . , 10,
där ∆ är skillnad i grad av rost mellan M1 och M2 . Vi vill testa hypotes om det finns någon
systematisk skillnad mellan de två rostskyddsmedlen, dvs
H0 : ∆ = 0,
mot H1 : ∆ 6= 0.
Vi bildar differenser zi = yi − xi :
2.81, 4.35, 2.83, 2.32, 0.41, −0.35, 4.62, 3.72, −0.63, −0.57.
Enligt
modellen är zi observationer av Zi som är oberoende och N (∆, σz ) fördelade, där σz =
p
2
σ1 + σ22 fördelade, i = 1, . . . , 10. Vi skattar ∆ med z̄ = 1.951 och σz med
s
1 X
sz =
10(zi − z̄)2 = 2.064.
10 i=1
Som testvariabeln använder vi
z̄ − 0 √ 1.951
t= √
= 10
= 2.989.
2.064
10
Eftersom |t| > t0.025 (9) = 2.26 förkastas H0 på nivån 0.05%.
Svar: Det finns en signifikant skillnad mellan de två rostskyddsmedlen.
Alternativt kan ett 95% konfidensintervall för ∆ göras (se formelsamlingen avsnitt 10.1 och 11.2):
sz
2.064
I∆ = (z̄ ± t0.025 (9) √ = (1.951 ± 2.26 √ ) = (1.951 ± 1.475) = (0.48, 3.43).
10
10
Svar: Eftersom intervallet ej täcker över 0 är slutsatserna de samma som ovan vis hypotesprövning.
Uppgift 5
Vi har typsituationen för χ2 -test med tre möjliga resultat:
A1 ⇔ Felet A inträffar, A2 ⇔ felet B inträffar,A3 ⇔ inget av felen inträffar.
D.v.s. r = 3. Beteckningar enligt formelsamlingen. Hypotesen är
H0 : p1 = 0.05, p2 = 0.09 och p3 = 1 − p1 − p2 = 1 − 0.05 − 0.09 = 0.86.
4
forts tentamen i SF1901 2015-06-09
Vi har n = 150 observationer varav x1 = 12, x2 = 17 och x3 = 150 − 12 − 21 = 117. Vi får därför
r
X
(xj − npj )2
(12 − 150 · 0.05)2 (21 − 150 · 0.09)2 (117 − 150 · 0.86)2
Q=
=
+
+
= 7.98.
np
150
·
0.05
150
·
0.09
150
·
0.86
j
j=1
χ2α (r − 1) = χ20.05 (2) = 5.99 < 7.98, vilket gör att vi förkastar H0 på 5% nivån.
Eftersom np1 = 150 · 0.05 = 7.5 ≥ 5 så gäller att alla npj ≥ 5, vilket är ett krav för χ2 -testet.
Svar: H0 förkastas på 5% nivån. Försäljningsspecifikationen är inte förenlig med data.
Uppgift 6
Låt X vara viktprocent av olivinsand i gjutmassa. Då gäller att X ∈ N (µ, 1.1). Vi testar hypotes
H0 : µ = 18 (dvs tillverkningsprosess är under kontroll)
mot
H1 : µ < 18 (tillverkningsprosess är ur kontroll)
och förkastar H0 om x̄ < c, där x̄ är medelvärde av de fem oberoende observationer x1 , . . . , x5
som man har fått
√ vid övervakning av tillverkningsprocessen. Det gäller att x̄ är en observation av
X̄ ∈ N (µ, 1.1/ 5).
(a) Man vill bestämma c sådan att testets signifikansnivån α blir 0.01, dvs
0.01 = P (H0 förkastas då H0 är sann) = P (X̄ < c),
√
då X̄ ∈ N (18, 1.1/ 5). Detta ger
1.1
c = 18 − λ0.01 · √ = 16.8556.
5
Svar: c = 16.8556.
(b) Här söker vi testets styrka i punkten 17, se fms. avsn. 14.1.
1.1
h(17) = P (förkasta H0 om µ = 17) = P X̄ < c|X̄ ∈ N 17, √
5
c − 17
16.8556 − 17
√
√
=Φ
= Φ(−0.2935) = 0.3846.
=Φ
1.1/ 5.5
1.1/ 5.5
Svar: h(17) = 0.3846.