Ordinarie tenta - Matematikcentrum

Matematisk statistik
Matematikcentrum
Lunds tekniska högskola
Lunds universitet
Tentamen: 2015–10–26 kl 800 –1300
FMS 086 — Matematisk statistik för B, K, N och BME, 7.5 hp
MASB02 — Matematisk statistik för kemister,
7.5 hp
Korrekt och väl motiverad lösning på uppgifterna 1–5 ger 10 poäng vardera medan delfrågorna på uppgift 6 ger
4 poäng vardera. Totalt kan man få 70 poäng. Gränsen för godkänd är 35 poäng, dock finns det vissa minimikrav
på uppgifterna 1–5 (18p) respektive uppgift 6 (7p).
Institutionens papper används både som kladdpapper och inskrivningspapper. Varje lösning skall börja överst på
nytt papper. Rödpenna får ej användas.
Tillåtna hjälpmedel: Matematiska och statistiska tabeller som ej innehåller statistiska formler, formelsamling
matematisk statistik för bio- och kemitekniker, samt miniräknare.
Resultatet förs in i LADOK senast måndag den 16 november i matematikhusets entréhall.
Redovisa införda beteckningar; ange modeller, approximationer, hypoteser och slutsatser.
Motivera alla antagande.
Skriv anonymkoden (eller namn) på omslaget och SAMTLIGA inlämnade papper.
1. I en tillverkningsprocess fylls vätska på flaskor som sedan förpackas i kartonger om 24 flaskor. Varje flaska
bör innehålla 330 ml vätska. För att ingen flaska ska innehålla för lite väljer man att överfylla flaskorna
något, mängden vätska i varje flaska kan anses vara N 335, 52 -fördelad.
(a) Vad är sannolikheten att en flaska innehåller mindre än 330 ml vätska?
(5p)
(b) Vad är sannolikheten att det i en kartong finns minst två flaskor med för lite vätska (mindre än 330
ml)?
(5p)
2. Antibiotikaresistenta bakterier är ett växande problem för sjukvården. Baserat på data från hela landet kan
antalet fall av antibiotikaresistenta bakterier antas vara Poissonfördelat med 1.17 förväntade fall per 100
patienter.
På en avdelning noterar man 5 fall bland 100 patienter. Avgör, med ett lämpligt test, om avdelningen är
särskilt utsatt.
(10p)
3. En större ombyggnation av ett reningsverk har genomförts för att minska utsläppen av bl.a. fosfor. Mätningar av fosforhalter (mg/l) i det renade vattnet före och efter ombyggnation har gjorts men tyvärr finns
ingen rådata kvar. Ur rapporterna kan man utläsa att 95%-iga konfidensintervall för fosforhalterna var:
före ombyggnation: (0.28, 0.42) baserat på 15 mätningar.
efter ombyggnation: (0.21, 0.29) baserat på 15 mätningar.
(a) Antag att mätningarna är normalfördelade med okänd varians. Bestäm vilket medelvärde, x, standardavvikelse, s, och kvantil som har använts i intervallet före ombyggnation?
(4p)
(b) Antag att variansen är okänd men samma för alla mätningar. Använd båda konfidensintervallen för
att skatta den gemensamma variansen.
(2p)
(c) Konstruera ett tvåsidigt konfidensintervall för skillnaden i förväntade fosforhalter före och efter
ombyggnationen.
(4p)
4. En ny spektrometer ska, enligt tillverkaren, kunna bestämma koncentrationer med en osäkerhet på σ2 =
0.0625. För att undersöka om spektrometern uppfyller tillverkarens specifikation bestämmer man sig för
att utföra upprepade mätningar på två olika prov. Mätningarna kan antas vara normalfördelade. På grund
av problem i laboratoriet blev det tyvärr olika antal mätningar för de olika proven.
Prov
1
2
4.724
10.313
Mätningar
5.265 4.844
9.820 9.806
2
i xi
P
P
14.833
40.484
73.501
410.145
i xi
—
10.545
(a) Ställ upp en lämplig modell och skatta den gemensamma variansen.
(6p)
(b) Avgör, genom att konstruera ett lämpligt 95% konfidensintervall, om variansen är större än den av
tillverkaren angivna variansen.
(4p)
5. Kolnanorör (carbon nanotubes — CNT) kan potentiellt användas som armering i polymer-cement. För
att undersöka hur hållfastheten i cement beror av olika tillsatser mätes det tryck (i MPa) som cementen tål
i ett 22 faktorförsök. Följande faktorer varierades: med eller utan CNT och andelen epoxy i den tillsatta
polymeren. För varje faktorkombination gjordes 5 försök och följande värden erhölls.
Faktorer
(A)
(B)
CNT epoxy (%)
Nej
25
Ja
25
Nej
75
Ja
75
Medelvärde
μ∗11 = 67.6
μ∗21 = 69.9
μ∗12 = 70.9
μ∗22 = 58.2
Varians
2 = 14.8
s11
2 = 17.5
s21
2 = 27.4
s12
2 = 7.4
s22
(a) Skatta huvud- och samspelseffekter
(4p)
(b) Avgör, under lämpliga antagande om oberoende och normalfördelning, vilka av effekterna i a) som
är signifikanta på 5%-nivån?
(4p)
(c) Vad kan man säga om tillsatsen av CNT i polymer-cement?
(2p)
6. Teorifrågor. Ge koncisa svar på nedanstående frågor.
(a) X och Y är oberoende stokastiska variabler med X ∈ Po(3) och Y ∈ Po(1), beräkna P(X + Y > 5).
(4p)
(b) Antag att X är en kontinuerlig stokastisk variabel med täthetsfunktion
1


0,
fX (x) = 2x ,


0,
x<0
0≤x≤2
2<x
0.5
0
−2
Beräkna E(X ) och V(X ).
0
2
4
(4p)
(c) För att undersöka storleken på sfäriska partiklar som suspenderats i vätska lyser man genom vätskan
och noterar skuggornas area. Sambandet mellan area (A) och volym (V) för partiklarna ges av
V =
4 · A3/2
√ .
3 π
Ange en approximativ formel för E(V ) och V(V ) uttryckt i areans väntevärde, E(A) = μ, och varians,
V(A) = σ2 .
(4p)
(d) Följande flervalsfrågor ger +1p för rätt svar men -1p för fel svar (lägst 0p på uppgiften).
Antag att X1 , X2 , . . . , X100 är 100 st oberoende likafördelade s.v. med E(Xi ) = μ och V(Xi ) = σ2 .
i) Sant eller falsk:
N enligt CGS.
Xi ∈
∼
ii) Sant
P100eller falsk:
∈
i=1 Xi ∼ N enligt CGS.
iii) Man bildar medelvärdet
100
X =
1 X
Xi
100
i=1
Vad kan man säga om fördelningen för medelvärdet?
2
A:
X∈
N μ, σ
∼
C:
2
X∈
N
100
·
μ,
100
·
σ
∼
B:
σ2
X∈
N μ,
∼
100
D:
X är inte approximativt Normalfördelad.
Antag att Y ∈ Bin(n, 0.1).
iv) Sant eller falsk:
Om n = 11 är Y ∈
N enligt CGS.
∼
(4p)
(e) För att undersöka hur en partikel rör sig under påverkan av ett svagt magnetfält mäts den tillryggalagda sträckan (m) som funktion av tiden (s) under 30 experiment. Linjär regression användes sedan
för att anpassa fyra olika modeller till data.
Model 1:
yi = a + b · ti + εi
Model 2:
yi = a + b · ti + c · ti2 + εi
Model 3:
yi = a + b · ti + c · ti2 + d · ti3 + εi
log(yi ) = a + b · ti + εi
Model 4:
Redogör kortfattat (1-2 meningar) om för- och nackdelar med respektive model.
Parameter skattningar och konfidensintervall:
Skattningar
Model
a (intervall)
b (intervall)
c (intervall)
1
0.52 (0.06, 0.97)
5.84 (5.07, 6.61)
2
1.27
(0.80, 1.74)
0.82 (−1.35, 3.00)
3
1.45
(0.91, 1.99)
−2.00 (−6.93, 2.92)
4
0.01 (−0.07, 0.27)
Residualplottar på nästa sida!
1.89
(1.60, 2.18)
(4p)
d (intervall)
5.01 (2.92, 7.11)
12.43 (0.64, 24.23)
−4.94 (−12.69, 2.80)
y=a+b*t
Residualer
6
Residualer
Probability
1
y
0
−1
2
0
0.5
tid (s)
1
0
y=a+b*t+c*t2
0.5
tid (s)
1
−1
Residualer
Probability
6
y
0
2
0.5
tid (s)
1
y=a+b*t+c*t2+d*t3
−1
0
0.5
tid (s)
1
Probability
y
0
2
1
log(y)=a+b*t
0.5
tid (s)
1
0
0.5
tid (s)
1
−0.5
−1
0
0.5
tid (s)
LYCKA TILL!
0
0.5
Data
Residualer
0
log(2)
0
0.5
Data
1
0.99
0.98
0.95
0.90
0.75
0.50
0.25
0.10
0.05
0.02
0.01
Residualer
1
log(6)
log(y)
−1
0
Probability
0.5
tid (s)
−0.5
Residualer
6
0
1
0.99
0.98
0.95
0.90
0.75
0.50
0.25
0.10
0.05
0.02
0.01
Residualer
1
0
Data
Residualer
1
0
0.99
0.98
0.95
0.90
0.75
0.50
0.25
0.10
0.05
0.02
0.01
1
0.99
0.98
0.95
0.90
0.75
0.50
0.25
0.10
0.05
0.02
0.01
−0.5
0
Data
0.5
1