Avd. Matematisk statistik TENTAMEN I SF1901, SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 28:E OKTOBER 2015 KL 8.00–13.00. Kursledare: Tatjana Pavlenko, 08- 790 84 66, Björn Olof Skytt 08-790 86 49. Tillåtna hjälpmedel : Formel- och tabellsamling i Matematisk statistik, Mathematics Handbook (Beta), Hjälpreda för miniräknare, räknare. Införda beteckningar skall förklaras och definieras. Resonemang och uträkningar skall vara så utförliga och väl motiverade att de är lätta att följa. Numeriska svar skall anges med minst två siffrors noggrannhet. Tentamen består av 6 uppgifter. Varje korrekt lösning ger 10 poäng. Gränsen för godkänt är preliminärt 24 poäng. Möjlighet att komplettera ges för tentander med, preliminärt, 22–23 poäng. Tid och plats för komplettering kommer att anges på kursens hemsida. Det ankommer på dig själv att ta reda på om du har rätt att komplettera. Poäng från kontrollskrivning och laborationer under kursomgång period 1 HT2015 tillgodoräknas. Obs! Man måste på denna tentamen erhålla minst 20 poäng (av 60) utan medräknad bonus för att bonuspoängen skall räknas med. Tentamen kommer att vara rättad inom tre arbetsveckor från skrivningstillfället och kommer att finnas tillgänglig på studentexpeditionen minst sju veckor efter skrivningstillfället. Uppgift 1 a) Vid tillverkning av en viss typ av komponenter kan tre olika typer av fel inträffa, A, B och C. Av erfarenhet vet man att P (A) = P (B) = P (C) = 0.1 Man vet vidare att felet A och felet B inträffar oberoende av varandra. Det gäller även att felet A och felet C inträffar oberoende av varandra. Man vet också att felet B och felet C inte kan inträffa samtidigt. Vad är sannolikheten att inget av felen inträffar? (5 p) b) En förläggare skickar riktad reklam för en viss lärobok till 80% av alla skolor som ska undervisa motsvarande ämne. 30% av skolorna som fick reklamen använde boken. Det gjorde även 10% av de som inte fick reklamen. Vad är sannolikheten att en slumpmässigt utvald skola som använde boken har fått den utskickade reklamen? (5 p) Uppgift 2 Inom ett tunnelprojekt bestäms det att följa upp oplanerade driftstopp under tunneldrivningen. Det har upprättats en definition av vad som menas med ett oplanerat driftstopp. Enligt definitionen skall minst en av följande saker inträffa: 1) tunneldrivningen stoppas på grund av brister i säkerheten; 2) tunneldrivningen stoppas på grund av dåliga bergförhållanden; 3) tunneldrivningen stoppas på grund av ett mekaniskt fel, i ett maskin eller annan utrustning. Med den definitionen har det visat sig att antalet oplanerade driftstopp per månad inom projektet, betecknat med X, varierar mellan 0 och 3, och kan beskrivas med följande (ofullständiga) sannolikhetsfördelning: P (X = 0) = 0.25, P (X = 1) = 0.35, P (X = 2) = 0.25. 2 forts tentamen i SF1901 2015-10-28 Antag att antalet driftstopp under en månad är oberoende av motsvarande antal under andra månader. Bestäm approximativt sannolikheten att det inträffar fler än 100 oplanerade driftstopp under en femårsperiod. Approximationen skall motiveras. (10 p) Uppgift 3 Antag att ytan för en sfär beskrivs av en exponentialfördelad stokastisk variabel X med täthetsfunktion 1 fX (t) = e−t/θ , θ t≥0 där θ > 0 är väntevärdet, θ = E (X). För att skatta ytan θ görs upprepade bestämningar av sfärens diameter y1 , . . . , yn . Dessa modelleras som utfall av oberoende och likafördelade stokastiska variabler. (Förhållandet mellan yta och diameter är X = πY 2 .) a) Visa att täthetsfunktionen för Y är fY (t) = 2πt −πt2 /θ e , θ t ≥ 0. Du förväntas visa dina uträkningar. (4 p) b) Baserat på observationerna y1 , . . . , yn tag fram ett uttryck för Maximum-likelihoodskattningen av θ. Beräkna även denna numeriskt då y1 = 0.20, y2 = 0.25 och y3 = 0.18 centimeter. (4 p) c) Avgör om skattningen av θ är väntevärdesriktig? Motivera svaret genom att visa dina uträkningar. (2 p) Uppgift 4 Man vill undersöka om utbytet av en viss kemisk reaktion blir detsamma om reaktionen sker vid 80◦ C i stället för 90◦ C. Man gör fem satser vid varje temperatur och får följande resultat: Utbyte i procent ◦ 80 90◦ 49.96 49.62 49.14 50.54 49.30 50.28 52.21 51.28 48.76 48.58 Undersök om utbytet kan sägas skilja sig åt eller ej, när vi kan anta att variationen i utbyte mellan satser vid respektive temperatur är normalfördelad med en varians som är densamma för de båda temperaturerna. Välj signifikansnivån 5%. Ange tydligt vilka de uppställda hypoteserna är och vad slutsatsen är. (10 p) Uppgift 5 Ett konsultföretag har konstruerat ett visst telefonkösystem som enligt upphandlarens önskemål ska fungera på så sätt att när en person ringer upp så ska antalet samtal före i kön vara Poissonfördelat med väntevärdet 2.6. När systemet har varit i drift ett halvår så ringer man upp 200 gånger vid olika slumpmässigt valda tider och får följande resultat: Antal samtal före i kön Antal uppringda gånger 0 30 1 42 2 34 3 ≥4 28 66 3 forts tentamen i SF1901 2015-10-28 Testa på signifikansnivån 5% om antalet samtal före i kön kan anses vara Poisson-fördelat med väntevärde 2.6. Ange tydligt vilka de uppställda hypoteserna är och vad slutsatsen är. (10 p) Uppgift 6 För att mäta radonkoncentrationen inom huset (uttryckt i Bq/m3 ) hängs det upp en film som är känslig för alfa-partiklar. När filmen träffas av en partikel uppstår efter framkallning ett hål i filmen. För att modellera antalet hål i en film, X, antas det att X följer en Poissonfördelning med ett väntevärde som är proportionellt mot radonkoncentrationen γ. Antag att x = 27 är en observation av X ∈ P o(γK) där K = 0.1 för den aktuella mätsituationen. a) Testa nollhypotesen H0 : γ = 200 Bq/m3 mot H1 : γ > 200 Bq/m3 på den approximativa signifikansnivån α = 0.05. Approximationen skall motiveras. Ange tydligt om H0 förkastas eller ej och motivera svaret. (4 p) b) Bestäm styrkefunktionen h(γ) för testet i a). (6 p) Avd. Matematisk statistik LÖSNINGSFÖRSLAG TENTAMEN I SF1901, MATEMATISK STATISTIK. ONSDAGEN DEN 28:E OKTOBER 2015 KL 8.00–13.00 Uppgift 1 a) P(inget fel inträffar) = 1-P(minst ett fel inträffar) = 1-P (A ∪ B ∪ C) P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B) − P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C)= =[ Det gäller att A och B är oberoende samt att A och C är oberoende]= =P (A) + P (B) + P (C) − P (A)P (B) − P (A)P (C) − P (B ∩ C) + P (A)P (B ∩ C)= =[B och C är disjunkta]=P (A) + P (B) + P (C) − P (A)P (B) − P (A)P (C) − 0 + P (A) · 0) = = 0.1 + 0.1 + 0.1 − 0.1 · 0.1 − 0.1 · 0.1 = 0.28 P(inget fel inträffar) blir då 1-0.28=0.72 Svar: P(inget fel inträffar) =0.72 b) Låt R beteckna händelsen att skolan fått den riktade reklamen för boken och låt A beteckna händelsen att skolan använder boken i undervisningen. Då söker vi P (R|A). P (R|A) = = P (R ∩ A) P (R ∩ A) = = P (A) P (R ∩ A) + P (R ∩ A∗ ) 0.3 · 0.8 24 P (A|R)P (R) = = = 0.923 ∗ ∗ P (A|R)P (R) + P (A|R )P (R ) 0.3 · 0.8 + 0.1 · 0.2 26 Svar: Den sökta sannolikheten är 0.923 Uppgift 2 X betecknar antal driftstopp per månad. För att få den fullständiga fördelningen av X behöver vi pX (3) = P (X = 3). Detta fås genom P (X = 3) = 1 − (P (X = 0) + P (X = 1) + P (X = 2)) = 0.15. Låt nu Xi vara antal driftstopp under månad i, i = 1, . . . , 60. Det totala antalet driftstopp under en femårsperiod, Y = X1 + X2 + · · · + X60 är då enligt centrala gränsvärdessatsen (många månader, oberoende Xi med samma fördelning) approximativt Normalfördelad, N (E(Y ), D(Y )). För att bestämma E(Y ) och D(Y ) behöver vi E(Xi ) och D(Xi ): E(Xi ) = 0 · 0.25 + 1 · 0.35 + 2 · 0.25 + 3 · 0.15 = 1.3. p V (Xi ) = E(Xi2 ) − (E(Xi ))2 = 1.01, D(Xi ) = V (Xi ) = 1.005. 2 forts tentamen i SF1901 2015-10-28 √ Nu får vi den approximativa fördelningen för Y som N (60 · 1.3, 60 · 1.005) = N (78, 7.785). Den sökta sannolikheten blir ! ! 60 60 X X 100 − 78 P (Y > 100) = P Xi > 100 = 1−P Xi ≤ 100 ≈ 1−Φ = 1−0.9976 = 0.0024. 7.785 i=1 i=1 Svar: P (Y > 100) ≈ 0.0024. Uppgift 3 p a) Med Y = X/π så har Y fördelningsfunktionen p FY (t) = P (Y ≤ t) = P X/π ≤ t = P X ≤ πt2 = FX (πt2 ) dvs täthetsfunktionen fY (t) = d d 2πt −πt2 /θ FY (t) = FX (πt2 ) = fX (πt2 )2πt = e dt dt θ för t ≥ 0. b) ML-skattningen av θ är det värde som maximerar L(θ) = fY1 (y1 ) · · · fYn (yn ) = 2πyn −πyn2 /θ (2π)n (y1 · · · yn ) − π Pni=1 yi2 2πy1 −πy12 /θ e ··· e = e θ . θ θ θn Det är samma värde som maximerar ln(L(θ)) = ln((2π)n (y1 · · · yn )) − n ln(θ) − n πX 2 y . θ i=1 i Lösning av " # n n d n π X 2 −n πX 2 0= ln(L(θ)) = − + 2 y = 2 θ− y dθ θ θ i=1 i θ n i=1 i P ger ML-skattningen θ∗ obs = πn ni=1 yi2 . För de tre observationerna y1 = 0.20, y2 = 0.25 och y3 = 0.18 fås skattningen θ∗ obs = Svar: θ∗ obs = π n Pn i=1 π (0.202 + 0.252 + 0.182 ) = 0.14 cm2 . 3 yi2 , θ∗ obs = 0.14cm2 c) Nu är n θ∗ = n πX 2 1X Yi = Xi = X n i=1 n i=1 där X1 , . . . , Xn är exponentialfördelade med väntevärde θ. Alltså är E (θ∗ ) = θ och skattningen θ∗ obs är väntevärdesriktig. Svar: θ∗ obs är väntevärdesriktig. 3 forts tentamen i SF1901 2015-10-28 Uppgift 4 Låt x1 , . . . , x5 och y1 , . . . , y5 vara de uppmätta utbytena hos satserna vid 80◦ C respektive 90◦ C. Dessa är observationer av stokastiska variabler X1 , . . . , X5 respektive Y1 , . . . , Y5 (alla oberoende), med fördelningar N(µX , σ) respektive N(µY , σ). Detta är hypotesprövning med två oberoende stickprov. Vi ställer upp hypoteserna H0 och H1 H0 : µX = µY H1 : µX 6= µY Vi bildar konfidensintervallet IµX −µY r 1 1 = x̄ − ȳ ± tα/2 (nX + nY − 2) · s · + nX nY där (nX − 1)s2X + (nY − 1)s2Y . nX + nY − 2 Med nX = nY = 5, x̄ = 49.87, ȳ = 50.06, sX = 1.376, sY = 1.0919, t0.025 (8) = 2.31 får vi IµY −µX = (0.19 ± 1.77). Eftersom 0 ingår i konfidensintervallet kan man inte förkasta H0 på signifikansnivån 5%. Detta innebär att man med 5% felrisk inte kan påstå att det föreligger systematisk skillnad mellan de två temperaturerna vad gäller utbytet av den kemiska reaktionen. Svar: En påvisbar skillnad kan inte styrkas på risknivån 5 %. s2 = Uppgift 5 Låt pi vara sannolikheten för att det är i samtal före i kön när man ringer upp, i = 0, . . . , 3, och p4 = 1 − (p0 + · · · + p3 ). Vi vill testa H0 : pi = µi −µ e , i = 0, . . . , 3, och p4 = 1 − (p0 + · · · + p3 ) i! för µ = 2.6, ty väntevärdet för en Poissonfördelning är µ. Detta ger Antal uppringda gånger, xi Sannolikheter pi Väntevärden npi 0 30 0.07427 14.854 Antal samtal före i kön 1 2 3 42 34 28 0.19311 0.25105 0.21757 38.622 50.210 43.514 ≥4 66 0.26400 52.800 200 1 De observerade utfallen xi jämförs med väntevärdena npi med teststorheten q= 4 X (xi − npi )2 i=0 npi = 15.444 + 0.295 + 5.176 + 5.531 + 3.300 = 29.75. som om H0 är sann är ett utfall från en (approximativt) χ2 (5 − 1) = χ2 (4)-fördelad stokastisk variabel. Notera att alla npi ≥ 5 så approximationen är tillåten. Ur χ2 (4)-tabell fås att testet som förkastar H0 då q > χ20.05 = 9.49 har risknivå 5%. Vi observerar utfallet 29.75 > 9.49 och förkastar H0 , dvs data är inte förenliga med att komma från en Poisson(2.6)-fördelning. Svar: Data är inte förenliga med att komma från en Poisson(2.6)-fördelning. 4 forts tentamen i SF1901 2015-10-28 Uppgift 6 Ur uppgiftstexten vet vi att antalet hål, X, är Poissonfördelat, X ∈ P o(Kγ), där K = 0.1. Normalapproximation är tillåten under H0 eftersom 0.1 · 200 = 20 > 15. Vi har alltså att X ∈ √ N (20, 20) approximativt. a) Testvariabeln Tobs. (x) = förkastas. 27−20 √ 20 = 1.5652. Eftersom Tobs. (x) = 1.5652 < λ0.05 = 1.64 kan H0 inte Svar: H0 förkastas ej. b) Testets styrka ges av h(γ) = P (H0 förkastas|γ) = P X − 20 √ ≥ λ0.05 |γ 20 √ = P X > 20 + λ0.05 20|γ = ! √ λ0.05 20 + 20 − 0.1γ X − 0.1γ √ √ |standardisera| = P > ≈ 0.1γ 0.1γ ! ! √ √ 0.1γ − λ0.05 20 − 20 λ0.05 20 + 20 − 0.1γ √ √ =Φ . ≈1−Φ 0.1γ 0.1γ Svar: Styrkefunktionen ges av h(γ) = Φ √ 0.1γ−λ√ 0.05 20−20 . 0.1γ
© Copyright 2024