Avd. Matematisk statistik TENTAMEN I SF1901, SANNOLIKHETSTEORI OCH STATISTIK, TISDAGEN DEN 9:E JUNI 2015 KL 14.00–19.00. Kursledare: Tatjana Pavlenko, 08- 790 84 66 Tillåtna hjälpmedel : Formel- och tabellsamling i Matematisk statistik, Mathematics Handbook (Beta), Hjälpreda för miniräknare, räknare. Införda beteckningar skall förklaras och definieras. Resonemang och uträkningar skall vara så utförliga och väl motiverade att de är lätta att följa. Numeriska svar skall anges med minst två siffrors noggrannhet. Tentamen består av 6 uppgifter. Varje korrekt lösning ger 10 poäng. Gränsen för godkänt är preliminärt 24 poäng. Möjlighet att komplettera ges för tentander med, preliminärt, 22–23 poäng. Tid och plats för komplettering kommer att anges på kursens hemsida. Det ankommer på dig själv att ta reda på om du har rätt att komplettera. Poäng från kontrollskrivning och laborationer under kursomgång period 4 VT2015 tillgodoräknas. Obs! Man måste på denna tentamen erhålla minst 20 poäng (av 60) utan medräknad bonus för att bonuspoängen skall räknas med. Tentamen kommer att vara rättad inom tre arbetsveckor från skrivningstillfället och kommer att finnas tillgänglig på studentexpeditionen minst sju veckor efter skrivningstillfället. Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända P (A ∪ B) = 0.92, P (A ∪ B ∗ ) = 0.88, P (A∗ ∪ B) = 0.68. Avgör om A och B är oberoende händelser. (5 p) (b) Antag att i genomsnitt var tionde bil som passerar Häggvikavfarten på E6 kör för fort och att olika bilar håller oberoende hastigheter. En polis mäter hastigheten på 15 bilar. Vad är sannolikheten att minst 3 bilar kör för fort? (5 p) Uppgift 2 (a) Låt X och Y vara normalfördelade och beroende stokastiska variabler med E(X) = V (X) = 1 och E(Y ) = V (Y ) = 1 samt korrelationskoefficient ρ = −1/4. Bestäm P (X + 2Y ) ≤ 2). (3 p) (b) Vid ett försök att bestämma jordaccelerationen g (enhet m/s2 ) vid en viss plats mätte man hur lång tid det tog för föremål att falla olika kända sträckor. Man erhöll följande mätvärden Fallsträcka (meter): Falltid (sekunder): 0.25 0.23 0.50 0.32 0.75 0.39 1.00 0.45 2 forts tentamen i SF1901 2015-06-09 Den förväntade falltiden t och fallsträckan s är relaterade genom sambandet s= gt2 . 2 Härled och beräkna med minstakvadratmetoden skattningen av g baserad på ovanstående data om vi betraktar falltiderna som utfall av oberoende stokastiska variabler med samma varians och där de enskilda mätningarna av falltiderna saknar systematiska fel. (7 p) Uppgift 3 En ideell förening Den Gröna Jorden planerar en insamling för utökning av grönområden runt fastigheterna. Föreningen skickar därför ett brev till var och en av de 1000 medlemmarna där man ber om ett bidrag på 50 eller 100 kronor. Man vet från tidigare att 50 och 100 kronors bidrag är lika vanliga och att 20% av medlemmarna inte ger något bidrag. Bestäm med hjälp en lämplig och välmotiverad approximation, sannolikheten att föreningens sammanlagda insamling överstiger 58 000 kronor. (10 p) Uppgift 4 För att undersöka effekten av två olika rostskyddsmedel, M1 och M2 , behandlades 10 järnstavar med medel M1 och ytterliggare 10 stavar med medel M2 . På var och en av 10 olika platser grävdes därefter två stavar ned; en stav med varje behandling. Efter två månader togs alla stavar upp och graden av rost mättes. Följande mätvärden (i lämplig enhet) erhölls: Plats: Medel M1 : Medel M2 : 1 19.15 21.96 2 23.35 27.70 3 20.10 22.93 4 16.70 19.02 5 6 31.85 17.70 32.26 17.35 7 22.77 27.39 8 21.71 25.43 9 34.06 33.43 10 18.71 18.14 Ange en lämplig statistisk modell baserad på normalfördelning som beskriver data, och undersök genom att testa en hypotes eller genom att dra slutsatser från ett konfidenintervall, om det finns någon systematisk skillnad i grad av rost mellan de två rostskyddsmedlen. Välj signifikansnivån α = 0.05. (10 p) Uppgift 5 Vid tillverkning av en viss detalj kan två typer av fel uppstå, A och B. Dessa fel kan dock ej uppkomma bägge två på en och samma detalj. I försäljningsspecifikationen för denna detalj står det angivet att fel A förekommer med sannolikheten 0.05, och fel B med sannolikheten 0.09. För att undersöka om dessa värden fortfarande är aktuella så kontrollerades 150 enheter uttagna helt slumpmässigt. Av dessa befanns 12 st ha fel A, 21 st ha fel B, och resten var felfria. Utför ett statistiskt test på 5% signifikansnivå för att avgöra om försäljningsspecifikationen är förenlig med data. (10 p) Uppgift 6 Vid tillverkning av gjutmassa för kakelugnar är det viktigt att viktprocent av ett visst ämne, olivinsand, inte ligger allt för långt under 18%. Vid övervakning av tillverkningsprocessen tar man forts tentamen i SF1901 2015-06-09 3 med jämna mellanrum slumpmässigt ut 5 prov ur den tillverkade massan och mäter viktprocenten av olivinsand. De erhållna mätningarna är x1 , . . . , x5 . Om x̄, som man får från dessa mätningar, understiger 18% alltför mycket, dvs x̄ < c, betraktar man detta som att tillverkningprocessen är ur kontroll och slår larm. Man har studerat tillverkningen under längre tid och kommit fram till att x1 , . . . , x5 kan anses som ett stickprov från en normalfördelning med väntevärde µ (vilket är 18 då tillverkningsprosessen är under kontroll) och standardavvikelse 1.1. (a) Vid övervakning av tillverkningsprocessen löper man en viss risk att slå larm även om processen är under kontroll. Bestäm konstanten c så att denne felrisk (dvs testets signifikansnivå) blir 0.01. (6 p) (b) Antag att man använder den alarmgräns c som du har bestämt i del (a). Bestäm sannolikheten att upptäcka att tillverkningsprocessen är ur kontroll då den verkliga viktprocenten av olivinsand är 17%. Om du inte klarar del (a) så använd c = 16.3. (4 p) Avd. Matematisk statistik LÖSNINGSFÖRSLAG TENTAMEN I SF1901 MATEMATISK STATISTIK. TISDAGEN DEN 9:E JUNI 2015 KL 14.00–19.00 Uppgift 1 (a) A och B är oberoende om P (A ∩ B) = P (A)P (B). Vi har P (A ∪ B ∗ ) = 1 − P (A∗ ∩ B) och P (A∗ ∪ B) = 1 − P (A ∩ B ∗ ). Vidare P (A ∩ B) = P (A ∪ B) − P (A ∩ B ∗ ) − P (A∗ ∩ B) = 0.92 − (1 − 0.68) − (1 − 0.88) = 0.48. P (A) = P (A ∪ B) − P (A∗ ∩ B) = 0.92 − (1 − 0.88) = 0.8. P (B) = P (A ∪ B) − P (A ∩ B ∗ ) = 0.92 − (1 − 0.68) = 0.6. Detta ger P (A)P (B) = 0.8 · 0.6 = 0.48 = P (A ∩ B). Svar: A och B är oberoende. (b) Låt X vara antalet bilar som kör för fort. Då gäller att X ∈ Bin(15, 0.1). Vi vill beräkna P (X ≥ 3), (minst tre bilar kör för fort). P (X ≥ 3) = 1 − P (X ≤ 2) = 1 − FX (2) = |tabell 6, fls| = 1 − 0.8159 = 0.1841. Svar: P (X ≥ 3) = 0.1841. Uppgift 2 p √ (a) C(X, Y ) = ρ V (X) · V (Y ) = −1/4 1 · 1 = −1/4. V (X + 2Y ) = V (X) + 22 V (Y ) + 2 · 2C(X, Y ) = 1 + 4 · 1 + 4 · (−1/4) = 4. √ Vidare vet man att X + 2Y ∈ N (1 + 2, 4) = N (3, 2). Med hjälp av detta får vi P (X + 2Y ≤ 2) = Φ (−0.5) = 1 − Φ (0.5) = 1 − 0.6915 = 0.3085. Svar: P (X + 2Y ≤ 2 = 0.3085. (b) Falltiden m(s) då fallsträckan är s uppfyller enligt texten s= g(m(s))2 2 p som ger m(s) = 2s/g. Låt Xi = falltiden då sträckan är si . Vi har alltså E(Xi ) = m(si ) = p 2si /g. De observerade falltiderna x1 , · · · , x4 för fallsträckorna s1 , · · · , s4 är alltså utfall av X1 , X2 , X3 , X4 som är oberoende med samma varians σ 2 och väntevärden m(si ), i = 1, 2, 3, 4. 2 forts tentamen i SF1901 2015-06-09 ∗ Skattningen gobs är alltså det g-värde som minimerar Q(g) = 4 X r xi − i=1 2si g 2 . Vi får r 4 dQ X 2si √ 1 1 = 2 xi − 2si · · g −3/2 = 3/2 dg g 2 g 1 4 X 1 xi √ 4 1 X 2si 2si − √ g 1 ! . Minimum då dQ/dg = 0 ger !2 P 2 41 si . P4 √ x 2s i i 1 ∗ = gobs Med insatta numeriska värden erhålls ∗ gobs = 5 1.597 2 = 9.80. ∗ Svar: gobs = 9.80. Uppgift 3 Låt Xi beteckna bidrag från medlem nr i, i = 1, . . . , 1000. XiPär oberoende av varandra med samma fördelning. Vi vill bestämma P (Y > 58000) där Y = 1000 i=1 Xi är sammanlagt bidrag. Eftersom antal medlemmar är tillräkligt stort kan vi använda Centrala Gränsvärdessatsen vilket ger att Y är approximativt N (E(Y ), D(Y ))-fördelad, där ! 1000 1000 X X E(Y ) = E Xi = E(Xi ) = 1000E(Xi ), i=1 V (Y ) = V 1000 X i=1 ! Xi = |ober. Xi | = i=1 1000 X V (Xi ) = 1000V (Xi ), i=1 och D(Y ) = √ 1000D(Xi ). För att bestämma E(Xi ) och D(Xi ) måste vi först ta fram fördelningen för Xi . Från uppgift vet vi att P (Xi = 50) = P (Xi = 100) och att P (Xi = 0) = 0.20. Eftersom sannolikheterna måste summeras till ett får vi p + p + 0.20 = 1 vilket ger p = 0.4. Med detta ges fördelningen för Xi av k pX (k) Nu får man E(Xi ) = 3 X k=1 0 0.2 50 0.4 100 0.4 kpX (k) = 0 · 0.2 + 50 · 0.4 + 100 · 0.4 = 60. 3 forts tentamen i SF1901 2015-06-09 Vidare E(Xi2 ) = 3 X k 2 kX (k) = 5000 k=1 vilket ger V (Xi ) = E(Xi2 ) − (E(Xi ))2 = 5000 − 602 = 1400 p √ √ √ och D(Xi ) = V (Xi ) = 1400 = 37.42. Nu har man att Y ∈ N (1000 · 60, 1400 · 1000) = N (60000, 1183.2), approximativt. Detta ger 58000 − 60000 = 1−Φ(−1.69) = Φ(1.69) = 0.9545. P (Y > 58000) = 1−P (Y ≤ 58000) ≈ 1−Φ 1183.2 Svar: P (Y > 58000) ≈ 0.9545. Uppgift 4 Typsituation för modellen stickprov i par: Xi ∈ N (µi , σ1 ) och Yi ∈ N (µi + ∆, σ2 ), i = 1, . . . , 10, där ∆ är skillnad i grad av rost mellan M1 och M2 . Vi vill testa hypotes om det finns någon systematisk skillnad mellan de två rostskyddsmedlen, dvs H0 : ∆ = 0, mot H1 : ∆ 6= 0. Vi bildar differenser zi = yi − xi : 2.81, 4.35, 2.83, 2.32, 0.41, −0.35, 4.62, 3.72, −0.63, −0.57. Enligt modellen är zi observationer av Zi som är oberoende och N (∆, σz ) fördelade, där σz = p 2 σ1 + σ22 fördelade, i = 1, . . . , 10. Vi skattar ∆ med z̄ = 1.951 och σz med s 1 X sz = 10(zi − z̄)2 = 2.064. 10 i=1 Som testvariabeln använder vi z̄ − 0 √ 1.951 t= √ = 10 = 2.989. 2.064 10 Eftersom |t| > t0.025 (9) = 2.26 förkastas H0 på nivån 0.05%. Svar: Det finns en signifikant skillnad mellan de två rostskyddsmedlen. Alternativt kan ett 95% konfidensintervall för ∆ göras (se formelsamlingen avsnitt 10.1 och 11.2): sz 2.064 I∆ = (z̄ ± t0.025 (9) √ = (1.951 ± 2.26 √ ) = (1.951 ± 1.475) = (0.48, 3.43). 10 10 Svar: Eftersom intervallet ej täcker över 0 är slutsatserna de samma som ovan vis hypotesprövning. Uppgift 5 Vi har typsituationen för χ2 -test med tre möjliga resultat: A1 ⇔ Felet A inträffar, A2 ⇔ felet B inträffar,A3 ⇔ inget av felen inträffar. D.v.s. r = 3. Beteckningar enligt formelsamlingen. Hypotesen är H0 : p1 = 0.05, p2 = 0.09 och p3 = 1 − p1 − p2 = 1 − 0.05 − 0.09 = 0.86. 4 forts tentamen i SF1901 2015-06-09 Vi har n = 150 observationer varav x1 = 12, x2 = 17 och x3 = 150 − 12 − 21 = 117. Vi får därför r X (xj − npj )2 (12 − 150 · 0.05)2 (21 − 150 · 0.09)2 (117 − 150 · 0.86)2 Q= = + + = 7.98. np 150 · 0.05 150 · 0.09 150 · 0.86 j j=1 χ2α (r − 1) = χ20.05 (2) = 5.99 < 7.98, vilket gör att vi förkastar H0 på 5% nivån. Eftersom np1 = 150 · 0.05 = 7.5 ≥ 5 så gäller att alla npj ≥ 5, vilket är ett krav för χ2 -testet. Svar: H0 förkastas på 5% nivån. Försäljningsspecifikationen är inte förenlig med data. Uppgift 6 Låt X vara viktprocent av olivinsand i gjutmassa. Då gäller att X ∈ N (µ, 1.1). Vi testar hypotes H0 : µ = 18 (dvs tillverkningsprosess är under kontroll) mot H1 : µ < 18 (tillverkningsprosess är ur kontroll) och förkastar H0 om x̄ < c, där x̄ är medelvärde av de fem oberoende observationer x1 , . . . , x5 som man har fått √ vid övervakning av tillverkningsprocessen. Det gäller att x̄ är en observation av X̄ ∈ N (µ, 1.1/ 5). (a) Man vill bestämma c sådan att testets signifikansnivån α blir 0.01, dvs 0.01 = P (H0 förkastas då H0 är sann) = P (X̄ < c), √ då X̄ ∈ N (18, 1.1/ 5). Detta ger 1.1 c = 18 − λ0.01 · √ = 16.8556. 5 Svar: c = 16.8556. (b) Här söker vi testets styrka i punkten 17, se fms. avsn. 14.1. 1.1 h(17) = P (förkasta H0 om µ = 17) = P X̄ < c|X̄ ∈ N 17, √ 5 c − 17 16.8556 − 17 √ √ =Φ = Φ(−0.2935) = 0.3846. =Φ 1.1/ 5.5 1.1/ 5.5 Svar: h(17) = 0.3846.
© Copyright 2025