Todennäköisyyslaskennan ja tilastotieteen peruskurssi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto 6B H Seppälä & V Husgafvel Syksy 2015 Harjoitus 6B Tilastollinen riippuvuus ja korrelaatio Yhden selittäjän lineaarinen regressio Tuntitehtävät 6B1 Kokeessa tutkittiin erään elektronisen komponentin elinaikaa. Koe oli ns. kiihdytetty elinaikakoe, jossa komponentti saadaan vanhenemaan normaalitilannetta nopeammin nostamalla komponentin käyttölämpötilaa. Kokeeseen poimittiin satunnaisesti viisi komponenttia, joita käytettiin viidessä erilaisessa lämpötilassa kunnes ne lakkasivat toimimasta. Lämpötilat mitattiin Fahrenheit-asteina (F, havainnot x) ja komponenttien elinajat mitattiin tunteina (h, havainnot y). Alla on listattu havainnot x ja y. i xi yi 1 2 3 4 5 500 600 700 800 900 804 791 658 599 562 (a) Piirrä havaittujen lukuparien (xi , yi ) hajontakuvio. (b) Arvioi hajontakuvion perusteella havaintojen x ja y otoskorrelaation merkki ja suuruusluokka. (c) Havaintojen x ja y summat, neliösummat ja tulosumma ovat: n X i=1 n X xi = 3500 x2i = 2550000 i=1 n X n X i=1 n X yi = 3414 yi2 = 2379706 i=1 xi yi = 2322200 i=1 Laske havaintojen x ja y keskiarvot, otoskeskihajonnat ja otoskorrelaatio. 6B2 Tutkimuksessa todettiin, että kuulalaakerin kuulien eksentrisyys (havainnot x) ja pinnan tasaisuus (havainnot y) noudattavat likimäärin kaksiulotteista normaalijakaumaa. Havaintojen x ja y välinen otoskorrelaatio oli 0.1 ja otoskoko 100. Testaa 5 %:n merkitsevyystasoa käyttäen nollahypoteesia, että havainnot x ja y ovat korreloimattomia, kun oletetaan että havainnot (xi , yi ), i = 1, 2, ..., 100, ovat realisaatioita riippumattomista satunnaisvektoreista, jotka noudattavat kaksiulotteista normaalijakaumaa N2 µx , µ2 , σx , σy , ρxy 1/2 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto H Seppälä & V Husgafvel Syksy 2015 Harjoitus 6B Kotitehtävät 6B3 Kokeessa tutkittiin seitsemän kuorma-auton polttoainetaloudellisuuden y (mailia/gallona) riippuvuutta ajoneuvon painosta x (tonnia). Kokeesta saatu data on listattu alla. i xi yi 1 2 3 4 5 6 7 8.00 24.50 27.00 14.50 28.50 12.75 21.25 7.69 4.97 4.56 6.49 4.34 6.24 4.45 Tästä aineistosta saadaan laskettua havaintojen x ja y keskiarvot, otosvarianssit, otoskeskihajonnat, otoskovarianssi ja otoskorrelaatio: m(x) = 19.5 m(y) = 5.5343 2 s2 (y) = 1.6547 s (x) = 61.3542 s(x) = 7.8329 s(y) = 1.2863 s(x, y) = −0.9446 r(x, y) = s(x)s(y) s(x, y) = −9.5179 (a) Estimoi lineaarisen regressiomallin Yi = β0 + β1 xi + i , i = 1, 2, ..., n. regressiokertoimet β0 ja β1 pienimmän neliösumman menetelmällä. (b) Laske estimoidun mallin sovite ja jäännös havaintoyksikölle i = 6. (c) Piirrä estimoimasi regressiosuora datapisteitä (xi , yi ), i = 1, 2, ..., n esittävään hajontakuvioon. Piirrä kuvioon myös jäännöstä kuvaava jana. 6B4 Tehtävä 4 on jatkoa tehtävälle 3. Kun syötteen arvo x̃ on havaittu, paras ennuste vastemuuttujan Y arvolle (lineaaristen ja harhattomien ennusteiden joukossa) on b0 + b1 x̃, missä b0 ja b1 ovat regressiokertoimien β0 ja β1 pienimmän neliösumman estimaatit. Ennusteen aineistosta laskettu tason (1 − α) ennusteväli on muotoa s 1 (x̃ − m(x))2 b0 + b1 x̃ ± tα/2 S 1 + + n (n − 1)s2 (x) missä tα/2 on t(n − 2)-jakauman (1 − α/2)-kvantiili, S 2 on aineistoista laskettu varianssiparametrin σ 2 harhaton estimaatti (tässä tehtävässä sen arvo on 0.214), ja m(x) ja s2 (x) ovat syötteen havainnoista lasketut keskiarvo ja otosvarianssi. Ennusta vastemuuttujan Y arvo, kun syötemuuttuja saa arvot x = 19.5, x = 26 ja x = 450 (maailman painavimman kuorma-auton paino). Määritä myös ennusteiden 95 %:n ennustevälit. 2/2
© Copyright 2024