6. viikon laskuharjoitus B - MyCourses - Aalto

Todennäköisyyslaskennan ja tilastotieteen peruskurssi
Matematiikan ja systeemianalyysin laitos
Aalto-yliopisto
6B
H Seppälä & V Husgafvel
Syksy 2015
Harjoitus 6B
Tilastollinen riippuvuus ja korrelaatio
Yhden selittäjän lineaarinen regressio
Tuntitehtävät
6B1 Kokeessa tutkittiin erään elektronisen komponentin elinaikaa. Koe oli ns. kiihdytetty elinaikakoe, jossa komponentti saadaan vanhenemaan normaalitilannetta nopeammin nostamalla komponentin käyttölämpötilaa. Kokeeseen poimittiin satunnaisesti viisi
komponenttia, joita käytettiin viidessä erilaisessa lämpötilassa kunnes ne lakkasivat toimimasta. Lämpötilat mitattiin Fahrenheit-asteina (F, havainnot x) ja komponenttien
elinajat mitattiin tunteina (h, havainnot y). Alla on listattu havainnot x ja y.
i
xi
yi
1
2
3
4
5
500 600 700 800 900
804 791 658 599 562
(a) Piirrä havaittujen lukuparien (xi , yi ) hajontakuvio.
(b) Arvioi hajontakuvion perusteella havaintojen x ja y otoskorrelaation merkki ja
suuruusluokka.
(c) Havaintojen x ja y summat, neliösummat ja tulosumma ovat:
n
X
i=1
n
X
xi = 3500
x2i = 2550000
i=1
n
X
n
X
i=1
n
X
yi = 3414
yi2 = 2379706
i=1
xi yi = 2322200
i=1
Laske havaintojen x ja y keskiarvot, otoskeskihajonnat ja otoskorrelaatio.
6B2 Tutkimuksessa todettiin, että kuulalaakerin kuulien eksentrisyys (havainnot x) ja pinnan tasaisuus (havainnot y) noudattavat likimäärin kaksiulotteista normaalijakaumaa.
Havaintojen x ja y välinen otoskorrelaatio oli 0.1 ja otoskoko 100. Testaa 5 %:n merkitsevyystasoa käyttäen nollahypoteesia, että havainnot x ja y ovat korreloimattomia, kun
oletetaan että havainnot
(xi , yi ), i = 1, 2, ..., 100,
ovat realisaatioita riippumattomista satunnaisvektoreista, jotka noudattavat kaksiulotteista normaalijakaumaa
N2 µx , µ2 , σx , σy , ρxy
1/2
Todennäköisyyslaskennan ja tilastotieteen peruskurssi
Matematiikan ja systeemianalyysin laitos
Aalto-yliopisto
H Seppälä & V Husgafvel
Syksy 2015
Harjoitus 6B
Kotitehtävät
6B3 Kokeessa tutkittiin seitsemän kuorma-auton polttoainetaloudellisuuden y (mailia/gallona) riippuvuutta ajoneuvon painosta x (tonnia). Kokeesta saatu data on listattu alla.
i
xi
yi
1
2
3
4
5
6
7
8.00 24.50 27.00 14.50 28.50 12.75 21.25
7.69 4.97 4.56 6.49 4.34 6.24 4.45
Tästä aineistosta saadaan laskettua havaintojen x ja y keskiarvot, otosvarianssit, otoskeskihajonnat, otoskovarianssi ja otoskorrelaatio:
m(x) = 19.5
m(y) = 5.5343
2
s2 (y) = 1.6547
s (x) = 61.3542
s(x) = 7.8329
s(y) = 1.2863
s(x, y)
= −0.9446
r(x, y) =
s(x)s(y)
s(x, y) = −9.5179
(a) Estimoi lineaarisen regressiomallin
Yi = β0 + β1 xi + i ,
i = 1, 2, ..., n.
regressiokertoimet β0 ja β1 pienimmän neliösumman menetelmällä.
(b) Laske estimoidun mallin sovite ja jäännös havaintoyksikölle i = 6.
(c) Piirrä estimoimasi regressiosuora datapisteitä
(xi , yi ),
i = 1, 2, ..., n
esittävään hajontakuvioon. Piirrä kuvioon myös jäännöstä kuvaava jana.
6B4 Tehtävä 4 on jatkoa tehtävälle 3. Kun syötteen arvo x̃ on havaittu, paras ennuste vastemuuttujan Y arvolle (lineaaristen ja harhattomien ennusteiden joukossa) on
b0 + b1 x̃,
missä b0 ja b1 ovat regressiokertoimien β0 ja β1 pienimmän neliösumman estimaatit.
Ennusteen aineistosta laskettu tason (1 − α) ennusteväli on muotoa
s
1
(x̃ − m(x))2
b0 + b1 x̃ ± tα/2 S 1 + +
n (n − 1)s2 (x)
missä tα/2 on t(n − 2)-jakauman (1 − α/2)-kvantiili, S 2 on aineistoista laskettu varianssiparametrin σ 2 harhaton estimaatti (tässä tehtävässä sen arvo on 0.214), ja m(x) ja
s2 (x) ovat syötteen havainnoista lasketut keskiarvo ja otosvarianssi. Ennusta vastemuuttujan Y arvo, kun syötemuuttuja saa arvot x = 19.5, x = 26 ja x = 450 (maailman
painavimman kuorma-auton paino). Määritä myös ennusteiden 95 %:n ennustevälit.
2/2