Perttula, Vattulainen, Suurhasko - Tampereen teknillinen yliopisto

Todennäköisyyslaskenta
Opintomoniste kurssille
MAT-02500 Todennäköisyyslaskenta,
Tampereen teknillinen yliopisto
Antti Perttula, Kimmo Vattulainen, Tia Suurhasko
Versio 9/2012
Sisältö
1 Todennäköisyys
1.1 Peruskäsitteitä . . . . . . . . . . . . . .
1.2 Tilastollinen ja klassinen todennäköisyys
1.3 Todennäköisyyslaskennan aksiomat . . .
1.4 Ehdollinen todennäköisyys . . . . . . . .
1.5 Kokonaistodennäköisyys ja Bayesin kaava
1.6 Tapahtumien riippumattomuus . . . . .
2 Todennäköisyysjakaumia
2.1 Empiirisen otoksen kuvailua . . . . . . .
2.2 Diskreetin satunnaismuuttujan jakauma
2.3 Jatkuvan satunnaismuuttujan jakauma .
2.4 Odotusarvo, varianssi ja keskihajonta . .
2.5 Satunnaismuuttujan funktiot . . . . . . .
2.6 Satunnaismuuttujan funktion odotusarvo
2.7 Tsebyshevin epäyhtälö . . . . . . . . . .
2.8 Momentit generoiva funktio . . . . . . .
2.9 Binomijakauma . . . . . . . . . . . . . .
2.10 Poisson jakauma . . . . . . . . . . . . .
2.11 Normaalijakauma . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Yhteisjakaumat ja satunnaismuuttujien funktiot
3.1 Diskreetin satunnaisvektorin jakauma . . . . . . .
3.2 Jatkuvan satunnaisvektorin jakauma . . . . . . .
3.3 Marginaalijakaumat . . . . . . . . . . . . . . . . .
3.4 Satunnaismuuttujien riippumattomuus . . . . . .
3.5 Satunnaismuuttujien funktion odotusarvo . . . . .
3.6 Riippumattomien satunnaismuuttujien summa . .
3.7 Kovarianssi, korrelaatio ja summan varianssi . . .
3.8 Otoskeskiarvon jakauma . . . . . . . . . . . . . .
3.9 Keskeinen raja-arvolause . . . . . . . . . . . . . .
3.10 Tilastollinen testaaminen . . . . . . . . . . . . . .
3.11 χ2 -jakauma ja otosvarianssi . . . . . . . . . . . .
3.12 t- ja F-jakaumat . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
3
5
9
12
13
15
.
.
.
.
.
.
.
.
.
.
.
18
18
20
25
28
31
34
36
37
39
42
45
.
.
.
.
.
.
.
.
.
.
.
.
48
48
49
51
53
56
59
60
64
66
70
72
76
Liite 1. Todennäköisyysjakaumia
80
Liite 2. Jakaumataulukoita
93
2
1
1.1
Todennäköisyys
Peruskäsitteitä
Todennäköisyyslaskennan tavoitteena on kehittää satunnaisluonteisten ilmiöiden kuvaamiseen
soveltuvia matemaattisia malleja. Mallintamisen kohde on satunnaisilmiöön liittyvä koe
(satunnaiskoe) (random experiment), jonka lopputulosta ei saada selville laskemalla ja
päättelemällä vaan tuloksen määrää ”sattuma”. Tavoitteena on malli, jolla voitaisiin mahdollisimman totuudenmukaisesti ennustaa kokeen tuloksia. Jotta mallintaminen on mahdollista,
vaaditaan, että koe voidaan toistaa ja koetoistot ovat riippumattomia, ja että koetoistoissa
esiintyy tilastollista säännönmukaisuutta; yksityisten tulosten suhteelliset frekvenssit näyttävät koetoistojen lukumäärän kasvaessa stabilisoituvan.
Kokeen tulokset eivät välttämättä ole lukuja. Funktiota, joka liittää reaaliluvun tai reaalilukuvektorin jokaiseen koetulokseen, sanotaan satunnaismuuttujaksi (random variable).
Tässä monisteessa satunnaismuuttujat usein ilmoitetaan suoraan kokeen numeerisena (numeeriseksi koodattuna) tuloksena, jolloin funktiotulkintaa ei käytetä. Satunnaismuuttujia merkitään isoilla kirjaimilla X, Y, . . . ja satunnaismuuttujan arvoja vastaavilla pienillä kirjaimilla
x, y, . . . .
Esimerkki 1.1.1. Olkoon rahanheitto satunnaiskoe. Kokeen tulos on päälle jäävä kolikon
puoli, klaava tai kruunu. Koodataan klaava numeroksi 1 ja kruunu numeroksi 2. Näin saadaan
satunnaismuuttuja X=rahanheitos tulos, jonka mahdollisia arvoja ovat 1 ja 2.
Esimerkki 1.1.2. Satunnaisesti valitun henkilön ”ominaisvektori” (X1 , X2 , X3 ), missä X1 on
sukupuoli (1=mies, 2= nainen), X2 on pituus (m) ja X3 on paino (kg), on satunnaisvektori
(random vector). Sen komponentit ovat skalaarisia satunnaismuuttujia. Komponenteista X2
ja X3 riippuva ”painoindeksi” Z = X3 /X2 2 on myös satunnaismuuttuja.
Kokeen mahdollista yksittäistä koetulosta sanotaan alkeistapaukseksi (sample point).
Kaikkien mahdollisten alkeistapausten joukko on otosavaruus (sample space) Ω.
Otosavaruuden osajoukko A ⊂ Ω on tapahtuma (event).
Olkoon A ⊂ Ω. Sanotaan, että kokeessa realisoituu tapahtuma A, jos koetulos on A:n alkio.
Myös otosavaruus Ω ja tyhjä joukko ∅ ovat otosavaruuden osajoukkoja ja siis tapahtumia.
Otosavaruus Ω itse on ”varma tapahtuma”. ”Mahdotonta tapahtumaa” merkitään tyhjän joukon symbolilla ∅; onhan ∅ joukko, jossa ei ole ainuttakaan alkeistapausta.
3
Esimerkki 1.1.3. Olkoon satunnaiskoe nopanheitto ja kokeeseen liittyvä satunnaismuuttuja
X=’päällimäiseksi jäävä silmäluku’. Sen otosavaruus Ω = {1, 2, 3, 4, 5, 6}. A = {2, 4, 6} =
’parillinen silmäluku’ on eräs tapahtuma. Jos heiton tulos X = 2, niin A realisoitui.
Tästä samasta nopanheitosta voidaan muodostaa myös muita satunnaismuuttujia, esim.
Y =’suurin näkyvissä olevista silmäluvuista’. Piiloon jää vain alapuolinen silmäluku, joten
aina on näkyvissä 5 sivutahkoa. Silmäluku 6 on suurin paitsi, jos se on alapuolella. Silloin 5
on suurin. Satunnaismuuttujan Y otosavaruus on siis ΩY = {5, 6}.
Usein haluttu tapahtuma täytyy esittää usean tapahtuman lausekkeena käyttämällä joukkoopin operaatioita. Kerrataan joukko-opin perusoperaatiot ja annetaan niille todennäköisyyslaskennan tapahtumakuvaus sekä graafinen esitys ns. Venn-diagrammeina.
• Tapahtuman A komplementtitapahtuma A
(complement, muita merkintöjä: A0 , AC , C(A))
A = Ω \ A = {x ∈ Ω : x ∈
/ A} =”A ei realisoidu”
Jos A ja B ovat tapahtumia, niin tapahtumia ovat myös
• Tapahtumien A ja B yhdiste eli unioni (union)
A ∪ B = {x ∈ Ω : x ∈ A tai x ∈ B}=”A tai B realisoituu”
• Tapahtumien A ja B leikkaus (intersection)
A ∩ B = {x ∈ Ω : x ∈ A, x ∈ B} =”A ja B realisoituu”
• Tapahtumien A ja B erotus (difference)
(muita merkintöjä: A − B)
A \ B = A ∩ B = {x ∈ Ω : x ∈ A, x ∈
/ B}
=”A realisoituu mutta B ei”
• Tapahtumien A ja B sanotaan olevan erillisiä (disjoint)
eli toisensa poissulkevia (mutually exclusive),
jos A:lla ja B:llä ei ole yhteisiä alkeistapauksia
eli jos A ∩ B = ∅
4
Esimerkki 1.1.4. Venn-diagrammien avulla voidaan todeta oikeiksi (harjoitustehtävänä)
deMorganin lait
A ∪ B = A ∩ B, A ∩ B = A ∪ B
Kokeen mallintamisessa pyritään löytämään satunnaismuuttujan todennäköisyysjakauma
(probability distribution), jolla voidaan ennustaa tapahtumien realisoituminen luvulla. Todennäköisyysjakaumista kerrotaan luvussa 2.
Todennäköisyysmitta (probability measure) P on funktio, joka liittää jokaiseen tapahtumaan luvun väliltä [0, 1]. Todennäköisyysmitan arvo P (X ∈ A) tai vain lyhyesti P (A) on
tapahtuman A todennäköisyys (probability).
1.2
Tilastollinen ja klassinen todennäköisyys
Arkikielessä todennäköisyydestä voidaan puhua, vaikka taustalla ei olisikaan mitään toistettavissa olevaa koetta tai havaintoa. Tällöin kyse on lähinnä puhujan uskosta, millä todennäköisyydellä jokin tapahtuu, esim. ”99%:n todennäköisyydellä pääsen läpi tentistä”. Miten
sitten voidaan määrittää tapahtuman todennäköisyys? Tässä kappaleessa määritellään kaksi
todennäköisyyden määritelmää, jotka vastaavat hyvin sitä intuitiivista käsitystä, mitä sanalla todennäköisyys ymmärretään. Määritelmät eivät ole matemaattisesti täsmällisiä. Sellainen
määritellään seuraavassa kappaleessa 1.3.
Tilastollinen todennäköisyys
Frekvenssitulkinta. Kun sama koe suoritetaan n kertaa samoissa olosuhteissa, puhutaan
n-toistokokeesta. Merkitään fn (A):lla tapahtuman A realisoitumisen frekvenssiä n-toistokokeessa. Suhde
fn (A)
pn (A) =
n
on tapahtuman A suhteellinen frekvenssi (relative frequency). Frekvenssitulkinnassa määritellään tapahtuman A tilastollinen todennäköisyys (statistical probability) suhteellisen
frekvenssin ”raja-arvona”, kun koetoistojen lukumäärä n kasvaa rajatta:
P (A) = ” lim ” pn (A)
n→∞
Frekvenssitulkinta todennäköisyysmitalle ei ole matemaattisesti tyydyttävä. Miten määritellään esim. äärettömän pitkä koetoistojen sarja tai suhteellisten frekvenssien muodostaman
jonon suppeneminen?
5
Sovellutuksissa frekvenssitulkintaa voidaan käyttää. Reaalimaailmassa on runsaasti kokeita
tai havaintoja, joissa tarkasteltavan tapahtuman suhteellinen frekvenssi ”tuntuu” suppenevan; n-toistokokeissa suurilla n:n arvoilla n1 , n2 , . . . , nk tapahtuman A suhteelliset frekvenssit pn1 (A), pn2 (A), . . . , pnk (A) poikkeavat toisistaan hyvin vähän. Soveltajan tehtävänä on
arvioida suhteellisen frekvenssin ”raja-arvolle” mahdollisimman tarkka arvo. Raja-arvon arviointi helpottuu, jos koetta voidaan simuloida ja toistaa tietokoneilla.
Monet käytännön elämän tapahtumien todennäköisyydet ovat juuri tilastollisia todennäköisyyksiä, sillä ne perustuvat havainnoista tehtyihin tilastoaineistoihin. Esim. jos väitetään, että
kone rikkuu takuuaikanaan todennäköisyydellä 0.01, on tiedon perusteena tavallisesti pitkäaikainen seuranta, että keskimäärin yksi sadasta koneesta on rikkoontunut takuuaikanaan ja
että jatkossakin oletetaan rikkoontumisen noudattavan tätä säännönmukaisuutta.
Klassinen todennäköisyys
Olkoon kokeen otosavaruudessa äärellinen määrä N alkeistapausta Ω = {a1 , a2 , . . . , aN },
jotka ovat kaikki yhtä mahdollisia. Tapahtuman A ⊂ Ω klassinen todennäköisyys on
P (A) =
card(A)
N
missä card(A) tarkoittaa A:n alkioiden lukumäärää (cardinality) eli tapahtumalle A suotuisten (favourable) alkeistapausten lukumäärää. Tapahtuman A todennäköisyys on siis A:lle
suotuisten alkeistapausten lukumäärän ja kaikkien alkeistapausten lukumäärän suhde.
Kun tätä klassisen todennäköisyyden määritelmää sovelletaan, on siis alkeistapausten määrän
oltava äärellinen ja niiden tulee olla yhtä mahdollisia eli niinsanotusti symmetrisiä (symmetric). Havaitaan, että jokaisen alkeistapauksen ai todennäköisyys on tällöin
P (ai ) =
1
N
Sovellutuksissa satunnaiskokeiden alkeistapaukset eivät yleensä ole symmetrisiä eikä tällöin
voida käyttää klassista määritelmää.
Huomautus. Tarkkaan ottaen yllä olevaa ”määritelmää” ei voida pitää määritelmänä; mitä
siinä sanonta ”yhtä mahdollista” oikein tarkoittaa, kun todennäköisyyttä vasta ollaan määrittelemässä?
Klassisen todennäköisyyden ”määritelmässä” suotuisten ja kaikkien alkeistapausten lukumäärien laskeminen saattaa olla mutkikas kombinatorinen tehtävä; seuraavassa annetaan lyhyt
tiivistelmä käyttökelpoisia kombinatorisia käsitteitä.
6
Tuloperiaate. Kuvitellaan (yhdistettyä) koetta, joka voidaan suorittaa p:ssä eri vaiheessa.
Olkoon i:nnen kokeen tulosmahdollisuuksia Ni . Koko kokeessa on eri tulosmahdollisuuksia
N = N1 N2 · · · Np =
P
Y
Ni
i=1
Esimerkki 1.2.1. Koe, jossa on N tulosmahdollisuutta, toistetaan p kertaa. Tässä ptoistokokeessa tulosmahdollisuuksia on N p kappaletta.
Permutaatio, variaatio ja kombinaatio
Joukon alkioiden asettamista eri järjestykseen sanotaan permutoinniksi. Jokainen näin saatu järjestetty joukko eli jono on permutaatio (permutation). n-alkioisella joukolla on tuloperiaatteen perusteella erilaisia permutaatioita n-kertoma kappaletta,
n! = 1 · 2 · · · n
Suurilla arvoilla n voit laskea n-kertomalle likiarvoja Stirlingin kaavalla :
√
n! ≈ 2πn nn e−n
Olkoon joukossa n alkiota. Joukon k-variaatio eli k-permutaatio (k ≤ n) on mikä tahansa
joukon k:sta eri alkiosta muodostettu jono. Ensimmäinen alkio voidaan valita n:llä, toinen
(n − 1):llä, kolmas (n − 2):lla jne., ja viimeinen (n − (k − 1)):llä tavalla. Täten n-alkioisella
joukolla on erilaisia k-permutaatioita
n(n − 1)(n − 2) · · · (n − (k − 1)) =
n!
(n − k)!
Annetun n-alkioisen joukon k-kombinaatio on joukon k-alkioinen osajoukko. Nyt siis alkioiden järjestyksellä ei ole merkitystä.
Lause 1.2.1. n-alkioisen joukon k-kombinaatioiden lukumäärä on binomikerroin
n
n!
k = 0, 1, . . . , n,
0! = 1
=
k
k!(n − k)!
Todistus. Merkitään k-kombinaatioiden lukumäärää x:llä. Koska jokaisella k-kombinaatiolla
on k! erilaista permutaatioita, niin k-permutaatioiden lukumäärä on xk!, ja siis
xk! =
n!
(n − k)!
⇔
7
x=
n!
k!(n − k)!
Esimerkki 1.2.2. Tutkitaan erilaisia ’sanoja’, jotka voidaan muodostaa kirjaimista a-z. Näitä
on 26 kpl, joista vokaaleja on 6 ja konsonantteja 20.
a) Erilaisia 5 kirjaimen sanoja tuloperiaatteen mukaan 26 · 26 · 26 · 26 · 26 = 265 = 11881376.
Tässä siis jokainen kirjain voidaan valita useamman kerran.
b) Sellaisia sanoja, joissa kirjaimet ovat järjestyksessä konsonantti + vokaali + konsonantti +
sama kuin edellinen konsonantti + vokaali (siis esimerkiksi ’kello’) on tuloperiaatteen mukaan
20 · 6 · 20 · 1 · 6 = 14400.
c) Jos yhden kirjaimen voi valita sanaan vain kerran, on kyse kirjainjoukon a-z permutaatioista. Nyt erilaisia 5 kirjaimen sanoja, joissa voi esiintyä yksi kirjain vain kerran on
26 · 25 · 24 · 23 · 22 = 7893600.
d) Jos halutaan vaihtaa jonkin sanan kirjaimien järjestystä on kyse ns. anagrammista. Esim.
sanan ’aitat’ eräs anagrammi on ’taiat’. Sanan ’aitat’ anagrammien lukumäärää laskettaessa
tulee ottaa huomioon kirjaimien ’a’ ja ’t’ esiintyminen kahdesti. Kaikkiaan 5 eri kirjainta
voidaan järjestää 5! = 120 eri tavalla. Näistä on sanan ’aitat’ kohdalla sama sana aina neljä
kertaa: kaksi a-kirjainta voidaan järjestää 2!=2 eri tavalla samoin kaksi t-kirjainta. Siksi sanan
’aitat’ erilaisia anagrammeja on 5!/(2!2!) = 30 erilaista.
e) Edellä on ollut kyse sanoista, joissa kirjainten järjestyksellä on merkitystä. Tutkitaan nyt
erilaisia kirjainjoukkoja, joissa järjestyksellä ei ole merkitystä. 26 kirjaimesta voidaan valita
erilaisia 5 kirjaimen joukkoja
26
26!
26 · 25 · 24 · 23 · 22
=
=
= 65780
5
5!21!
5!
Edellä olevan yhtälöketjun toiseksi viimeisestä muodosta saadaan binomikertoimelle seuraava
tulkinta. Erilaisten 5 alkion osajoukkojen määrä saadaan jakamalla 5-permutaatioiden määrä
(= 26 · 25 · 24 · 23 · 22) erilaisilla 5 alkion järjestyksillä (= 5!).
f ) Sellaisia 5 kirjaimen joukkoja, joissa on kaksi eri vokaalia ja kolme eri konsonanttia on
tuloperiaatteen mukaan
6
20
6!
20!
·
=
·
= 17100
2
3
2!4! 3!17!
g) Klassisia todennäköisyyksiä laskettaessa tutkitaan suotuisten alkeistapausten ja kaikkien
alkeistapausten lukumäärien osamäärää. Esimerkiksi siis
• Todennäköisyys, että 5 kirjaimen sanassa on 5 eri kirjainta on 7893600/11881376 = 0.664
(tapaukset a) ja c)).
• Todennäköisyys, että 5 kirjaimen joukossa on kaksi eri vokaalia ja kolme eri konsonanttia
on 17100/65780 = 0.260 (tapaukset e) ja f )).
8
1.3
Todennäköisyyslaskennan aksiomat
Klassisella ja frekvenssitulkintaan perustuvalla todennäköisyydellä on omat rajoituksensa.
Klassinen todennäköisyys edellyttää äärellisen määrän yhtä mahdollisia alkeistapauksia. Jos
klassista todennäköisyyttä käytetään mallina, joudutaan satunnaiskokeelle olettamaan alkeistapaukset yhtä mahdollisiksi. Kuinka hyvin malli toimii, riippuu siitä, miten hyvin oletus sopii
yhteen todellisuuden kanssa.
Frekvenssitulkinnassa käytetään suhteellisen frekvenssin raja-arvoa. Tällaista raja-arvoa ei
voida tarkalleen saavuttaa, koska äärettömiä koesarjoja ei voida toteuttaa. Frekvenssitulkintaa käytettäessä muodostetut todennäköisyydet ovat vain likiarvoja todellisille todennäköisyyksille.
Kuten muukin matematiikka todennäköisyyslaskenta on aksiomatisoitu. Tällä on pyritty antamaan todennäköisyyslaskennalle matemaattisesti pitävä perusta.
Todennäköisyysmitta P on otosavaruuden Ω osajoukkojen muodostamassa joukossa F
määritelty reaaliarvoinen joukkofunktio P : F → R, joka toteuttaa seuraavat
Kolmogorovin aksiomat :
Aksioma 1. 0 ≤ P (A) ≤ 1 ∀A ∈ F
Aksioma 2. Jos A1 , A2 , · · · ∈ F on (ääretön) jono pareittain erillisiä tapahtumia
(pairwise disjoint events), so. Ai ∩ Aj = ∅ jos i 6= j, niin
P (A1 ∪ A2 ∪ . . . ) = P (A1 ) + P (A2 ) + . . .
Aksioma 3. P (Ω) = 1 ja P (∅) = 0
Jos otosavaruus on äärellinen, voidaan todennäköisyysmitan määrittelyjoukoksi F ottaa Ω:n
kaikkien osajoukkojen joukko. Ajan, pituuden ym. jatkuvasti muuttuvien suureiden yhteydessä otosavaruus on useimmiten ääretön. Tällöin määrittelyjoukoksi ei voida ottaa Ω:n kaikkien osajoukkojen joukkoa, vaan vain tietyn ”σ-algebran” toteuttavat riittävän ”säännölliset”
tapahtumat hyväksytään määrittelyjoukkoon F. Soveltajaa tämä ei haittaa, sillä reaalimaailmassa kokeen tapahtumat ovat ”säännöllisiä” ja muodostavat ”σ-algebran”.
Todennäköisyyden ominaisuuksia. Olkoon P otosavaruuden Ω todennäköisyysmitta. Aksiomiin nojautuen johdetaan todennäköisyyksille eräitä hyödyllisiä laskusääntöjä.
Lause 1.3.1. Jos A1 , A2 , . . . , An on kokoelma pareittain erillisiä tapahtumia, niin
P (A1 ∪ A2 ∪ · · · ∪ An ) = P (A1 ) + P (A2 ) + · · · + P (An )
9
Todistus. Laajennetaan kokoelma pareittain erillisten tapahtumien jonoksi asettamalla
Ai = ∅, i = n + 1, n + 2, . . . . Nyt
!
!
n
∞
n
n
[
[
X
X
Aks 2+3
P
Ai = P
Ai
=
P (Ai ) + 0 =
P (Ai ) i=1
Seuraus.
A∩B =∅
i=1
⇒
i=1
i=1
P (A ∪ B) = P (A) + P (B)
Lause 1.3.2.
P (A) = 1 − P (A)
Todistus. A ∩ A = ∅, A ∪ A = Ω
Seur.
⇒
P (A) + P (A) = P (Ω) = 1
Esimerkki 1.3.1. Pelaaja heittää kahta noppaa. Hän suorittaa 24 pelikierrosta. Hän voittaa,
jos hän saa ainakin kerran kuutosparin. Olkoon A = ”ainakin kerran kuutospari”, jolloin
24
A = ”ei kertaakaan kuutosparia”. Koska tuloperiaatteen mukaan P (A) = 35
, niin voitto36
todennäköisyys on
24
35
P (A) = 1 − P (A) = 1 −
= 0.491
36
Lause 1.3.3. Yhteenlaskusääntö (Additive rule). Mielivaltaisille tapahtumille A ja
B pätee
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
Todistus. Annetaan A ja A ∪ B erillisten tapahtumien yhdisteenä:
A = (A ∩ B) ∪ (A ∩ B)
B
A
A ∪ B = B ∪ (A ∩ B)
A ÇB
Seurauksen nojalla
P (A) = P (A ∩ B) + P (A ∩ B)
P (A ∪ B) = P (B) + P (A ∩ B)
mistä puolittain vähentämällä seuraa väite. 10
A ÇB
Edellisen lauseen avulla voidaan todistaa (harjoitustehtävänä), että kolmen tapahtuman
A1 , A2 , A3 yhdisteen todennäköisyydelle pätee yhteenlaskusääntö:
P (A1 ∪ A2 ∪ A3 ) =P (A1 ) + P (A2 ) + P (A3 )
− P (A1 ∩ A2 ) − P (A1 ∩ A3 ) − P (A2 ∩ A3 )
+ P (A1 ∩ A2 ∩ A3 )
Induktiotodistuksella yhteenlaskusääntö voidaan yleistää.
Tapahtumien A1 , A2 , . . . , An yhdisteen todennäköisyydelle pätee kaava
!
n
n
[
X
XX
P
Ai =
P (Ai ) −
P (Ai ∩ Aj )
i=1
i=1
+
XX
i<j
P (Ai ∩ Aj ∩ Ak ) − · · · + (−1)n+1 P
n
\
!
Ai
i=1
i<j<k
Huomautus. Koska joukko-opin Venn-diagrammilla piirrettyjen joukkojen pinta-alat täyttävät myös Kolmogorovin aksiomat, voidaan niiden avulla muistaa ja hahmotella, (mutta ei
todistaa!) todennäköisyyslaskennan laskusääntöjä.
Esimerkki 1.3.2. Pakasta vedetään yksi kortti. Millä todennäköisyydellä se on (a) pata tai
ässä? (b) mustakortti, pata tai ässä?
(a) Merkitään A = ”pata” ja B = ”ässä”. Nyt P (A) =
13
,
52
P (A ∪ B) = P (A) + P (B) − P (A ∩ B) =
(b) Merkitään C = ”musta”. Nyt P (C) =
1
P (A ∩ B ∩ C) = 52
. Siis
26
,
52
P (B) =
4
52
ja P (A ∩ B) =
13 + 4 − 1
16
4
=
=
52
52
13
P (A ∩ C) =
13
,
52
P (B ∩ C) =
2
52
P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B) − P (A ∩ C)
− P (B ∩ C) + P (A ∩ B ∩ C)
13 + 4 + 26 − 1 − 13 − 2 + 1
28
7
=
=
=
52
52
13
11
ja
1
.
52
Siis
1.4
Ehdollinen todennäköisyys
Olkoon A ja B kaksi tapahtumaa, joista tapahtuman B tiedetään tapahtuneen. Ajatellaan nyt
B otosavaruudeksi, jossa tarkastellaan tapahtuman A realisoitumista. Jos lisäksi myös A on
tapahtunut, on tämä tapahtuma joukko A∩B. Nyt tapahtuman A todennäköisyys ehdolla, että tapahtuma B on realisoitunut, on tapahtuman A ∩ B ⊂ B todennäköisyys otosavaruudessa
B. Tätä sanotaan A:n ehdolliseksi todennäköisyydeksi ehdolla B ja sitä merkitään P (A | B):
Määritelmä 1.4.1. Olkoot A ja B tapahtumia ja olkoon P (B) > 0. Tapahtuman A
ehdollinen todennäköisyys ehdolla B (conditional probability) on luku
P (A | B) =
P (A ∩ B)
P (B)
Esimerkki 1.4.1. Liikenneonnettomuuksista 55 % aiheutuu kuljettajan huonosta ajotaidosta, 12 % auton teknillisestä viasta ja 5 %:ssa on syynä sekä huono ajotaito että teknillinen
vika. On tapahtunut liikenneonnettomuus ja on havaittu, että onnettomuuden aiheuttaneessa
autossa on teknillinen vika. Millä todennäköisyydellä onnettomuuteen vaikutti myös kuljettajan huono ajotaito?
Olkoon A = ”syynä huono ajotaito” ja B = ”syynä tekninen vika”. Nyt P (A) = 0.55,
P (B) = 0.12 ja P (A ∩ B) = 0.05. Kysytty todennäköisyys on
P (A | B) =
0.05
= 0.42.
0.12
Ehdollisen todennäköisyyden määritelmästä seuraa
Kertolaskusääntö (Multiplicative rule). Jos P (B) > 0, niin
P (A ∩ B) = P (B)P (A | B)
Kolmen tapahtuman A1 , A2 , A3 leikkauksen todennäköisyydelle pätee kertolaskusääntö:
P (A1 ∩ A2 ∩ A3 ) = P ((A1 ∩ A2 ) ∩ A3 )
= P (A1 ∩ A2 )P (A3 | A1 ∩ A2 )
= P (A1 )P (A2 | A1 )P (A3 | A1 ∩ A2 )
edellyttäen, että P (A1 ∩ A2 ) > 0. Induktiolla voidaan todistaa
12
Kertolaskusäännön yleistys
!
n
\
P
Ai = P (A1 )P (A2 | A1 )P (A3 | A1 ∩ A2 ) · · · P
An |
i=1
n−1
\
!
Ai
i=1
edellyttäen, että P (A1 ∩ A2 ∩ · · · ∩ An−1 ) > 0.
Esimerkki 1.4.2. Ryhmässä on 30 henkilöä, joista 20:llä on DI-tutkinto. Valitaan satunnaisesti 3 henkilöä. Mikä on todennäköisyys, että kaikilla on DI-tutkinto?
Tehtävä voidaan ratkaista suoraan kombinatorisesti:
20
3
30
3
P (”kaikilla DI”) =
= 0.28
tai kertolaskusäännöllä: Ajatellaan henkilöt valituksi peräkkäin yksi kerrallaan ja merkitään
Ai =”i:s on DI ja muut mitä tahansa”. Nyt
P (”kaikilla DI”) = P (A1 ∩ A2 ∩ A3 )
= P (A1 )P (A2 | A1 )P (A3 | A1 ∩ A2 )
20 19 18
=
·
·
= 0.28
30 29 28
1.5
Kokonaistodennäköisyys ja Bayesin kaava
Oletetaan, että otosavaruudessa Ω on ositus (partition)
B1 , B2 , . . . , Bn eli tapahtumat Bi ovat pareittain erillisiä
ja
Ω = B1 ∪ B2 ∪ · · · ∪ Bn
Tällöin tapahtuma A ⊂ Ω voidaan antaa pareittain erillisten tapahtumien A ∩ Bi , i = 1, . . . , n yhdisteenä
A = (A ∩ B1 ) ∪ (A ∩ B2 ) ∪ · · · ∪ (A ∩ Bn )
joten lauseen 1.3.1 perusteella
P (A) =
n
X
P (A ∩ Bi )
i=1
Jos nyt P (Bi ) > 0, i = 1, . . . , n, saadaan tästä kertolaskusäännön nojalla
13
Tapahtuman A kokonaistodennäköisyyden kaava (theorem of total probability):
P (A) =
n
X
P (Bi )P (A | Bi )
i=1
Kaavalla voit laskea todennäköisyyden P (A), kun tunnet ositteiden Bi todennäköisyydet ja
tapahtuman A todennäköisyydet ositteissa Bi .
Ehdolliselle todennäköisyydelle P (Bk | A) = P (Bk ∩ A)/P (A) saadaan kertolaskusääntöä
P (Bk ∩ A) = P (Bk )P (A | Bk ) ja kokonaistodennäköisyyden kaavaa käyttäen
Bayesin kaava (Bayes’ rule). Jos B1 , B2 , . . . , Bn on otosavaruuden Ω ositus ja
P (Bi ) > 0, i = 1, . . . , n, sekä P (A) > 0, niin
P (Bk )P (A | Bk )
P (Bk | A) = Pn
i=1 P (Bi )P (A | Bi )
Esimerkki 1.5.1. Tehtaan tuotannosta 1 % on viallisia (tapahtuma B1 ), 5 % huonoja (tapahtuma B2 ) ja 94 % hyviä (tapahtuma B3 ). Kehitettiin testauslaite, joka hylkää viallisen
tuotteen todennäköisyydellä 0.90 ja huonon tuotteen todennäköisyydellä 0.70. Todennäköisyydellä 0.10 testi saattaa virheellisesti hylätä tuotteen, vaikka tuote olisi hyvä.
Olkoon valittu satunnaisesti tuote ja testilaite on hylännyt sen. Mikä on todennäköisyys, että
tämä tuote todella on viallinen?
Annettujen tietojen perusteella P (B1 ) = 0.01, P (B2 ) = 0.05 ja P (B3 ) = 0.94. Olkoon
A =”tuote hylätään”. Tällöin P (A | B1 ) = 0.90, P (A | B2 ) = 0.70, P (A | B3 ) = 0.10
ja
P (B1 )P (A | B1 )
P (B1 )P (A | B1 ) + P (B2 )P (A | B2 ) + P (B3 )P (A | B3 )
0.01 · 0.90
=
≈ 0.065
0.01 · 0.90 + 0.05 · 0.70 + 0.94 · 0.10
P (B1 | A) =
Nimittäjässä oleva lauseke
P (B1 )P (A | B1 ) + P (B2 )P (A | B2 ) + P (B3 )P (A | B3 )
on tuotteen hylkäämisen kokonaistodennäköisyys eli
P (A) = 0.01 · 0.90 + 0.05 · 0.70 + 0.94 · 0.10 ≈ 0.138
14
Esimerkki 1.5.2. Testissä saadaan selville 95% dopingia käyttäneistä. 2% testatuista urheilijoista tulee ns. väärä positiivinen tulos eli heille testi on positiivinen, vaikka he ovatkin puhtaita. Oletetaan, että 1% urheilijoista käyttää dopingia. Jos satunnaisesti valitun urheilijan
testitulos on positiivinen, millä todennäköisyydellä hän on käyttänyt dopingia?
Määritellään tapahtumat D=’käyttää dopingia’ ja T =’tulos on positiivinen’. Tietojen
perusteella P (D) = 0.01, P (D) = 0.99, P (T | D) = 0.95, ja P (T | D) = 0.02
Tapahtumat D ja D (käyttäjät ja ei-käyttäjät) muodostavat otosavaruuden osituksen ja kokonaistodennäköisyyden kaavalla
P (T ) = P (T ∩ D) + P (T ∩ D)
Kysytty todennäköisyys on P (D | T ). Ehdollisen todennäköisyyden määritelmän perusteella
saadaan
P (D | T ) =
1.6
P (T ∩ D)
P (T ∩ D)
=
P (T )
P (T ∩ D) + P (T ∩ D)
=
P (D)P (T | D)
P (D)P (T | D) + P (D)P (T | D)
=
0.01 · 0.95
= 0.324
0.01 · 0.95 + 0.99 · 0.02
Tapahtumien riippumattomuus
Määritelmä 1.6.1. Saman otosavaruuden tapahtumat A ja B ovat (tilastollisesti)
riippumattomia ((statistically) independent), jos
P (A ∩ B) = P (A)P (B)
Määritelmästä saadaan seuraus:
Jos P (B) > 0, niin A ja B ovat riippumattomia täsmälleen silloin, kun
P (A | B) = P (A)
Täten sanalla ”riippumaton” on sisältöä sikäli, että toisen tapahtuman realisoituminen ei
vaikuta toisen tapahtuman todennäköisyyteen.
15
Esimerkki 1.6.1. Tapahtumien riippumattomuus saattaa olla hyvin muodollista; sille ei
löydy selvää tulkintaa. Tarkastellaan nopanheittoa. Olkoot A = {1, 2} ja B = {”parillinen”} =
{2, 4, 6}. Tapahtumat A ja B ovat määritelmän mukaan riippumattomia, sillä
P (A ∩ B) = P ({2}) =
1
6
ja P (A)P (B) =
2 3
1
· =
6 6
6
Esimerkki 1.6.2. Osoitetaan, että jos A ja B ovat riippumattomia, niin myös A ja B ovat
riippumattomia. Oletuksen mukaan siis P (A ∩ B) = P (A)P (B), jolloin
P (A ∩ B) = P (A) − P (A ∩ B)
= P (A) − P (A)P (B)
= P (A)(1 − P (B))
= P (A)P (B).
Siis myös A ja B ovat riippumattomia.
Useamman kuin kahden tapahtuman riippumattomuus määritellään seuraavasti:
Määritelmä 1.6.2. Tapahtumat A1 , . . . , An ovat riippumattomia, jos jokaiselle näiden
tapahtumien joukon osajoukolle A(1) , A(2) , . . . , A(m) , m ≤ n pätee
P (A(1) ∩ A(2) ∩ · · · ∩ A(m) ) = P (A(1) )P (A(2) ) · · · P (A(m) )
Esimerkki 1.6.3. Tapahtumat A1 , A2 ja A3 ovat riippumattomia, jos ne ovat pareittain
riippumattomia ja P (A1 ∩ A2 ∩ A3 ) = P (A1 )P (A2 )P (A3 ).
Huomautus 1. Tapahtumien riippumattomuus säilyy, jos jo(t)kin tapahtuma(t) korvataan
komplement(e)illaan.
Huomautus 2. Käytännössä, jos ei ole mitään näyttöä tapahtumien riippuvuudesta, oletetaan tapahtumat riippumattomiksi, jolloin siis tapahtumien leikkauksien todennäköisyys on
tapahtumien todennäköisyyksien tulo.
Esimerkki 1.6.4. Tarkastellaan toistokoetta. Toistot voidaan olettaa toisistaan riippumattomiksi. Olkoon A kokeen tapahtuma, jonka esiintymistä seurataan. Tällöin
P (Aˆ1 ∩ Aˆ2 ∩ · · · ∩ Aˆn ) = P (Aˆ1 )P (Aˆ2 ) · · · P (Aˆn )
missä Aˆi voi olla joko n-toistokokeen tapahtuma ”i:nnessä toistossa realisoituu A” tai tapahtuma ”i:nnessä toistossa realisoituu A”.
16
Esimerkki 1.6.5. Olkoon laitteessa komponenttien Ki toiminta toisistaan riippumatonta.
Olkoon Ai =”komponentti Ki toimii aikavälin ∆t” ja olkoon P (Ai ) = pi . Laske todennäköisyys, että laite toimii aikavälin ∆t, kun laite koostuu a) sarjaan b) rinnan kytketyistä
komponenteista K1 , K2 , . . . , Km . c) Entä jos laite on oheisen kuvan mukainen?
Olkoon A = ”laite toimii aikavälin ∆t”.
a) Komponenttien ollessa kytketty sarjaan laite toimii, jos jokainen komponentti toimii
P (A) = P (A1 ∩ A2 ∩ · · · ∩ Am ) = P (A1 )P (A2 ) · · · P (Am ) =
m
Y
pi
i=1
b) Rinnan kytkennässä taas riittää, että yksikin komponentti toimii. De Morganin säännöllä
!
m
Y
P (A) = P (A1 ∪ A2 ∪ · · · ∪ Am ) = 1 − P (A1 ∩ A2 ∩ · · · ∩ Am ) = 1 −
(1 − pi )
i=1
c) Nyt joko ylä- tai alasarjan täytyy toimia. Merkitään Ay =”yläsarja toimii” ja Aa =”alasarja
toimii”
P (A) = P (Ay ∪ Aa )
= 1 − P (Ay ∩ Aa )
= 1 − P (Ay )P (Aa )
!
!
m
m
Y
Y
=1− 1−
pi
1−
pi
=1−
=2
m
Y
i=1
i=1
m
Y
1−2
pi −
i=1
pi +
i=1
m
Y
p2i
i=1
17
m
Y
i=1
!
p2i
2
Todennäköisyysjakaumia
Satunnaismuuttujia koskevan päätöksenteon pohjana on, että satunnaismuuttujan todennäköisyysjakauma tunnetaan. Tässä kappaleessa tutustutaan todennäköisyysjakaumiin yleisesti, niiden tunnuslukuihin sekä muutamiin tavallisimpiin jakaumiin. Käytännön sovelluksissa
lähtökohtana on usein empiirinen havaintoaineisto, jolloin sen perusteella voidaan tehdä päätelmiä satunnaismuuttujan jakaumasta tai ainakin jakauman ns. parametreista, jos jakauma
on jo etukäteen kiinnitetty, esim. normaalijakaumaksi. Kerrataan aluksi ns. kuvailevaa eli
deskriptiivistä tilastotiedettä, jossa empiirisen otosta kuvaillaan tunnusluvuin ja tilastollisen
grafiikan keinoin.
2.1
Empiirisen otoksen kuvailua
Tavallisesti satunnaismuuttujan x todennäköisyysjakauman mallintamisessa aluksi koe toistetaan useita kertoja tai havainnoidaan satunnaismuuttujan arvoja muulla tavoin. Näin saadut satunnaismuuttujan havaintoarvot muodostavat (empiirisen) otoksen (sample). Tämän empiirisen otoksen perusteella voidaan tehdä johtopäätöksiä tästä satunnaismuuttujasta. Enemmän näiden johtopäätösten tekemisen perusteista ja itse johtopäätösten tekemisestä
kerrotaan jatkokurssilla Tilastomatematiikka. Tässä lyhyesti määritetään empiirisistä otosta
kuvaavia tunnuslukuja ja graafisia kuvioita.
Käsitellään n :n alkion otosta, jonka oletetaan olevan peräisin satunnaismuuttujasta x. Empiirisen otoksen frekvenssijakaumassa (frequency distribution) otos järjestetään taulukkomuotoon, jossa luetteloidaan satunnaismuuttujan erisuuret arvot tai luokittelemalla saadut arvoluokat xi ja arvojen esiintymislukumäärät eli frekvenssit (frequency) fi . Usein
on tarkoituksenmukaista käyttää frekvenssien sijasta suhteellisia frekvenssejä (relative
frequency) pi = fi /n. Frekvenssijakaumaa voidaan havainnollistaa graafisesti esim. (frekvenssi)histogrammilla (frequency histogram). Jos käytetään tasavälistä luokittelua, histogrammin muoto havainnollistaa satunnaismuuttujan todennäköisyysjakaumaa.
Kun lasketaan frekvenssien tai suhteellisten frekvenssien kumulatiivisia summia (cumulative
sum) saadaan ns. summafrekvenssit Fi ja suhteelliset summafrekvenssit Fi /n
Fi =
i
X
j=1
i
fj ,
i
F i X fj X
=
=
pj
n
n
j=1
j=1
Nämä arvot vastaavat kysymykseen ”kuinka monta / kuinka suuri osa koetuloksista on tietyn
arvon xi suuruisia tai sitä pienempiä”.
Otosta voidaan kuvailla ns. tunnusluvuilla, jotka yhdellä luvulla kuvaavat jakauman sijaintia
tai arvojen vaihtelua. Otosta x1 , x2 . . . , xn kuvaavista tunnusluvuista tärkeimpiä ovat
18
n
keskiarvo (average, sample mean) :
1X
xi
x=
n i=1
n
1 X
(xi − x)2
n − 1 i=1
√
(otos)keskihajonta (sample standard deviation) :
s = s2
(otos)varianssi (sample variance) :
s2 =
Jos otos on luokiteltu luokkakeskuksina xi ja frekvensseinä fi , i = 1, . . . , k,
niin
k
k
k
X
1X
1 X
2
x=
f i xi =
p i xi
ja
s =
fi (xi − x)2
n i=1
n
−
1
i=1
i=1
P
k
i=1
fi = n ,
Keskihajonta mittaa havaintotulosten xi jakaantumista keskiarvon x molemmin puolin. Mitä
suurempi on keskihajonta s sitä enemmän havaintoarvot xi (keskimäärin) poikkeavat x:sta.
Esimerkki 2.1.1. Oletetaan, että elektronisen komponentin ikä (vuosia) on satunnaismuuttuja. On tutkittu 100 komponentin ikä ja on saatu seuraavat mittaustulokset:
0.24, .62, 0.66, 4.2, 0.54, 6.4, 5.4, 1.6, 2.2, 1.6, 0.30, 1.2, 0.80, 1.9, 0.60, 2.4, 5.4, 0.02, 0.96, 6.4,
0.80, 0.02, 0.96, 3.6, 2.4, 0.50, 1.6, 2.8, 2.2, 2.2, 1.8, 2.6, 0.17, 0.54, 0.30, 0.52, 6.4, 3.2, 2.6, 0.98,
0.02, 0.92, 1.4, 0.44, 0.80, 2.6, 1.2, 6.0, 0.66, 0.26, 7.8, 1.3, 3.8, 6.0, 1.8, 1.1, 0.19, 1.6, 2.6, 4.8,
1.4, 0.34, 1.8, 4.2, 1.2, 3.6, 0.34, 1.1, 4.4, 0.24, 0.74, 2.6, 0.34, 2.8, 3.0, 0.28, 1.2, 0.12, 4.0, 2.4,
2.6, 1.3, 1.1, 4.0, 4.4, 2.0, 0.66, 0.12, 0.44, 0.62, 0.66, 3.6, 0.80, 2.8, 0.08, 5.4
1.5,
1.2,
2.8,
2.6,
Kun data luokitellaan luokkina 0 − 1, 1 − 2, . . . , 7 − 8 saadaan seuraava frekvenssitaulukko
Luokka
frekvenssi
fi
0–1
1–2
2–3
3–4
4–5
5–6
6–7
7–8
39
21
18
6
7
3
5
1
suhteellinen
frekvenssi
fi /n
0.39
0.21
0.18
0.06
0.07
0.03
0.05
0.01
19
summafrekvenssi
Fi
39
60
78
84
91
94
99
100
suhteellinen
summafrekvenssi
Fi /n
0.39
0.60
0.78
0.84
0.91
0.94
0.99
1.00
Otoksen keskiarvo x = 1.99, varianssi s2 = 3.18 ja otoskeskihajonta s = 1.78. Alla oleva frekvenssihistogrammi muistuttaa muodoltaan satunnaismuuttujan x todennäköisyysjakaumaa.
2.2
Diskreetin satunnaismuuttujan jakauma
Satunnaismuuttuja X on diskreetti, jos se voi saada vain erillisiä arvoja. Siten sen otosavaruudessa Ω on äärellinen tai ääretön määrä alkeistapauksia, joiden todennäköisyydet ovat
positiivisia,
Ω = {x1 , x2 , . . . , xn , . . . }
Diskreetin satunnaismuuttujan X todennäköisyysjakauma tunnetaan, kun vain tiedetään, millä todennäköisyydellä X saa eri arvot xi eli mitä on P (X = xi ). Tämä ilmoitetaan määrittelemällä satunnaismuuttujan tiheysfunktio:
Funktio f : R → [0, 1] on diskreetin satunnaismuuttujan X, otosavaruutenaan Ω,
tiheysfunktio (density function), jos
1. f (x) ≥ 0
P
2.
f (x) = 1
x∈Ω
3. f (x) = P (X = x)
Huomautus 1. Satunnaismuuttujan X tiheysfunktio f (x) on siis määritelty kaikilla reaaliluvuilla. Tavallisesti tiheysfunktion muoto kerrotaan vain otosavaruudessa ja jätetään mainitsematta itsestään selvä f (x) = 0, jos x ∈
/ Ω.
20
Arvoja f (xi ) = P (X = xi ), missä xi ∈ Ω, kutsutaan pistetodennäköisyyksiksi. Diskreetin
satunnaismuuttujan tiheysfunktiosta käytetäänkin myös nimitystä pistetodennäköisyysfunktio. Mielivaltaisen tapahtuman A ⊂ Ω todennäköisyys P (A) saadaan summaamalla yhteen
A:n alkioiden pistetodennäköisyydet,
X
P (A) =
f (x)
x∈A
Näin määritelty todennäköisyysmitta P toteuttaa Kolmogorovin aksiomat.
Esimerkki 2.2.1. Satunnaismuuttujan X, jonka otosavaruus Ω = {1, 2, 3, . . . } ja
P (X = x) = 1/2x , kun x ∈ N, jakauma ilmoitetaan tiheysfunktiolla
f (x) =
1
,
2x
kun x = 1, 2, . . . .
Diskreetin satunnaismuuttujan X jakaumaa voi havainnollistaa graafisesti janadiagrammilla,
jossa arvoon xi on liitetty f (xi )-pituinen jana.
Lasketaan ehdollinen todennäköisyys
P ({X > 2} ∩ {X < 4})
P (X = 3)
=
P (X < 4)
P (X < 4)
f (3)
1/8
1
=
=
=
f (1) + f (2) + f (3)
1/2 + 1/4 + 1/8
7
P (X > 2 | X < 4) =
Diskreetin satunnaismuuttujan X kertymäfunktio (cumulative distribution function)
F (x) määritellään
X
F (x) = P (X ≤ x) =
f (t), x ∈ R
t≤x
21
Diskreetin satunnaismuuttujan kertymäfunktio on kasvava porrasfunktio (kohdassa x = xi on
f (xi ):n suuruinen hyppäys) ja
0 ≤ F (x) ≤ 1,
lim F (x) = 0,
x→−∞
lim F (x) = 1
x→∞
Jos tunnet kertymäfunktion, voit helposti laskea tapahtumien todennäköisyyksiä, esimerkiksi
P (a < X ≤ b) = F (b) − F (a)
P (a ≤ X ≤ b) = F (b) − F (a) + P (X = a)
Diskreetin satunnaismuuttujan tapahtuman todennäköisyyttä laskettaessa on tärkeää huomata kuuluvatko rajat mukaan tapahtumaan vai eivät.
Esimerkki 2.2.2. Määrätään esimerkin 2.2.1 satunnaismuuttujan X kertymäfunktio. Arvolla
x ∈ N on
x
X
1 geom. summa
1
F (x) = P (X ≤ x) =
=
1− x
t
2
2
t=1
joten kertymäfunktio on
F (x) =
(
1−
1
,
2x
0,
kun t ≤ x < t + 1 (t = 1, 2, . . . )
kun x < 1
Diskreetti satunnaismuuttuja X noudattaa diskreettiä tasajakaumaa, (discrete uniform distribution), jos sen otosavaruudessa Ω on äärellinen määrä n symmetrisiä=yhtä
todennäköisiä alkeistapauksia. Tällöin X:n tiheysfunktio on
f (x) =
1
,
n
kun x ∈ Ω
Usein alkeistapaukset ovat kokonaislukuja Ω = {a, a + 1, a + 2, . . . , b}, joita on b − a + 1
kappaletta. Tällöin merkitään X ∼ Tasd(a, b) ja tiheysfunktio
f (x) =
1
,
b−a+1
kun x ∈ Ω = {a, a + 1, a + 2, . . . , b}
22
Esimerkki 2.2.3. Nopanheiton tuloksen X otosavaruus Ω = {1, 2, 3, 4, 5, 6} ja se noudattaa
diskreettiä tasajakaumaa X ∼ Tasd(1, 6). Tiheysfunktio on
1
f (x) = ,
6
kun x ∈ Ω.
Esimerkki 2.2.4. Hypergeometrinen jakauma (hypergeometric distribution). Tiedetään
että N kappaleen joukossa on m kappaletta tuotetta A. Poimitaan joukosta n kappaleen satunnaisotos ilman takaisinpanoa. Olkoon satunnaismuuttuja X =’Otoksessa olevien tuotteiden
A lukumäärä’. Mitä on P (X = x)?
Suotuisia tapahtumia, joissa x on tuotetta A ja n − x muita kuin tuotteita A, on tuloperiaat N −m
N
teen nojalla m
kappaletta.
Kaikkiaan
n
alkion
otoksia
on
, joten
x
n−x
n
P (X = x) =
m
x
N −m
n−x
N
n
Sanotaan, että satunnaismuuttuja X noudattaa hypergeometrista jakaumaa parametrein
(N, m, n), merkitään X ∼ Hyperg(N, m, n). Sen otosavaruus Ω on kaikkien sellaisten kokonaislukujen x joukko, että
max{0, n − (N − m)} ≤ x ≤ min{n, m}
Laatikossa on m = 5 valkoista ja 7 mustaa palloa, yhteensä siis N = 12 palloa. Näistä
valitaan palauttamatta n = 6 palloa. Valkoisten pallojen lukumäärä tässä 6 pallon otoksessa
X ∼ Hyperg(12, 5, 6), Ω = {0, 1, 2, 3, 4, 5} ja sen tiheysfunktio on
7 5
f (x) =
x
6−x
12
6
, x ∈ Ω = {0, 1, 2, 3, 4, 5}
Nyt todennäköisyys, että otoksessa olisi vähintään 4 valkoista palloa on
5 7
5 7
5 · 21 1 · 7
P (X = 4) + P (X = 5) = f (4) + f (5) = 4 122 + 5 121 =
+
= 0.121
924
924
6
6
23
Esimerkki 2.2.5. Kurssilla on 5 harjoituskertaa=aihealuetta. Tentissä on 4 tehtävää satunnaisesti valitusta 4 aihealueesta, yksi kustakin. Kurssin 250 opiskelijaa valmistautuvat tenttiin opiskelemalla täydellisesti vain kahden aihealueen kaikki harjoitukset, jokainen siis valitsee
omat 2 aihealuettaan. Kurssista pääsee läpi osaamalla puolet tehtävistä (2/4). Kuinka moni
a) pääsee läpi 1. tenttikerralla
b) ei pääse läpi 3 ensimmäisellä tenttikerralla
a) 5 aihealueesta voidaan valita neljä 54 = 5 eri tavalla. Opiskelijan valitsemat kaksi aihealuetta sisältyvät kolmeen näistä eri kombinaatioista. Olkoon satunnaismuuttuja X = ’sen
tentin järjestysnumero, jolloin opiskelija pääsee läpi’. Näin todennäköisyys, että hän pääsee
läpi 1. tentistä on
3
P (X = 1) = = 0.6
5
ja 250 opiskelijasta pääsee läpi 0.6 · 250 = 150.
b) Mikä on satunnaismuuttujan X tiheysfunktio? X on diskreetti satunnaismuuttuja, jonka
otosavaruus
Ω = {1, 2, 3, . . .}
Jos henkilö pääsee läpi n. kerralla, on hänellä ensin n − 1 epäonnistumista ja sitten
onnistuminen. Tiheysfunktio on siis
f (x) = (0.4)x−1 · 0.6, kun x ∈ {1, 2, 3, . . .}
ja b)-kohdan todennäköisyys on siis
P (X > 3) = 1 − P (X ≤ 3)
= 1 − [P (X = 1) + P (X = 2) + P (X = 3)]
= 1 − (0.4)0 · 0.6 + (0.4)1 · 0.6 + (0.4)2 · 0.6
= 0.064
ja 3. tentin jälkeen reputtaneita on 0.064 · 250 = 16.
Tämä todennäköisyysjakauma on ns. geometrinen jakauma (geometric distribution). Jos
toistokokeessa on kaksi vaihtoehtoa 0 ja 1 niin satunnaismuuttuja X= ’millä toistokerralla
ensimmäisen kerran tapahtuu vaihtoehto 1’ noudattaa geometrista jakaumaa Geom(p) , missä
parametri p= vaihtoehdon 1 todennäköisyys. Sen tiheysfunktio ja otosavaruus ovat
X ∼ Geom(p) :
f (x) = p(1 − p)x−1 , x ∈ Ω = {1, 2, 3, . . .}, 0 ≤ p ≤ 1
Usein vaihtoehto 1 nimetään ’onnistumiseksi’ (success) ja vaihtoehto 0 ’epäonnistumiseksi’
(failure), Tässä esimerkissä X ∼ Geom(0.6).
24
2.3
Jatkuvan satunnaismuuttujan jakauma
Satunnaismuuttujan X, jonka otosavaruus Ω on (äärellinen tai ääretön) reaalilukuväli tai välien yhdiste, sanotaan olevan jatkuva (continuous) tai jatkuvasti jakautunut (continuously
distributed). Sen todennäköisyysjakaumaa tavallisesti mallinnetaan tiheysfunktiolla.
Funktio f : R → [0, ∞) on jatkuvan satunnaismuuttujan X tiheysfunktio (density
function), jos
1. f (x) ≥ 0, ∀x ∈ R
2.
R∞
f (x) dx = 1
−∞
3. P (a ≤ X ≤ b) =
Rb
f (x) dx, missä a ≤ b
a
Huomautus 1. Satunnaismuuttujan X tiheysfunktio f (x) on siis määritelty kaikilla reaaliluvuilla. Usein tiheysfunktion muoto kerrotaan vain otosavaruudessa ja jätetään mainitsematta
itsestään selvä f (x) = 0, jos x ∈
/ Ω.
Tapahtuman {a ≤ X ≤ b} todennäköisyys
lasketaan siis tiheysfunktion määrättynä integraalina
Z b
P (a ≤ X ≤ b) =
f (x) dx
a
kaikilla a ≤ b ∈ R, myös kun a = −∞ ja/tai
b = ∞.
Määrätyn integraalin ominaisuuksien perusteella yllä määritelty todennäköisyysmitta P toteuttaa Kolmogorovin aksiomat.
Huomautus 2. Jatkuvan satunnaismuuttujan yksittäisen muuttujan arvon todennäköisyys
on nolla,
Z a
P (X = a) = P (a ≤ X ≤ a) =
f (x) dx = 0
a
Näin jatkuvalla satunnaismuuttujalla
P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X ≤ b) = P (a < X < b)
25
Siis todennäköisyys sille, että satunnaismuuttuja saa tietyn arvon, on 0. Tässä ei kuitenkaan
ole mitään ristiriitaa todellisuuden kanssa. Nimittäin jatkuvan satunnaismuuttujan arvoa ei
voi mitata täysin tarkasti, vaan mittaustulos on aina jokin väli, jonka pituus riippuu mittaustarkkuudesta. Esimerkiksi, mitattakoon satunnaismuuttujan X arvot yhden desimaalin
tarkkuudella. Tällöin todennäköisyys, että X:n arvoksi saadaan 5.2 on
Z 5.25
f (x) dx
P (5.15 ≤ X < 5.25) =
5.15
Tiheysfunktion intuitiivinen tulkinta. Olkoon jatkuvasta satunnaismuuttujasta X kerätty luokiteltu frekvenssijakauma. Piirretään tähän luokitukseen perustuva histogrammi siten että kunkin osavälin kohdalle piirretty pylväs pinta-alaltaan kuvaa kyseisen välin todennäköisyyttä eli todennäköisyyttä sille, että X
saa arvon ko.väliltä (pylvään korkeus on välille osuneiden mittaus tulosten suhteellinen
frekvenssi jaettuna luokitusvälin pituudella).
Muuttujan X tiheysfunktion kuvaaja kulkee
jostain pylväiden huippukohtien kautta. Jos tihennetään luokitusta rajatta samalla kun koetoistojen määrä kasvaa rajatta, lähestyy pylväiden huiput X:n tiheysfunktion kuvaajaa.
Jatkuvan satunnaismuuttujan kertymäfunktio (cumulative distribution function) F määritellään samalla tavalla kuin diskreetille muuttujallekin
Z x
F (x) = P (X ≤ x) =
f (t) dt, x ∈ R
−∞
Kertymäfunktio on kasvava ja
0 ≤ F (x) ≤ 1,
lim F (x) = 0,
x→−∞
lim F (x) = 1
x→∞
Lause 2.3.1. Pisteissä x, joissa tiheysfunktio f (x) on jatkuva, on kertymäfunktiolla
derivaatta
F 0 (x) = f (x)
26
Todistus. Valitaan vakio a siten että välillä [a, x] on tiheysfunktio jatkuva. Nyt
Z a
Z x
Z x
f (t) dt =
f (t) dt +
f (t) dt ⇒ F 0 (x) = f (x)
F (x) =
−∞
a
| −∞ {z
}
vakio
Kertymäfunktion F avulla voi helposti esittää erilaisten tapahtumien todennäköisyydet, esimerkiksi
P (a ≤ X ≤ b) = F (b) − F (a)
P (X ≤ a) = F (a)
P (X ≥ a) = 1 − F (a)
Kaikissa epäyhtälöissä voi yhtäsuuruuden jättää myös pois.
Esimerkki 2.3.1. Työpaikassa kahvitauon pituus X minuuteissa on satunnaismuuttuja, jonka tiheysfunktio on
c (15 − x) kun 5 ≤ x ≤ 15
f (x) =
0
muulloin
R∞
a) Määritetään aluksi vakio c. Koska
f (x) dx oltava = 1 eli
−∞
Z∞
Z15
1
15x − x2
2
5
5
1
1 2
2
2
= c 15 − · 15 − 15 · 5 + · 5
2
2
1
= 50c = 1 ⇒ c =
50
c(15 − x) dx =
−∞
.15
c(15 − x) dx = c
b) Kertymäfunktio, kun x on välillä [5, 15] on
Zx
x
1
1 .
1
F (x) =
(15 − t) dt =
15t − t2
50
50
2
5
5
1
1 2
1 2
=
15x − x − 15 · 5 + · 5
50
2
2
1 2
3
5
= −
x + x−
100
10
4
Kertymäfunktio määritellään paloittain

kun x < 5
 0
1
3
5
2
F (x) =
− x + 10 x − 4 kun 5 ≤ x ≤ 15
 100
1
kun x > 15
27
Satunnaismuuttuja T noudattaa eksponenttijakaumaa (exponential distribution)
parametrina λ > 0, merkitään T ∼ Exp(λ), jos sen tiheysfunktio on
f (t) = λe−λt ,
kun t ≥ 0
Kertymäfunktioksi saadaan arvoilla t ≥ 0:
Z
t
F (t) = P (T ≤ t) =
Z
−∞
=
.t
t
f (u) du =
λe−λu du
0
−e−λu = 1 − e−λt
0
Esimerkki 2.3.2. Tietyn sähköisen komponentin elinajan T (vuosissa) tiedetään olevan eksponentiaalisesti jakautunut parametrinä λ = 2. Todennäköisyys sille, että komponentti kestää
korkeintaan yhden vuoden, kun se on jo kestänyt kaksi vuotta, on ehdollinen todennäköisyys
F (3) − F (2)
P (2 < T < 3)
=
P (T > 2)
1 − F (2)
−6
−4
(1 − e ) − (1 − e )
e−4 (−e−2 + 1)
=
=
1 − (1 − e−4 )
e−4
P (T < 2 + 1 | T > 2) =
= 1 − e−2
Laskettaessa todennäköisyys P (T < 1) saadaan sama tulos P (T < 1) = 1 − e−2 . Eli todennäköisyys, että komponentti kestää vielä yhden vuoden on sama uudella komponentilla ja jo
kaksi vuotta toimineella komponentilla.
Jatkuva satunnaismuuttuja X noudattaa jatkuvaa tasajakaumaa (continuous uniform
distribution) välillä [a, b], merkitään X ∼ Tas(a, b), jos X:n otosavaruus on väli [a, b] ja
tiheysfunktio f (x) on vakio tällä välillä. Tällöin X:n tiheysfunktio on
f (x) =
2.4
1
,
b−a
kun x ∈ [a, b]
Odotusarvo, varianssi ja keskihajonta
Vastaavasti kuin frekvenssijakaumia voidaan todennäköisyysjakaumia luonnehtia erilaisin tunnusluvuin. Pelkästään jakauman tyypin ja sen tunnuslukujen avulla voidaan tehdä tarkasteltavasta satunnaiskokeesta hyödyllisiä johtopäätöksiä. Tavallisimmat jakauman sijaintia kuvaavat tunnusluvut ovat odotusarvo, varianssi ja keskihajonta. Odotusarvo ilmoittaa jakauman
keskikohdan, varianssi ja keskihajonta mittaavat jakauman hajaantumisen suuruutta.
28
Diskreetit satunnaismuuttujat
Diskreetin satunnaismuuttujan X, jonka otosavaruus on Ω ja tiheysfunktio on f (x), odotusarvo, varianssi ja keskihajonta määritellään lukuina
odotusarvo (mean, expected value) :
E(X) =
X
merk.
xf (x) = µ
x∈Ω
varianssi (variance) :
Var(X) =
X
merk.
2
(x − µ) f (x) = σ 2
x∈Ω
keskihajonta (standard deviation) :
D(X) =
p
Var(X) = σ
Huomautus. Jos otosavaruudessa on ääretön määrä alkioita, on tunnusluku olemassa vain
kun sen määrittelevä sarja suppenee ja summa on termien järjestyksestä riippumaton. Diskreetin muuttujan odotusarvo on mahdollisten arvojen xi todennäköisyyksillään P (X = xi ) =
f (xi ) painotettu keskiarvo. Varianssi taas on odotusarvosta laskettujen neliöityjen poikkeamien (xi − µ)2 todennäköisyyksillä painotettu keskiarvo.
Fysikaalinen tulkinta. Jos ajatellaan, että yhden yksikön verran ”todennäköisyysmassaa”
on jaettu x-akselin pisteisiin xi pistetodennäköisyyden f (xi ) verran, niin odotusarvo ilmoittaa
massan painopisteen x-akselilla ja varianssi massan hitausmomentin painopisteen suhteen.
Esimerkki 2.4.1. Arpanopan silmäluvun X odotusarvo ja varianssi ovat
X
1
21
1
=3
E(X) =
x f (x) = (1 + 2 + 3 + 4 + 5 + 6) · =
|{z}
6
6
2
x∈Ω
Var(X) =
= 61 ∀x
X
(x − µ)2 f (x)
x∈Ω
1
=
6
"
−5
2
2
+
−3
2
2
+
−1
2
2
2 2 2 #
1
3
5
35
=
+
+
+
2
2
2
12
Voidaan osoittaa (harjoitustehtävänä), että
Diskreettiä tasajakaumaa noudattavan satunnaismuuttujan X ∼ Tasd(1, n) odotusarvo
ja varianssi ovat
n+1
n2 − 1
E(X) =
ja Var(X) =
2
12
29
Jatkuvat satunnaismuuttujat
Jos satunnaismuuttuja X on jatkuva ja sen tiheysfunktio on f (x), niin määritellään X:n
odotusarvo ja varianssi diskreetin tapauksen summia vastaavilla integraaleilla (edellyttäen,
että integraalit suppenevat),
Z
odotusarvo :
varianssi :
keskihajonta :
∞
merk.
xf (x) dx = µ
E(X) =
Z
Var(X) =
−∞
∞
merk.
(x − µ)2 f (x) dx = σ 2
−∞
p
D(X) = Var(x) = σ
Fysikaalinen tulkinta. Jos ajatellaan, että yhden yksikön verran ”todennäköisyysmassaa”
on tiivistynyt x-akselille viivatiheytenä tiheysfunktio f (x), niin odotusarvo on x-akselin painopiste ja varianssi on x-akselin hitausmomentti painopisteen suhteen.
Esimerkki 2.4.2. Olkoon X jatkuva satunnaismuuttuja, jonka tiheysfunktio on f (x) = 2x,
kun 0 < x < 1. Satunnaismuuttujan X odotusarvo on
Z
∞
E(X) =
Z
xf (x) dx =
−∞
1
2
2x dx =
0
.1 2
0
3
x3 =
2
3
ja varianssi
2
Z 1
2
8
8
Var(X) =
x−
f (x) dx =
2x3 − x2 + x dx
3
3
9
−∞
0
.1 1
8
4
1 8 4
1
=
x4 − x3 + x2 = − + =
2
9
9
2 9 9
18
Z
∞
0
Voidaan osoittaa (harjoitustehtävänä), että
Jatkuvaa tasajakaumaa noudattavan satunnaismuuttujan X ∼ Tas(a, b) odotusarvo ja
varianssi ovat
a+b
(b − a)2
E(X) =
ja
Var(X) =
2
12
30
2.5
Satunnaismuuttujan funktiot
Satunnaismuuttuja X määriteltiin kappaleessa 1.1 kuvaukseksi (funktioksi) otosavaruudesta
reaalilukujen joukkoon. Jos muodostetaan satunnaismuuttujan reaaliarvoinen funktio
Y = h(X) on kyseessä yhdistetty funktio, joka on myös satunnaismuuttuja. Tällä uudella
satunnaismuuttujalla on oma otosavaruutensa ja tiheysfunktionsa.
Esimerkki 2.5.1. Olkoon X diskreetti satunnaismuuttuja, jonka tiheysfunktio ja otosavaruus
ovat
x2
f (x) = , x ∈ ΩX = {−2, −1, 1, 2}
10
Muodostetaan uusi satunnaismuuttuja Y = h(X) = X 2 + 1. Kun x ∈ ΩX , voi Y saada
arvoja h(−2) = h(2) = 5 ja h(−1) = h(1) = 2. Arvojen todennäköisyydet saadaan laskemalla
alkuperäisten arvojen todennäköisyydet
(−1)2 12
1
+
=
10
10
5
4
(−2)2 22
+
=
P (Y = 5) = P (X = −2) + P (X = 2) = f (−2) + f (2) =
10
10
5
P (Y = 2) = P (X = −1) + P (X = 1) = f (−1) + f (1) =
Nämä todennäköisyydet voidaan esittää myös funktiomuodossa ja näin saadaan satunnaismuuttujan y tiheysfunktioksi ja otosavaruudeksi
g(y) =
y−1
, y ∈ ΩY = {2, 5}
5
Yleisessä tapauksessa jos X on diskreetti, on myös Y diskreetti. Satunnaismuuttujan Y tiheysfunktio g(y) määrätään tavallisesti siten, että lasketaan todennäköisyydet Y :n otosavaruuden
pisteissä:
X
X
g(y) = P (Y = y) = P (h(X) = y) =
P (X = xi ) =
f (xi )
xi :h(xi )=y
xi :h(xi )=y
Siinä erikoistapauksessa, että funktiolla y = h(x) on käänteisfunktio, on voimassa
Lause 2.5.1. Olkoon diskreetin satunnaismuuttujan X tiheysfunktio f (x) ja Y = h(X).
Jos funktio y = h(x) on kääntyvä, y = h(x) ⇔ x = h−1 (y), niin Y :n tiheysfunktio on
g(y) = f h−1 (y)
Todistus. g(y) = P (Y = y) = P (h(X) = y) = P (X = h−1 (y)) = f (h−1 (y))
31
Esimerkki 2.5.2. Olkoon satunnaismuuttujan X tiheysfunktio
x−1
3 1
f (x) =
, kun x = 1, 2, 3, . . .
4 4
Määrätään satunnaismuuttujan Y = X 2 tiheysfunktio g(y).
Muuttujan Y otosavaruus on ΩY = {1, 4, 9, . . . }. Koska
y = x2 = h(x)
niin
3
√
g(y) = f ( y) =
4
⇔
x=
√y−1
1
,
4
√
y = h−1 (y)
kun y = 1, 4, 9, . . .
Tutkitaan seuraavaksi jatkuvaa satunnaismuuttujaa X. Nyt satunnaismuuttuja Y = h(X)
voi olla diskreetti tai jatkuva, tai ei diskreetti eikä jatkuva. Tarkastellaan tilannetta, kun Y
on jatkuva ja funktio y = h(x) on aidosti monotoninen.
Lause 2.5.2. Olkoon X jatkuva satunnaismuuttuja, jonka tiheysfunktio on f (x) ja
Y = h(X). Olkoon funktio y = h(x) derivoituva ja aidosti monotoninen. Funktiolla
y = h(x) on olemassa käänteisfunktio y = h(x) ⇔ x = h−1 (y) ja Y :n tiheysfunktio on
d −1 −1
g(y) = f h (y) h (y)
dy
Todistus. Tiheysfunktio g(y) voidaan määrätä siten, että lasketaan ensin Y :n kertymäfunktio,
joka sitten derivoidaan.
Olkoon funktio y = h(x) aidosti kasvava. Tällöin myös sen käänteisfunktio on aidosti kasvava.
Nyt Y :n kertymäfunktio voidaan määrätä X :n kertymäfunktion avulla
FY (y) = P (Y ≤ y) = P (h(X) ≤ y) = P (X ≤ h−1 (y)) = FX (h−1 (y))
ja derivoimalla kertymäfunktio saadaan tiheysfunktio lauseen 2.3.1 mukaan
d −1 d
d
d −1
−1
0
−1
−1
g(y) = FY (y) = FX (h (y)) = FX (h (y)) h (y) = f (h (y)) h (y)
dy
dy
dy
dy
koska aidosti kasvavan funktion derivaatta
d −1
h (y)
dy
32
> 0.
Jos funktio y = h(x) aidosti vähenevä, on sen käänteisfunktio myös aidosti vähenevä.
FY (y) = P (Y ≤ y) = P (h(X) ≤ y) = P (X ≥ h−1 (y)) = 1 − FX (h−1 (y))
ja derivoimalla kertymäfunktio saadaan tiheysfunktio lauseen 2.3.1 mukaan
d −1 d
d
d −1
−1
−1
−1
g(y) = FY (y) =
1 − FX (h (y) = −f (h (y)) h (y) = f (h (y)) h (y)
dy
dy
dy
dy
sillä aidosti vähenevän funktion derivaatta
d −1
h (y)
dy
< 0 ja
d −1
h (y)
dy
d −1
= −| dy
h (y)|.
Esimerkki 2.5.3. Satunnaismuuttujan X tiheysfunktio on
f (x) = e−x ,
x ∈ ΩX = [0, ∞).
Määrätään satunnaismuuttujan Y = X 2 tiheysfunktio g(y).
√
x = y = h−1 (y) (y ≥ 0), niin
√
d −1 1
−1
g(y) = f h (y) h (y) = e− y √ , kun y ∈ ΩY = (0, ∞).
dy
2 y
Koska y = x2 = h(x) (x ≥ 0)
⇔
Esimerkki 2.5.4. Olkoon X jatkuva satunnaismuuttuja, jonka tiheysfunktio
f (x) =
x
, x ∈ ΩX = [1, 5]
12
Mikä on uuden satunnaismuuttujan Y = 2X − 3 tiheysfunktio g(y)?
Koska y = 2x − 3 = h(x) on h−1 (y) = (y + 3)/2 ja
d −1
h (y)
dy
= 1/2. Tiheysfunktio on
d
1 (y + 3) 1
y+3
g(y) = f h−1 (y) h−1 (y) =
·
· =
dy
12
2
2
48
Koska muunnosfunktio on aidosti kasvava, on Y :n otosavaruus ΩY = [h(1), h(5)] = [−1, 7].
33
2.6
Satunnaismuuttujan funktion odotusarvo
Miten voidaan laskea uuden satunnaismuuttujan Y = h(X) odotusarvo E(Y )? Jos pystyy
määrittämään tiheysfunktion g(y) voi odotusarvon laskea kappaleen 2.4 tuloksilla. Odotusarvo
E(Y ) voidaan kuitenkin määrittää käyttämällä satunnaismuuttujan X tiheysfunktiota f (x):
Lause 2.6.1. Olkoon satunnaismuuttujan X otosavaruus ΩX ja tiheysfunktio f (x).
Olkoon Y = h(X).
a) Jos X on diskreetti, niin
X
E(Y ) = E(h(X)) =
h(x)f (x)
x∈ΩX
b) Jos X on jatkuva ja y = h(x) on paloittain jatkuva, niin
Z ∞
h(x)f (x) dx
E(Y ) = E(h(X)) =
−∞
Todistus.
(a)
E(Y ) =
X
yg(y) =
=
yP (h(x) = y) =
X
h(x)f (x) =
y∈ΩY x:h(x)=y
X
y∈ΩY
y∈ΩY
y∈ΩY
X
X
X
y
X
f (x)
x:h(x)=y
h(x)f (x)
x∈ΩX
(b) Todistus on hankala; rajoitutaan tapaukseen, jossa y = h(x) on aidosti monotoninen ja
kääntyvä, y = h(x) ⇔ x = h−1 (y). Tällöin
Z ∞
Z ∞
sij. x = h−1 (y)
d
h(x)f (x) dx =
y f h−1 (y) h−1 (y) dy
dx = d h−1 (y) dy
dy
−∞
−∞
|
{z
}
dy
g(y)
Z
∞
=
yg(y) dy = E(Y )
−∞
Lauseesta seuraa käyttökelpoisia tuloksia. Voidaan osoittaa (todistus harjoitustehtävänä), että
Lause 2.6.2. Satunnaismuuttujan X funktion Y = ag(X) + bh(X) odotusarvo
E(Y ) = E(ag(X) + bh(X)) = aE(g(X)) + bE(h(X))
ja erityisesti
E(aX + b) = aE(X) + b
34
Lause 2.6.3. Satunnaismuuttujan X varianssille pätee laskukaava:
Var(X) = E(X 2 ) − [E(X)]2
Todistus. Merkitään E(X) = µ. Havaitaan, että Var(X) on funktion Y = (X − µ)2 odotusarvo,
Var(X) = E (X − µ)2 = E(X 2 − 2µX + µ2 ) = E(X 2 ) − 2µE(X) + µ2 = E(X 2 ) − µ2
Esimerkki 2.6.1. Olkoon diskreetin satunnaismuuttujan X tiheysfunktio
f (x) =
x
,
10
kun x = 1, 2, 3, 4
Nyt
2
3
4
1
+2·
+3·
+4·
=3
10
10
10
10
1
2
3
4
E(X 2 ) = 1 ·
+4·
+9·
+ 16 ·
= 10
10
10
10
10
Var(X) = 10 − 32 = 1
E(X) = 1 ·
Esimerkki 2.6.2. Olkoon X jatkuva satunnaismuuttuja, jonka tiheysfunktio f (x) = 2x, kun
0 < x < 1. Esimerkissä 2.4.2 on laskettu E(X) = 2/3 ja
2
Z
E(X ) =
0
1
1
1
x 2x dx = , joten Var(X) = −
2
2
2
2
2
1
=
3
18
Lause 2.6.4.
Var(aX + b) = a2 Var(X)
Todistus.
Var(aX + b)
Lause 2.6.3
=
E((aX + b)2 ) − [E(aX + b)]2
= E(a2 X 2 + 2abX + b2 ) − [aE(X) + b]2
Lause 2.6.2
=
= a2
a2 E(X 2 ) + 2abE(X) + b2 − a2 [E(X)]2 − 2abE(X) − b2
E(X 2 ) − [E(X)]2
= a2 Var(X)
35
2.7
Tsebyshevin epäyhtälö
Jos satunnaismuuttujan X tiheysfunktio tunnetaan, voidaan tapahtumien todennäköisyydet
laskea tarkasti. Jos tiheysfunktio on tuntematon, voidaan todennäköisyyttä kuitenkin arvioida, jos satunnaismuuttujan X odotusarvo µ ja varianssi σ 2 tunnetaan. Varianssi on X:n
jakauman hajaantumisen mitta; fysikaalista tulkintaa käyttäen varianssi ilmaisee x-akselille
tiivistyneen ”todennäköisyysmassan” keskittymistä (kun σ 2 on pieni) tai leviämistä (kun σ 2
on suuri) odotusarvon ympärille. Tsebyshevin epäyhtälön nojalla voidaan sanoa, että todennäköisyysmassan valtaosa sijaitsee odotusarvon ympärillä muutaman σ:n pituisessa välissä.
Lause 2.7.1. Tsebyshevin epäyhtälö
P (|X − µ| ≥ t) ≤
σ2
t2
⇔
P (|X − µ| < t) ≥ 1 −
1
k2
⇔
σ2
t2
∀t > 0
Erityisesti, jos t = kσ, niin
P (|X − µ| ≥ kσ) ≤
P (|X − µ| < kσ) ≥ 1 −
1
k2
Todistus. Annetaan todistus jatkuvalle satunnaismuuttujalle X, jonka tiheysfunktio on f (x).
Z
Z
(x − µ)2
P (|X − µ| ≥ t) =
f (x) dx ≤
f (x) dx
t2 }
|X−µ|≥t
|X−µ|≥t | {z
≥1
1
= 2
t
Z
1
(x − µ) f (x) dx ≤ 2
t
|X−µ|≥t
2
∞
σ2
(x − µ)2 f (x) dx = 2
t
| −∞
{z
}
Z
=σ 2
Huomaa, että arvoilla t ≤ σ epäyhtälö ei kerro mitään.
Jos t = 2σ, niin vähintään todennäköisyydellä 0.75
satunnaismuuttujan arvo osuu lähemmäksi odotusarvoa
kuin 2σ. Jos taas t = 3σ, niin korkeintaan todennäköisyydellä 1/9 ≈ 0.11 satunnaismuuttujan arvo osuu
välin (µ − 3σ, µ + 3σ) ulkopuolelle.
Esimerkki 2.7.1. Kuulalaakereiden halkaisija X (mm) on satunnaismuuttuja, jonka odotusarvo ja tiheysfunktio ovat tuntemattomia. Varianssin tiedetään olevan σ 2 = 0.09. Määrätään Tsebyshevin epäyhtälöllä yläraja todennäköisyydelle, että satunnaisesti valitun kuulan
halkaisija poikkeaa odotusarvosta ainakin 0.7:
P (|X − µ| ≥ 0.7) ≤
σ2
0.09
=
≈ 0.184
2
0.7
0.72
36
2.8
Momentit generoiva funktio
Määritelmä 2.8.1. Olkoon k positiivinen kokonaisluku. Satunnaismuuttujan X
k. (origo)momentti (moment about the origin) on odotusarvo
E(X k )
Satunnaismuuttujan X k. keskusmomentti (moment about the mean) on odotusarvo
E((X − µ)k )
Odotusarvo E(X) on siis 1. origomomentti ja varianssi Var(X) on 2. keskusmomentti.
Edellä olevia odotusarvoja ei voi aina muodostaa. Momentit ovat olemassa, jos odotusarvot
voidaan laskea. Yksi tapa momenttien laskemiseksi on yrittää muodostaa satunnaismuuttujan
ns. momentit generoiva funktio.
Määritelmä 2.8.2. Satunnaismuuttujan X momentit generoiva funktio (momenttifunktio, moment generating function) on diskreetille satunnaismuuttujalle
X
M (t) = E(etX ) =
etx f (x)
x∈ΩX
ja jatkuvalle satunnaismuuttujalle
Z
tX
∞
M (t) = E(e ) =
etx f (x) dx
−∞
M (0) = E(1) = 1, joten momentit generoiva funktio on määritelty ainakin arvolla t = 0.
Momentit generoivalla funktiolla on seuraava ominaisuus, jolla voi tutkia miten satunnaismuuttuja on jakautunut (todistus sivuutetaan):
Lause 2.8.1. Yksikäsitteisyysominaisuus. Jos satunnaismuuttujien X ja Y momentit generoivat funktiot ovat samoja: MX (t) = MY (t) jollakin arvon t = 0 sisältävällä
avoimella välillä, niin muuttujat X ja Y ovat jakautuneet samalla tavalla.
37
Seuraavassa lauseessa on momentit generoivan funktion keskeinen ominaisuus, jota voi käyttää jakauman ominaisuuksien selvittämiseen. Sen mukaan momentit generoivan funktion derivaattafunktioiden avulla saadaan laskettua satunnaismuuttujan X origomomentit. Tästä
johtuu nimitys momentit generoiva funktio.
Lause 2.8.2. Momentit generoivan funktion k:s derivaatta arvolla t = 0 on satunnaismuuttujan X k. origomomentti
M (k) (0) = E(X k )
Todistus.
M
(k)
dk
(t) = k E(etX ) = E
dt
dk tX
e
dtk
(t=0)
= E(X k etX ) = E(X k )
Seuraus.
E(X) = M 0 (0)
ja
Var(X) = M 00 (0) − M 0 (0)2
Esimerkki 2.8.1. Olkoon X ∼ Exp(1) jolloin f (x) = e−x ,
kun x ≥ 0
Momentit generoiva funktio on olemassa vain arvoilla t < 1, sillä
Z ∞
Z ∞
tx −x
M (t) =
e e dx =
e(t−1)x dx
0
=
.∞
0
0
1 (t−1)x
1
e
=
,
t−1
1−t
kun t < 1
Nyt
1
2
00
ja
M
(t)
=
(1 − t)2
(1 − t)3
Seurauksen nojalla on E(X) = 1 ja Var(X) = 2 − 12 = 1.
M 0 (t) =
Lause 2.8.3. Olkoon MX (t) satunnaismuuttujan X momentit generoiva funktio. Tällöin
satunnaismuuttujan Y = aX + b momentit generoiva funktio on
MY (t) = ebt MX (at)
Todistus.
MY (t) = E(etY ) = E(etaX+tb ) = ebt E(e(at)X ) = ebt MX (at)
38
2.9
Binomijakauma
Toistetaan samaa koetta n kertaa ja kussakin toistossa tarkastetaan realisoituuko tietty tapahtuma A vai A:n komplementti A. Tapahtuman A realisoitumiskertojen lukumäärä X tässä n-toistokokeessa on diskreetti satunnaismuuttuja, jonka mahdolliset arvot ovat 0, 1, . . . , n.
Mitä on P (X = x)? Olkoon
P (A) = p,
jolloin P (A) = 1 − p
Oletetaan toistot riippumattomiksi. Toistokokeen alkeistapauksen, jossa A realisoituu x kertaa
ja A realisoituu n − x kertaa jossakin järjestyksessä, todennäköisyys on px (1 − p)n−x . Tällaisia
alkeistapauksia on nx erilaista, joten
n x
P (X = x) =
p (1 − p)n−x
x
Diskreetti satunnaismuuttuja X noudattaa binomijakaumaa (binomial distribution)
parametrein (n, p), merkitään X ∼ Bin(n, p), jos X:n otosavaruus Ω = {0, 1, . . . , n} ja
tiheysfunktio
n x
f (x) = b(x; n, p) =
p (1 − p)n−x , kun x = 0, 1, . . . , n
x
Tiheysfunktion arvoja otosavaruuden pisteissä sanotaan binomitodennäköisyyksiksi. Käyttämällä binomikaavaa
n X
n x n−x
a b
= (a + b)n
x
x=0
binomitodennäköisyyksiin, saadaan
n
X
x=0
b(x; n, p) =
n X
n
x=0
x
px (1 − p)n−x = (p + 1 − p)n = 1
39
Satunnaismuuttujan X ∼ Bin(n, p) kertymäfunktio on
F (x) = P (X ≤ x) =
bxc
X
b(t; n, p)
t=0
missä bxc on suurin kokonaisluku, joka ≤ x. Taulukoista tai valmisohjelmista löydät binomijakautuneen muuttujan kertymäfunktion ja sen käänteisfunktion arvoja.
Lause 2.9.1. Jos X ∼ Bin(n, p), niin M (t) = (pet + 1 − p)n ,
E(X) = np ja Var(X) = np(1 − p)
Todistus. Merkitään q = 1 − p. Momentit generoiva funktio on
n n x n−x X n
e
M (t) = E(e ) =
p q
=
(pet )x q n−x
x
x
x=0
x=0
tX
bin. kaava
⇒
n
X
tx
M (t) = (pet + q)n .
Nyt
M 0 (t) = n(pet + q)n−1 pet
jolloin
E(X) = M 0 (0) = n(p + q)n−1 p = np.
Edelleen
M 00 (t) = n(n − 1)(pet + q)n−2 pet pet + n(pet + q)n−1 pet
ja siis
M 00 (0) = n(n − 1)(p + q)n−2 p2 + n(p + q)n−1 p
= n(n − 1)p2 + np
= np((n − 1)p + 1),
jolloin
Var(X) = n(n − 1)p2 + np − n2 p2
= n2 p2 − np2 + np − n2 p2
= np(1 − p)
40
Esimerkki 2.9.1. Rahaa heitetään 5 kertaa. Satunnaismuuttuja X = ’kruunujen lukumäärä’
noudattaa binomijakaumaa parametrein n = 5, p = 0.5, X ∼ Bin(5, 0.5) tiheysfunktionaan
5
5
x
5−x
f (x) =
0.5 (1 − 0.5)
=
0.55 , kun x ∈ Ω = {0, 1, . . . , 5}
x
x
Esitetään jakauma vielä pistetodennäköisyyksien taulukkona ja graafisesti:
xi
0
1
2
3
4
5
5
0
5
1
5
2
5
3
5
4
5
5
f (xi )
· 0.55 = 0.0312
· 0.55 = 0.1562
· 0.55 = 0.3125
· 0.55 = 0.3125
· 0.55 = 0.1562
· 0.55 = 0.0312
Esimerkki 2.9.2. Erään tuottajan transistoreista on 5 % viallisia. Asiakas ostaa 6 transistoria. Olkoon X = viallisten lukumäärä, jolloin X ∼ Bin(6, 0.05) tiheysfunktionaan
6
f (x) =
0.05x 0.956−x =, kun x ∈ Ω = {0, 1, . . . , 6}
x
Todennäköisyys, että asiakas saa yhden tai kaksi viallista transistoria on
6
6
5
P (X = 1 tai X = 2) =
· 0.05 · 0.95 +
· 0.052 · 0.954 = 0.263
1
2
Todennäköisyys, että asiakas saa vähintään yhden viallisen transistorin on
P (X ≥ 1) = 1 − P (X < 1) = 1 − P (X = 0) = 1 − 0.956 = 0.265
41
2.10
Poisson jakauma
Diskreetti satunnaismuuttuja X, jonka otosavaruus on ei-negatiivisten kokonaislukujen
joukko Ω = {0, 1, 2, . . . }, noudattaa Poisson-jakaumaa (Poisson distribution) parametrina λ > 0, merkitään X ∼ Poi(λ), jos sen tiheysfunktio
f (x) = p(x; λ) =
λx −λ
e ,
x!
kun x = 0, 1, 2, . . .
t
Lause 2.10.1. Jos X ∼ Poi(λ), niin M (t) = e−λ eλe ,
E(X) = λ ja Var(X) = λ
Todistus. Muodostetaan momentit generoiva funktio:
tX
M (t) = E(e ) =
∞
X
x=0
sillä
∞
P
x=0
ux
x!
x
tx λ −λ
e
x!
e
=e
−λ
∞
X
(λet )x
x=0
x!
= e−λ eλe
t
= eu . Derivoidaan tämä kerran ja kahdesti t :n suhteen
M 0 (t) = λe−λ+t+λe
t
t
t
ja M 00 (t) = λ e−λ+t+λe + λe−λ+2 t+λe
ja näin saadaan E(X) = M 0 (0) = λ ja Var(X) = M 00 (0) − (M 0 (0))2 = λ .
Tietyissä tilanteissa Poisson-jakaumaa voidaan käyttää binomijakauman approksimoimiseen.
Olkoon X ∼ Bin(n, p). Kiinnitetään np = λ vakioksi ja annetaan n → ∞, jolloin p = λ/n → 0.
Tällöin
λ
lim b x; n,
= p(x; λ)
∀x = 0, 1, . . .
n→∞
n
42
sillä
x n−x
λ
n
λ
λ
b x; n,
=
1−
n
x
n
n
n −x
λ
λ
n(n − 1) · · · (n − x + 1) λx
1−
1−
=
x!
nx
n
n
−x
n
1
x−1
λ
λ
λx
1−
··· 1 −
1−
1−
=
x!
n
n
n
n
x
λ
→ e−λ ,
kun n → ∞,
x!
sillä
1
1−
n
−x
x−1
λ
,··· , 1 −
ja 1 −
→ 1 kun n → ∞
n
n
sekä eksponenttifunktion raja-arvomääritelmän mukaan raja-arvo
n
λ
= e−λ
lim 1 −
n→∞
n
Konvergointi on nopeata, kun λ << n. Siis:
Kun n on suuri, p on pieni ja λ << n eli kyseessä on harvinainen tapahtuma hyvin
monen toiston sarjassa, voidaan approksimoida
Bin(n, p) ≈ Poi(λ),
missä λ = np
Esimerkki 2.10.1. Tiedetään, että sadasta signaalista keskimäärin yksi välittyy virheellisesti. Lähetetään 200 toisistaan riippumatonta signaalia. Lasketaan todennäköisyys sille, että
ainakin kolme signaalia välittyy virheellisesti. Olkoon X = virhesignaalien lukumäärä ja A =
”signaali virheellinen”. Nyt P (A) = 0.01, ja lähetetään 200 signaalia. Siis X ∼ Bin(200, 0.01).
Lasketaan todennäköisyys ensin tarkasti:
P (X ≥ 3) = 1 − P (X < 3)
200
200
200
0
200
1
199
2
198
=1−
0.01 · 0.99 +
0.01 · 0.99 +
0.01 · 0.99
0
1
2
= 1 − [0.1340 + 0.2707 + 0.2720]
= 0.3233
Laskettaessa sama todennäköisyys Poissonin approksimaatiota käyttäen saadaan 4 desimaalin
tarkkuudella sama tulos
0
2
21 22
−2
P (X ≥ 3) = 1 − e
+
+
= 1 − e−2 (1 + 2 + 2) = 0.3233
0!
1!
2!
43
Tärkeä Poisson-jakauman sovellutus on sen käyttö stokastisten prosessien käsittelyssä, kun
ollaan kiinnostuneita tietyn tapahtuman A realisoitumisten lukumäärästä prosessissa tietyllä
aikavälillä. Oletetaan prosessista:
1. Jos I1 , I2 , . . . , In ovat pistevieraita aikavälejä, niin tapahtuman A esiintymismäärät eri
aikaväleillä ovat riippumattomia.
2. Tapahtuman A esiintymisten keskimääräistä lukumäärää aikayksikössä voidaan pitää
vakiona q.
3. Todennäköisyys sille, että A realisoituu hyvin lyhyellä aikavälillä ∆t useammin kuin
kerran, on likimain nolla.
Jos prosessi toteuttaa nämä oletukset 1-3 ja X =”tapahtuman A esiintymisten lukumäärä
aikavälillä (t1, t2)”, niin voidaan osoittaa
X ∼ Poi(λ), missä parametri λ = q(t2 − t1 )
Esimerkki 2.10.2. Gramma radiumia lähettää keskimäärin 3.57 × 1010 α-hiukkasta sekunnissa. Lasketaan todennäköisyys sille, että yhden nanosekunnin (= 10−9 sek) aikana se lähettää (a) täsmälleen 35 α-hiukkasta (b) 27, 28 tai 29 α-hiukkasta. Voidaan otaksua prosessin
toteuttavan ”Poisson-oletukset” 1)-3). Olkoon X α-hiukkasten lukumäärä nanosekunnissa.
Tällöin
X ∼ Poi(λ), missä λ = (3.57 × 1010 ) × 10−9 = 35.7
a) Täsmälleen 35 α-hiukkasta
P (X = 35) = p(35; 35.7) =
35.735 −35.7
e
= 0.0668
35!
b) 27, 28 tai 29 α-hiukkasta.
P (27 ≤ X ≤ 29) =
29
X
x=27
p(x; 35.7) =
35.727 −35.7 35.728 −35.7 35.729 −35.7
e
+
e
+
e
= 0.0924
27!
28!
29!
Huomautus. Poisson-jakaumaa voit myös soveltaa satunnaiskokeisiin, joissa ollaan kiinnostuneita tapahtuman A realisoitumisten lukumäärästä tietyllä pituuden, pinta-alan tai tilavuuden osalla. Satunnaiskokeen tulee toteuttaa oletuksia 1)-3) vastaavat oletukset.
44
2.11
Normaalijakauma
Tärkein jatkuvista jakaumista on normaalijakauma (normal distribution). Satunnaismuuttuja X, jonka otosavaruus on koko reaalilukujen joukko, on normaalijakautunut parametrein (µ, σ 2 ), merkitään X ∼ N(µ, σ 2 ), jos X:n tiheysfunktio on
1 x−µ 2
1
f (x) = n(x; µ, σ) = √ e− 2 ( σ )
σ 2π
(−∞ < µ < ∞, σ > 0)
Käyttämällä hyväksi epäoleellisten tasointegraalien teoriaa voidaan osoittaa, että
R∞
n(x; µ, σ) dx = 1. Tiheysfunktion kuvaaja on symmetrinen suoran x = µ suhteen.
−∞
Muuttuja Z ∼ N(0, 1) on standardoidusti normaalijakautunut. Sen tiheysfunktio on
1 2
1
φ(z) = √
e− 2 z
2π
ja kertymäfunktio on
1
Φ(z) = P (Z ≤ z) = √
2π
Z
z
1 2
e− 2 t dt
−∞
Tiheysfunktion symmetrisyyden perusteella Φ(−z) = 1 − Φ(z), sillä
Φ(−z) = P (Z ≤ −z) = P (Z ≥ z) = 1 − P (Z ≤ z) = 1 − Φ(z)
Lause 2.11.1. Jos X ∼ N(µ, σ 2 ), niin M (t) = e
E(X) = µ
ja
45
µt+σ 2 t2 /2
,
Var(X) = σ 2 .
Todistus. Muodostetaan momentit generoiva funktio:
Z ∞
1 x−µ 2
1
tX
M (t) = E(e ) =
etx √
e− 2 ( σ ) dx
σ 2π
−∞
Z ∞
1
1
2
2
et(µ+tσ +σy) √
=
e− 2 (y+tσ) σ dy
σ 2π
−∞
Z ∞
1 2
1
2 2
2 2
√
e− 2 y dy
= eµt+t σ −t σ /2
2π
{z
}
| −∞
2
sij. y = x − µ − tσ , dy = dx
σ
σ
1
µt+t2 σ 2 /2
=e
Nyt M 0 (t) = M (t)(µ + σ 2 t) ja M 00 (t) = M 0 (t)(µ + σ 2 t) + M (t)σ 2 ja siis
E(X) = M 0 (0) = e0 µ = µ. Edelleen M 00 (0) = µ·µ+1·σ 2 ⇒ Var(X) = µ2 +σ 2 −µ2 = σ 2 .
Lause 2.11.2.
X ∼ N(µ, σ 2 )
Y = aX + b ∼ N(aµ + b, a2 σ 2 )
⇒
Lause 2.8.3
2
2
2 σ 2 )t2 /2
Todistus. MY (t)
=
ebt MX (at) = ebt eµat+σ (at) /2 = e(µa+b)t+(a
mistä seuraa lauseen 2.8.1 perusteella että Y ∼ N(aµ + b, a2 σ 2 )
Seuraus 1. Jos X ∼ N(µ, σ 2 ), niin Z =
X −µ
∼ N(0, 1).
σ
Normaalijakauman kertymäfunktion arvoja et voi integroida suljetussa muodossa vaan arvot
on laskettava numeerisesti. Valmisohjelmat antavat N(µ, σ 2 )-jakautuneen satunnaismuuttujan kertymäfunktion ja sen käänteisfunktion arvoja. Taulukoista löytyvillä (Liite 2) N(0, 1)jakauman kertymäfunktion Φ(z) arvoilla voit laskea myös N (µ, σ 2 )-jakautuneen muuttujan
tapahtumien todennäköisyyksiä, sillä
Seuraus 2. Muuttujan X ∼ N(µ, σ 2 ) kertymäfunktio on
x−µ
F (x) = Φ
σ
Todistus. F (x) = P (X ≤ x) = P
X−µ
σ
≤
x−µ
σ
=Φ
46
x−µ
σ
Esimerkki 2.11.1. Jos muuttujan X ∼ N(µ, σ 2 ) kertymäfunktio on F , niin
b−µ
a−µ
P (a ≤ X ≤ b) = F (b) − F (a) = Φ
−Φ
σ
σ
Esimerkki 2.11.2. Suomalaisten täysikasvuisten naisten pituus X senttimetreissä noudattaa
jakaumaa N(165.0, 6.52 ). Siis Z = X−165.0
∼ N(0, 1). Todennäköisyys sille, että satunnaisesti
6.5
valitun naisen pituus mitattuna senttimetrin tarkkuudella on 165.0, on
X − 165.0
165.5 − 165.0
164.5 − 165.0
≤
≤
P (164.5 ≤ X ≤ 165.5) = P
6.5
6.5
6.5
= P (−0.08 ≤ Z ≤ 0.08)
= Φ(0.08) − Φ(−0.08)
= Φ(0.08) − (1 − Φ(0.08))
= 2 Φ(0.08) −1
| {z }
0.5319
= 0.064
Todennäköisyys sille, että satunnaisesti valitun naisen pituus mitattuna senttimetrin tarkkuudella on välillä (155, 175), on
154.5 − 165.0
X − 165.0
175.5 − 165.0
P (154.5 ≤ X ≤ 175.5) = P
≤
≤
6.5
6.5
6.5
= 2 Φ(1.62) −1
| {z }
0.9474
= 0.8948
Lasketaan vielä mikä on se pituus c, jota pidempiä on 1 % suomalaisista naisista:
P (X ≥ c) = 0.01
⇔
⇔
⇔
⇔
⇔
P (X ≤ c) = 0.99
X − 165.0
c − 165.0
P
≤
= 0.99
6.5
6.5
c − 165.0
Φ
= 0.99 = Φ(2.33)
6.5
c − 165.0
= 2.33
6.5
c = 6.5 · 2.33 + 165.0 = 180.1 cm
Huomautus. Normaalijakaumaan palataan vielä luvun 3 lopussa, missä käsitellään keskeistä
raja-arvolausetta. Voidaan osoittaa, että usean, mitä tahansa jakaumaa noudattavan satunnaismuuttujan summa noudattaa melko hyvin normaalijakaumaa. Tämän seurauksena saadaan tulos, että binomijakaumaa noudattavaa satunnaismuuttujaa X ∼ Bin(n, p) voidaan
approksimoida normaalijakaumalla N(np, np(1 − p)), jos p on lähellä arvoa 0.5.
47
3
Yhteisjakaumat ja satunnaismuuttujien funktiot
Sovelluksissa usein kokeen tuloksena saadaan havaintoarvot satunnaismuuttujille X1 , X2 , . . . , Xp
eli satunnaisvektorille (X1 , X2 , . . . , Xp ). Koetta kuvaavan matemaattisen mallin rakentaminen edellyttää, että eri komponenttien todennäköisyysjakaumien lisäksi selvitetään komponenttien yhteisjakauma eli satunnaisvektorin jakauma. Tällöin tehtävänä on mallintaa
(havaintoarvojen pohjalta) satunnaisvektorin eri tapahtumien todennäköisyydet. Todennäköisyysmitan tulee toteuttaa Kolmogorovin aksiomat. Kuten skalaarisessa tapauksessa myös
satunnaisvektorin tapahtumien todennäköisyydet tavallisesti annetaan tiheysfunktion avulla. Seuraavassa tarkastellaan lähinnä 2-ulotteisia satunnaisvektoreita. Yleistys p-ulotteisille
satunnaisvektoreille on monesti suoraviivainen; siirrytään p-ulotteisiin vektoreihin, jatkuvan
jakauman tapauksessa 2-ulotteiset integraalit korvataan p-ulotteisilla.
3.1
Diskreetin satunnaisvektorin jakauma
Satunnaisvektori (X, Y ) on diskreetti (discrete), jos sen molemmat komponentit ovat diskreettejä satunnaismuuttujia. Diskreetin satunnaisvektorin otosavaruus on tason äärellinen tai
ääretön diskreetti osajoukko Ω = {(x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ), . . . }.
Satunnaisvektorin (X, Y ) tiheysfunktio (density function) f (x, y) määritellään jokaisessa
tason pisteessä (x, y) siten että
f (x, y) = P (X = x, Y = y)
Nyt f (x, y) = 0, jos (x, y) ∈
/ Ω. Arvot f (x, y), missä (x, y) ∈ Ω, ovat pistetodennäköisyyksiä. Niiden summan on oltava
X
f (x, y) = 1
(x,y)∈Ω
Tapahtuman A ⊂ Ω todennäköisyys lasketaan
X
P (A) =
f (x, y)
(x,y)∈A
Satunnaisvektorin (X, Y ) kertymäfunktio (cumulative distribution function) F määritellään
jokaisessa tason pisteessä (x, y) siten että
X
F (x, y) = P (X ≤ x, Y ≤ y) =
f (r, s)
(r,s): r≤x, s≤y
48
Esimerkki 3.1.1. Satunnaisvektorin (X, Y ) otosavaruus on
Ω = {(0, 1), (0, 2), (1, 0), (1, 1), (2, 0)} ja tiheysfunktio on muotoa
kun (x, y) ∈ Ω
f (x, y) = c(x + 2y),
Ehdosta, että pistetodennäköisyyksien summa = 1, määräytyy vakio c:
1=
X
⇒
c(x + 2y) = c(2 + 4 + 1 + 3 + 2) = c12
(x,y)∈Ω
c=
1
12
Määritettäessä tapahtuman todennäköisyyttä lasketaan tapahtumaan kuuluvien alkeistapahtumien pistetodennäköisyydet yhteen, esimerkiksi
1
1
3
(1 + 2 · 0) + (2 + 2 · 0) =
12
12
12
1
4
1
P (X = 1) = f (1, 0) + f (1, 1) = (1 + 2 · 0) + (1 + 2 · 1) =
12
12
12
P (X > Y ) = f (1, 0) + f (2, 0) =
3.2
Jatkuvan satunnaisvektorin jakauma
Satunnaisvektori (X, Y ) on jatkuva (continuous), jos sen komponentit ovat jatkuvia satunnaismuuttujia. Satunnaisvektorin otosavaruus Ω on xy-tason osajoukko. Sen todennäköisyysjakaumaa tavallisesti luonnehditaan tiheysfunktiolla.
Jatkuvan satunnaisvektorin (X, Y ) tiheysfunktio (density function) on koko tasossa määritelty ei-negatiivinen funktio f (x, y), joka on = 0 otosavaruuden ulkopuolella, ja jonka avulla
voidaan esittää tapahtuman (X, Y ) ∈ A} todennäköisyys tasointegraalina
ZZ
ZZ
P (A) = P ((X, Y ) ∈ A) =
f (x, y)dxdy =
f (x, y)dxdy
A
A∩Ω
Funktiota f (x, y) kutsutaan myös satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktioksi (the density function of the joint distribution). Jotta P (Ω) = 1, on sen toteutettava ehto
ZZ
ZZ
f (x, y)dxdy =
f (x, y)dxdy = 1
R2
Ω
Tasointegraali yli koko tason R2 lasketaan raja-arvon avulla:
ZZ
Z ∞Z ∞
Z
f (x, y)dxdy =
f (x, y)dxdy = lim
R2
−∞
t→∞
−∞
t
−t
Z
t
f (x, y)dxdy
−t
Tapahtuman todennäköisyys P (A) on geometrisesti tulkittuna pinnan f (x, y) ≥ 0 ja xy−tason
väliin jäävän suoran sylinterikappaleen tilavuus, jonka pohjana on xy−tason joukko A.
49
Satunnaisvektorin (X, Y ) kertymäfunktio (cumulative distribution function) määritellään
jokaisessa tason pisteessä (x, y) siten, että
Z x Z y
F (x, y) = P (X ≤ x, Y ≤ y) =
f (r, s) ds dr
−∞
−∞
missä f (x, y) on vektorin (X, Y ) tiheysfunktio.
Pisteissä (x, y), joissa tiheysfunktio on jatkuva, pätee
∂2
F (x, y) = f (x, y)
∂y∂x
Esimerkki 3.2.1. Satunnaisvektorin (X, Y ) tiheysfunktio on muotoa
kun (x, y) ∈ Ω = {(x, y) : 0 < x < y, 0 < y < 1}
f (x, y) = cxy,
Määritetään vakio c:
ZZ
Z
1
Z
y
1=
f (x, y)dxdy = c
xy dx dy
0
0
!
Z 1
Z 1 .y
1 3
1 2
yx dy = c
y dy
=c
2
0 2
0
Ω
0
.1
=c
0
1 4
1
y =c
8
8
⇒
c=8
Lasketaan todennäköisyys P (X + Y < 1). Nyt integroimisjoukko on otosavaruuden ja joukon
{(x, y) | x+y < 1} leikkausjoukko. Otosavaruus on kolmio, jonka kärkipisteet ovat (0, 0), (0, 1)
ja (1, 1) ja tästä kolmiosta rajataan suoran y = 1 − x alapuolelle jäävä osa (kuva).
1
P (X + Y < 1) = P ({X + Y < 1} ∩ Ω) = P (0 < X < , X < Y < 1 − X)
2
!
Z 1 Z 1−x
Z 1
1−x
.
2
2
=
8xy dy dx =
4xy 2 dx
0
x
1
2
Z
=
0
4x(1 − 2x + x2 ) − 4x3 dx
0
1
2
Z
=
(−8x2 + 4x)dx
0
1
.2 8
3
2
− x + 2x
=
3
0
1 1
1
=− + =
3 2
6
50
x
3.3
Marginaalijakaumat
Tarkastellaan koetta, jossa tuloksena saadaan havaintoarvo satunnaismuuttujille X ja Y eli
satunnaisvektorille (X, Y ).
Oletetaan tunnetuksi satunnaismuuttujien X ja Y yhteisjakauman eli satunnaisvektorin (X, Y )
tiheysfunktio f (x, y). Mikä on X:n tiheysfunktio, kun tarkkaillaan koetuloksia vain muuttujan X osalta? Tällainen tiheysfunktio löytyy ja sitä kutsutaan komponentin X (marginaalijakauman) tiheysfunktioksi (the density function (of the marginal distribution)). Sille
käytetään merkintää f1 (x). Vastaavasti määritellään komponentin Y marginaalijakauman tiheysfunktio f2 (y). Nämä tiheysfunktiot ovat normaaleja yhden satunnaismuuttujan tiheysfunktioita, jotka ovat muodostetut yhteisjakaumasta.
Äärellisessä diskreetissä tapauksessa marginaalijakaumat saadaan taulukoimalla ja laskemalla
todennäköisyyksien rivi- ja sarakesummia seuraavan esimerkin mukaan.
Esimerkki 3.3.1. Mitkä ovat esimerkin 3.1.1 komponenttien marginaalijakaumien tiheysfunktiot? Satunnaisvektorin (X, Y ) otosavaruus Ω = {(0, 1), (0, 2), (1, 0), (1, 1), (2, 0)} ja
tiheysfunktio
1
f (x, y) = (x + 2y), kun (x, y) ∈ Ω
12
Taulukoidaan nämä todennäköisyydet
x
0
1
2
Σ
0
− 1/12 2/12
3/12
y 1 2/12 3/12 −
5/12
−
4/12
2 4/12 −
Σ 6/12 4/12 2/12 12/12 = 1
Taulukon sarake- ja rivisummista saadaan marginaalijakaumien tiheysfunktiot.
f1 (x) :
Ωx = {0, 1, 2}
f2 (y) :
Ωy = {0, 1, 2}
6
, f1 (1) =
12
3
f2 (0) = , f2 (1) =
12
f1 (0) =
4
, f1 (2) =
12
5
, f2 (2) =
12
2
12
4
12
Jatkuvan satunnaismuuttujan kohdalla marginaalijakaumien tiheysfunktiot saadaan ’integroimalla toisen muuttujan vaikutus pois’ seuraavan lauseen mukaan.
51
Lause 3.3.1. Satunnaisvektorin (X, Y ), jonka tiheysfunktio on f (x, y), komponenttien
X ja Y marginaalijakaumien tiheysfunktiot ovat
Z ∞
Z ∞
f (x, y) dy
ja
f2 (y) =
f (x, y) dx
f1 (x) =
−∞
−∞
Todistus. Annetaan todistus X:n tiheysfunktiolle. Selvästikin R:n tapahtuman {a ≤ X ≤ b}
todennäköisyys on yhtäsuuri kuin R2 :n tapahtuman {a ≤ X ≤ b, Y voi olla mitä tahansa}
todennäköisyys:
P (a ≤ X ≤ b) = P (a ≤ X ≤ b, Y ∈ R)
Z b Z ∞
f (x, y) dy dx
=
−∞
a
b
Z
f1 (x) dx
=
a
missä f1 (x) =
tiheysfunktio.
R∞
−∞
f (x, y) dy on tiheysfunktion määritelmän nojalla X:n marginaalijakauman
Satunnaisvektorin (X, Y ) ∈ R2 sanotaan olevan tasajakautunut (uniformly
distributed) joukossa Ω ⊂ R2 , merkitään (X, Y ) ∼ Tas(Ω), jos sen otosavaruus on Ω ja
tiheysfunktio
1
, kun (x, y) ∈ Ω
f (x, y) =
a(Ω)
missä a(Ω) on Ω:n pinta-ala. Jos A ⊂ Ω, niin P (A) = a(A)/a(Ω).
Esimerkki 3.3.2. Olkoon satunnaisvektori (X, Y ) tasajakautunut kolmioon
0 ≤ x ≤ 1, 0 ≤ y ≤ x. Kolmion ala on 1/2, joten tiheysfunktio
kun 0 ≤ x ≤ 1, 0 ≤ y ≤ x
f (x, y) = 2,
Lasketaan komponenttien tiheysfunktiot:
Z ∞
Z
f1 (x) =
f (x, y) dy =
−∞
Z
∞
f2 (y) =
2 dy = 2x,
kun 0 ≤ x ≤ 1
0
Z
1
2 dx = 2(1 − y),
f (x, y) dx =
−∞
x
y
52
kun 0 ≤ y ≤ 1
3.4
Satunnaismuuttujien riippumattomuus
Määritelmä 3.4.1. Satunnaisvektorin (X, Y ) komponentit X ja Y ovat riippumattomia, jos kaikille A, B ⊂ R
P (X ∈ A, Y ∈ B) = P (X ∈ A)P (Y ∈ B)
Määritelmän mukaan komponentit X ja Y ovat riippumattomia, jos kaikille reaalilukujoukoille A ja B tapahtumat {X ∈ A} ja {Y ∈ B} ovat riippumattomia. Täten riippumattomilla satunnaismuuttujilla on, kuten intuitiivisesti pitääkin olla, seuraava oleellinen ominaisuus:
Tieto toisen muuttujan saamasta arvosta ei saa vaikuttaa toiseen muuttujaan liittyviin todennäköisyyksiin. Esimerkiksi ihmisten pituus ja sosiaaliturvatunnuksen alkuosan 4 ensimmäistä
merkkiä (miksi vain nämä?) voitaneen olettaa riippumattomiksi satunnaismuuttujiksi.
Esimerkki 3.4.1. Ovatko esimerkin 3.1.1 komponentit riippumattomia? Satunnaisvektorin
(X, Y ) otosavaruus Ω = {(0, 1), (0, 2), (1, 0), (1, 1), (2, 0)} ja tiheysfunktio
f (x, y) =
1
(x + 2y),
12
kun (x, y) ∈ Ω
Valitaan esimerkiksi joukot A = {0} ja B = {0}. Todennäköisyydet
1
6
1
(0 + 2 · 1) + (0 + 2 · 2) =
12
12
12
1
1
3
P (Y ∈ B) = P (Y = 0) = (1 + 2 · 0) + (2 + 2 · 0) =
12
12
12
P (X ∈ A, Y ∈ B) = P (X = 0, Y = 0) = 0
P (X ∈ A) = P (X = 0) =
Näin on löydetty joukot A ja B, joille
P (X ∈ A)P (Y ∈ B) =
6 3
·
6= P (X ∈ A, Y ∈ B) = 0
12 12
Koska riippumattomuuden määritelmän mukaan yhtäsuuruus pitäisi olla voimassa kaikilla
joukoilla A ja B, niin komponentit X ja Y eivät ole riippumattomia.
Tällä tavoin voidaan diskreeteissä tapauksissa osoittaa komponenttien riippuvuus, jos vain
löydetään yksi joukkopari, jolle yhtäsuuruus ei päde. Riippumattomuuden osoittamiseksi pitäisi yhtäsuuruus osoittaa kaikille mahdollisille joukoille A ja B, joka pienissä otosavaruuksissa
on mahdollista, joskin työlästä.
Jatkuvien satunnaismuuttujien kohdalla riippumattomuuden pystyy selvittämään seuraavan
lauseen avulla:
53
Lause 3.4.1. Satunnaisvektorin (X, Y ), jonka tiheysfunktio on f (x, y), komponentit
ovat riippumattomia (independent), jos ja vain jos
f (x, y) = f1 (x)f2 (y)
missä f1 (x) ja f2 (y) ovat X:n ja Y :n marginaalijakauman tiheysfunktiot.
Todistus. ”⇒” Oletetaan että satunnaismuuttujat X ja Y ovat riippumattomia. Silloin voidaan satunnaisvektorin (X, Y ) kertymäfunktio esittää muuttujien X ja Y kertymäfunktioiden
F1 (x) ja F2 (y) tulona:
F (x, y) = P (X ≤ x, Y ≤ y) = P (X ≤ x)P (Y ≤ y) = F1 (x)F2 (y)
Tätä puolittain osittaisderivoimalla saadaan
f (x, y) =
∂2
F (x, y) = F10 (x)F20 (y) = f1 (x)f2 (y)
∂y∂x
”⇐” Oletetaan että f (x, y) = f1 (x)f2 (y). Nyt kaikille A, B ⊂ R:
Z Z
P (X ∈ A, Y ∈ B) =
f (x, y) dy dx
A
B
Z Z
=
f1 (x)f2 (y) dy dx
A
B
Z
Z
f2 (y) dy
f1 (x) dx
=
A
B
= P (X ∈ A)P (Y ∈ B)
joten X ja Y ovat riippumattomia.
Huomautus 1. Jos riippumattomien satunnaismuuttujien X ja Y tiheysfunktiot f1 (x)
ja f2 (y) tunnetaan, niin niiden yhteisjakauman tiheysfunktio on f (x, y) = f1 (x)f2 (y).
Esimerkki 3.4.2. Satunnaiskoe, jonka mittaustuloksen X tiheysfunktio on
g(x) = 2x, kun 0 ≤ x ≤ 1 toistetaan kahdesti. Mittaustulokset X ja Y ovat riippumattomia.
Mitä on P (X + Y ≤ 1)?
Nyt muuttujien X ja Y yhteisjakauman tiheysfunktio on
(
4xy,
kun 0 ≤ x ≤ 1, 0 ≤ y ≤ 1
f (x, y) = g(x)g(y) =
0,
muulloin
54
ja
Z
1
Z
P (X + Y ≤ 1) =
1−x
Z
1−x
.
1
4xydy dx =
0
Z
0
0
1
3
2
(2x − 4x + 2x)dx =
=
0
2xy 2 dx
0
.1 1
0
!
4
x − x3 + x 2
2
3
4
1 4
1
= − +1=
2 3
6
Yleistetään riippumattomuuden määritelmä koskemaan useampaa kuin kahta muuttujaa:
Määritelmä 3.4.2. Satunnaismuuttujat X1 , X2 , . . . , Xp ovat riippumattomia, jos kaikille A1 , A2 , . . . , Ap ⊂ R pätee:
P (X1 ∈ A1 , X2 ∈ A2 , . . . , Xp ∈ Ap ) = P (X1 ∈ A1 )P (X2 ∈ A2 ) · · · P (Xp ∈ Ap )
Huomautus 2. Sovellutuksissa satunnaismuuttujien riippumattomuuden selvittäminen saattaa olla vaikeata; riippumattomaksi ne oletetaan, jos ei ole mitään näyttöä riippuvuudesta.
Esitetään lopuksi tärkeä tulos riippumattomien satunnaismuuttujien funktioiden riippumattomuudesta.
Lause 3.4.2. Olkoot satunnaismuuttujat X1 , X2 , . . . , Xp riippumattomia ja
U1 = h1 (X1 ), U2 = h2 (X2 ), . . . , Up = hp (Xp ). Tällöin satunnaismuuttujat U1 , U2 , . . . , Up
ovat riippumattomia.
Todistus.
P (U1 ∈ A1 , . . . , Up ∈ Ap ) = P (h1 (X1 ) ∈ A1 , . . . , hp (Xp ) ∈ Ap )
= P (X1 ∈ B1 , . . . , Xp ∈ Bp )
= P (X1 ∈ B1 ) · · · P (Xp ∈ Bp )
= P (h1 (X1 ) ∈ A1 ) · · · P (hp (Xp ) ∈ Ap )
= P (U1 ∈ A1 ) · · · P (Up ∈ Ap ),
missä Bi = {Xi ∈ ΩXi | hi (Xi ) ∈ Ai }.
Huomautus 3. Voidaan osoittaa, että jos riippumattomista satunnaismuuttujista X1 , X2 , . . . , Xp
valitaan mikä tahansa määrä ja mitkä tahansa eri satunnaismuuttujat X(1) , X(2) , . . . , X(k) ,
(2 ≤ k ≤ p), niin nämä ovat riippumattomia.
55
3.5
Satunnaismuuttujien funktion odotusarvo
Tarkastellaan satunnaismuuttujien X ja Y reaaliarvoista funktiota U = h(X, Y ). Näin saatu U
on skalaarinen satunnaismuuttuja. Miten saadaan satunnaismuuttujan U odotusarvo E(U )?
Muodostetaanko U :n tiheysfunktio ja käytetään sitten odotusarvon määritelmää? Näin ei
tarvitse menetellä, sillä voidaan todistaa (vastaavasti kuin lause 2.6.1)
Lause 3.5.1. Olkoon satunnaismuuttujien X ja Y yhteisjakauman eli satunnaisvektorin
(X, Y ) tiheysfunktio f (x, y) ja otosavaruus Ω. Olkoon U = h(X, Y ). Tällöin,
jos (X, Y ) on diskreetti,
X
E(U ) = E(h(X, Y )) =
h(x, y)f (x, y)
(x,y)∈Ω
ja jos (X, Y ) on jatkuva,
ZZ
E(U ) = E(h(X, Y )) =
h(x, y)f (x, y) dxdy
Ω
Esimerkki 3.5.1. Jatketaan esimerkkiä 3.2.1 ja lasketaan muuttujan U = XY odotusarvo.
Satunnaisvektorin (X, Y ) tiheysfunktio ja otosavaruus ovat
kun (x, y) ∈ Ω = {(x, y) : 0 < x < y, 0 < y < 1}
f (x, y) = 8xy,
Edellisen lauseen mukaan
Z
1
Z
E(XY ) =
y
Z
xy8xy dx dy =
0
Z
=
0
0
1
0
1
.y 8
0
3
!
x3 y 2
dy
.1 8
8 5
4
y dy =
y6 =
3
18
9
0
Lause 3.5.2.
E(g(X, Y ) + h(X, Y )) = E(g(X, Y )) + E(h(X, Y ))
56
Todistus. Annetaan todistus tapauksessa, jossa muutujien X ja Y yhteisjakauma on jatkuva,
tiheysfunktiona f (x, y) ja otosavaruutena Ω. Diskreetissä tapauksessa todistus on täysin analoginen; integraalien tilalla ovat summat. Nyt lauseen 3.5.1 ja tasointegraalin ominaisuuksien
nojalla
ZZ
Lause 3.5.1
(g(x, y) + h(x, y)) f (x, y) dxdy
E(g(X,Y ) + h(X, Y ))
=
Ω
ZZ
ZZ
=
g(x, y)f (x, y) dxdy +
h(x, y)f (x, y) dxdy
Ω
Ω
= E(g(X, Y )) + E(h(X, Y ))
Asettamalla lauseessa 3.5.2 g(X, Y ) = a1 X ja h(X, Y ) = a2 Y saadaan tulos
E(a1 X + a2 Y ) = a1 E(X) + a2 E(Y ). Tämä voidaan yleistää:
Satunnaismuuttujien X1 , X2 , . . . , Xn lineaarisen lausekkeen odotusarvolla on
lineaarisuusominaisuus
E(a1 X1 + a2 X2 + · · · + an Xn ) = a1 E(X1 ) + a2 E(X2 ) + · · · + an E(Xn )
Lause 3.5.3. Jos satunnaismuuttujat X ja Y ovat riippumattomia, niin
E(XY ) = E(X)E(Y )
Todistus. Todistetaan tapaus, jossa muuttujien X ja Y yhteisjakauma on jatkuva, tiheysfunktiona f (x, y). Olkoon X:n ja Y :n tiheysfunktiot fi (x) ja f2 (y). Koska X ja Y ovat riippumattomia, on satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktio f (x, y) = f1 (x)f2 (y).
Täten
Z ∞Z ∞
E(XY ) =
xyf1 (x)f2 (y) dxdy
−∞ −∞
Z ∞
Z ∞
=
xf1 (x) dx
yf2 (y) dy
−∞
−∞
= E(X)E(Y )
57
Esimerkki 3.5.2. Olkoon satunnaisvektorin (X, Y ) tiheysfunktio
f (x, y) = x + y,
kun 0 < x < 1, 0 < y < 1
Lasketaan odotusarvot E(X), E(Y ), E(X + Y ) ja E(XY ). Koska f (x, y) = x + y,
1
Z
f1 (x) =
x + y dy =
0
0
1
Z
f2 (y) =
0
.1
1
1
xy + y 2 = x +
2
2
ja
1
x + y dx = y + .
2
Saadaan siis
Z
E(X) =
0
1
.1 1
1
1
1 1
7
x(x + )dx =
x3 + x 2 = + =
2
3
4
3 4
12
0
ja
Z
E(Y ) =
0
1
1
7
y(y + )dy = .
2
12
Edelleen
7
14
7
7
+
=
= .
12 12
12
6
Tutkitaan vielä, ovatko X ja Y riippumattomia. Koska
ZZ
Z 1Z 1
E(XY ) =
xy(x + y)dxdy =
x2 y + xy 2 dy dx
Ω
0
0
!
Z 1 .1
Z 1
1 2 2 1 3
1 2 1
=
x y + xy dx =
x + x dx
2
3
3
0
0 2
0
2
.1 1
1 2 1
7
3
=
x + x =
6=
= E(X)E(Y ),
6
6
3
12
E(X + Y ) = E(X) + E(Y ) =
0
niin X ja Y eivät ole riippumattomia. Huomaa kuitenkin, että vaikka E(XY ) olisi ollut
= E(X)E(Y ), niin siitä ei kuitenkaan välttämättä seuraa se, että X ja Y olisivat olleet
riippumattomia. Lauseen 3.5.3 avulla voidaan osoittaa vain satunnaismuuttujien riippuvuus.
Riippumattomuuden osoittamiseen se ei sovellu.
58
3.6
Riippumattomien satunnaismuuttujien summa
Tärkeä satunnaismuuttujien tyyppi on riippumattomien satunnaismuuttujien X1 , X2 , . . . , Xn
summa Y = X1 +X2 +· · ·+Xn . Mikä on Y :n jakauma kun muuttujien Xi jakaumat tunnetaan?
Usein Xi :t ovat samalla tavalla jakautuneita.
Seuraavassa lauseessa on momentit generoivien funktioiden tärkeä ominaisuus. Sitä ja momentit generoivan funktion yksikäsitteisyysominaisuutta sekä induktioperiaatetta käyttämällä voidaan selvittää riippumattomien satunnaismuuttujien summan jakauma.
Lause 3.6.1. Riippumattomien satunnaismuuttujien X1 ja X2 summan Y = X1 + X2
momentit generoiva funktio on muuttujien X1 ja X2 momentit generoivien funktioiden
tulo:
MY (t) = MX1 (t)MX2 (t)
Todistus Koska X1 ja X2 ovat riippumattomia, niin lauseen 3.4.2 mukaan riippumattomia
ovat myös muuttujien X1 ja X2 funktiot etX1 ja etX2 , missä t ∈ R. Täten
MY (t) = E(etY ) = E(et(X1 +X2 ) ) = E(etX1 etX2 )
Lause 3.5.3
=
E(etX1 )E(etX2 ) = MX1 (t)MX2 (t) Esimerkki 3.6.1. Olkoot X ∼ Bin(n, p) ja Y ∼ Bin(m, p) riippumattomia. Tällöin
MX+Y (t) = MX (t)MY (t)
Lause 2.8.1
⇒
Lause 2.8.1
=
(pet + 1 − p)n (pet + 1 − p)m = (pet + 1 − p)n+m
X + Y ∼ Bin(n + m, p)
Todistetaan tärkeä tulos: Riippumattomien normaalijakautuneiden satunnaismuuttujien lineaarikombinaatio on normaalijakautunut.
Lause 3.6.2. Jos X1 , X2 , . . . , Xn ovat riippumattomia normaalijakautuneita satunnaismuuttujia, Xi ∼ N(µi , σi2 ), niin
Y = a1 X 1 + a2 X 2 + · · · + an X n
∼ N(µY , σy2 )
missä
µY = a1 µ1 + a2 µ2 + · · · + an µn ja σY2 = a21 σ12 + a22 σ22 + · · · + a2n σn2
59
Todistus. Käytetään induktiota. Näytetään ensin väite oikeaksi kun n = 2. Lauseen 2.11.2
mukaan ai Xi ∼ N(ai µi , a2i σi2 ). Lausetta 3.6.1 ja 2.11.1 soveltamalla saadaan:
MY (t) = Ma1 X1 (t)Ma2 X2 (t)
2 2 2 /2
= ea1 µ1 t+a1 σ1 t
2 2 2 /2
· ea2 µ2 t+a2 σ2 t
2 2
2 2
2 /2
= e(a1 µ1 +a2 µ2 )t+(a1 σ1 +a2 σ2 )t
Osoitetaan sitten, että jos väite pätee kun n = k, niin se pätee myös kun n = k + 1. Koska
muuttujat X1 , X2 , . . . , Xk+1 ovat riippumattomia, niin ilmeisesti y = a1 X1 +a2 X2 +· · ·+ak Xk
ja Xk+1 ovat riippumattomia, ja oletusten mukaan normaalisti jakautuneita. Yllä todistetun
nojalla summa
2
Y + ak+1 Xk+1 ∼ N(µY + ak+1 µk+1 , σY2 + a2k+1 σk+1
)
missä µY = a1 µ1 + · · · + ak µk ja σY2 = a21 σ12 + · · · + a2k σk2 .
3.7
Kovarianssi, korrelaatio ja summan varianssi
Olkoot X ja Y kaksi saman kokeen satunnaismuuttujaa. Esimerkiksi kokeessa realisoituvan
satunnaisvektorin kaksi komponenttia. Halutaan selvittää, onko muuttujien X ja Y välillä
(tilastollista) riippuvuutta. Jos keskinäistä riippuvuutta löytyy, niin mikä on riippuvuuden
laatu ja voimakkuus. Seuraavassa rajoitutaan lineaariseen riippuvuuteen. Merkitään
µX = E(X)
ja
µY = E(Y )
Satunnaismuuttujien X ja Y lineaarisen riippuvuuden voimakkuuden ilmaisee tulon
(X − µX )(Y − µY ) odotusarvo, joka on nimeltään
Satunnaismuuttujien X ja Y kovarianssi (covariance)
merk.
Cov(X, Y ) = E((X − µX )(Y − µY )) = σXY
Määritelmästä nähdään, että Cov(X, X) = Var(X). Kovarianssille pätee laskukaava:
Lause 3.7.1.
Cov(X, Y ) = E(XY ) − E(X)E(Y )
Todistus.
Cov(X, Y ) = E((X − µX )(Y − µY )) = E(XY − XµY − µX Y + µX µY )
E:n lin.
= E(XY ) − E(X)µY − µX E(Y ) + µX µY = E(XY ) − µX µY
60
Lause 3.7.2. Jos X ja Y ovat riippumattomia, niin Cov(X, Y ) = 0.
Todistus. Cov(X, Y ) = E(XY ) − E(X)E(Y )
Lause 3.5.3
=
E(X)E(Y ) − E(X)E(Y ) = 0
Valitettavasti lausetta ei voi yleisesti kääntää. Vaikka Cov(X, Y ) = 0, se ei takaa satunnaismuuttujien X ja Y riippumattomuutta.
Luvulla Cov(X, Y ) voidaan ilmaista vain lineaarista riippuvuutta. Jos Cov(X, Y ) > 0, ovat
poikkeamat (X − µX ) ja (Y − µY ) arvoltaan yleisesti ottaen saman suuntaisia eli X:n arvojen
kasvaessa myös Y :n arvot keskimäärin kasvavat. Kokeen koetoistoissa mitattujen muuttujien
X ja Y havaintoarvoparien (x, y) arvot keskittyvät siihen xy-tason osaan, jossa
(X − µX )(Y − µY ) > 0.
p
Kovarianssin
suuruus
riippuu
osittain
X:n
ja
Y
:n
keskihajonnoista
Var(X) = σX ja
p
Var(Y ) = σY minkä johdosta Cov(X, Y ) ei ole hyvä mitta lineaarisen riippuvuuden voimakkuudelle. Tähän tarkoitukseen paremmin sopivan mitan antaa keskihajonnaltaan = 1
ˆ = X/σX ja Yˆ = Y /σY kovarianssi,
normitettujen muuttujien X
Cov(X, Y )
X
µ
Y
µ
1
X
Y
ˆ Yˆ ) = E
Cov(X,
−
−
=
E((X − µX )(Y − µY )) =
{z
}
|
σX
σX
σY
σY
σX σY
σX σY
Cov(X,Y )
Tämä suure on
Satunnaismuuttujien X ja Y välinen (lineaarinen) korrelaatio (correlation):
Cov(X, Y )
merk.
= ρXY
Corr(X, Y ) = p
Var(X)Var(Y )
Esimerkki 3.7.1. Esimerkin 3.2.1 satunnaisvektorin (X, Y ) tiheysfunktio on
f (x, y) = 8xy, kun 0 < x < y < 1. Lasketaan komponenttien X ja Y kovarianssi ja korrelaatio.
Esimerkissä 3.5.1 saatiin E(XY ) = 94 . Nyt
Z
1
Z
E(X) =
y
Z
x8xy dxdy =
0
Z
=
0
0
1
0
1
.y 8
0
.1 8
8 4
8
y dy =
y5 =
3
15
15
0
61
3
!
3
x y dy
Z
1
y
Z
E(Y ) =
.y
1
Z
y8xy dxdy =
0
Z
0
0
1
=
4y 4 dy =
0
.1 4
0
5
y5 =
!
4x2 y 2 dy
0
4
12
=
5
15
joten
Cov(X, Y ) = E(XY ) − E(X)E(Y ) =
8 12
4
4
−
·
=
9 15 15
225
Korrelaatiota varten lasketaan ensin
1
Var(X) = E(X ) − (E(X)) = −
3
2
Var(Y ) = E(Y ) − (E(Y )) = −
3
2
2
8
15
2
=
11
225
=
6
225
ja
2
2
12
15
2
jolloin
Corr(X, Y ) = p
Cov(X, Y )
Var(X)Var(Y )
=q
4
225
11
225
q
= 0.492
6
225
Korrelaation ominaisuuksia
1) −1 ≤ Corr(X, Y ) ≤ 1
2)
3)
Corr(X, Y = aX + b) =
Corr(X, Y ) =
(
1
−1
(
1,
jos a > 0
−1,
⇒
jos a < 0
P (Y = aX + b) = 1, missä
(
a>0
a<0
Mitä suurempi |Corr(X, Y )| on, sen voimakkaammasta lineaarisesta riippuvuudesta on kyse,
eli sitä tiiviimmin muuttujaparin (X, Y ) arvot osuvat erään suoran ympärille. Korrelaation
arvot Corr(X, Y ) = ±1 kuvaavat täydellistä lineaarista riippuvuutta. Jos Corr(X, Y ) = 0
voidaan vain päätellä, että muuttujien X ja Y välillä ei ole lineaarista riippuvuutta. Sen
sijaan muun luonteista riippuvuutta voi olla.
62
Korrelaatiokertoimen arvosta voidaan tehdä esimerkiksi seuraavanlaisia sanallisia tulkintoja.
Lineaarinen riippuvuus on
• voimakas, jos | ρ |≥ 0.8
• huomattava, jos 0.6 ≤| ρ |< 0.8
• kohtalainen, jos 0.3 ≤| ρ |< 0.6
• merkityksetön, jos | ρ |< 0.3
Kun korrelaatiota käytetään empiirisellä aineistolla, on aina suotavaa ensin muodostaa pisteparvi eli sirontakuvio (scatter plot), jossa mitatut satunnaismuuttujien X ja Y havaintoarvoparit (xi , yi ), i = 1, . . . , n merkitään xy-koordinaatistoon. Sirontakuvio saattaa paljastaa
mahdollisen epälineaarisen riippuvuuden. Korrelaatio on suhteellisen herkkä poikkeaville arvoille ja myös nämä paljastuvat sirontakuviosta. Alla on kuvattu joitakin sirontakuvioita ja
korrelaatiokertoimia.
Regressioanalyysissa (regression analysis) tutkitaan havaintoaineiston muuttujien lineaarisia riippuvuuksia. Tätä aihetta käsitellään jatkokurssilla Tilastomatematiikka.
Lause 3.7.3. Satunnaismuuttujien X ja Y lineaarisen lausekkeen varianssille pätee
Var(aX + bY ) = a2 Var(X) + b2 Var(Y ) + 2ab Cov(X, Y )
Erityisesti, jos X ja Y ovat riippumattomia, niin Cov(X, Y ) = 0 ja
Var(aX + bY ) = a2 Var(X) + b2 Var(Y )
Todistus. Määritelmän mukaan
Var(aX + bY ) = E((aX + bY − µaX+bY )2 )
63
Odotusarvon lineaarisuusominaisuuden nojalla µaX+bY = aµX + bµY , joten
Var(aX + bY ) = E((a(X − µX ) + b(Y − µY ))2 )
= E(a2 (X − µX )2 + b2 (Y − µY )2 + 2ab(X − µX )(Y − µY ))
E:n lin.
=
a2 E((X − µX )2 ) + b2 E((Y − µY )2 ) + 2abE((X − µX )(Y − µY ))
= a2 Var(X) + b2 Var(Y ) + 2ab Cov(X, Y )
Lause 3.7.3 yleistyy useamman kuin kahden satunnaismuuttujan lineaarisille lausekkeille. Jatkossa tarvitaan seuraavaa tulosta
Lause 3.7.4. Jos satunnaismuuttujat X1 , X2 , . . . , Xn ovat riippumattomia, niin
Var(a1 X1 + a2 X2 + · · · + an Xn ) = a21 Var(X1 ) + a22 Var(X2 ) + · · · + a2n Var(Xn )
2
= 2 ja σY2 = 4 ja kovarianssi σXY = −2,
Esimerkki 3.7.2. Jos X:n ja Y :n varianssit ovat σX
on satunnaismuuttujan U = 3X − 4Y + 8 varianssi
σU2 = Var(3X − 4Y + 8)
Lause 2.6.4
=
Var(3X − 4Y )
2
= 32 σX
+ (−4)2 σY2 + 2 · 3 · (−4)σXY = 130
3.8
Otoskeskiarvon jakauma
Tarkastellaan koetta, jossa realisoituu satunnaismuuttujalle X arvo. Suoritetaan tämän kokeen n-toistokoe. Olkoon Xi i:nnen koetoiston satunnaismuuttuja. Koetoistojen satunnaismuuttujien X1 , X2 , . . . , Xn sanotaan olevan n:n kappaleen otos satunnaismuuttujasta X.
Otoksessa satunnaismuuttujat Xi ovat riippumattomia ja noudattavat samaa jakaumaa kuin
X. Täten E(Xi ) = E(X) ja Var(Xi ) = Var(X).
n-toistokokeessa otoksen X1 , X2 , . . . , Xn (satunnaisvektori) saamia arvoja x1 , x2 , . . . , xn kutsutaan myös otokseksi.
64
Otoksesta X1 , X2 , . . . , Xn riippuvia otossuureita (statistics) käytetään X:n jakauman tuntemattomien parametrien, kuten odotusarvon ja varianssin, arviointiin ja parametreihin kohdistuvien väitteiden testaamiseen. Tällöin on tunnettava otossuureiden jakaumat. Tärkeimmät otossuureet ovat
n
otoskeskiarvo (sample mean) :
X=
n
1X
1X
Xi tai x =
xi
n i=1
n i=1
n
otosvarianssi (sample variance) :
n
1 X
1 X
(Xi − X)2 tai s2 =
(xi − x)2
S =
n − 1 i=1
n − 1 i=1
2
otoshajonta (sample standard deviation) :
S tai s, joka on otosvarianssin neliöjuuri
Otossuureet ovat otosmuuttujien Xi satunnaisuuden takia n-toistokokeen satunnaismuuttujia. Entä miten otoskeskiarvo on jakautunut? Satunnaismuuttujien X1 , X2 , . . . , Xn lineaarisen lausekkeen odotusarvolle pätee (odotusarvon lineaarisuus, kpl 3.5)
E(a1 X1 + a2 X2 + · · · + an Xn ) = a1 E(X1 ) + a2 E(X2 ) + · · · + an E(Xn )
ja jos satunnaismuuttujat Xi ovat riippumattomia, niin varianssille pätee (lause 3.7.4)
Var(a1 X1 + a2 X2 + · · · + an Xn ) = a21 Var(X1 ) + a22 Var(X2 ) + · · · + a2n Var(Xn )
Erityisesti, jos X1 , X2 , . . . , Xn on otos satunnaismuuttujasta X, niin E(Xi ) = E(X) ja
Var(Xi ) = Var(X). Näin otoskeskiarvon odotusarvolle ja varianssille saadaan seuraava tulos.
Lause 3.8.1. Olkoon X1 , X2 , . . . , Xn otos satunnaismuuttujasta X.
Tällöin X:n otoskeskiarvon X odotusarvo on yhtäsuuri kuin X:n odotusarvo,
E(X) = E(X) = µ
ja otoskeskiarvon varianssi on ainoastaan n:s osa X:n varianssista,
Var(X) =
Var(X)
σ2
=
n
n
Otossuureen sanotaan olevan harhaton estimaattori (unbiased estimator) tietylle parametrille, jos otossuureen odotusarvo on yhtäsuuri kuin tämä parametri. Otossuureen realisaatio antaa tälle parametrille harhattoman estimaatin (unbiased estimate). Lauseen 3.8.1
mukaan satunnaismuuttujan X otoskeskiarvo on harhaton estimaattori X:n odotusarvolle.
65
Vastaavasti voidaan osoittaa (kpl 3.10), että X:n otosvarianssi on X:n varianssin harhaton
estimaattori eli E(S 2 ) = Var(X) = σ 2 .
Jos X on normaalisti jakautunut, niin Lauseen 3.6.2 mukaan X:n otoskeskiarvo on myös
normaalisti jakautunut, siis
Lause 3.8.2. Jos X1 , X2 , . . . , Xn on otos muuttujasta X ∼ N(µ, σ 2 ), niin otoskeskiarvo
σ2
X ∼ N µ,
n
Otoskeskiarvon keskihajontaa kutsutaan keskiarvon keskivirheeksi (the standard error of
the mean).
q
σ
D(X) = Var(X) = √
n
Otoksesta arvioitu satunnaismuuttujan X odotusarvo on tapana antaa muodossa otoskeskiarvo ± keskiarvon keskivirhe. Luotettavampi tapa on muodostaa odotusarvolle luottamusväli,
joka ennalta sovitulla todennäköisyydellä sisältää odotusarvon. Luottamusvälejä tarkastellaan
jatkokurssilla Tilastomatematiikka.
3.9
Keskeinen raja-arvolause
Keskeinen raja-arvolause (central limit theorem) antaa perustelut normaalijakauman laajalle käytölle. Lause ilmaisee, että riippumattomien satunnaismuuttujien summan jakauma
yhteenlaskettavien lukumäärän kasvaessa lähestyy normaalijakaumaa. Merkille pantavaa on,
että tämä lähestyminen normaalijakaumaksi tapahtuu olivatpa yhteenlaskettavien jakaumat
(eräitä vaatimattomia rajoituksia lukuunottamatta) millaisia tahansa, diskreettejä tai jatkuvia. Seuraavassa annetaan keskeinen raja-arvolause sen yksinkertaisimmassa muodossa.
Lause 3.9.1. Keskeinen raja-arvolause. Olkoon X1 , X2 , . . . , Xn otos satunnaismuuttujasta X, jonka odotusarvo on µ ja varianssi σ 2 . Tällöin, kun n → ∞, standardoidun
otoskeskiarvon
X − µX
X −µ
∗
√
X =
=
σX
σ/ n
kertymäfunktio F (t) lähenee N(0, 1)-jakauman kertymäfunktiota Φ(z),
∗
F (t) = P (X ≤ t) → Φ(z),
66
kun n → ∞
Käytännön tehtävissä keskeistä raja-arvolausetta sovelletaan muodossa:
∗
Standardoitu otoskeskiarvo X on suurilla n:n arvoilla likimain standardoidusti normaalijakautunut. Tälle niin sanotulle normaaliapproksimaatiolle käytetään merkintää
∗ .
X ∼ N(0, 1)
Yleensä normaaliapproksimaatiolla saadaan hyviä arvioita, jos n ≥ 30, olipa X:n jakauma
millainen tahansa. Jos X:n jakauman tiedetään olevan lähellä normaalijakaumaa, voidaan
normaaliapproksimaatiota soveltaa jo arvoa n = 30 pienemmillä arvoilla. Jos X on normaalijakautunut, niin silloin otoskeskiarvo on lauseen 3.8.2 mukaan täsmälleen normaalijakautunut
kaikilla n:n arvoilla, eikä approksimaatiota tarvita.
Seuraus. Olkoon X1 , X2 , . . . , Xn otos satunnaismuuttujasta X, jonka odotusarvo on µ
ja varianssi σ 2 . Tällöin
σ2
.
otoskeskiarvo
X ∼ N µ,
n
ja summa
.
X1 + X2 + · · · + Xn ∼ N(nµ, nσ 2 )
Esimerkki 3.9.1. Hissin varoitustaulun mukaan se voi kuljettaa korkeintaan 25 henkilöä
tai 2000 kg. Henkilöpaino (kg) on satunnaismuuttuja, jonka odotusarvoksi oletetaan µ = 74
ja varianssiksi σ 2 = 100. Halutaan tietää millä todennäköisyydellä satunnaisesti valitun 25
henkilön kokonaispaino ylittää 2000 kg.
Jos X =’ 25 henkilön kokonaispaino’, niin
.
X ∼ N(25 · 74, 25 · 100) = N(1850, 2500)
Täten
2000 − 1850
X − 1850
√
√
≤
2500
2500
P (X > 2000) = 1 − P (X ≤ 2000) = 1 − P
2000 − 1850
√
≈1−Φ
= 1 − Φ(3) = 0.0013
2500
67
Esimerkki 3.9.2. Olkoon satunnaismuuttujan X varianssi σ 2 = 25. Todennäköisyys sille,
että n = 50 kappaleen otoksen otoskeskiarvo X poikkeaa X:n odotusarvosta µ vähemmän
kuin 2, on
P (|X − µ| < 2) = P (−2 < X − µ < 2)

X −µ
σX
| {z
}
 −2

<
=P
 σX

2 

<

σX 
√
σ
25
1
σX = √ = √ = √
n
50
2
norm.appr.∼N(0,1)
√
√
≈ Φ(2 2) − Φ(−2 2)
√
= 2Φ(2 2) − 1
≈ 0.995
Binomijakauman normaaliapproksimaatio
Olkoon X ∼ Bin(n, p), missä parametri p on tarkasteltavana olevan tapahtuman A todennäköisyys. Satunnaismuuttuja X voidaan esittää summana X = Y1 + Y2 + · · · + Yn , missä Yi :t
ovat riippumattomia ja Yi saa arvon 1, jos i:nnessä kokeessa A realisoituu ja arvon 0, jos A
ei realisoidu. Siten Y1 , Y2 , . . . , Yn on otos muuttujasta Y ∼ Bin(1, p). Lauseen 2.9.1 mukaan
Y :n odotusarvo µ = p ja varianssi σ 2 = p(1 − p), joten
Satunnaismuuttujaa X ∼ Bin(n, p) voidaan normaaliapproksimoida
.
X ∼ N(np, np(1 − p))
Huomatus 1. Jos p on lähellä arvoa 0 tai
1, niin normaaliapproksimaatio saattaa antaa
huonoja arvioita binomijakauman todennäköisyyksille. Jos taas p on lähellä arvoa 0.5, niin
normaaliapproksimaatiolla saadaan hyviä arvioita jo pienillä arvoilla n. Ohjeena voidaan
sanoa, että mikäli np ≥ 5 ja n(1 − p) ≥ 5, niin
normaaliapproksimaation arviot ovat käyttökelpoisia.
68
Kun diskreettiä binomijakaumaa approksimoidaan jatkuvalla normaalijakaumalla, saadaan
tarkempia tuloksia, kun suoritetaan jatkuvuuskorjaus. Jatkuvuuskorjauksessa tapahtuman
rajoiksi muutetaan se reaalilukuväli, jolla olevat luvut pyöristettäisiin diskreetin jakauman
kokonaisluvuiksi. Seuraavassa taulukossa on esimerkkejä jatkuvuuskorjauksista.
Tapahtuma,
Jatkuvuuskorjattu,
jakauma Bin(n, p)
jakauma N(np, np(1 − p))
P (X ≤ 3)
P (X ≤ 3.5)
P (X < 3) = P (X ≤ 2)
P (X ≤ 2.5)
P (X ≥ 4)
P (X ≥ 3.5)
P (X > 4) = P (X ≥ 5)
P (X ≥ 4.5)
Esimerkki 3.9.3. Heitetään kolikkoa 900 kertaa. Kruunujen esiintymismäärä on satunnais.
muuttuja X ∼ Bin(900, 0.5). Sen normaaliapproksimaatio on X ∼ N(450, 225). Todennäköisyys, että kruunujen lukumäärä on yli 495 = P (X > 495), on jatkuvuuskorjauksella korjattuna
P (X > 495.5) = 1 − P (X ≤ 495.5)
495.5 − 450
√
≈1−Φ
225
= 1 − Φ(3.03)
= 0.0012
Huomatus 2. Keskeisellä raja-arvolauseella on edellä esitettyjä paljon yleisempi versio. Olkoot X1 , X2 , . . . päättymätön jono riippumattomia satunnaismuuttujia, joiden jakaumista
tiedetään vain odotusarvot µ1 , µ2 , . . . ja varianssit σ12 , σ22 , . . . . Määritellään summat
Yn = X1 + X2 + · · · + Xn
(n = 1, 2, . . . )
Nyt
E(Yn ) = µ1 + µ2 + · · · + µn = µYn
Var(Yn ) = σ12 + σ22 + · · · + σn2 = σY2n
Varsin yleisin oletuksin, kun n → ∞, standardoidun satunnaismuuttujan Yn∗ = (Yn −µYn )/σYn
kertymäfunktio lähenee N(0, 1)-jakauman kertymäfunktiota. Suurilla n:n arvoilla voidaan teh.
dä normaaliapproksimaatio Yn∗ ∼ N(0, 1). Tästä seuraa, että
.
Yn = X1 + X2 + · · · + Xn ∼ N(µYn , σY2n )
Tässä on teoreettinen selitys sille, että mittausvirheet jakautuvat likimain normaalisti; mittausvirhe on lukuisten pienten satunnaisvirheiden summa.
69
3.10
Tilastollinen testaaminen
Otossuureiden avulla voidaan testata jakauman parametrejä koskevia väitteitä. Tilastollisessa
testaamisessa muodostetaan testisuureen jakauma, kun oletetaan testattavan väitteen olevan
tosi ja tutkitaan kuinka tavallinen/harvinainen otoksesta laskettu testisuureen arvo on tässä
jakaumassa.
Tilastollisessa testaamisessa on seuraavat vaiheet.
1. Asetetaan testattava väite nollahypoteesi H0 ja tälle vaihtoehtoinen hypoteesi H1 .
Tilastollisen testaamisen periaate on, että nollahypoteesi on voimassa, kunnes löytyy
vahva näyttö siitä, ettei se todennäköisesti olekaan totta. Nollahypoteesi on jakauman
parametria koskeva yhtälö esim. H0 : µ = 10.
Vaihtoehtoinen hypoteesi on se väite, johon päädytään, jos nollahypoteesi hylätään.
Vaihtoehtoiset hypoteesit ovat epäyhtälöitä esim. H1 : µ 6= 10, H1 : µ > 10 tai
H1 : µ < 10. Vastahypoteesi määrää, mihin suuntaan olevat tarpeeksi suuret poikkeamat
aiheuttavat nollahypoteesin hylkäämisen.
2. Valitaan testisuure, jonka jakauma tunnetaan, kun nollahypoteesin oletetaan olevan tosi.
3. Valitaan testin merkitsevyystaso eli riskitaso α. Merkitsevyystaso on ehdollinen todennäköisyys, että nollahypoteesi hylätään, vaikka se onkin tosi. Tavallisesti käytetään
merkitsevyystasoja α = 0.05, 0.01, 0.005 tai 0.001.
4. Määritetään testisuureen harvinaisten arvojen joukko, ns. kriittinen alue, jonka todennäköisyys on merkitsevyystason α suuruinen. Tilanteessa, jossa vaihtoehtoinen hypoteesi on kaksisuuntainen eli on esim. muotoa H1 : µ 6= 10, kriittinen alue koostuu
kahdesta reaalilukuvälistä jakauman reunoilla, jolloin kumpikin väli on todennäköisyydeltään α/2. Tällöin testi on kaksisuuntainen testi (two-tailed test).
Jos vaihtoehtoinen hypoteesi on esim. muotoa H1 : µ > 10, kriittinen alue on yksiosainen, tässä tapauksessa vain jakauman oikeassa reunassa oleva reaalilukuväli, jonka
todennäköisyys on merkitsevyystason α suuruinen. Tällöin testi on yksisuuntainen
testi (one-tailed test).
5. Lasketaan testisuureen arvo otoksessa.
6. Jos testisuureen arvo osuu kriittiselle alueelle, nollahypoteesi hylätään ja vaihtoehtoinen
hypoteesi valitaan. Jos testisuureen arvo osuu testisuureen tavallisten arvojen joukkoon,
nollahypoteesi jää voimaan.
70
Edellä esitetty kriittisen alueen määrääminen ja testaus voidaan tehdä jakaumataulukoiden
avulla. Monet tilastolliset ohjelmistot laskevat suoraan testiin liittyvän merkitsevyystason,
ns. p−arvon (p−value) . Tämä on pienin merkitsevyystaso, joka johtaa nollahypoteesin hylkäämiseen. Jos p−arvo on käytössä, kriittisen alueen määräämistä ei tarvita. Nollahypoteesi
hylätään, jos p−arvo on pienempi kuin etukäteen valittu merkitsevyysraja 0.05, 0.01 tms.
Ohjelmistojen p−arvoja tulkittaessa täytyy ottaa huomioon testin yksi- tai kaksisuuntaisuus.
Esimerkki 3.10.1. Seudun vuotuisen sademäärän X (cm) keskiarvoksi 100 vuoden ajalta
oli saatu 106.0 ja keskihajonnaksi 15.3. Lisäksi voitiin olettaa, että X ∼ N(106.0, 15.32 ).
Viimeisen 5 vuoden sademäärän keskiarvoksi oli saatu 89.3. Millä todennäköisyydellä näin
paljon lukua 106.0 pienempi keskiarvo olisi odotettavissa, mikäli 5 viimeisen vuoden havainnot
tulkitaan olevan otos jakaumasta N(106.0, 15.32 )? Onko seudun sääolosuhteissa tapahtunut
pysyvänluonteinen muutos?
Tässä testattava väite on, että sääolosuhteissa ei ole tapahtunut muutosta. Asetetaan nollahypoteesiksi H0 : µ = 106, missä µ on viiden vuoden sademäärien keskiarvo. Kun mittaustulos
on 89.3, on luontevaa testata sademäärän pienenemistä, jolloin vaihtoehtoinen hypoteesi on
H1 : µ < 106. Valitaan merkitsevyystasoksi α = 0.01.
Koska vuoden sademäärä X ∼ N(106, 15.32 ), niin viiden vuoden sademäärän otoskeskiarvo
15.32
X ∼ N 106,
= N(106, 46.818) = N(106, 6.8422 ).
5
Otoskeskiarvoa voidaan käyttää testisuureena ja sen jakauma H0 :n ollessa tosi, on N(106, 6.8422 ).
Kriittinen alue on jakauman N(106, 6.8422 ) vasemmassa reunassa oleva reaalilukuväli, jonka
71
todennäköisyys on 0.01. Lasketaan kriittisen alueen yläraja c, jolla P (X ≤ c) = 0.01
c − 106
P (X ≤ c) = 0.01 ⇔ P Z <
= 0.01
6.842
c − 106
⇔ Φ
= Φ(−2.33)
6.842
⇔ c = −2.33 · 6.842 + 106 = 91.5
Nyt kriittinen alue on väli [0, 91.5] ja otoksesta laskettu arvo 89.3 osuu tälle välille. Näin
ollen nollahypoteesi hylätään ja sademäärä on siis todennäköisesti pienentynyt.
Tässä tapauksessa voitaisiin laskea myös tarkka todennäköisyys
89.3 − 106
= Φ(−2.441) = 1 − Φ(2.441) = 1 − 0.9927 = 0.0073
P (X < 89.3) = P Z <
6.842
Tämä luku on testin p-arvo. Nollahypoteesi siis hylätään, jos p-arvo on pienempi kuin valittu
merkitsevyystaso, esim. 0.01. Monet ohjelmistot antavat tilastollisten testien yhteydessä juuri
p-arvon.
3.11
χ2 -jakauma ja otosvarianssi
Määritellään ensin ns. χ2 -jakauma.
Oletetaan, että Zi ∼ N(0, 1), i = 1, 2, . . . , n ovat riippumattomia. Näiden satunnaismuuttujien neliösumma
W =
n
X
Zi2 = Z12 + Z22 + · · · + Zn2 ∼ χ2 (n)
i=1
noudattaa χ2 -jakaumaa vapausastein n (χ2 distribution with n degrees of freedom).
χ2 (n)-jakautuneen satunnaismuuttujan tiheysfunktio on
f (w) =
1
2n/2 Γ(n/2)
missä Γ on Eulerin gammafunktio Γ(t) =
wn/2−1 e−w/2 ,
R∞
0
e−x xt−1 dx.
72
kun w ≥ 0
χ2 (3)
χ2 (6)
0.2
0.1
0.1
0
3
6
9 12
3
6
9 12
Laskuja varten satunnaismuuttujan W ∼ χ2 (n) kertymäfunktion Fχ2 (n) (w) = P (W ≤ w) ja
sen käänteisfunktion arvoja on taulukoitu (monisteen lopussa) eri vapausasteen arvoilla. Myös
monissa ohjelmissa on valmiita funktioita arvojen laskemiseen.
Esimerkki 3.11.1. Olkoon W ∼ χ2 (14). Määrätään arvot w1 ja w2 siten, että
P (W ≤ w1 ) = 0.1 ja P (W ≥ w2 ) = 0.1:
P (W ≤ w1 ) = 0.1
⇒
w1 = 7.790
P (W ≥ w2 ) = 0.1
⇔
P (W ≤ w2 ) = 0.9
⇒
w2 = 21.064
Lause 3.11.1. Satunnaismuuttujan W ∼ χ2 (n) odotusarvo ja varianssi ovat
E(W ) = n
Var(W ) = 2n
ja
Todistus. Harjoitustehtävänä.
Tutkitaan sitten otosvarianssia ja sen jakaumaa.
Lause 3.11.2. Olkoon X1 , X2 , . . . , Xn otos satunnaismuuttujasta X. X:n otosvarianssi
n
1 X
S =
(Xi − X)2
n − 1 i=1
2
on X:n varianssin σ 2 harhaton estimaattori,
E(S 2 ) = Var(X) = σ 2
73
Todistus.
n
2
E(S ) = E
=E
1 X
(Xi − X)2
n − 1 i=1
1
n−1
1
=
E
n−1
1
=
n−1
n
2
1 X
=E
(Xi − µ) − (X − µ)
n − 1 i=1
!
n
X
2
2
(Xi − µ) − 2(Xi − µ)(X − µ) + (X − µ)
i=1
n
X
n
X
2
(Xi − µ) − 2(X − µ)
i=1
n
X
1
=
E
n−1
1
=
E
n−1
!
i=1
n
X
(Xi − µ) +
i=1
n
X
!
!
(X − µ)
2
i=1
!
2
2
(Xi − µ) − 2(X − µ)(nX − nµ) + n(X − µ)
!
2
2
(Xi − µ) − n(X − µ)
i=1
n
X
2
E (Xi − µ)
2
− nE (X − µ)
!
i=1


n
1 X

=
Var(X ) −n Var(X)

| {z i}
| {z }
n−1
i=1
=
σ2
σ 2 /n
1
(nσ 2 − σ 2 ) = σ 2
n−1
Tässä lauseessa on syy siihen, miksi otosvarianssin määritelmässä on n − 1 eikä n.
Otosvarianssin odotusarvo on siis sama kuin varianssi. Oletetaan jatkossa, että X1 , X2 , . . . , Xn
on otos muuttujasta X ∼ N(µ, σ 2 ). Otosvarianssin S 2 jakauman sijaan tutkitaan otossuureen
n
(n − 1)S 2
1 X
=
(Xi − X)2
σ2
σ 2 i=1
jakaumaa. Todetaan ensin tulos, jonka mukaan kahden χ2 − jakautuneen satunnaismuuttujan
summa on myös χ2 −jakautunut.
Lause 3.11.3. Jos satunnaismuuttujat W1 ja W2 ovat riippumattomia ja
W1 =
n
X
Zi2
2
∼ χ (n) ja W2 =
i=1
m
X
Ui2 ∼ χ2 (m)
i=1
niin muuttujat Z1 , . . . , Zn , U1 , . . . , Um ovat riippumattomia ja siten
W1 + W2 ∼ χ2 (n + m)
74
Todistus. Sivuutetaan.
Lause 3.11.4. Jos X1 , X2 , . . . , Xn on otos muuttujasta X ∼ N(µ, σ 2 ), niin
a) X ja S 2 ovat riippumattomia
b)
(n − 1)S 2
∼ χ2 (n − 1)
2
σ
Todistus. (i) Sivuutetaan
(ii) Täsmällinen todistus sivuutetaan, mutta idea on seuraava.
2 2
n (n − 1)S 2 X Xi − µ
X −µ
√
−
=
σ2
σ
σ/
n
i=1
2
2
n X
Xi − µ
(n − 1)S 2
X −µ
√
=
+
2
σ
σ
σ/
n
| {z }
|i=1
{z
}
2
⇔
∼χ (1)
∼χ2 (n)
Tässä oikealla puolella on a):n nojalla kahden riippumattoman satunnaismuuttujan summa.
Summa on χ2 (n)-jakautunut ja summan jälkimmäinen termi on χ2 (1)-jakautunut. Lauseen
3.10.3 perusteella kahden riippumattoman χ2 -jakautuneen muuttujan summa on χ2 -jakautunut
satunnaismuuttuja, ja myös vapausasteet toteuttavat yhtälön. Täten on ilmeistä, että
(n − 1)S 2 /σ 2 on χ2 -jakautunut ja sen vapausasteet ovat n − 1.
Esimerkki 3.11.2. Oletetaan, että mittaustulos X on normaalijakaumasta X ∼ N(µ, σ 2 ).
Aikaisempien tulosten perusteella varianssiksi on arvioitu σ 2 = 1100. Nyt halutaan tietää,
onko varianssi pysynyt ennallaan ja suoritetaan 11 mittausta ja saadaan mittaustulokset 453,
460, 351, 421, 339, 439, 402, 422, 470, 310 ja 416.
Nyt nollahypoteesi H0 : σ 2 = 1100. Tämän otoksen otoskeskiarvo x = 407.5 ja otosvarianssi
s2 = 2761.1. Tämän perusteella näyttäisi siltä, että jos varianssi on muuttunut, se on kasvanut.
Varianssin pieneneminen on tavallisesti parempaan suuntaan tapahtuva muutos, sillä tällöin
mittausten vaihtelu pienenee. Siksi jos epäilynä on juuri varianssin suureneminen, valitaan
vaihtoehtoinen hypoteesiksi H1 : σ 2 > 1100. Valitaan merkitsevyystasoksi α = 0.01.
Tähän tilanteeseen sopiva testisuure ja sen jakauma on
(n − 1)s2
∼ χ2 (n − 1) = χ2 (10)
σ2
75
Kriittinen alue on jakauman oikeassa reunassa. χ2 − taulukosta (n = 10) saadaan tulos
P (W > 23.2) = 0.01, joten kriittinen alue on väli [23.2, ∞). Otoksesta laskettu otossuure saa
arvon
(n − 1)s2
10 · 2761.1
= 25.1
=
2
σ
1100
joka osuu kriittiselle alueelle. Nollahypoteesi hylätään ja päätös on, että todellinen varianssi
on todennäköisesti suurempi kuin 1100.
3.12
t- ja F-jakaumat
Määritellään aluksi ns. t-jakauma (Studentin t-jakauma).
Olkoon Z ∼ N(0, 1) ja W ∼ χ2 (n) riippumattomia. Satunnaismuuttujan
Z
T =p
W/n
jakauma on t-jakauma vapausastein n (t-distribution with n degrees of freedom),
merkitään T ∼ t(n).
t-jakauman tiheysfunktio on
−(n+1)/2
t2
1+
n
R∞
missä Γ on Eulerin gammafunktio Γ(t) = 0 e−x xt−1 dx.
1 Γ((n + 1)/2)
f (t) = √
nπ Γ(n/2)
(−∞ < t < ∞)
Satunnaismuuttujan T tiheysfunktio on yksihuippuinen ja symmetrinen arvon 0 suhteen. Se
muistuttaa normaalijakaumaa N(0,1) ja voidaan osoittaa, että t-jakauma lähenee jakaumaa
N(0, 1), kun n → ∞.
Taulukoista monisteen lopussa tai valmisohjelmista löydät satunnaismuuttujan t ∼ t(n) kertymäfunktion FT (n) (t) = P (T ≤ t) ja sen käänteisfunktion arvoja. Taulukosta ei löydy negatiivisia t:n arvoja. Nämä voidaan selvittää symmetrian nojalla: Ft(n) (−t) = 1 − Ft(n) (t)
Esimerkki 3.12.1. Olkoon T ∼ t(18). Määrätään arvot t1 ja t2 siten, että P (|T | ≤ t1 ) = 0.9
ja P (T ≤ t2 ) = 0.01:
P (|T | ≤ t1 ) = 0.9
⇔
P (T ≤ t1 ) = 0.95
P (T ≤ t2 ) = 0.01
⇔
P (T ≤ −t2 ) = 0.99
76
⇒
⇒
t1 = 1.734
−t2 = 2.552
⇒
t2 = −2.552
t−jakaumaa tarvitaan normaalijakautuneeksi oletetun satunnaismuuttujan odotusarvon estimoinnissa, kun varianssi on tuntematon, seuraavan lauseen mukaan.
Lause 3.12.1. Jos X1 , X2 , . . . , Xn on otos muuttujasta X ∼ N(µ, σ 2 ), niin
T =
X −µ
√ ∼ t(n − 1)
S/ n
Todistus.
U
X −µ
(n − 1)S 2
√ ∼ N(0, 1) ja W =
, missä U =
Nyt T = p
∼ χ2 (n − 1)
σ2
σ/ n
W/(n − 1)
Lause 3.10.4:n nojalla U ja W ovat riippumattomia.
Esimerkki 3.12.2. Tehtaan ilmoituksen mukaan venttilivarren halkaisija noudattaa normaalijakaumaa ja on keskimäärin 8.040 mm. Varaosia valmistava yritys ottaa tuotantoerästään
40 kappaleen otoksen tutkiakseen, onko tuotantoerän laatu yhtä hyvä kuin alkuperäisillä.
Otoskeskiarvoksi saatiin x =8.038 mm ja otoskeskihajonnaksi s = 0.006 mm.
Nollahypoteesi on H0 : µ = 8.040. Koska halutaan selvittää, onko halkaisija muuttunut,
valitaan vaihtoehtoinen hypoteesiksi H1 : µ 6= 8.040. Valitaan merkitsevyystasoksi 0.05.
Varianssi on tuntematon, joten käytetään otossuuretta
t=
X −µ
√ ∼ t(n − 1) = t(39)
S/ n
Kriittinen alue koostuu kahdesta osasta, koska vaihtoehtoinen hypoteesi on muotoa
H1 : µ 6= 8.040. Taulukosta (n = 40 kohdalta) saadaan tulos P (t > 2.021) = 0.025, joten
t-jakauman symmetrisyyden perusteella kriittinen alue on välit (−∞, −2.021] ja [2.021, ∞)
Testisuureen arvoksi saadaan tässä otoksessa saadaan
8.038 − 8.040
√
t=
= −2.108
0.006/ 40
joka osuu kriittiselle alueelle. Tässä tapauksessa nollahypoteesi hylätään ja venttiilivarren
halkaisija on muuttunut.
Jos merkitsevyystasoksi valittaisiin α = 0.01, kriittinen alue olisi välit (−∞, −2.704] ja
[2.704, ∞). Tällöin testisuureen arvo −2.108 ei kuuluisi kriittiselle alueelle ja nollahypoteesi
jäisikin voimaan.
Kahden χ2 −jakautuneen satunnaismuuttujan osamäärän avulla saadaan uusi jakauma ns.
F -jakauma, josta käytetään myös nimityksiä Fisherin jakauma ja Snedecorin jakauma.
77
Olkoot satunnaismuuttujat W1 ∼ χ2 (n1 ) ja W2 ∼ χ2 (n2 ) riippumattomia. Satunnaismuuttuja
W1 /n1
F =
W2 /n2
on F -jakautunut vapausastein n1 , n2 , (F -distributed with n1 , n2 degrees of freedom)
merkitään F ∼ F (n1 , n2 ).
F-jakautuneen satunnaismuuttujan tiheysfunktio on
n1
− n1 +n
2
2
2
Γ n1 +n
n1
n1 2 n1 −2
2
1+ x
f (x) =
x 2
, kun x > 0
n2
Γ n21 Γ( n22 ) n2
R∞
ja f (x) = 0, kun x ≤ 0. Γ on Eulerin gammafunktio Γ(t) = 0 e−x xt−1 dx.
Taulukoista monisteen lopussa tai valmisohjelmista löydät muuttujan F ∼ F (n1 , n2 ) kertymäfunktion FF (n1 ,n2 ) (x) = P (F ≤ x) ja sen käänteisfunktion arvoja.
Esimerkki 3.12.3. Olkoon F ∼ F (10, 15). Tutkitaan mitä on x, kun P (F ≤ x) = 0.95 ja
P (F ≥ x) = 0.01:
P (F ≤ x) = 0.95
⇒
x = 2.54
P (F ≥ x) = 0.01
⇔
P (F ≤ x) = 0.99
Koska
F ∼ F (n1 , n2 )
⇒
x = 3.80
1
∼ F (n2 , n1 )
F
⇒
siitä seuraa
P (F ≤ x) = α
⇔
P
1
1
≥
F
x
=α
⇔
P
1
1
≤
F
x
=1−α
Tämän nojalla taulukoilla voit laskea myös x:n arvoja, jotka liittyvät todennäköisyyksiin
P (F ≤ x) = 0.05,
P (F ≤ x) = 0.025 ja P (F ≤ x) = 0.01
Esimerkki 3.12.4. Jos F ∼ F (4, 3), niin
1
1
≤
= 0.99
P (F ≤ x) = 0.01 ⇔ P
F
x
1
F
∼F (3,4)
⇔
1 taul.
= 16.69
x
⇔
x = 0.06
F-jakaumaa käytetään normaalijakautuneiksi oletettujen satunnaismuuttujien varianssien yhtäsuuruuden testaamiseen seuraavan tuloksen perusteella.
78
Lause 3.12.2. Olkoon
2
X1 , X2 , . . . , XnX otos satunnaismuuttujasta X ∼ N(µX , σX
) ja
Y1 , Y2 , . . . , YnY otos satunnaismuuttujasta Y ∼ N(µY , σY2 )
2
ja olkoot otokset riippumattomia. Jos SX
ja SY2 ovat X:n ja Y :n otosvarianssit, niin
otossuure
S 2 /σ 2
F = X2 X
∼ F (nX − 1, nY − 1)
SY /σY2
2
Todistus. Koska otokset ovat riippumattomia, ovat SX
ja SY2 riippumattomia. Lause 3.10.4:n
2
2
mukaan (nX − 1)SX
/σX
∼ χ2 (nX − 1) ja (nY − 1)SY2 /σY2 ∼ χ2 (nY − 1), joten
2 /σ 2
(nX −1)SX
X
nX −1
2
(nY −1)SY2 /σY
nY −1
=
2
2
SX
/σX
∼ F (nX − 1, nY − 1)
SY2 /σY2
Esimerkki 3.12.5. Kurssin A tenttiin osallistui 51 opiskelijaa ja tulosten varianssi s2A = 478
ja toiseen rinnakkaisen kurssin B tenttiin osallistui 26 opiskelijaa varianssin ollessa s2B = 372.
Voidaanko näissä otosvariansseissa havaittu ero tulkita todisteeksi siitä, että pistemäärien
varianssit näillä rinnakkaisilla kursseilla ovat erisuuret. Pistemäärien jakaumat oletetaan normaaleiksi.
6 σB2 . Valitaan
Nollahypoteesi on H0 : σA2 = σB2 ja vaihtoehtoinen hypoteesi H1 : σA2 =
merkitsevyystasoksi α = 0.05. Testisuureeksi valitaan F −testisuure, joka nollahypoteesin
ollessa tosi, eli kun σA2 = σB2 sievenee muotoon
SA2 /σA2
SA2
F = 2 2 = 2 ∼ F (50, 25)
SB /σB
SB
Kriittinen alue koostuu kahdesta välistä, joiden kummankin todennäköisyys on 0.05/2 =
0.025. Taulukosta saadaan tulos P (F ≤ 2.08) = 0.975, joten P (F > 2.08) = 0.025. Kriittisen
alueen toinen osa on väli [2.08, ∞).
Toisen osan yläraja on luku c, jolle P (F ≤ c) = 0.025. Jos F ∼ F (50, 25), niin
1
∼F (25,50) 1 taul.
1
1
P (F ≤ c) = 0.025 ⇔ P
≤
= 0.975 F ⇔
= 1.92
⇔
F
c
c
c = 0.52
Kriittinen alue on siis välit [0, 0, 52] ja [2.08, ∞). Testisuureen arvo on F = 478/372 = 1.28 ja
arvo ei osu kriittiselle alueelle. Kurssien tulosten variansseja voidaan siis pitää yhtäsuurina.
79
Liite 1. Todennäköisyysjakaumia
Kurssilla esillä olleita todennäköisyysjakaumia. Jakaumista esitellään perustietoina tiheysfunktio, odotusarvo ja varianssi, momentit generoiva funktio, esimerkkikuvaajia ja lisätietoja.
Diskreettejä todennäköisyysjakaumia
1.
2.
3.
4.
5.
6.
Diskreetti tasajakauma
Bernoullijakauma
Binomijakauma
Geometrinen jakauma
Poisson jakauma
Hypergeometrinen jakauma
Jatkuvia todennäköisyysjakaumia
7. Jatkuva tasajakauma
8. Eksponenttijakauma
9. Normaalijakauma
10. χ2 -jakauma
11. t-jakauma
12. F-jakauma
Liite 2. Jakaumataulukoita
Normaalijakauman N(0,1) kertymäfunktion arvoja taulukoituna
χ2 -jakauman kriittisiä pisteitä
t-jakauman kriittisiä pisteitä
F-jakauman kriittisiä pisteitä
80
1. Diskreetti tasajakauma, Tasd(a,b)
Tiheysfunktio
f (x) =
1
, x = a, a + 1, a + 2, . . . , b
b−a+1
Odotusarvo ja varianssi
E(X) =
a+b
(b − a + 1)2 − 1
, Var(X) =
2
12
Lisätietoja
· Englanniksi: Discrete uniform distribution, Unifd(a,b)
· Klassisen todennäköisyyden peruslähtökohta: symmetristen alkeistapausten todennäköisyydet noudattavat diskreettiä tasajakaumaa.
· Nopanheiton tulos, rahanheiton tulos.
· Tasd(0,1)=Ber(0.5).
Tiheysfunktion kuvaaja
Tasd(2,7)
0.17
2 3 4 5 6 7
81
2. Bernoullijakauma, Ber(p)
Tiheysfunktio
f (x) = px (1 − p)1−x , x = 0, 1
Odotusarvo ja varianssi
E(X) = p, Var(X) = p(1 − p)
Momentit generoiva funktio
M (t) = pet + 1 − p
Lisätietoja
· Englanniksi: Bernoulli distribution
· Satunnaismuuttujalla vain kaksi mahdollisuutta (koodattu 0 ja 1). Tapauksen X = 1
todennäköisyys = p. Riippumatta satunnaismuuttujasta tapaus X = 1 on nimetty usein
onnistumiseksi (success) ja tapaus X = 0 on epäonnistuminen (failure). Esim. syntyvän lapsen
sukupuoli (0=tyttö, 1=poika), tentissä onnistuminen.
· Bernoullikokeella tarkoitetaan juuri bernoullijakaumaa noudattavan satunnaismuuttujan
koetta. Kokeiden tulosten oletetaan olevan riippumattomia.
· Tasd(0,1) = Ber(0.5), Ber(p) = Bin(1,p).
Tiheysfunktion kuvaaja
Ber(0.3)
0.7
0.3
0
1
82
3. Binomijakauma, Bin(n,p)
Tiheysfunktio
n x
f (x) =
p (1 − p)n−x , x = 0, 1, 2, . . . , n
x
Odotusarvo ja varianssi
E(X) = np, Var(X) = np(1 − p)
Momentit generoiva funktio
M (t) = (pet + 1 − p)n
Lisätietoja
· Englanniksi: Binomial distribution
· Onnistumisten (todennäköisyys = p) lukumäärä n:ssä bernoullikokeessa esim. kuinka monta
klaavaa 5:ssä rahanheitossa.
· Jos X1 ∼ Bin(n, p) ja X2 ∼ Bin(m, p) ovat riippumattomia, niin X1 + X2 ∼ Bin(n + m, p).
· Ber(p) = Bin(1, p).
· Bin(n, p) ≈ Poi(np), kun n on suuri, p on pieni ja np << n .
· Bin(n, p) ≈ N(np, np(1 − p)), kun np ≥ 5 ja n(1 − p) ≥ 5.
Tiheysfunktion kuvaajia
Bin(5,0.3)
Bin(7,0.8)
0.3
0.2
0.1
0
0.3
0.2
0.1
0
1 2 3 4 5
83
1 2 3 4 5 6 7
4. Geometrinen jakauma, Geom(p)
Tiheysfunktio
f (x) = p(1 − p)x−1 , x = 1, 2, . . .
Odotusarvo ja varianssi
1
1−p
E(X) = , Var(X) =
p
p2
Momentit generoiva funktio
M (t) =
pet
1 − (1 − p)et
Lisätietoja
· Englanniksi: geometric distribution
· f (x) on todennäköisyys, että ’onnistuminen’ toistetussa bernoullikokeessa tapahtuu x.:llä
kerralla, esimerkiksi millä todennäköisyydellä rahanheitossa saadaan ensimmäinen klaava viidennellä heitolla. Parametri p on ’onnistumisen’ todennäköisyys yksittäisessä kokeessa,
Tiheysfunktion kuvaaja
Geom(0.4)
0.4
0.2
0
4
8
84
5. Poisson jakauma, Poi(λ)
Tiheysfunktio
λx −λ
f (x) = e , x = 0, 1, 2, . . .
x!
Odotusarvo ja varianssi
E(X) = λ, Var(X) = λ
Momentit generoiva funktio
t
M (t) = e−λ eλe
Lisätietoja
· Englanniksi: Poisson distribution
· Harvinaisten tapahtumien todennäköisyysjakauma. Jos suoritetaan suuri määrä (n) bernoullikokeita, joissa onnistumisen todennäköisyys (p) on pieni, onnistumisten määrä noudattaa
likimain Poisson jakaumaa ja parametri λ ≈ np. Poissonin prosessin oletukset (luentomoniste kpl. 2.9) täyttävässä prosessissa onnistumisten lukumäärä noudattaa likimäärin Poissonin
jakaumaa.
· Jos X1 ∼ Poi(λ1 ) ja X2 ∼ Poi(λ2 ) ovat riippumattomia, niin X1 + X2 ∼ Poi(λ1 + λ2 ).
· Bin(n, p) ≈ Poi(np), kun n on suuri, p on pieni ja np << n.
Tiheysfunktion kuvaaja
Poi(3)
0.2
0.1
0
4
8
85
6. Hypergeometrinen jakauma, Hyperg(N,m,n)
Tiheysfunktio
f (x) =
m
x
N −m
n−x
N
n
, max{0, n − (N − m)} ≤ x ≤ min{n, m}, x ∈ Z
Odotusarvo ja varianssi
E(X) =
nm
nm(N − m)(N − n)
, Var(X) =
N
N3 − N
Lisätietoja
· Englanniksi: Hypergeometric distribution
· Joukossa on N alkiota, joista m:llä on ominaisuus A ja lopuilla ei ole. Poimitaan palauttamatta n alkion otos. Kun x=’niiden alkioiden lukumäärä otoksessa, joilla on ominaisuus A’,
niin X ∼ Hyperg(N, m, n).
· Kun otoskoko n on pieni verrattuna kaikkien alkioiden lukumäärään N, palauttamatta suoritettu otanta ≈ palauttaen suoritettu otanta. Siksi hypergeometrista jakaumaa voidaan approksimoida binomijakaumalla:
· Hyperg(N, m, n) ≈ Bin(n, m/N ), kun n ≤ N/10.
Tiheysfunktion kuvaajia
Hyperg(10,4,4)
Hyperg(12,9,6)
0.4
0.4
0.2
0.2
0
1 2 3 4
86
1 2 3 4 5 6
7. Jatkuva tasajakauma, Tas(a,b)
Tiheysfunktio
f (x) =
1
, a≤x≤b
b−a
Odotusarvo ja varianssi
E(X) =
a+b
(b − a)2
, Var(X) =
2
12
Momentit generoiva funktio
(
M (t) =
ebt −eat
t(b−a)
1
kun t 6= 0
kun t = 0
Lisätietoja
· Englanniksi: (continuous) uniform distribution Unif(a,b) tai U(a,b)
· Monissa tietokoneohjelmissa satunnaisluvun (random number) käsite on luku
X ∼ Tas(0, 1). Muiden jatkuvien satunnaislukujen generoinnin perusta algoritmeissa.
Tiheysfunktion kuvaaja
Tas(2,7)
0.2
0
1 2 3 4 5 6 7
87
8.Eksponenttijakauma , Exp(λ)
Tiheysfunktio
f (x) = λe−λx , x ≥ 0, λ > 0
Odotusarvo ja varianssi
E(X) =
1
1
, Var(X) = 2
λ
λ
Momentit generoiva funktio
M (t) =
λ
, t<λ
λ−t
Lisätietoja
· Englanniksi: Exponential distribution
· Eksponenttijakaumaa noudattavalla satunnaismuuttujalla on ’unohtuvaisuusominaisuus’
P (X > x1 + x2 | X > x1 ) = P (X > x2 )
· Elektronisen komponentin ikä
Tiheysfunktion kuvaajia
Exp(0.5)
Exp(1)
0.4
0.8
0.2
0.4
0
3
6
0
9 12
88
3
6
9 12
9. Normaalijakauma, N(µ, σ 2 )
Tiheysfunktio
1 x−µ 2
1
f (x) = √ e− 2 ( σ ) , x ∈ R, µ ∈ R, σ > 0
σ 2π
Odotusarvo ja varianssi
E(X) = µ, Var(X) = σ 2
Momentit generoiva funktio
2 σ 2 /2
M (t) = eµt+t
Lisätietoja
· Englanniksi: normal distribution, Gaussian distribution, Norm(µ, σ 2 )
· Jos X ∼ N (µ, σ 2 ), niin aX + b ∼ N (aµ + b, a2 σ 2 ), a, b ∈ R
· Jos X1 ∼ N (µ1 , σ12 ) ja X2 ∼ N (µ2 , σ22 ), niin X1 + X2 ∼ N (µ1 + µ2 , σ12 + σ22 ).
· Keskeisen raja-arvolauseen perusteella usean satunnaismuuttujan summa ja siis myös otoskeskiarvo on likimain normaalisti jakautunut riippumatta alkuperäisten satunnaismuuttujien
jakaumista.
· Bin(n, p) ≈ N(np, np(1 − p)), kun np ≥ 5 ja n(1 − p) ≥ 5.
Tiheysfunktion kuvaajia
Norm(0,1)
Norm(2,9)
0.4
0.1
0.2
–3 –2 –1
–7 –4 –1 2 5 8 11
1 2 3
89
10. χ2 -jakauma, χ2 (n)
Tiheysfunktio
f (x) =
1
x(n/2)−1 e−x/2 , x > 0, n ∈ Z+
2n/2 Γ(n/2)
missä Γ on Eulerin gammafunktio
Z
Γ(t) =
∞
e−x xt−1 dx
0
Odotusarvo ja varianssi
E(X) = n, Var(X) = 2n
Lisätietoja
· Englanniksi: chi-square distribution, χ2 (df )
· Nimitys: muuttuja on χ2 -jakautunut vapausastein n (degrees on freedom, df). Kirjain χ
lausutaan ’khii’.
· Jos X1 , X2 , . . . , Xn ovat riippumattomia ja Xi ∼ N (µ, σ 2 ), niin
(n − 1)s2
∼ χ2 (n − 1)
2
σ
P
· Jos Zi ∼ N (0, 1) ja ovat riippumattomia, niin ni=1 Zi2 ∼ χ2 (n)
χ2(3)
χ2(6)
0.2
0.1
0.1
0
3
6
9 12
3
90
6
9 12
11. (Studentin) t-jakauma, t(n)
Tiheysfunktio
1 Γ((n + 1)/2)
f (x) = √
nπ Γ(n/2)
x2
1+
n
−(n+1)/2
, x ∈ R, n ∈ Z+
missä Γ on Eulerin gammafunktio
Z
∞
e−x xt−1 dx
Γ(t) =
0
Odotusarvo ja varianssi
E(X) = 0, n > 1, Var(X) =
n
, n>2
n−2
Lisätietoja
· Englanniksi: (Student’s) t-distribution, t(df)
· Nimitys: muuttuja on t-jakautunut vapausastein n (degrees on freedom, df).
· t-jakauma lähestyy N(0,1)-jakaumaa, kun n → ∞
· Jos X1 , X2 , . . . , Xn on otos muuttujasta X ∼ N (µ, σ 2 ), niin
X −µ
√ ∼ t(n − 1)
s/ n
Tiheysfunktion kuvaajia
t(2)
t(30)
0.4
0.35
–6
–3
3
–6
6
91
–3
3
6
12. F-jakauma, F(n1 ,n2 ), Fisherin jakauma, Snedecorin jakauma
Tiheysfunktio
f (x) =



n1 +n2
2
n1
n
Γ( 22 )
2
Γ(
Γ(
)
n21
n1
n2
)
x
n1 −2
2
1+
n1
x
n2
− n1 +n
2
2
kun x > 0
kun x ≤ 0
0
missä Γ on Eulerin gammafunktio
Z
Γ(t) =
∞
e−x xt−1 dx
0
Odotusarvo ja varianssi
E(X) =
n2
2n22 (n1 + n2 − 2)
, n2 > 2, Var(X) =
, n2 > 4
n2 − 2
n1 (n2 − 2)2 (n2 − 4)
Lisätietoja
· Englanniksi: F-distribution
· Nimitys: muuttuja on F-jakautunut vapausastein n1 ja n2 (degrees on freedom, df).
· Jos X1 ∼ χ2 (n1 ) ja X2 ∼ χ2 (n2 ), niin
F =
X1 /n1
∼ F (n1 , n2 )
X2 /n2
Tällöin 1/F ∼ F (n2 , n1 )
Tiheysfunktion kuvaajia
F(6,6)
F(2,6)
0.6
0.6
0.3
0.3
3
6
3
9
92
6
9
Normaalijakauman N(0,1) kertymäfunktion arvoja Φ ( x ) = P(Z < x)
x
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
3.1
3.2
3.3
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.5000
0.5398
0.5793
0.6179
0.6554
0.6915
0.7257
0.7580
0.7881
0.8159
0.8413
0.8643
0.8849
0.9032
0.9192
0.9332
0.9452
0.9554
0.9641
0.9713
0.9772
0.9821
0.9861
0.9893
0.9918
0.9938
0.9953
0.9965
0.9974
0.9981
0.9987
0.9990
0.9993
0.9995
0.5040
0.5438
0.5832
0.6217
0.6591
0.6950
0.7291
0.7611
0.7910
0.8186
0.8438
0.8665
0.8869
0.9049
0.9207
0.9345
0.9463
0.9564
0.9649
0.9719
0.9778
0.9826
0.9864
0.9896
0.9920
0.9940
0.9955
0.9966
0.9975
0.9982
0.9987
0.9991
0.9993
0.9995
0.5080
0.5478
0.5871
0.6255
0.6628
0.6985
0.7324
0.7642
0.7939
0.8212
0.8461
0.8686
0.8888
0.9066
0.9222
0.9357
0.9474
0.9573
0.9656
0.9726
0.9783
0.9830
0.9868
0.9898
0.9922
0.9941
0.9956
0.9967
0.9976
0.9982
0.9987
0.9991
0.9994
0.9995
0.5120
0.5517
0.5910
0.6293
0.6664
0.7019
0.7357
0.7673
0.7967
0.8238
0.8485
0.8708
0.8907
0.9082
0.9236
0.9370
0.9484
0.9582
0.9664
0.9732
0.9788
0.9834
0.9871
0.9901
0.9925
0.9943
0.9957
0.9968
0.9977
0.9983
0.9988
0.9991
0.9994
0.9996
0.5160
0.5557
0.5948
0.6331
0.6700
0.7054
0.7389
0.7704
0.7995
0.8264
0.8508
0.8729
0.8925
0.9099
0.9251
0.9382
0.9495
0.9591
0.9671
0.9738
0.9793
0.9838
0.9875
0.9904
0.9927
0.9945
0.9959
0.9969
0.9977
0.9984
0.9988
0.9992
0.9994
0.9996
0.5199
0.5596
0.5987
0.6368
0.6736
0.7088
0.7422
0.7734
0.8023
0.8289
0.8531
0.8749
0.8944
0.9115
0.9265
0.9394
0.9505
0.9599
0.9678
0.9744
0.9798
0.9842
0.9878
0.9906
0.9929
0.9946
0.9960
0.9970
0.9978
0.9984
0.9989
0.9992
0.9994
0.9996
0.5239
0.5636
0.6026
0.6406
0.6772
0.7123
0.7454
0.7764
0.8051
0.8315
0.8554
0.8770
0.8962
0.9131
0.9279
0.9406
0.9515
0.9608
0.9686
0.9750
0.9803
0.9846
0.9881
0.9909
0.9931
0.9948
0.9961
0.9971
0.9979
0.9985
0.9989
0.9992
0.9994
0.9996
0.5279
0.5675
0.6064
0.6443
0.6808
0.7157
0.7486
0.7794
0.8078
0.8340
0.8577
0.8790
0.8980
0.9147
0.9292
0.9418
0.9525
0.9616
0.9693
0.9756
0.9808
0.9850
0.9884
0.9911
0.9932
0.9949
0.9962
0.9972
0.9979
0.9985
0.9989
0.9992
0.9995
0.9996
0.5319
0.5714
0.6103
0.6480
0.6844
0.7190
0.7517
0.7823
0.8106
0.8365
0.8599
0.8810
0.8997
0.9162
0.9306
0.9429
0.9535
0.9625
0.9699
0.9761
0.9812
0.9854
0.9887
0.9913
0.9934
0.9951
0.9963
0.9973
0.9980
0.9986
0.9990
0.9993
0.9995
0.9996
0.5359
0.5753
0.6141
0.6517
0.6879
0.7224
0.7549
0.7852
0.8133
0.8389
0.8621
0.8830
0.9015
0.9177
0.9319
0.9441
0.9545
0.9633
0.9706
0.9767
0.9817
0.9857
0.9890
0.9916
0.9936
0.9952
0.9964
0.9974
0.9981
0.9986
0.9990
0.9993
0.9995
0.9997
93
χ2-jakauman χ2(n) kriittisiä pisteitä c: F(c) = P(w < c) = 1 - α
α
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
0.995
0.99
0.975
0.95
0.000
0.010
0.072
0.207
0.412
0.676
0.989
1.344
1.735
2.156
2.603
3.074
3.565
4.075
4.601
5.142
5.697
6.265
6.844
7.434
8.034
8.643
9.260
9.886
10.520
11.160
11.808
12.461
13.121
13.787
20.707
27.991
35.534
43.275
51.172
59.196
0.000
0.020
0.115
0.297
0.554
0.872
1.239
1.646
2.088
2.558
3.053
3.571
4.107
4.660
5.229
5.812
6.408
7.015
7.633
8.260
8.897
9.542
10.196
10.856
11.524
12.198
12.879
13.565
14.256
14.953
22.164
29.707
37.485
45.442
53.540
61.754
0.001
0.051
0.216
0.484
0.831
1.237
1.690
2.180
2.700
3.247
3.816
4.404
5.009
5.629
6.262
6.908
7.564
8.231
8.907
9.591
10.283
10.982
11.689
12.401
13.120
13.844
14.573
15.308
16.047
16.791
24.433
32.357
40.482
48.758
57.153
65.647
0.004
0.103
0.352
0.711
1.145
1.635
2.167
2.733
3.325
3.940
4.575
5.226
5.892
6.571
7.261
7.962
8.672
9.390
10.117
10.851
11.591
12.338
13.091
13.848
14.611
15.379
16.151
16.928
17.708
18.493
26.509
34.764
43.188
51.739
60.391
69.126
0.9
0.1
0.05
0.025
0.01
0.005
0.016
2.706
3.841
5.024
6.635
7.879
0.211
4.605
5.991
7.378
9.210
10.597
0.584
6.251
7.815
9.348
11.345 12.838
1.064
7.779
9.488
11.143 13.277 14.860
1.610
9.236
11.070 12.833 15.086 16.750
2.204 10.645 12.592 14.449 16.812 18.548
2.833 12.017 14.067 16.013 18.475 20.278
3.490 13.362 15.507 17.535 20.090 21.955
4.168 14.684 16.919 19.023 21.666 23.589
4.865 15.987 18.307 20.483 23.209 25.188
5.578 17.275 19.675 21.920 24.725 26.757
6.304 18.549 21.026 23.337 26.217 28.300
7.042 19.812 22.362 24.736 27.688 29.819
7.790 21.064 23.685 26.119 29.141 31.319
8.547 22.307 24.996 27.488 30.578 32.801
9.312 23.542 26.296 28.845 32.000 34.267
10.085 24.769 27.587 30.191 33.409 35.718
10.865 25.989 28.869 31.526 34.805 37.156
11.651 27.204 30.144 32.852 36.191 38.582
12.443 28.412 31.410 34.170 37.566 39.997
13.240 29.615 32.671 35.479 38.932 41.401
14.041 30.813 33.924 36.781 40.289 42.796
14.848 32.007 35.172 38.076 41.638 44.181
15.659 33.196 36.415 39.364 42.980 45.559
16.473 34.382 37.652 40.646 44.314 46.928
17.292 35.563 38.885 41.923 45.642 48.290
18.114 36.741 40.113 43.195 46.963 49.645
18.939 37.916 41.337 44.461 48.278 50.993
19.768 39.087 42.557 45.722 49.588 52.336
20.599 40.256 43.773 46.979 50.892 53.672
29.051 51.805 55.758 59.342 63.691 66.766
37.689 63.167 67.505 71.420 76.154 79.490
46.459 74.397 79.082 83.298 88.379 91.952
55.329 85.527 90.531 95.023 100.425 104.215
64.278 96.578 101.879 106.629 112.329 116.321
73.291 107.565 113.145 118.136 124.116 128.299
94
t - jakauman t(n) kriittisiä pisteitä c: F(c) = P(t < c) = 1 - α
α
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
80
120
∞
0.40
0.325
0.289
0.277
0.271
0.267
0.265
0.263
0.262
0.261
0.260
0.260
0.259
0.259
0.258
0.258
0.258
0.257
0.257
0.257
0.257
0.257
0.256
0.256
0.256
0.256
0.256
0.256
0.256
0.256
0.256
0.255
0.254
0.254
0.253
0.25
1.000
0.816
0.765
0.741
0.727
0.718
0.711
0.706
0.703
0.700
0.697
0.695
0.694
0.692
0.691
0.690
0.689
0.688
0.688
0.687
0.686
0.686
0.685
0.685
0.684
0.684
0.684
0.683
0.683
0.683
0.681
0.678
0.677
0.674
0.10
3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
1.363
1.356
1.350
1.345
1.341
1.337
1.333
1.330
1.328
1.325
1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.310
1.303
1.292
1.289
1.282
0.05
6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
1.812
1.796
1.782
1.771
1.761
1.753
1.746
1.740
1.734
1.729
1.725
1.721
1.717
1.714
1.711
1.708
1.706
1.703
1.701
1.699
1.697
1.684
1.664
1.658
1.645
95
0.025
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.021
1.990
1.980
1.960
0.01
31.821
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.583
2.567
2.552
2.539
2.528
2.518
2.508
2.500
2.492
2.485
2.479
2.473
2.467
2.462
2.457
2.423
2.374
2.358
2.326
0.005 0.0005
63.657 636.619
9.925 31.599
5.841 12.924
4.604
8.610
4.032
6.869
3.707
5.959
3.499
5.408
3.355
5.041
3.250
4.781
3.169
4.587
3.106
4.437
3.055
4.318
3.012
4.221
2.977
4.140
2.947
4.073
2.921
4.015
2.898
3.965
2.878
3.922
2.861
3.883
2.845
3.850
2.831
3.819
2.819
3.792
2.807
3.768
2.797
3.745
2.787
3.725
2.779
3.707
2.771
3.690
2.763
3.674
2.756
3.659
2.750
3.646
2.704
3.551
2.639
3.416
2.617
3.373
2.576
3.291
F-jakauman kriittisiä pisteitä c: P(F<c)=0.95, kun F~F(n1, n2)
n1
1
2
3
4
5
6
7
8
9
10
12
15
20
25
50
100
n2
1
2
3
4
5
6
7
8
9
10
12
15
20
25
50
100
161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88 243,91 245,95 248,01 249,26 251,77 253,04
18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,46 19,48 19,49
10,13
9,55
9,28
9,12
9,01
8,94
8,89
8,85
8,81
8,79
8,74
8,70
8,66
8,63
8,58
8,55
7,71
6,94
6,59
6,39
6,26
6,16
6,09
6,04
6,00
5,96
5,91
5,86
5,80
5,77
5,70
5,66
6,61
5,79
5,41
5,19
5,05
4,95
4,88
4,82
4,77
4,74
4,68
4,62
4,56
4,52
4,44
4,41
5,99
5,14
4,76
4,53
4,39
4,28
4,21
4,15
4,10
4,06
4,00
3,94
3,87
3,83
3,75
3,71
5,59
4,74
4,35
4,12
3,97
3,87
3,79
3,73
3,68
3,64
3,57
3,51
3,44
3,40
3,32
3,27
5,32
4,46
4,07
3,84
3,69
3,58
3,50
3,44
3,39
3,35
3,28
3,22
3,15
3,11
3,02
2,97
5,12
4,26
3,86
3,63
3,48
3,37
3,29
3,23
3,18
3,14
3,07
3,01
2,94
2,89
2,80
2,76
4,96
4,10
3,71
3,48
3,33
3,22
3,14
3,07
3,02
2,98
2,91
2,85
2,77
2,73
2,64
2,59
4,75
3,89
3,49
3,26
3,11
3,00
2,91
2,85
2,80
2,75
2,69
2,62
2,54
2,50
2,40
2,35
4,54
3,68
3,29
3,06
2,90
2,79
2,71
2,64
2,59
2,54
2,48
2,40
2,33
2,28
2,18
2,12
4,35
3,49
3,10
2,87
2,71
2,60
2,51
2,45
2,39
2,35
2,28
2,20
2,12
2,07
1,97
1,91
4,24
3,39
2,99
2,76
2,60
2,49
2,40
2,34
2,28
2,24
2,16
2,09
2,01
1,96
1,84
1,78
4,03
3,18
2,79
2,56
2,40
2,29
2,20
2,13
2,07
2,03
1,95
1,87
1,78
1,73
1,60
1,52
3,94
3,09
2,70
2,46
2,31
2,19
2,10
2,03
1,97
1,93
1,85
1,77
1,68
1,62
1,48
1,39
F-jakauman kriittisiä pisteitä c: P(F<c)=0.975, kun F~F(n1, n2)
n1
1
2
3
4
5
6
7
8
9
10
12
15
20
647,8
38,51
17,44
12,22
10,01
8,81
8,07
7,57
7,21
6,94
6,55
6,20
5,87
5,69
5,34
5,18
799,5
39,00
16,04
10,65
8,43
7,26
6,54
6,06
5,71
5,46
5,10
4,77
4,46
4,29
3,97
3,83
864,2
39,17
15,44
9,98
7,76
6,60
5,89
5,42
5,08
4,83
4,47
4,15
3,86
3,69
3,39
3,25
899,6
39,25
15,10
9,60
7,39
6,23
5,52
5,05
4,72
4,47
4,12
3,80
3,51
3,35
3,05
2,92
921,8
39,30
14,88
9,36
7,15
5,99
5,29
4,82
4,48
4,24
3,89
3,58
3,29
3,13
2,83
2,70
937,1
39,33
14,73
9,20
6,98
5,82
5,12
4,65
4,32
4,07
3,73
3,41
3,13
2,97
2,67
2,54
948,2
39,36
14,62
9,07
6,85
5,70
4,99
4,53
4,20
3,95
3,61
3,29
3,01
2,85
2,55
2,42
956,7
39,37
14,54
8,98
6,76
5,60
4,90
4,43
4,10
3,85
3,51
3,20
2,91
2,75
2,46
2,32
963,3
39,39
14,47
8,90
6,68
5,52
4,82
4,36
4,03
3,78
3,44
3,12
2,84
2,68
2,38
2,24
968,6
39,40
14,42
8,84
6,62
5,46
4,76
4,30
3,96
3,72
3,37
3,06
2,77
2,61
2,32
2,18
976,7
39,41
14,34
8,75
6,52
5,37
4,67
4,20
3,87
3,62
3,28
2,96
2,68
2,51
2,22
2,08
984,9
39,43
14,25
8,66
6,43
5,27
4,57
4,10
3,77
3,52
3,18
2,86
2,57
2,41
2,11
1,97
993,1
39,45
14,17
8,56
6,33
5,17
4,47
4,00
3,67
3,42
3,07
2,76
2,46
2,30
1,99
1,85
12
15
20
25
50
100
n2
1
2
3
4
5
6
7
8
9
10
12
15
20
25
50
100
998,1 1008,1 1013,2
39,46 39,48 39,49
14,12 14,01 13,96
8,50
8,38
8,32
6,27
6,14
6,08
5,11
4,98
4,92
4,40
4,28
4,21
3,94
3,81
3,74
3,60
3,47
3,40
3,35
3,22
3,15
3,01
2,87
2,80
2,69
2,55
2,47
2,40
2,25
2,17
2,23
2,08
2,00
1,92
1,75
1,66
1,77
1,59
1,48
F-jakauman kriittisiä pisteitä c: P(F<c)=0.99, kun F~F(n1, n2)
n1
1
2
3
4
5
6
7
8
9
10
25
50
100
n2
1
2
3
4
5
6
7
8
9
10
12
15
20
25
50
100
4052,2 4999,5 5403,4 5624,6 5763,6 5859,0 5928,4 5981,1 6022,5 6055,8 6106,3 6157,3 6208,7 6239,8 6302,5 6334,1
98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40 99,42 99,43 99,45 99,46 99,48 99,49
34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 27,05 26,87 26,69 26,58 26,35 26,24
21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,37 14,20 14,02 13,91 13,69 13,58
16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05
9,89
9,72
9,55
9,45
9,24
9,13
13,75 10,92
9,78
9,15
8,75
8,47
8,26
8,10
7,98
7,87
7,72
7,56
7,40
7,30
7,09
6,99
12,25
9,55
8,45
7,85
7,46
7,19
6,99
6,84
6,72
6,62
6,47
6,31
6,16
6,06
5,86
5,75
11,26
8,65
7,59
7,01
6,63
6,37
6,18
6,03
5,91
5,81
5,67
5,52
5,36
5,26
5,07
4,96
10,56
8,02
6,99
6,42
6,06
5,80
5,61
5,47
5,35
5,26
5,11
4,96
4,81
4,71
4,52
4,41
10,04
7,56
6,55
5,99
5,64
5,39
5,20
5,06
4,94
4,85
4,71
4,56
4,41
4,31
4,12
4,01
9,33
6,93
5,95
5,41
5,06
4,82
4,64
4,50
4,39
4,30
4,16
4,01
3,86
3,76
3,57
3,47
8,68
6,36
5,42
4,89
4,56
4,32
4,14
4,00
3,89
3,80
3,67
3,52
3,37
3,28
3,08
2,98
8,10
5,85
4,94
4,43
4,10
3,87
3,70
3,56
3,46
3,37
3,23
3,09
2,94
2,84
2,64
2,54
7,77
5,57
4,68
4,18
3,85
3,63
3,46
3,32
3,22
3,13
2,99
2,85
2,70
2,60
2,40
2,29
7,17
5,06
4,20
3,72
3,41
3,19
3,02
2,89
2,78
2,70
2,56
2,42
2,27
2,17
1,95
1,82
6,90
4,82
3,98
3,51
3,21
2,99
2,82
2,69
2,59
2,50
2,37
2,22
2,07
1,97
1,74
1,60
96
Hakemisto
χ2 -jakauma, 72, 90
χ2 -jakauma, taulukko, 94
kokonaistodennäköisyys, 13
Kolmogorovin aksiomat, 9
kombinaatio, 7
komplementtitapahtuma, 4, 10
korrelaatio, 61
kovarianssi, 60
kriittinen alue, 70
odotusarvo, satunnaismuuttujan funktio, 56
alkeistapaus, 3
Bayesin kaava, 13
Bernoullijakauma, 82
binomijakauma, 39, 42, 83
binomijakauman normaaliapproksimaatio, 68
leikkaus, 4
lineaarikombinaatio, 59
marginaalijakauma, 51
marginaalijakauman tiheysfunktio, 51
merkitsevyystaso, 70
momentit generoiva funktio, 37, 59
momentti, 37
deMorganin lait, 5
diskreetti satunnaismuuttuja, 20
diskreetti tasajakauma, 22, 81
ehdollinen todennäköisyys, 12
eksponenttijakauma, 28, 88
erilliset joukot, 4
erotus, joukkojen, 4
estimaatti, 65
estimaattori, 65
Eulerin gammafunktio, 72
nollahypoteesi, 70
normaalijakauma, 45, 59, 66, 89
normaalijakauma, taulukko, 93
odotusarvo, 29, 30
odotusarvo, satunnaismuuttujan funktio, 34
origomomentti, 37
otosavaruus, 3
otoshajonta, 65
otoskeskiarvo, 65
otossuure, 65
otosvarianssi, 65
otosvarianssi, testaus, 79
otosvarianssin jakauma, 73
F-jakauma, 77, 92
F-jakauma, taulukko, 96
Fisherin jakauma, 77, 92
geometrinen jakauma, 24, 84
hypergeometrinen jakauma, 23, 86
jatkuva satunnaismuuttuja, 25
jatkuva tasajakauma, 28, 87
jatkuvuuskorjaus, 69
p-arvo, 71
permutaatio, 7
pistetodennäköisyysfunktio, 21
Poisson jakauma, 42, 85
kaksisuuntainen testi, 70
kertolaskusääntö, 12
kertymäfunktio, 21, 26, 48, 50
keskeinen raja-arvolause, 66
keskiarvon keskivirhe, 66
keskihajonta, 29, 30
keskusmomentti, 37
klassinen todennäköisyys, 6
riippumattomuus, satunnaismuuttujien, 53
riippumattomuus, tapahtumien, 15
satunnaiskoe, 3
satunnaismuuttuja, 3
satunnaismuuttujan funktio, 31
97
satunnaismuuttujien summa, 59
satunnaisvektori, 48
satunnaisvektori, jatkuva, 49
satunnaisvektorin jakauma, 48
Snedecorin jakauma, 77, 92
Stirlingin kaava, 7
Studentin t-jakauma, 76, 91
suhteellinen frekvenssi, 5
t-jakauma, 76, 91
t-jakauma, taulukko, 95
tapahtuma, 3
tasajakauma, diskreetti, 22, 81
tasajakauma, jatkuva, 28, 87
tasajakauma, satunnaisvektori, 52
tiheysfunktio, diskreetti satunnaismuuttuja,
20
tiheysfunktio, jatkuva satunnaismuuttuja, 25
tiheysfunktio, satunnaisvektori, 49
tilastollinen testaaminen, 70
tilastollinen todennäköisyys, 5
todennäköisyysmitta, 5, 9
Tsebyshevin epäyhtälö, 36
tuloperiaate, 7
unioni, 4
vaihtoehtoinen hypoteesi, 70
variaatio, 7
varianssi, 29, 30, 35, 63
yhdiste, 4
yhteenlaskusääntö, 10
yhteisjakauma, 48
yksisuuntainen testi, 70
98