031021P Tilastomatematiikka (5 op) viikot 5–6

031021P Tilastomatematiikka (5 op)
viikot 5–6
Jukka Kemppainen
Mathematics Division
Jakauman tunnusluvut
Jakauman tärkeimmät tunnusluvut ovat odotusarvo ja varianssi.
◮
Odotusarvo ilmoittaa jakauman keskikohdan eli arvon, jonka
satunnaismuuttuja keskimääräisesti saavuttaa.
◮
Varianssi ilmoittaa, kuinka paljon satunnaismuuttujan arvot
keskimäärin poikkeavat odotusarvosta.
Muita tunnuslukuja ovat mm.
◮
Jakauman momentit, eli satunnaismuuttujan sopivien
potenssien odotusarvot;
◮
Jakauman vinous;
◮
Kvartiilit;
◮
Keskipoikkeama...
Jukka Kemppainen
Mathematics Division
2 / 53
Odotusarvo
Tarkastellaan odotusarvon määrittelyä erikseen diskreetin ja
jatkuvan sm:n tapauksessa. Aloitetaan diskreetistä sm:stä.
Määr. 20
Jos X on diskreetti satunnaismuuttuja, jonka arvojoukko on
SX = {x1 , x2 , . . . }, niin lukua
E (X ) =
∞
X
xk P(X = xk )
k=1
sanotaan X :n odotusarvoksi edellyttäen, että sarja suppenee.
Jukka Kemppainen
Mathematics Division
3 / 53
Odotusarvo
Määr. 21
Jos X on jatkuva satunnaismuuttuja, jonka tiheysfunktio on fX ,
niin lukua
Z ∞
xfX (x)dx
E (X ) =
−∞
sanotaan X :n odotusarvoksi edellyttäen, että integraali suppenee.
Odotusarvolle käytetään usein merkintää E (X ) = µX tai
yksinkertaisesti µ = µX , jos sekaannuksen vaaraa ei ole.
Huomautus 4
◮ Erityisesti, jos diskreetti sm. saa vain äärellisen määrän
arvoja, odotusarvo on aina olemassa.
◮
Kaikilla satunnaismuuttujilla ei ole odotusarvoa.
Jukka Kemppainen
Mathematics Division
4 / 53
Esimerkki
Esim. 39
Milloin satunnaismuuttujalla X , jonka
◮
◮
pistetodennäköisyysfunktio on muotoa P(X = k) = c k1p ,
k = 1, 2, . . .;
tiheysfunktio on f (x) = c (1+x1 2 )p , x ∈ R,
on odotusarvo?
Jukka Kemppainen
Mathematics Division
5 / 53
Diskreettien jakaumien odotusarvoja (1/2)
◮
Binomijakauman, X ∼ Bin(n, p), odotusarvo on
E (X ) = np.
◮
Geometrisen jakauman, X ∼ Geo(p), odotusarvo on
E (X ) =
◮
1
.
p
Poissonin jakauman, X ∼ Poi(a), odotusarvo on
E (X ) = a.
Jukka Kemppainen
Mathematics Division
6 / 53
Diskreettien jakaumien odotusarvoja (2/2)
Laskentakaavojen intuitiivinen perustelu:
◮
◮
◮
Binomijakaumalle E (X ) = np, sillä yksittäisessä toistossa
onnistumisen tn. on p, joten ’pitkässä juoksussa’
onnistumisten lkm. on np.
Geometriselle jakaumalle E (X ) = p1 , sillä pitkässä juoksussa
keskimääräinen onnistumisten lkm. per yritysten lkm. on p,
joten keskimääräinen yritysten lkm. per onnistuminen on 1/p.
Poissonin jakaumalle E (X ) = a on selvä, jos Poissonin
jakauma ajatellaan binomijakauman raja-jakaumana.
Jukka Kemppainen
Mathematics Division
7 / 53
Kuvia
Kuvissa on esitetty sm:ien X ∼ Bin(50, 0.2) ja X ∼ Poi(5)
pistetodennäköisyysfunktiot ja merkitty odotusarvo.
Kuva : X ∼ Bin(50, 0.2) ja
E (X ) = 10
Jukka Kemppainen
Kuva : X ∼ Poi(5) ja E (X ) = 5
Mathematics Division
8 / 53
Jatkuvien jakaumien odotusarvoja
◮
Tasajakauman, X ∼ Tas(a, b), odotusarvo on E (X ) =
a+b
2 .
◮
Eksponenttijakauman, X ∼ Exp(λ), odotusarvo on
E (X ) = λ1 .
◮
Normaalijakauman, X ∼ N(µ, σ 2 ), odotusarvo on E (X ) = µ.
◮
Weibullin jakauman, X ∼ Wei(α, β), odotusarvo on
E (X ) = α−1/β Γ(1 + 1/β),
missä
Γ(x) =
Z
∞
t x−1 e−t dt,
α, β > 0,
x > 0,
0
on Eulerin Gamma-funktio.
Jukka Kemppainen
Mathematics Division
9 / 53
Kuvia
Kuvissa on esitetty sm:ien X ∼ N(100, 25) ja X ∼ Exp( 21 )
tiheysfunktiot ja merkitty odotusarvo.
Kuva : X ∼ N(100, 25) ja
E (X ) = 100
Jukka Kemppainen
Kuva : X ∼ Exp( 21 ) ja
E (X ) = 2
Mathematics Division
10 / 53
Esimerkkejä
Esim. 40
Heitetään kolikkoa 3 kertaa. Olkoon X kruunujen lukumäärä.
Laske odotusarvo E (X ).
Esim. 41
Jatkuvan satunnaismuuttujan X tiheysfunktio on

0 ≤ x < 1,

x,
fX (x) = 2 − x, 1 ≤ x ≤ 2,


0,
muulloin.
Laske X :n odotusarvo.
Jukka Kemppainen
Mathematics Division
11 / 53
Esimerkkejä
Esim. 42
Teräväpiirtotelevisiota (HDTV) on lyhyessä ajassa myyty 30000
kappaletta. Jokaisessa näistä on yksi kappale komponenttia A,
jonka kestoikä on eksponenttijakautunut odotusarvona 4 vuotta.
Millä todennäköisyydellä komponentti A kestää ainakin vuoden?
HDTV:n takuu on vuoden. Kuinka monen HDTV:n komponentti
A joudutaan keskimäärin vaihtamaan takuun puitteissa?
Komponentti on halpa (3 euroa), mutta sen uusimiseen liittyvä
asennuskulu on 55 euroa. Kuinka paljon kuluja on odotettavissa
takuuna uusittavista komponenteista ja niiden asennuksista?
Jukka Kemppainen
Mathematics Division
12 / 53
Muunnoksen Y = h(X ) odotusarvo
Sovelluksissa joudutaan usein tarkastelemaan satunnaismuuttujien
muunnoksia. Oletetaan, että X on satunnaismuuttuja ja
h : R → R sellainen funktio, että Y = h(X ) on satunnaismuuttuja
(vrt. Lause 7, s.17).
Jos X on diskreetti sm., saadaan
Lause 11
Muunnoksen Y = h(X ) odotusarvo on
X
h(xi )P(X = xi )
E (Y ) = E (h(X )) =
i :xi ∈SX
edellyttäen, että sarja suppenee itseisesti, eli
X
|h(xi )|P(X = xi ) < ∞.
i :xi ∈SX
Jukka Kemppainen
Mathematics Division
13 / 53
Muunnoksen odotusarvo
Jos taasen X on jatkuva satunnaismuuttuja, jonka tiheysfunktio
on fX , saadaan
Lause 12
Muunnoksen Y = h(X ) odotusarvo on
Z ∞
h(x)fX (x)dx
E (Y ) = E (h(X )) =
−∞
edellyttäen, että integraali suppenee itseisesti, eli
Z ∞
|h(x)|fX (x)dx < ∞.
−∞
Jukka Kemppainen
Mathematics Division
14 / 53
Esimerkkejä
Esim. 43
Olkoon Θ välille ] − π2 , π2 [ tasajakautunut kulma ja Y = tan(Θ).
Määrää (mikäli mahdollista) Y :n odotusarvo.
Jukka Kemppainen
Mathematics Division
15 / 53
Esimerkkejä
Esim. 44
Oletetaan, että tuotteen laatutappio on kE ((X − m)2 ), missä k
on verrannollisuuskerroin ja m suureen X tavoitearvo tuotannossa.
Olkoon laitteen kulutuskesto X (kk) Weibull-jakautunut
parametrien arvoilla α = 0,40 ja β = 21 . Laitteen tuottaja
tavoitteli tuotteelleen 100 kk:n kulutuskestoa. Mikä oli tuotteen
kulutuskeston laatutappio, kun verrannollisuuskerroin oli k = 0,1?
Tuottaja pyrki säätämään tuotantoaan siten, että parametrin β
arvo pysyi kiinteänä ja parametrin α arvo muuttui. Millä α:n
arvolla kulutuskeston tavoitearvo ja odotusarvo ovat yhtä suuret?
−2
−1
(E (X ) = α β ( β1 )! ja E (X 2 ) = α β ( β2 )!, kun β1 ∈ N.)
Jukka Kemppainen
Mathematics Division
16 / 53
Varianssi
Tarkastellaan varianssin määrittelyä erikseen diskreetin ja jatkuvan
sm:n tapauksessa.
Aloitetaan diskreetistä sm:stä.
Määr. 22
Jos X on diskreetti satunnaismuuttuja, jonka arvojoukko on
SX = {1, 2, . . . } ja odotusarvo µX , niin lukua
X
D 2 (X ) =
(xk − µX )2 P(X = xk )
k:xk ∈SX
sanotaan X :n varianssiksi ja merkitään D 2 (X ) = Var(X ) = σX2
edellyttäen, että sarja suppenee.
Jukka Kemppainen
Mathematics Division
17 / 53
Varianssi
Vastaavasti jatkuvan sm:n tapauksessa määritellään
Määr. 23
Jos X on jatkuva satunnaismuuttuja, jonka tiheysfunktio on fX ja
odotusarvo µX , niin lukua
Z ∞
2
(x − µX )2 fX (x)dx
D (X ) =
−∞
sanotaan X :n varianssiksi ja merkitään D 2 (X ) = Var(X ) = σX2
edellyttäen, että integraali suppenee.
p
Lukua σX = Var(X ) sanotaan satunnaismuuttujan X
keskihajonnaksi.
Jukka Kemppainen
Mathematics Division
18 / 53
Varianssi
Jos katsotaan varianssin määritelmää ja verrataan sitä
muunnoksen h(X ) = (X − µX )2 odotusarvoon, niin havaitaan,
että itse asiassa varianssi on muunnoksen h(X ) odotusarvo ja siten
Var(X ) = E ((X − E (X ))2 ).
Edellisestä yhtäsuuruudesta saadaan varianssille seuraava
hyödyllinen laskentakaava
Lause 13
Olkoon X satunnaismuuttuja, jolla on varianssi. Tällöin
Var(X ) = E (X 2 ) − E (X )2 .
Jukka Kemppainen
Mathematics Division
19 / 53
Esimerkki
Esim. 45
Oletetaan, että X ∼ N(0, 1). Tällöin Y = eX noudattaa ns.
log-normaalijakaumaa. Määrää Y :n odotusarvo ja varianssi.
Jukka Kemppainen
Mathematics Division
20 / 53
Diskreettien jakaumien variansseja
◮
Binomijakauman, X ∼ Bin(n, p), varianssi on
Var(X ) = np(1 − p).
◮
Geometrisen jakauman, X ∼ Geo(p), varianssi on
Var(X ) = 1−p
.
p2
◮
Poissonin jakauman, X ∼ Poi(a), varianssi on Var(X ) = a.
Jukka Kemppainen
Mathematics Division
21 / 53
Jatkuvien jakaumien variansseja
◮
Tasajakauman, X ∼ Tas(a, b), varianssi on Var(X ) =
(b−a)2
12 .
◮
Eksponenttijakauman, X ∼ Exp(a), varianssi on
Var(X ) = a12 .
◮
Normaalijakauman, X ∼ N(µ, σ 2 ), varianssi on Var(X ) = σ 2 .
◮
Weibullin jakauman, X ∼ Wei(α, β), varianssi on
Var(X ) = α−2/β (Γ(1 + 2/β) − Γ(1 + 1/β)2 ).
Jukka Kemppainen
Mathematics Division
22 / 53
Odotusarvon ja varianssin ominaisuuksia
Lause 14
Jos sm. X on todennäköisyydellä yksi vakio a, ts. P(X = a) = 1,
niin E (X ) = a ja Var(X ) = 0. Kääntäen, jos Var (X ) = 0, niin
P(X = a) = 1 jollekin a ∈ R.
Lause 15
Jos X ja Y ovat satunnaismuuttujia ja a, b ∈ R, niin
E (aX + bY ) =aE (X ) + bE (Y ),
Var(aX + bY ) =a2 Var(X ) + b2 Var(Y )
+ 2abE ((X − E (X ))(Y − E (Y )))
edellyttäen, että em. suureet ovat äärellisiä.
Jukka Kemppainen
Mathematics Division
23 / 53
Ominaisuuksia
Lause 16
Jos X ja Y ovat riippumattomia, niin
E (XY ) = E (X )E (Y ),
Var(aX + bY ) = a2 Var(X ) + b2 Var(Y )
edellyttäen, että em. suureet ovat äärellisiä.
Edellinen tulos pätee myös n:n riippumattoman sm:n tapauksessa.
Korollaari 2
Jos X1 , . . . , Xn ovat riippumattomia satunnaismuuttujia, joilla on
odotusarvo ja varianssi, ja a1 , . . . , an ∈ R, niin
E (X1 · · · Xn ) = E (X1 ) · · · E (Xn ),
Var(a1 X1 + · · · + an Xn ) = a12 Var(X1 ) + · · · + an2 Var(Xn ).
Jukka Kemppainen
Mathematics Division
24 / 53
Esimerkkejä
Esim. 46
Olkoon X ∼ N(µ, σ 2 ). Laske standardisoidun satunnaismuuttujan
Z = X σ−µ odotusarvo ja varianssi.
Esim. 47
Kytketään 100 sähkövastusta yhteen. Jokaisen vastuksen
resistanssi on tasaisesti jakautunut 90 Ω ja 110 Ω välille.
Oletetaan, että sähkövastukset ovat toisistaan riippumattomia.
Määrää systeemin
(a) kokonaisresistanssin odotusarvo ja varianssi, kun vastukset on
kytketty sarjaan.
(b) kokonaisresistanssin käänteisluvun odotusarvo ja varianssi,
kun vastukset on kytketty rinnan.
Jukka Kemppainen
Mathematics Division
25 / 53
Todennäköisyyslaskennan raja-arvolauseita
Tilastollisessa tutkimuksessa tehdään aineistojen pohjalta
päätelmiä tutkittavasta ilmiöstä. Tehtäessä ilmiöstä
riippumattomia havaintoja, on toivottavaa, että havaintojen
lukumäärän kasvaessa saadaan yhä varmemmin ”oikea kuva
todellisuudesta”. Todennäköisyyslaskennan raja-arvolauseet luovat
perustan todennäköisyyslaskennan tilastollisille sovelluksille.
Jukka Kemppainen
Mathematics Division
26 / 53
Esimerkki
Esim. 48
Olkoot X1 , X2 , . . . , Xn riippumattomia satunnaismuuttujia, joille
E (Xi ) = µ ja D 2 (Xi ) = σ 2 kaikilla i = 1, . . . , n. Laske
aritmeettisen keskiarvon
n
X =
1X
Xi
n
i =1
odotusarvo ja varianssi.
Jukka Kemppainen
Mathematics Division
27 / 53
Tn-laskennan raja-arvolauseita
Edellisen esimerkin mukaan tehtäessä satunnaismuuttujasta X
riippumattomia havaintoja x1 , P
. . . , xn keskittyy havaintojen
aritmeettinen keskiarvo x = n1 ni=1 xi yhä varmemmin
satunnaismuuttujan X odotusarvon ympäristöön, sillä E (X ) = µ
ja D 2 (X ) → 0, kun n → ∞. Huomaa, että havaintojen
aritmeettinenP
keskiarvo x on sm:n X saama arvo.
1
Keskiarvot n ni=1 Xi muodostavat satunnaismuuttujajonon, joka
tietyllä tavalla suppenee kohti odotusarvoa µ. Tarkastellaan
seuraavaksi satunnaismuuttujajonon suppenemisen muotoja.
Jukka Kemppainen
Mathematics Division
28 / 53
Satunnaismuuttujajonon suppeneminen
Satunnaismuuttujajonon X1 , X2 , . . . suppenemista on mahdollista
luonnehtia eri tavoin. Tällä kurssilla tarkastellaan seuraavia
suppenemisen muotoja:
◮
Jakaumasuppeneminen Jono X1 , X2 , . . . suppenee
jakaumaltaan kohti satunnaismuuttujaa X , jos
kertymäfunktioiden jono Fn suppenee kohti rajajakauman
kertymäfunktiota FX jokaisessa F :n jatkuvuuspisteessä.
◮
Stokastinen suppeneminen tarkoittaa sitä, että poikkeama
rajamuuttujasta X on mielivaltaisen pieni suurella
todennäköisyydellä, eli kaikilla ǫ > 0
lim P(|Xn − X | < ǫ) = 1.
n→∞
Jukka Kemppainen
Mathematics Division
29 / 53
Satunnaismuuttujajonon suppeneminen
◮
Melkein varma suppeneminen tarkoittaa sitä, että jono
X1 , X2 , . . . suppenee todennäköisyydellä yksi kohti
rajamuuttujaa X , eli
P( lim Xn = X ) = 1.
n→∞
Voidaan osoittaa, että melkein varma suppeneminen on vahvin
suppenemisen muoto ja jakaumasuppeneminen taasen heikoin
muoto, eli suppenemiselle pätee
Melkein varmasti ⇒ Stokastisesti ⇒ Jakaumaltaan.
Jukka Kemppainen
Mathematics Division
30 / 53
Chebyshevin epäyhtälö
Lause 17 (Chebyshevin epäyhtälö)
Olkoon X satunnaismuuttuja, jolla on odotusarvo µ ja varianssi
σ 2 . Tällöin kaikilla ǫ > 0 pätee
P(|X − µ| ≥ ǫ) ≤
σ2
.
ǫ2
Chebyshevin epäyhtälöllä voidaan aina arvioida kuinka paljon
satunnaismuuttuja poikkeaa odotusarvostaan. Arvio on tosi karkea
ja se riippuu varianssin suuruudesta.
Jukka Kemppainen
Mathematics Division
31 / 53
Esimerkki
Esim. 49
Olkoon X ∼ N(0, 1). Laske todennäköisyyksille P(|X | ≥ 1),
P(|X | ≥ 2) ja P(|X | ≥ 3)
(a) arvio Chebychevin epäyhtälön avulla.
(b) tarkka arvo.
Jukka Kemppainen
Mathematics Division
32 / 53
Heikko suurten lukujen laki
Lause 18 (Chebyshev)
Olkoon X1 , X2 , . . . jono parittain riippumattomia, samalla tavalla
jakautuneita sm:ia, joilla on odotusarvo E (Xi ) = µ ja varianssi
D 2 (Xi ) = σ 2 . Olkoon
X
(n)
n
1X
=
Xi
n
i =1
satunnaismuuttujien X1 , X2 , . . . , Xn aritmeettinen keskiarvo.
Tällöin
(n)
P(|X − µ| ≥ ǫ) → 0, kun n → ∞
kaikilla ǫ > 0.
Jukka Kemppainen
Mathematics Division
33 / 53
Tulkinta
Heikko suurten lukujen laki tarkoittaa seuraavaa:
◮
Satunnaismuuttujien X1 , . . . , Xn aritmeettinen keskiarvo
suppenee stokastisesti kohti odotusarvoa µ.
◮
Jos X1 , . . . , Xn ovat riippumattomia havaintoja samasta
satunnaismuuttujasta X , jonka odotusarvo on µ ja varianssi
σ 2 , niin havaintojen lukumäärän kasvaessa havaintojen
aritmeettinen keskiarvo (otoskeskiarvo) yhä varmemmin
ilmoittaa todellisen odotusarvon. Otoskeskiarvolla voidaan siis
estimoida odotusarvoa, kun havaintojen lukumäärä on
riittävän suuri.
Jukka Kemppainen
Mathematics Division
34 / 53
Kuvia
Kuvissa on esitetty riippumattomien normaalijakautuneiden sm:ien
(n)
tiheysfunktioita.
Xi ∼ N(0, 1) aritmeettisen keskiarvon X
Kun ǫ = 0.01, niin Lauseen 18 tn:ksi saadaan
(103 )
(106 )
P(|X
| ≥ ǫ) ≈ 0.75 ja P(|X
| ≥ ǫ) ≈ 7.6 · 10−24 .
Jukka Kemppainen
Mathematics Division
35 / 53
Vahva suurten lukujen laki
Lause 19 (Kolmogorov)
Olkoon X1 , X2 , . . . jono parittain riippumattomia, samalla tavalla
jakautuneita satunnaismuuttujia, joilla on odotusarvo E (Xi ) = µ.
Tällöin
(n)
P( lim X = µ) = 1.
n→∞
Vahva suurten lukujen laki siis sanoo, että parittain
riippumattomien, samalla tavalla jakautuneiden
satunnaismuuttujien X1 , . . . , Xn aritmeettinen keskiarvo suppenee
melkein varmasti kohti odotusarvoa µ.
Jukka Kemppainen
Mathematics Division
36 / 53
Esimerkki
Esim. 50
Pelatessa ruletissa väriä (musta tai punainen) yhden euron
1
euroa. Mitä suurten
panoksella on voittosumman odotusarvo − 37
lukujen laki sanoo voittosummasta, jos peliä pelataan erittäin
monta kertaa yhden euron panoksella? Takaako laki, että sinun
tappiot ovat pieniä? Entäpä takaako laki, että suurella pelien
määrällä häviät?
Jukka Kemppainen
Mathematics Division
37 / 53
Keskeinen raja-arvolause
Suurten lukujen laeilla on lähinnä kvalitatiivinen merkitys
satunnaismuuttujien aritmeettisen keskiarvon käyttäytymisestä n:n
kasvaessa. Todennäköisyyksien kvantitatiiviseen laskemiseen
tarvitaan tarkempaa tietoa aritmeettisen keskiarvon jakauman
käyttäytymisestä. Tämän ilmoittaa keskeinen raja-arvolause.
Lause 20 (Keskeinen raja-arvolause)
Olkoon X1 , X2 , . . . jono keskinäisesti riippumattomia, samalla
tavalla jakautuneita sm:ia, joilla E (etXi ) on olemassa, kun |t| < δ
2
2
jollakin
Pδn > 0. Merkitään E (Xi ) = µ, D (Xi ) = σ ja
Sn = i =1 Xi . Tällöin
Z x
S − E (S )
u2
1
n
n
lim P
e− 2 du.
≤ x = Φ(x) = √
n→∞
σSn
2π −∞
Jukka Kemppainen
Mathematics Division
38 / 53
Keskeinen raja-arvolause
Keskeisessä raja-arvolauseessa esiintyvä suure voidaan kirjoittaa
muodossa
Sn
−µ
Sn − E (Sn )
= n σ .
√
σSn
n
Siis riittävän suurilla n:n arvoilla keskiarvo X = n1 Sn noudattaa
likimain normaalijakaumaa, eli
n
σ2
1X
Xi ∼ N(µ, )
n
n
i =1
likimain, kun n on riittävän suuri.
Summan todennäköisyyden arvioimista normaalijakaumalla
sanotaan normaalijakauma-approksimaatioksi.
Jukka Kemppainen
Mathematics Division
39 / 53
Huomioita
◮
Joskus n = 3 on riittävä otoksen koko;
◮
Joskus n = 100000 ei riitä;
◮
Pääsääntöisesti (ainakin tällä kurssilla) approksimaatio on
pätevä, kun n ≥ 30.
Huomautus 5
Keskeisen raja-arvolauseen todisti vuonna 1901 venäläinen A.N.
Lyapunov hieman yleisemmillä oletuksilla. Satunnaismuuttujien ei
esimerkiksi tarvitse olla samalla tavalla jakautuneita.
Jukka Kemppainen
Mathematics Division
40 / 53
Kuvia
P
Kuvissa on esitetty jakaumien Sn = ni=1 Xi ja
X ∼ N(E (Sn ), σS2n ) pistetodennäköisyydet ja tiheysfunktio, kun
n = 50 ja
Kuva : Sn ∼ Bin(n, 0.2)
Jukka Kemppainen
Mathematics Division
Kuva : Xi ∼ Poi(1)
41 / 53
Kuvia
P
Kuvissa on esitetty jakauman Sn = ni=1 Xi kertymäfunktio
kokonaislukupisteissä ja ja jakauman X ∼ N(E (Sn ), σS2n )
kertymäfunktio, kun n = 50 ja
Kuva : Sn ∼ Bin(n, 0.2)
Jukka Kemppainen
Mathematics Division
Kuva : Xi ∼ Poi(1)
42 / 53
Kuvia
P
Kuvissa on esitetty jakaumien Sn = ni=1 Xi ja
X ∼ N(E (Sn ), σS2n ) tiheysfunktiot (tf:t) ja kertymäfunktiot (kf:t),
kun n = 3 ja Xi ∼ Tas(0, 1).
Kuva : Tf:t fSn ja fX
Jukka Kemppainen
Kuva : Kf:t FSn ja FX
Mathematics Division
43 / 53
Kuvia
P
Kuvissa on esitetty jakaumien Sn = ni=1 Xi ja
X ∼ N(E (Sn ), σS2n ) tiheysfunktiot (tf:t) ja kertymäfunktiot (kf:t),
kun n = 10 ja Xi ∼ Exp(1).
Kuva : Tf:t fSn ja fX
Jukka Kemppainen
Kuva : Kf:t FSn ja FX
Mathematics Division
44 / 53
Esimerkkejä
Esim. 51
Olkoon Yn erään osakkeen hinta vuoden n. päivänä. Oletetaan,
että erotukset Xn = Yn+1 − Yn ovat riippumattomia,
normaalijakautuneita satunnaismuuttujia, joilla on sama
odotusarvo µ = 0 ja varianssi σ 2 = 41 . Jos Y1 = 100, niin laske
todennäköisyys, että vuoden lopussa osakkeen hinta on
(a) ≥ 100.
(b) ≥ 110.
(c) ≥ 120.
Jukka Kemppainen
Mathematics Division
45 / 53
Esimerkin 51 realisaatioita
Kuvissa on esitetty 2 eri realisaatiota esimerkin 51 osakkeen
hinnalle.
Jukka Kemppainen
Mathematics Division
46 / 53
Esimerkkejä
Esim. 52
Keskeinen raja-arvolause ei päde kaikille riippumattomille jonoille
X1 , X2 , . . .. Osoita, että jos Xk ∼ Poi( 21k ) kaikilla k = 1, 2, . . .,
niin muuttuja
Sn − E (Sn )
σSn
ei lähesty N(0, 1)-jakaumaa.
Esim. 53
Oletetaan, että elektronisen komponentin elinikä on sm., jonka
odotusarvo on µ = a ja keskihajonta σ = a. Kuinka monta
komponenttia tarvitaan, jotta niiden yhteenlaskettu elinikä olisi
korkeintaan 8a enintään tn:llä 0,05?
Jukka Kemppainen
Mathematics Division
47 / 53
Binomijakauman
normaalijakauma-approksimaatio
Tarkastellaan n-kertaista toistokoetta X1 , . . . , Xn , jossa
◮
Xi ilmoittaa tapahtuuko jokin suotuisa tapahtuma A vai ei
◮
Oletetaan, että tapahtuma A sattuu yksittäisissä toistoissa
muista toistoista riippumattomasti ja että
P(Xi = 1) = P(A) = P(′′ A sattuu′′ ) = p ja
P(Xi = 0) = P(A) = 1 − p kaikilla i = 1, . . . , n.
Tällöin Sn = X1 + X2 + · · · + Xn ilmoittaa A:n esiintymiskertojen
lukumäärän ja Sn ∼ Bin(n, p).
Koska E (Sn ) = np ja D 2 (Sn ) = np(1 − p), niin keskeisen
raja-arvolauseen mukaan
Sn ∼ N(np, np(1 − p))
likimain, kun n on riittävän suuri.
Jukka Kemppainen
Mathematics Division
48 / 53
Binomijakauman approksimaatio
Siis binomijakaumaa Bin(n, p) voidaan approksimoida
normaalijakaumalla N(np, np(1 − p)), kun n on riittävän suuri.
Approksimaation tarkkuutta on tutkittu ja todettu, että
approksimaatio on erityisen hyvä silloin, kun p ≈ 12 .
Luvun n pitäisi olla niin suuri, että varianssi np(1 − p) > 9, jolloin
käytännössä saadaan riittävän hyviä approksimaatioita.
Jukka Kemppainen
Mathematics Division
49 / 53
Approksimaatio, p:n vaikutus
Kuviin on piirretty binomijakauman X ∼ Bin(20, p)
pistetodennäköisyyksiä
ja normaalijakauman
p
N(20p, ( 20p(1 − p))2 ) tiheysfunktio, kun
Kuva : p = 0.1
Jukka Kemppainen
Kuva : p = 0.5
Mathematics Division
50 / 53
Approksimaatio, n:n vaikutus
Kuviin on piirretty binomijakauman X ∼ Bin(n, 0.05)
pistetodennäköisyyksiä
ja normaalijakauman
√
N(0.05n, ( 0.05 · 0.95n)2 ) tiheysfunktio, kun
Kuva : n = 20
Jukka Kemppainen
Kuva : n = 1000
Mathematics Division
51 / 53
Jatkuvuuskorjaus
Diskreettejä jakaumia approksimoitaessa voidaan tarkkuutta
parantaa tekemällä jatkuvuuskorjaus. Jos a ja b ovat
kokonaislukuja, joille 0 ≤ a ≤ b ≤ n, ja X on diskreetti sm., joka
saa kokonaislukuarvot 0, 1, . . . , n, niin tn:ää P(a ≤ X ≤ b) ei
approksimoida integraalina a:sta b:hen, vaan integraalina
a − 12 :sta b + 12 :een. Siis
1
1
≤X ≤b+ )
2
2
a − 1 − E (X )
b + 21 − E (X ) X
− E (X )
2
=P
≤
≤
σX
σX
σX
b + 1 − E (X ) a − 1 − E (X ) 2
2
≈Φ
−Φ
.
σX
σX
P(a ≤ X ≤ b) = P(a −
Jukka Kemppainen
Mathematics Division
52 / 53
Esimerkkejä
Esim. 54
Eräästä tuotteesta 10 % on viallisia. Jos ostetaan 10 tuotetta, niin
millä tn:llä saadaan korkeintaan yksi viallinen tuote, kun tn.
lasketaan
◮
tarkasti?
◮
normaalijakauma-approksimaatiolla jatkuvuuskorjauksella ja
ilman?
◮
Poisson-jakauman avulla?
Esim. 55
Heitetään noppaa 20 kertaa. Millä todennäköisyydellä pistelukujen
summa on vähintään 60 ja korkeintaan 80?
Jukka Kemppainen
Mathematics Division
53 / 53