null

Ilkka Mellin
Todennäköisyyslaskenta
Osa 3: Todennäköisyysjakaumia
Moniulotteisia todennäköisyysjakaumia
TKK
(c) Ilkka Mellin (2007)
1
Moniulotteisia todennäköisyysjakaumia
>> Multinomijakauma
Kaksiulotteinen normaalijakauma
TKK
(c) Ilkka Mellin (2007)
2
Multinomijakauma
Multinomijakauman tausta 1/3
• Multinomijakauma on binomijakauman (ks. lukua
Diskreettejä jakaumia) yleistys useamman toisensa
poissulkevan tapahtuman tilanteeseen.
• Olkoon A1, A2, … , Ak otosavaruuden S ositus.
• Tällöin:
Ai∩Aj = ∅ , i ≠ j
S = A1∪A2∪ ⋅⋅⋅ ∪Ak
• Olkoot tapahtumien A1, A2, … , Ak todennäköisyydet:
Pr(Ai) = pi , i = 1, 2, … , k
p1 + p2 + ⋅⋅⋅ + pk = 1
TKK
(c) Ilkka Mellin (2007)
3
Multinomijakauma
Multinomijakauman tausta 2/3
• Määritellään satunnaismuuttujat Xi , i = 1, 2, … , k:
Xi = Tapahtuman Ai esiintymisten lukumäärä
n-kertaisessa toistokokeessa
• Tällöin
X i ~ Bin(n, pi ) , i = 1, 2,… , k
jossa
pi = Pr(Ai) , i = 1, 2, … , k
• Lisäksi
X1 + X 2 + + X k = n
TKK
(c) Ilkka Mellin (2007)
4
Multinomijakauma
Multinomijakauman tausta 3/3
• Multinomijakaumalla tarkoitetaan satunnaismuuttujien
X1, X2, … , Xk
yhteisjakaumaa.
• Huomautus:
Satunnaismuuttuja Xi eivät ole riippumattomia, koska niitä sitoo
toisiinsa ehto
X1 + X 2 + + X k = n
jossa toistokokeiden lukumäärä n on kiinteä luku.
TKK
(c) Ilkka Mellin (2007)
5
Multinomijakauma
Multinomijakauma ja sen
pistetodennäköisyysfunktio
• Satunnaismuuttujat X1, X2, … , Xk noudattavat (k − 1)ulotteista multinomijakaumaa, jos niiden yhteisjakauman
pistetodennäköisyysfunktio on muotoa
Pr( X 1 = n1 ja X 2 = n2 ja … ja X k = nk )
n!
p1n1 p2n2
=
n1 !n2 ! nk !
jossa
p1 + p2 +
pknk
+ pk = 1
n1 + n2 + + nk = n
• Merkintä:
(X1, X2, … , Xk) ∼ Multinom(p1, p2, … , pk ; n)
TKK
(c) Ilkka Mellin (2007)
6
Multinomijakauma
Multinomijakauman ominaisuuksia
• Jos k = 2, niin multinomijakauma yhtyy binomijakaumaan:
PrMultinom ( X 1 = n1 ja X 2 = n − n1 ) = PrBin ( X 1 = n1 )
• Multinomijakauman yksiulotteiset reunajakaumat ovat
binomijakaumia.
• Multinomitodennäköisyydet saadaan korottamalla
multinomi (p1 + p2 + ⋅⋅⋅ + pk) potenssiin n:
n!
p1n1 p2n2 pknk
n1 !n2 ! nk !
jossa summa lasketaan yli kaikkien lukujen n1, n2, … , nk ,
joille pätee ehto
n1 + n2 + ⋅⋅⋅ + nk = n
( p1 + p2 +
TKK
+ pk ) n = ∑
(c) Ilkka Mellin (2007)
7
Moniulotteisia todennäköisyysjakaumia
Multinomijakauma
>> Kaksiulotteinen normaalijakauma
TKK
(c) Ilkka Mellin (2007)
8
Kaksiulotteinen normaalijakauma
Kaksiulotteinen normaalijakauma
• Kaksiulotteinen normaalijakauma on normaalijakauman
(ks. lukua Jatkuvia jakaumia) kaksiulotteinen yleistys.
• Huomautus:
Normaalijakauman yleistystä p-ulotteiseen avaruuteen (p > 1)
kutsutaan multinormaalijakaumaksi tai p-ulotteiseksi
normaalijakaumaksi.
TKK
(c) Ilkka Mellin (2007)
9
Kaksiulotteinen normaalijakauma
Kaksiulotteinen normaalijakauma ja sen
tiheysfunktio 1/2
• Satunnaismuuttujat X ja Y noudattavat kaksiulotteista
normaalijakaumaa, jos niiden yhteisjakauman
tiheysfunktio on muotoa


1
1
exp −
f XY ( x, y ) =
Q ( x, y ) 
2
2
2πσ X σ Y 1 − ρ XY
 2(1 − ρ XY )

jossa
2
2
 x − µ X   y − µY 
 x − µ X  y − µY 
Q ( x, y ) = 
+
− 2 ρ XY 


 σ 
σ
σ
σ

 




X
Y
X
Y
• Merkintä:
(X, Y) ∼ N2(µX, µY, σX2, σY2, ρXY)
TKK
(c) Ilkka Mellin (2007)
10
Kaksiulotteinen normaalijakauma
Kaksiulotteinen normaalijakauma ja sen
tiheysfunktio 2/2
• Kaksiulotteisen normaalijakauman
N2(µX, µY, σX2, σY2, ρXY)
parametrien on toteuttava seuraavat ehdot:
−∞ < µ X < +∞
σX > 0
−∞ < µY < +∞
σY > 0
−1 < ρ XY < +1
TKK
(c) Ilkka Mellin (2007)
11
Kaksiulotteinen normaalijakauma
Kaksiulotteinen normaalijakauman parametrit
• Olkoon
(X, Y) ∼ N2(µX, µY, σX2, σY2, ρXY)
• Kaksiulotteisen normaalijakauman parametreina, jotka
täysin määräävät jakauman, ovat satunnaismuuttujien X ja
Y odotusarvot ja varianssit sekä niiden korrelaatio:
E( X ) = µ X
Var( X ) = σ X2
E(Y ) = µY
Var(Y ) = σ Y2
Cor( X , Y ) = ρ XY
• Lisäksi
Cov( X , Y ) = σ XY = ρ XY σ X σ Y
TKK
(c) Ilkka Mellin (2007)
12
Kaksiulotteinen normaalijakauma
Tiheysfunktion ominaisuudet
• Kaksiulotteisen normaalijakauman tiheysfunktio
määrittelee pinnan
z = fXY(x, y)
kolmiulotteisessa avaruudessa.
• Pinnalla on maksimi satunnaismuuttujien X ja Y odotusarvojen µX ja µY määräämässä jakauman todennäköisyysmassan painopisteessä (µX, µY).
• Pinnan muodon määräävät tasa-arvoellipsit
2
2
 x − µ X   y − µY 
 x − µ X   y − µY 
Q ( x, y ) = 
+
− 2 ρ XY 




 σ X   σY 
 σ X  σY 
= c (vakio)
TKK
(c) Ilkka Mellin (2007)
13
Kaksiulotteinen normaalijakauma
Tasa-arvoellipsien ominaisuudet 1/3
• Kaksiulotteisen normaalijakauman tiheysfunktion
muodostaman pinnan muodon määräävillä tasaarvoellipseillä on seuraavat ominaisuudet:
(i) Ellipsien keskipisteenä on jakauman todennäköisyysmassan painopiste
(µX, µY)
(ii) Ellipsien eksentrisyys on sekä korrelaatiokertoimen
ρXY että standardipoikkeamien σX ja σY funktio.
(iii) Ellipsi on sitä eksentrisempi mitä voimakkaammin
satunnaismuuttujat X ja Y ovat korreloituneita eli
mitä suurempi on
|ρXY|
TKK
(c) Ilkka Mellin (2007)
14
Kaksiulotteinen normaalijakauma
Tasa-arvoellipsien ominaisuudet 2/3
(iv) Jos
ρXY = 0
ellipsien pääakselit ovat koordinaattiakseleiden
suuntaiset.
(v) Jos
ρXY = 0
ja lisäksi
σX = σY
niin ellipsit ovat ympyröitä.
(vi) Jos
ρXY = ±1
niin ellipsit surkastuvat janoiksi.
TKK
(c) Ilkka Mellin (2007)
15
Kaksiulotteinen normaalijakauma
Tasa-arvoellipsien ominaisuudet 3/3
• Tasa-arvoellipsien pääakselit ovat satunnaismuuttujien X
ja Y kovarianssimatriisin
 σ X2 σ XY 
Σ=
2 
σ
σ
Y 
 XY
ominaisvektoreiden suuntaiset ja niiden pituudet
suhtautuvat toisiinsa kuten matriisin Σ ominaisarvojen
neliöjuuret.
TKK
(c) Ilkka Mellin (2007)
16
Kaksiulotteinen normaalijakauma
Esimerkki:
Jakauman määrittely
•
•
Olkoon
(X, Y) ∼ N2(4, 3, 2, 1, 0.7)
Jakauman parametrit ovat
E( X ) = µ X = 4
Var( X ) = σ X2 = 2
E(Y ) = µY = 3
•
Siten
Var(Y ) = σ Y2 = 1
Cor( X , Y ) = ρ XY = 0.7
Cov( X , Y ) = ρ XY σ X σ Y = 0.7 × 2 × 1 = 0.9899
TKK
(c) Ilkka Mellin (2007)
17
Kaksiulotteinen normaalijakauma
Esimerkki:
Tiheysfunktion kuvaaja
• Olkoon
(X, Y) ∼ N2(4, 3, 2, 1, 0.7)
jolloin
µ X = 4 σ X2 = 2
µY = 3 σ Y2 = 1
ρ XY = 0.7
0.2
0.1
• Kuva oikealla esittää jakauman
tiheysfunktiota
fXY(x, y)
TKK
(c) Ilkka Mellin (2007)
8
10
6
0
-2
4
0
2
x
2
4
6
y
0
8
-2
10
18
Kaksiulotteinen normaalijakauma
Esimerkki:
Tasa-arvoellipsien yhtälöt
•
•
•
•
TKK
Olkoon
(X, Y) ∼ N2(4, 3, 2, 1, 0.7)
Jakauman todennäköisyysmassan painopisteenä on piste
(µX, µY) = (4, 3)
Jakauman tiheysfunktion muodostaman pinnan muodon määräävät
tasa-arvoellipsit
2
2
 x − 4  y − 3
 x − 4 y − 3
2
0.7
Q ( x, y ) = 
+
−
×


 


1
1




2
2




= c (vakio)
Ellipsien keskipisteenä on jakauman todennäköisyysmassan painopiste
(µX, µY) = (4, 3)
(c) Ilkka Mellin (2007)
19
Kaksiulotteinen normaalijakauma
Esimerkki:
Kovarianssimatriisi
•
•
TKK
Olkoon
(X, Y) ∼ N2(4, 3, 2, 1, 0.7)
Tällöin satunnaismuuttujien X ja Y kovarianssimatriisi on
 σ X2 σ XY 
Σ=
2 
σ
σ
Y 
 XY
 σ X2
ρ XY σ X σ Y 
=

2
ρ
σ
σ
σ
Y
 XY X Y


2
0.7 × 2 × 1
=

1
0.7 × 2 × 1

0.9899 
 2
=

0.9899
1


(c) Ilkka Mellin (2007)
20
Kaksiulotteinen normaalijakauma
Esimerkki:
Kovarianssimatriisin pääakselihajotelma 1/6
•
TKK
Olkoon
Σ = ULU´
kovarianssimatriisin Σ pääakselihajotelma, jossa L on matriisin Σ
ominaisarvojen muodostama diagonaalimatriisi ja U on vastaavien
ominaisvektoreiden muodostama ortogonaalinen matriisi, jossa
ominaisvektorit ovat sarakkeina.
(c) Ilkka Mellin (2007)
21
Kaksiulotteinen normaalijakauma
Esimerkki:
Kovarianssimatriisin pääakselihajotelma 2/6
•
Olkoot
λ1 ≥ λ2
•
matriisin Σ ominaisarvot ja
u1 = (u11, u21)
u2 = (u21, u22)
niitä vastaavat ominaisvektorit.
Tällöin
λ 0 
u u 
L =  1  , U =  11 12 
 0 λ2 
u21 u22 
ja
U´ΣU = L
U´U = UU´ = I
TKK
(c) Ilkka Mellin (2007)
22
Kaksiulotteinen normaalijakauma
Esimerkki:
Kovarianssimatriisin pääakselihajotelma 3/6
•
•
•
Olkoon λ kovarianssimatriisin Σ ominaisarvo.
Tällöin λ toteuttaa yhtälön
σ X2 − λ σ XY 
det( Σ − λ I 2 ) = det 
2

σ
σ
Y − λ
 XY
2
= λ 2 − (σ X2 + σ Y2 )λ + σ X2 σ Y2 − σ XY
=0
Tämän 2. asteen yhtälön ratkaisut saadaan kaavasta
λ=
•
TKK
2
σ X2 + σ Y2 ± (σ X2 − σ Y2 ) 2 + 4σ XY
2
Ratkaisuiksi saadaan
λ1 = 2.6091
λ2 = 0.3909
(c) Ilkka Mellin (2007)
23
Kaksiulotteinen normaalijakauma
Esimerkki:
Kovarianssimatriisin pääakselihajotelma 4/6
•
•
•
Olkoon u = (u1, u2) kovarianssimatriisin Σ ominaisarvoa λ vastaava
ominaisvektori.
Tällöin u toteuttaa matriisiyhtälön
Σu = λu
Koska vaadimme, että
u′u = u12 + u22 = 1
niin vektori u = (u1, u2) saadaan ratkaistuksi yhtälöryhmästä
(σ X2 − λ )u1 + σ XY u2 = 0

2
σ
u
(
σ
+
 XY 1
Y − λ )u2 = 0
 2
2
u
u
+
=1
1
2

TKK
(c) Ilkka Mellin (2007)
24
Kaksiulotteinen normaalijakauma
Esimerkki:
Kovarianssimatriisin pääakselihajotelma 5/6
•
•
TKK
Ominaisarvoa
λ1 = 2.6091
vastaavaksi ominaisvektoriksi saadaan
u1 = (u11, u21) = (0.8517, 0.5240)
Ominaisarvoa
λ2 = 0.3909
vastaavaksi ominaisvektoriksi saadaan
u2 = (u21, u22) = (−0.5240, 0.8517)
(c) Ilkka Mellin (2007)
25
Kaksiulotteinen normaalijakauma
Esimerkki:
Kovarianssimatriisin pääakselihajotelma 6/6
•
Kovarianssimatriisin
0.7 2   2
0.9899 
 σ X2 σ XY   2
Σ=
=
=
2 
1 
1   0.9899
σ XY σ Y   0.7 2
pääakselihajotelmaksi
Σ = ULU´
saadaan siis
0 
λ1 0   2.6091
L=
=

0.3909 
 0 λ2   0
 u11 u12  0.8517 −0.5240 
U=
 =  0.5240 0.8517 
u
u

 21 22  
jossa L on matriisin Σ ominaisarvojen muodostama diagonaalimatriisi
ja U on vastaavien ominaisvektoreiden muodostama ortogonaalinen
matriisi, jossa ominaisvektorit ovat sarakkeina.
TKK
(c) Ilkka Mellin (2007)
26
Kaksiulotteinen normaalijakauma
Esimerkki:
Tasa-arvoellipsit ja niiden pääakselit 1/4
•
•
•
TKK
Olkoon
(X, Y) ∼ N2(4, 3, 2, 1, 0.7)
Jakauman tiheysfunktion muodostaman pinnan muodon määräävien
tasa-arvoellipsien pääakselit leikkaavat jakauman todennäköisyysmassan painopisteessä
( µ X , µY ) = (4,3)
Tasa-arvoellipsien pääakseleiden pituudet suhtautuvat toisiinsa kuten
kovarianssimatriisin Σ ominaisarvojen
λ1 = 2.6091
λ2 = 0.3909
neliöjuuret ja vastaavat ominaisvektorit määräävät pääakseleiden
suunnat.
(c) Ilkka Mellin (2007)
27
Kaksiulotteinen normaalijakauma
Esimerkki:
Tasa-arvoellipsit ja niiden pääakselit 2/4
•
Tasa-arvoellipsien pääakseleiden suuntaisten suorien yhtälöt ovat
y = a1 + b1 x
y = a2 + b2 x
jossa
b1 =
u21 0.5240
=
= 0.6152
u11 0.8517
a1 = µY − b1µ X = 3 − b1 × 4 = 0.5390
ovat suurempaa ominaisarvoa 2.6091 vastaavan, pitempään
pääakseliin liittyvän suoran kertoimet ja
u
0.8517
b2 = 22 = −
= −1.6254
u12
0.5240
a2 = µY − b2 µ X = 3 − b2 × 4 = 9.5015
ovat pienempää ominaisarvoa 0.3909 vastaavan, lyhyempään
pääakseliin liittyvän suoran kertoimet.
TKK
(c) Ilkka Mellin (2007)
28
Kaksiulotteinen normaalijakauma
Esimerkki:
Tasa-arvoellipsit ja niiden pääakselit 3/4
• Olkoon
(X, Y) ∼ N2(4, 3, 2, 1, 0.7)
jolloin
µ X = 4 σ X2 = 2
µY = 3 σ Y2 = 1
ρ XY = 0.7
• Kuva oikealla esittää jakauman
tiheysfunktion kuvaajan tasaarvoellipsejä, jotka vastaavat
(likimäärin) todennäköisyyksiä
68 %, 95 % ja 99.7 %.
Esimerkiksi uloimman ellipsin
sisään jää n. 99.7 % jakauman
todennäköisyysmassasta.
TKK
N2(4, 3, 2, 1, 0.7)
10
8
( µ X , µY )
6
4
2
0
-2
(c) Ilkka Mellin (2007)
-2
0
2
4
6
8
10
29
Kaksiulotteinen normaalijakauma
Esimerkki:
Tasa-arvoellipsit ja niiden pääakselit 4/4
• Olkoon
(X, Y) ∼ N2(4, 3, 2, 1, 0.7)
• Kuva oikealla esittää jakauman
tiheysfunktion kuvaajan tasaarvoellipsejä, jotka vastaavat
(likimäärin) todennäköisyyksiä
68 %, 95 % ja 99.7 %.
• Kuvaan on lisäksi piirretty tasaarvoellipsien pääakselien
suuntaiset suorat
y = 0.5390 + 0.6152 × x
N2(4, 3, 2, 1, 0.7)
10
8
6
4
2
0
-2
-2
0
2
4
6
8
10
y = 9.5015 − 1.6254 × x
TKK
(c) Ilkka Mellin (2007)
30
Kaksiulotteinen normaalijakauma
Reunajakaumat
• Voidaan osoittaa, että kaksiulotteisen normaalijakauman
reunajakaumat ovat normaalisia:
X ∼ N(µX, σX2)
Y ∼ N(µY, σY2)
ja niiden tiheysfunktiot ovat
2

1
 1  x − µ X  
exp − 
f X ( x) =
 
2
σ
2πσ X
 
X
 
2

1
 1  y − µY  
exp − 
fY ( y ) =
 
2
σ
2πσ Y
  Y  
TKK
(c) Ilkka Mellin (2007)
31
Kaksiulotteinen normaalijakauma
Esimerkki:
Reunajakaumat
N(4, 2)
0.5
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
0
-2
•
•
TKK
N(3, 1)
0
2
4
6
8
10
-2
0
2
4
6
8
10
Olkoon
(X, Y) ∼ N2(4, 3, 2, 1, 0.7)
Kuvat yllä esittävät satunnaismuuttujien X ja Y reunajakaumia:
X ∼ N(4, 2)
Y ∼ N(3, 1)
(c) Ilkka Mellin (2007)
32
Kaksiulotteinen normaalijakauma
Korreloimattomuus vs riippumattomuus
• Kaksiulotteisen normaalijakauman tapauksessa
satunnaismuuttujien X ja Y korreloimattomuus on
yhtäpitävää niiden riippumattomuuden kanssa.
• Huomautuksia:
–
–
TKK
Satunnaismuuttujien riippumattomuudesta seuraa aina niiden
korreloimattomuus.
Satunnaismuuttujien korreloimattomuudesta ei yleisesti seuraa
niiden riippumattomuus.
(c) Ilkka Mellin (2007)
33
Kaksiulotteinen normaalijakauma
Korreloimattomuus vs riippumattomuus:
Perustelu 1/3
•
•
•
TKK
Oletetaan, että satunnaismuuttujat X ja Y noudattavat kaksiulotteista
normaalijakaumaa:
(X, Y) ∼ N2(µX, µY, σX2, σY2, ρXY)
Jos satunnaismuuttujat X ja Y ovat riippumattomia, niin ne ovat myös
korreloimattomia, koska satunnaismuuttujien riippumattomuudesta
seuraa aina niiden korreloimattomuus; ks. lukua Moniulotteiset
satunnaismuuttujat ja jakaumat.
Oletetaan nyt, että satunnaismuuttujat X ja Y korreloimattomia eli
ρXY = 0
(c) Ilkka Mellin (2007)
34
Kaksiulotteinen normaalijakauma
Korreloimattomuus vs riippumattomuus:
Perustelu 2/3
•
Kaksiulotteisen normaalijakauman tiheysfunktio on
f XY ( x, y ) =
1
2
2πσ X σ Y 1 − ρ XY
2


1
exp −
(
,
)
Q
x
y

2
ρ
2(1
)
−


XY
2
 x − µ X   y − µY 
 x − µ X  y − µY 
+
−
ρ
2
Q ( x, y ) = 
XY 
  σ 
 σ 
σ
σ

 




X
Y
X
Y
•
TKK
Jos ρXY = 0, niin
2
2


1
 1  x − µ X   y − µY   
exp − 
f XY ( x, y ) =
+



2πσ X σ Y
2
σ X   σ Y   
 

 1  x − µ  2 
 1  y − µ  2 
1
1
X
Y
=
exp − 
exp − 
⋅

 
2
2
σ
σ
2πσ X
  2πσ Y
 
X
Y
 
 
= f X ( x ) fY ( y )
(c) Ilkka Mellin (2007)
35
Kaksiulotteinen normaalijakauma
Korreloimattomuus vs riippumattomuus:
Perustelu 3/3
•
•
TKK
Jos siis ρXY = 0, niin
f XY ( x, y ) = f X ( x) fY ( y )
jossa fX(x) ja fY(y) ovat satunnaismuuttujien X ja Y reunajakaumien
tiheysfunktiot.
Koska oletuksesta ρXY = 0 seuraa, että kaksiulotteisen
normaalijakauman tiheysfunktio voidaan esittää reunajakaumiensa
tiheysfunktioiden tulona, niin satunnaismuuttujat X ja Y ovat tällöin
rippumattomia; ks. lukua Moniulotteiset satunnaismuuttujat ja jakaumat.
(c) Ilkka Mellin (2007)
36
Kaksiulotteinen normaalijakauma
Ehdolliset jakaumat 1/2
• Kaksiulotteisen normaalijakauman ehdolliset jakaumat
ovat normaalisia:
( X Y = y ) ~ N µ X Y , σ X2 Y
jossa
σX
µ X Y = E( X Y = y ) = µ X + ρ XY
( y − µY )
(
)
σY
2
)σ X2
σ X2 Y = Var( X Y = y ) = (1 − ρ XY
TKK
(c) Ilkka Mellin (2007)
37
Kaksiulotteinen normaalijakauma
Ehdolliset jakaumat 2/2
• Kaksiulotteisen normaalijakauman ehdolliset jakaumat
ovat normaalisia:
(Y X = x) ~ N µY X , σ Y2 X
jossa
σY
µY X = E(Y X = x) = µY + ρ XY
(x − µX )
(
)
σX
2
)σ Y2
σ Y2 X = Var(Y X = x) = (1 − ρ XY
TKK
(c) Ilkka Mellin (2007)
38
Kaksiulotteinen normaalijakauma
Ehdolliset jakaumat:
Perustelu 1/4
•
•
•
TKK
Esitetään perustelu kaksiulotteisen normaalijakauman ehdollisten
jakaumien normaalisuudelle tarkastelemalla satunnaismuuttujan Y
ehdollista jakaumaa satunnaismuuttujan X suhteen (ehdolla X = x).
Olkoon
f XY ( x, y ) = satunnaismuuttujien X ja Y yhteisjakauman
tiheysfunktio
fY | X ( y | x) = satunnaismuuttujan Y ehdollisen jakauman
tiheysfunktio satunnaismuuttujan X suhteen
f X ( x)
= satunnaismuuttujan X reunajakauman tiheysfunktio
Ehdollisen jakauman tiheysfunktion määritelmän mukaan
f XY ( x, y )
fY | X ( y | x ) =
f X ( x)
(c) Ilkka Mellin (2007)
39
Kaksiulotteinen normaalijakauma
Ehdolliset jakaumat:
Perustelu 2/4
•
Kaksiulotteisen normaalijakauman tiheysfunktio f XY ( x, y ) :
f XY ( x, y ) =
1
2
2πσ X σ Y 1 − ρ XY
2


1
exp −
(
,
)
Q
x
y

2
ρ
2(1
)
−


XY
2
 x − µ X   y − µY 
 x − µ X  y − µY 
+
− 2 ρ XY 
Q ( x, y ) = 


 σ 
σ
σ
σ

 




X
Y
X
Y
•
TKK
Satunnaismuuttujan X reunajakauman tiheysfunktio f X ( x) :
2

1
 1  x − µ X  
f X ( x) =
exp − 
 
σ
2
2πσ X
 
X
 
(c) Ilkka Mellin (2007)
40
Kaksiulotteinen normaalijakauma
Ehdolliset jakaumat:
Perustelu 3/4
•
Nähdään (melko) helposti, että
f ( x, y )
fY | X ( y | x) = XY
f X ( x)
=


1
exp − 2
Q( y | x) 
2
2
2
2πσ Y (1 − ρ XY )
 2σ Y (1 − ρ XY )

1


σ
Q( y | x) =  y − µ y − ρ XY Y ( x − µ X ) 
σX


TKK
(c) Ilkka Mellin (2007)
2
41
Kaksiulotteinen normaalijakauma
Ehdolliset jakaumat:
Perustelu 4/4
•
Siten satunnaismuuttujan Y ehdollinen jakauma satunnaismuuttujan X
suhteen (ehdolla X = x) on normaalinen:
(Y X = x) ~ N( µY X , σ Y2 X )
jossa
σ
µY X = E(Y X = x) = µY + ρ XY Y ( x − µ X )
σX
2
)σ Y2
σ Y2 X = Var(Y X = x) = (1 − ρ XY
TKK
(c) Ilkka Mellin (2007)
42
Kaksiulotteinen normaalijakauma
Ehdolliset odotusarvot
• Satunnaismuuttujan X ehdollinen odotusarvo eli
regressiofunktio satunnaismuuttujan Y suhteen
E( X Y = y ) = µ X + ρ XY
σX
( y − µY )
σY
on lineaarinen satunnaismuuttujan Y arvojen y suhteen.
• Satunnaismuuttujan Y ehdollinen odotusarvo eli
regressiofunktio satunnaismuuttujan X suhteen
σY
E(Y X = x) = µY + ρ XY
(x − µX )
σX
on lineaarinen satunnaismuuttujan X arvojen x suhteen.
TKK
(c) Ilkka Mellin (2007)
43
Kaksiulotteinen normaalijakauma
Regressiosuorat
• Kaksiulotteisen multinormaalijakauman regressiokäyrät
ovat suoria, joiden yhtälöt voidaan kirjoittaa satunnaismuuttujan X saamien arvojen x funktioina seuraaviin
muotoihin:
(i) x:n regressiosuora y:n suhteen:
1 σY
(x − µX )
y = µY +
×
ρ XY σ X
(ii) y:n regressiosuora x:n suhteen:
σY
y = µY + ρ XY
(x − µX )
σX
TKK
(c) Ilkka Mellin (2007)
44
Kaksiulotteinen normaalijakauma
Regressiosuorien ominaisuudet 1/5
• Olkoon
y = µY +
1
ρ XY
×
σY
(x − µX )
σX
x:n regressiosuora y:n suhteen ja
σY
y = µY + ρ XY
(x − µX )
σX
y:n regressiosuora x:n suhteen.
TKK
(c) Ilkka Mellin (2007)
45
Kaksiulotteinen normaalijakauma
Regressiosuorien ominaisuudet 2/5
• Regressiosuorilla on seuraavat ominaisuudet:
(i) Molemmat regressiosuorat kulkevat jakauman
todennäköisyysmassan painopisteen (µX, µY) kautta.
(ii) Molempien regressiosuorien kulmakertoimilla ja
satunnaismuuttujien X ja Y korrelaatiokertoimella
ρXY on aina sama merkki:
− Suorat ovat nousevia, jos ρXY > 0.
− Suorat ovat laskevia, jos ρXY < 0.
(iii) x:n regressiosuora y:n suhteen on aina jyrkempi kuin
y:n regressiosuora x:n suhteen, koska
2
ρ XY
≤1
TKK
(c) Ilkka Mellin (2007)
46
Kaksiulotteinen normaalijakauma
Regressiosuorien ominaisuudet 3/5
(iv) x:n regressiosuora y:n suhteen on sitä loivempi mitä
voimakkaammin satunnaismuuttujat X ja Y ovat
korreloituneita eli mitä suurempi on
|ρXY|
(v) y:n regressiosuora x:n suhteen on sitä jyrkempi mitä
voimakkaammin satunnaismuuttujat X ja Y ovat
korreloituneita eli mitä suurempi on
|ρXY|
TKK
(c) Ilkka Mellin (2007)
47
Kaksiulotteinen normaalijakauma
Regressiosuorien ominaisuudet 4/5
(vii) Molemmat regressiosuorat ovat sitä jyrkempiä mitä
pienempi on satunnaismuuttujan X varianssi
σ X2
(vi) Molemmat regressiosuorat ovat sitä jyrkempiä mitä
suurempi on satunnaismuuttujan Y varianssi
σ Y2
(viii) Regressiosuorat yhtyvät täsmälleen silloin, kun
ρ = ±1
TKK
(c) Ilkka Mellin (2007)
48
Kaksiulotteinen normaalijakauma
Regressiosuorien ominaisuudet 5/5
(ix) Jos ρ = 0, niin regressiosuorat ovat kohtisuorassa
toisiaan vastaan ja x:n regressiosuora y:n suhteen on
x = µX
ja y:n regressiosuora x:n suhteen on
y = µY
jolloin x:n saamat arvot eivät riipu y:n saamista
arvoista ja y:n saamat arvot eivät riipu x:n saamista
arvoista.
TKK
(c) Ilkka Mellin (2007)
49
Kaksiulotteinen normaalijakauma
Esimerkki:
Regressiosuorat 1/2
•
•
Olkoon
(X, Y) ∼ N2(4, 3, 2, 1, 0.7)
x:n regressiosuora muuttujan y suhteen on
1 σY
y = µY +
×
(x − µX )
ρ XY σ X
1
1
×
( x − 4) = −1.0406 + 1.0101x
0.7
2
y:n regressiosuora muuttujan x suhteen on
= 3+
•
y = µY + ρ XY
= 3 + 0.7
TKK
σY
(x − µX )
σX
1
( x − 4) = 1.0201 + 0.4950 x
2
(c) Ilkka Mellin (2007)
50
Kaksiulotteinen normaalijakauma
Esimerkki:
Regressiosuorat 2/2
• Olkoon
(X, Y) ∼ N2(4, 3, 2, 1, 0.7)
• Kuva oikealla esittää jakauman
tiheysfunktion kuvaajan tasaarvoellipsejä, jotka vastaavat
(likimäärin) todennäköisyyksiä
68 %, 95 % ja 99.7 %.
• Kuvan suorista jyrkempi
y = −1.0406 + 1.0101× x
on x:n regressiosuora y:n suhteen
ja suorista loivempi
y = 1.0201 + 0.4950 × x
on y:n regressiosuora x:n suhteen.
TKK
N2(4, 3, 2, 1, 0.7)
10
8
6
4
2
0
-2
(c) Ilkka Mellin (2007)
-2
0
2
4
6
8
10
51
Kaksiulotteinen normaalijakauma
Regressiosuorat ja standardointi
• Regressiosuorat voidaan kirjoittaa standardoitujen
muuttujien
x′ =
x − µX
σX
y′ =
y − µY
σY
funktioina seuraaviin muotoihin:
1
′
y =
x′
x:n regressiosuora y:n suhteen
ρ XY
y′ = ρ XY x′
y:n regressiosuora x:n suhteen
• Standardoitujen muuttujien välisten regressiosuorien
kulmakertoimet ovat siis toistensa käänteislukuja.
TKK
(c) Ilkka Mellin (2007)
52
Kaksiulotteinen normaalijakauma
Ehdolliset varianssit 1/2
• Satunnaismuuttujan X ehdollinen varianssi
satunnaismuuttujan Y suhteen on korkeintaan yhtä suuri
kuin satunnaismuuttujan X varianssi:
2
0 ≤ σ X2 Y = (1 − ρ XY
)σ X2 ≤ σ X2
• Jos siis ρXY ≠ 0, niin satunnaismuuttujan X ehdollinen
jakauma satunnaismuuttujan Y suhteen vaihtelee x:n
regressiosuoran ympärillä vähemmän kuin satunnaismuuttuja X oman painopisteensä ympärillä.
• Lisäksi pätee, että
σ X2 Y = 0 ⇔ ρ XY = ±1
σ X2 Y = σ X2
TKK
⇔
ρ XY = 0
(c) Ilkka Mellin (2007)
53
Kaksiulotteinen normaalijakauma
Ehdolliset varianssit 2/2
• Satunnaismuuttujan Y ehdollinen varianssi
satunnaismuuttujan X suhteen on korkeintaan yhtä suuri
kuin satunnaismuuttujan Y varianssi:
2
0 ≤ σ Y2| X = (1 − ρ XY
)σ Y2 ≤ σ Y2
• Jos siis ρXY ≠ 0, niin satunnaismuuttujan Y ehdollinen
jakauma satunnaismuuttujan X suhteen vaihtelee y:n
regressiosuoran ympärillä vähemmän kuin satunnaismuuttuja Y oman painopisteensä ympärillä.
• Lisäksi pätee, että
σ Y2 X = 0 ⇔ ρ XY = ±1
σ Y2 X = σ Y2 ⇔ ρ XY = 0
TKK
(c) Ilkka Mellin (2007)
54
Kaksiulotteinen normaalijakauma
Ehdolliset varianssit:
Kommentti
• Satunnaismuuttujan X ehdollisen varianssin kaavasta
2
σ X2 |Y = (1 − ρ XY
)σ X2
ja satunnaismuuttujan Y ehdollisen varianssin kaavasta
2
σ Y2| X = (1 − ρ XY
)σ Y2
nähdään välittömästi, että kumpikaan ehdollisista
variansseista ei riipu ehtomuuttujan arvoista.
• Siten kaksiulotteisen normaalijakauman kummankaan
ehdollisen jakauman todennäköisyysmassan vaihtelu
vastaavan regressiosuoran ympärillä ei riipu ehtomuuttujan arvoista.
TKK
(c) Ilkka Mellin (2007)
55
Kaksiulotteinen normaalijakauma
Esimerkki:
Ehdolliset varianssit
•
•
•
TKK
Olkoon
(X, Y) ~ N2(4, 3, 2, 1, 0.7)
Satunnaismuuttujan X ehdollinen varianssi satunnaismuuttujan Y
suhteen on
2
0 ≤ σ X2 Y = (1 − ρ XY
)σ X2 = (1 − 0.7 2 ) × 2 = 1.02 ≤ 2 = σ X2
Satunnaismuuttujan Y ehdollinen varianssi satunnaismuuttujan X
suhteen on
2
0 ≤ σ Y2 X = (1 − ρ XY
)σ Y2 = (1 − 0.7 2 ) × 1 = 0.51 ≤ 1 = σ Y2
(c) Ilkka Mellin (2007)
56