Download Report

1
Biometrija
Poglavje 1
MATRIČNI ZAPIS MODELA IN OSNOVE MATRIČNE
OPERACIJE
1.1
Skalar
Skalar je matrika reda 1 x 1. Skalarji so označeni z malimi ali velikimi navadnimi (neodebeljene) črkami
kot npr. yi j (odvisna slučajna spremenljivka), ai jk (vpliv živali kot naključni vpliv), βi (eden od nivojev pri
sistematskemu vplivu), b (regresijski koeficient), xi jk (neodvisna spremenljivka), xi j (element v matriki
X) ali c (konstanta). V oklepaju je omenjena ena od možnosti, ki jih bomo srečali pri biometriji. Oznaka
skalarja ni dovolj, da bi vedno prepoznali njegovo vlogo. Pomembno je, da so uporabljene oznake
obrazložene v vsakem primeru posebej, čeprav lahko pri običajnih, pogostih primerih o pomenu skoraj
zanesljivo sklepamo.
1.2
Vektor
Definicija: Vektor je polje števil ali simbolov urejenih samo v eno vrstico in en stolpec.
Vektorji so matrike, ki imajo eno samo vrstico (vrstični vektorji) oziroma en stolpec (stolpični vektor).
Pisali jih bomo z malimi odebeljenimi črkami npr. y, u, a, x ali β. Tako bomo označili stolpične vektorje.
Vrstični vektorji so pravzaprav transponirani stolpični vektorji (glej tudi 1.3.1) in jih bomo označili y0 ,
u0 , a0 , x0 ali β0 ali yT , uT , aT , xT ali βT . Tam, kjer ne moremo uporabiti odebeljenih črk, uporabljamo
lahko navadno pisavo, vektor pa podčrtamo z znakom ~, npr. y.
1.3
Matrika
Definicija: Matrika je polje števil ali simbolov urejenih v vrstice in stolpce.
Označevali jih bomo z velikimi, odebeljenimi črkami kot npr. X (matrika dogodkov za sistematske
vplive), Q (matrika kvadratne oblike), A (matrika sorodstva), V fenotipskih matrika varianc in kovarianc.
To je le nekaj matrik, ki bodo imele pri biometriji poseben pomen. Z oznakami A, B ali X pa lahko
enostavno mislimo samo na matrike brey posebnega pomena. Tako kot pri vektorjih je tudi pri matrikah
pomemben opis, kaj matrika predstavlja. Tam, kjer ne moremo uporabiti odebeljenih črk, uporabljamo
lahko navadno pisavo, oznako za matriko pa podčrtamo z znakom ~.
Matrika A na sliki 1.1 ima dve vrstici in štiri stolpce. Vsebuje torej osem elementov. Matrika ima svoje
elemente razvrščene v stolpce in vrstice.



C=


c11 c12 · · · c1c
c21 c22 · · · c2c 

..
.. . .
.. 
. . 
.
.
cr1 cr2 · · · crc
B=
b11 b12 b13 b14
b21 b22 b23 b24
[1.1]
Matrika C ima r vrstic in c stolpcev (primer 1.1). Število vrstic in stolpcev določata red matrike. Red
matrike C je r x c. Red matrike B je 2 x 4. Če želimo red matrike, ga navedemo v indeksu matrike (1.2).
A2x4 , Crxc , B2x4
[1.2]
2
Biometrija
A
é2 3 5 1 ù
= ê1 1 9 7 ú
ë
û
stolpci
vrstici
element matrike
2
3
Biometrija
Pri kvadratnih matrikah (glej 1.3.1) lahko navedemo samo eno vrednost. Matrika V (1.3) je matrika
fenotipskih varianc in kovarianc, zato je kvadratna. Ima 10 vrstic in 10 stolpcev.
V10
[1.3]
Posamezna
števila ali simboli so elementi matrike. Elemente matrike bomo poimenovali z malimi črkami
bi j . Indeksa i in j določata vrstico in stolpec, katerima element pripada. Prvi indeks označuje vrstico,
drugi stolpec brez ozira na črko.
Pri matrikah določamo tudi rang matrike: število neodvisnih vrstic in stolpcev.
1.3.1
Posebne matrike
a) Kvadratne matrike
(primer 1.4) imajo toliko vrstic kot stolpcev.


5 1 2
 3 8 4 
0 2 7
[1.4]
b) Simetrične matrike
(primer 1.5) so kvadratne matrike, za katere velja ai j = a ji .


5 1 2
 1 8 4 
2 4 7
[1.5]
c) Diagonalne matrike (primer 1.6) so simetrične matrike, ki imajo od 0 različne elemente samo na
diagonali. Vsi nediagonalni elementi enake 0.

5 0 0
D= 0 8 0 
0 0 7

[1.6]
Diagonalno matriko lahko zapišemo tudi v obliki iz enačbe 1.7.
D = {dii }
[1.7]
č) Identična matrika (primer 1.8) je diagonalna matrika, pri kateri so vsi diagonalni elementi enaki 1.
Označimo jo z I, praviloma moramo omeniti oziroma določiti tudi red matrike.


1 0 0
I= 0 1 0 
0 0 1
[1.8]
d) Ničelna matrika ima vse elemente enake 0. Označimo jo z 0, praviloma moramo določiti tudi red
matrike.
0=
0 0 0 0
0 0 0 0
[1.9]
3
4
Biometrija
e) Blok-diagonalna matrika je matrika, ki imajo vzdolž diagonale nanizane matrike. Poglejmo si matriko R iz enačbe 1.10. Na diagonali imamo varianci za dve lastnosti, ki se izmenično izmenjujeta. Večina
nediagonalnih elementov je enaka 0, samo med dvema zaporednima vrsticama je nakazana kovarianca
za ostanek med obema lastnostima (σe1 e2 ). V nadaljevanju bomo nekoliko poenostavili poimenovanje za
kovarianco (σe12 ). Obe oznaki jo zadostno opišeta.
σ2e1
 σe1 e2




R=




σe1 e2
σ2e2


σ2e1
σe1 e2
σ2e2
σe1 e2
..
.
σ2e1
σe1 e2
σe1 e2
σ2e2





=




[1.10]
Zamenjajmo torej zaradi enostavnosti oznako in poudarimo diagonalne matrike. Mala diagonalna matrika ima dve vrstici in dva stolpca. Je kvadratna in simetrična. Vsebuje 3 komponente kovariance.
Matriko bomo poimenovali R0 . Vsebuje varianco za prv0 in drugo lastnost ter kovarianco, če sta meritvi
opravljeni na isti živali.
 




=




σ2e1
σe12
σe12
σ2e2

σ2e1
R↑0 →
σe12
σe12
σ2e2
←↓ R0
..
.
σ2e1
σe12
σe12
σ2e2










[1.11]
Zaradi preglednosti lahko matriko 1.12 prepišemo tako, da namesto diagonalnih blokov navedemo kar
matriko R0 .



=


R0
R0
..




.
[1.12]
R0
f) Transponirana matrika A0 (1.13) ima za stolpce vrstice iz matrike A. Za oznako transponirano
uporabljamo tudi črko T v eksponentu (AT ).

2 3 5 1
1 1 9 7
T
2
 3
=
 5
1

1
1 

9 
7
[1.13]
g) Idempotentna matrika M je kvadratna in za njo velja M2 = M. Idepotentne matrike bomo omenjali pri kvadratnih oblikah, ki nam predstavlljajo vsote kvadratov.
4
5
Biometrija
h) Delne matrike (ang. submatrix). Matriko razcepimo na manjše matrike. Običajno to naredimo
glede na strukturo matrik. Kasneje bomo spoznali zanimive matrike, kamor urejujemo informacije iz
podatkov in porekla. Delitev matrik lahko nakažemo s pikčastimi črtami.
A B
C D
[1.14]
Kot primer navajamo matriko koeficientov (1.15) iz enačb mešanega modela. V zgornjem levem kotu so
zbrane informacije o sistematskem delu modela (X0 X), v spodnjem desnem kotu bom našli naključni del
(Z0 Z + Iσ2e σa−2 ), nediagonalna dela (X0 Z in Z0 X) pa povezujeta sistematski in naključni del. Pri našem
delu bomo razčlenitev opravili predvsem zaradi preglednosti, čeprav je bolj pomembna pri izpeljavi
posameznih enačb ali pri dokazih.
X0 X
Z0 X
X0 Z
0
Z Z + Iσ2e σ−2
a
[1.15]
i) Trikotna matrika je kvadratna in ima od nič različne nediagonalne elemente samo nad ali pod
diagonalo. Tako ločimo spodnjo trikotno matriko (ang. lower triangular matrix, 1.16) in zgornjo trikotno
matriko (ang. upper triangular matrix, 1.17).


2
 1 1

−1 2 3
[1.16]

2 1 −1

1 2 
3
[1.17]

j) Pozitivno definitne matrike so kvadratne, simetrične in imajo dominantno diagonalo. S Cholesky
razčlevitvijo (ang. Cholesky decomposition) najdemo tako spodnjo trikotno matriko L, da je njen produkt s transponirano mariko L0 pozitivno definitna matrika A (ang. positive definit matrix). Diagonalni
elementi v matriki L so pozitivni in večji od nič.
A = LL0
[1.18]

 


4 2 −2
2
2 1 −1
 2 2 1 = 1 1

1 2 
−2 1 14
−1 2 3
3
[1.19]
Vse matrike varianc in kovarianc morajo biti pozitivno definitne. Na diagonali so variance, na nediagonalnih elementih pa kovariance. Vzemimo, da je matrika A reda 1 x 1, torej je le skalar. V tem primeru
je edini element v matriki A varianca σ2 , element v matriki L pa standardni odklon σ.
k) Semi-pozitivno definitne matrike so zelo podobne pozitivno definitnim matrikam, le v matriki L
je na diagonali dovoljena tudi vrednost 0.

 


4 2 −2
2
2 1 −1
 2 2 1 = 1 1

1 2 
−2 1 5
−1 2 0
0
5
[1.20]
6
Biometrija
1.4
Seštevanje matrik in vektorjev
Definicija:
A pxq + B pxq = C pxq
[1.21]
ci j = ai j + bi j
[1.22]
Matrike, ki jih seštevamo, morajo imeti isto število vrstic in isto število stolpcev. Vsoto matrik dobimo
tako, da seštevamo istoležne elemente. Rezultat je istega reda kot matrike, ki jih seštevamo.

 
 
 
5 0
1+4 0+0
4
0
1 0
 −1 2  +  2
1  =  −1 + 2 2 + 1  =  1 3 
1 3
3−2 4−1
−2 −1
3 4

[1.23]
Osnovna pravila
1.5
MNOŽENJE MATRIK
Definicija:
A pxq ∗ Bqxr = C pxr
[1.24]
Matriki A in B iz enačbe pomnožimo tako, da pomnožimo i-to vrstico matrike A z j-ti stolpcem matrike
B ter produkte posameznih parov seštejemo. Tako dobimo vrednost elementa na presečišču i-te vrstice
in j-tega stolpca matrike C.
cik =
q
X
ai j ∗ b jk
[1.25]
j=1
Prva matrika mora zato imeti toliko v stolpcev kot druga matrika vrstic



2 0 −1 2
1 0
2 0 −1 2
 −1 2  ∗
=  −4 6 1 2 
−1 3 0 2 2x4
2 12 −3 14 3x4
3 4 3x2

[1.26]
Osnovna pravila
1.6
OPIS MODELA V MATRIČNI OBLIKI
Modele v matrični obliki bomo srečali v literaturi, ki opisuje obdelavo podatkov pri selekciji živali in
uravnavanju reje. Kot bomo kasneje videli, so zeli splošni in povedo sami zase brez dobrega dodatnega
opisa zelo malo o strukturi podatkov. Lahko so dodatno opremljeni z modelom v skalarni obliki. Ker pa
so splošni, so zelo primerni za prikaz metod, uporabljenih za reševanje sistemov enačb. Model v matrični
obliki si oglejmo najprej kar na primeru.
PRIMER: Vzemimo podatke iz tabele ?? in uporabimo naslednja modela v skalarni obliki in sicer za
dnevni prirast (1.27) in debelino hrbtne slanine (1.28):
yi jkl = µ + Pi + M j + Fk + ai jkl + ei jkl
[1.27]
yi jklm = µ + Pi + M j + Fk + bi xi jkl − x̄ + ai jkl + ei jklm
[1.28]
6
7
Biometrija
Model za dnevni prirast smo predstavili v enačbah1.29 in 1.30. Če bi obravnavali le eno lastnost, potem
je lahko enačba povsem brez indeksov. Ker pa sta si modela za dnevni prirast in debelino tako zelo
podobna, pa jih moramo ločiti z dodatnimi indeksi. Za indeks lahko uporabimo številko ali črko.
y1 = X1 β1 + Z1 u1 + e1
[1.29]
yD = XD βD + ZD uD + eD
[1.30]
kjer pomeni:
y1 , y D
- vektor opazovanj ali meritev (ang. observations) za dnevni prirast
X1 , XD
- matrike dogodkov (ang. incidence matrix) za sistematske vplive (ang. fixed effects)
Z1 , ZD
- matrika dogodkov za naključne vplive (ang. random effects)
β1 , βD
- vektor parametrov za sistematske vplive (ang. vector of parameters)
u1 , uD
- vektor naključnih vplivov
e1 , e D -
vektor ostankov (residual).
Sedaj ne bo težko napisati model še za debelino hrbtne slanine. V enačbi 1.31 smo za indeks uporabili
številko 2, ki bo opozoril, da gre za drugo lastnost. Da bi se spomnili, da delamo s slanino, pa smo v
enačbi 1.32 raje uporabili črko S.
y2 = X2 β2 + Z2 u2 + e2
[1.31]
yS = XS βS + ZS uS + eS
[1.32]
kjer pomeni:
y2 , yS
- vektor opazovanj ali meritev za debelino hrbtne slanine
X2 , XS
- matrike dogodkov za sistematske vplive
Z2 , ZS
- matrika dogodkov za naključne vplive
β2 , βS
- vektor parametrov za sistematskih vplivov
u2 , uS
- vektor naključnih vplivov
e2 , eS -
vektor ostankov.
Do sedaj smo obdelali posebej dnevni prirast in nato še debelino hrbtne slanine. Uporabili smo enolastnostno analizo. Kot vir informacij smo uporabili samo moreritve za lastnost in poreklo. Nismo pa
upoštevali, da sta lastnosti sicer povezani.
Z večlastnostnimi analizami se ne bomo preveč ukvarjali. Omenili jih bomo le toliko, da bomo vedeli,
da obstajajo in se predstavljali, kaj se pri njih dogaja. Proces pri reševanju sistemov enačb je povsem
enak procesu, ko delamo z eno lastnostjo.
Oba modela lahko sestavimo na način prikazan v (1.33) in zapišemo poenostavljeno kar v obliki prikazani v (1.34). Slednja oblika je praktična za izpeljavo metode, ne pove pa dosti o poizkusu. Tudi, ko
7
8
Biometrija
se odločimo za matrično obliko zapisa modela, moramo navajati skalarno obliko enačb. Pričakovane
vrednosti, strukturo varianc in kovarianc ter morebitne predpostavke pa prikažemo kar z matrikami.
y=
y1
y2
=
X1 β1
0
0
X2 β2
+
Z1 u1
0
0
Z2 u2
+
e1
e2
y = Xβ + Zu + e
[1.33]
[1.34]
kjer pomeni:
y
- vektor opazovanj ali meritev za obe lastnosti
X
- matrike dogodkov (ang. incidence matrix) za sistematske vplive (ang. fixed effects)
Z
- matrika dogodkov za naključne vplive (ang. random effects)
β
- vektor parametrov za sistematskih vplivov
u
- vektor naključnih vplivov (žival)
e
- vektor ostankov (residual)
Seznanimo se najprej z vsebino matrik in vektorjev v modelih.
1.6.1
Vektorji opazovanj in vektorji parametrov
Vektor opazovanj je stolpični vektor, ki ima toliko vrstic, kot smo opravili meritev za opazovano lastnost.
Kot primer bomo obdelali podatke o preizkusu mladic v pogojih reje iz tabele ??. V našem primeru smo
za dnevni prirast opravili 11 meritev in jih uvrstili v vektor y1 (ali yD ), pri debelini hrbtne slanine pa
22. Vrstni red navajanja podatkov je poljuben, vendar pa, ko ga enkrat izberemo, je sistem definiran in
ga ne smemo v naslednjih postopkih menjati. Vektorja y2 in y∗2 (oziroma yS in y∗S ) za debelino hrbtne
slanine vsebujeta iste meritve razporejene različno. Kljub temu, da vektorja nista enaka, pričakujemo
8
9
Biometrija
iste rešitve. Razporeditev rešitev pa bo odvisna od vrstnega reda parametrov.



506

 550 




 532 




 577 




 512 










499 


12
12

 466 



 15 
 13 







545



 15 
 15 







549



 14 
 14 







600



 19 
 15 







610



 23 
 16 










 12 
506
 26 
 14 





 550 





15


 25 
 12 





 532 





15 


 21 
 19 




 577 



 14 


 22 
 17 












19
512











 23  ∗  23 
∗


y1 =  499  y2 = 
 y2 = 
 y =  23  y = 



 13 
 24 

 26 


 466 







 14 
 26 

 25 


 545 







 16 
 24 





 549 


21





 12 
 25 







 600 
22



 17 
 27 







23
610



 24 
 21 







13



 24 
 19 







14



 27 
 22 







16



 19 
 23 










12
 23 
 23 




 17 



15
15

 24 




 24 




 27 




 19 




 23 
15
506
12
13
550
15
14
532
15
16
577
14
12
512
19
17
499
23
24
466
26
24
545
25
27
549
21
19
600
22
23
610
23
15
































































[1.35]
Zadnja dva vektorja y in y∗vključujeta vse meritve za obe lastnosti. Oba vektorja imata natanko 33
opazovanj, razlikujeta pa se le v vrstnem redu opazovanj.
Vektorji β1 , β2 , βD , βS in β vključujejo vse sistematske vplive. Ker sta modela za dnevni prirast in
debelino hrbtne slanine podobna, je seznam parametrov podoben, le pri slanini je dodana neodvisna
spremenljivka masa in odgovarjajoči regresijski koeficient bi kot parameter.
Vektor parametrov za sistematske vplive pri dnevnem prirastu lahko predstavljata bodisi enačba 1.36
bodisi enačba 1.37.
h
i
β01 = µ1 ... P11 P12 P13 ... M11 M12 ... F11 F12 F13
[1.36]
h
i
β0D = µD ... PD1 PD2 PD3 ... MD1 MD2 ... F D1 F D2 F D3
[1.37]
Sedaj pa sestavimo še vektor parametrov za debelino hrbtne slanine. Tudi tu lahko izberemo varianto, ko
lastnost označimo s številko (enačba 1.38) ali črko (enačba 1.39). Praviloma se odločimo samo za eno
varianto in se je vseskozi tudi držimo.
h
i
β02 = µ2 ... P21 P22 P23 ... M21 M22 ... F21 F22 F23 ... b21 b22 b23
[1.38]
9
10
β0S =
Biometrija
h
µS
..
.
. PS 1 PS 2 PS 3 .. MS 1
MS 2
..
.
. FS 1 FS 2 FS 3 .. bS 1 bS 2 bS 3
i
[1.39]
Parametri niso isti pri različnih lastnostih, saj pričakujemo pri vsaki lastnosti drugačne rešitve (ocene
oz. napovedi). Ne glede na to, ali sta modela enaka ali različna, potrebujemo za vsako lastnost druge
parametre. Vzemimo za primer samo srednjo vrednost µ. Izračunati moramo dve srednji vrednosti: eno
za srednjo vrednost za dnevni prirast µD in eno za debelino hrbtne slanine µS . Skupen rezultat ne bi imel
nobenega pomena, sicer pa tako in tako ne moramo šestevati vrednosti za dnevni prirast (v g/dan) in
vrednosti za debelino hrbtne slanine (v mm).
Ponovitve pri debelini slanine smo opravljali le z namenom, da izboljšamo zanesljivost meritev, saj
meritev slanine z ultrazvokom ni dovolj zanesljiva. Ponovitve tako ne vplivajo na število parametrov, ki
jih želimo oceniti. Seveda pa to velja za ponovitve, ki jih lahko razglasimo kot paralelke.
Drugače je v primeru, ko so meritve na isti živali (ali drugi opazovani enoti) opravljene v različnih časovnih razmikih, včasih tudi v različnem okolju. Kot primer naj navedemo analizo vzorcev mleka pri
posameznih kontrolah, v različnih laktacijah, velikost gnezda pri posameznih kotitvah, tehtanja odraslih živali v različnih časovnih razmikih, lahko pa so to tudi rezultati kemičnih analiz, ko proučujemo
zanesljivost metode. Tudi meritve debeline hrbtne slanine, merjene pri različnih masah, bi sodile v ta
sklop. Meritve niso paralelke in enakovredne. Pri takih meritvah nas zanima ponovljivost, zato v model
vključimo dodatni vpliv, ki ocenjuje skupno okolje, ki je meritvam na eni živali oz. kaki drugi opazovani
enoti skupen. Število nivojev pri takem vplivu je običajno veliko, za vsako žival vsaj eno. V primeru
meritev lastnosti mleka pa ločimo dve skupni okolji. Najprej je eno okolje, ki je skupno vsem meritvam
pri samici (kravi, ovci, kozi...), in ga imenujemo kar permanentno okolje, saj traja vse življenje. Drugi
del skupnega okolja pa je vezan na eno laktacijo: meritve znotraj laktacije so bolj primerljive, podobne,
kot meritve med laktacijami. Imenujemo ga kar skupno okolje (v laktaciji). Nivojev pri tem vplivu pa je
celo več: pri vsaki živali za vsako laktacijo eden. Torej jih je za eno žival toliko, kot ima žival laktacij.
Pri speciesih z več mladiči v gnezdu (drobnica, prašiči, kunci...) predstavlja skupno okolje za velikost
gnezda pri samici okolje, ki ga samica nudi vsem svojim potomcem. Lastnosti, ki bi podrobno opisovale
to okolje, praviloma ne moremo zmeriti. Predstavljajo pa tako imenovane materinske lastnosti, kot npr.
mlečnost pri samicah, obnašanje matere (agresivnost, nerodnost, požrtvovalnost....), pa tudi nekatere
železne navade rejca, ki povzročajo razlike med samicami. Trajne posledice za plodnost pa imajo le tisti
vplivi, ki so kreirali razvoj samice, torej okolje iz njene mladosti. Če so bili pogoji v mladosti optimalni,
bodo tudi proizvodni rezultati lahko optimalni. Na te, materinske lastnosti vpliva lahko tako genotip
(maternalni genetski vplivi) kot okolje (permanentno okolje).
V vektorjih naključnih vplivov u1 (1.40), uD (1.41), u2 (1.42), uS (1.43) in u(1.44) so nanizani naključni
vplivi, kot npr. aditivni genetski vpliv, pogosto imenovan kar preprosto “žival”. Tako smo posamene
elemente vektorjev označili kar s črkami a, ki nas spominjajo na aditivni genetski vpliv. Meritve smo
opravili na enajstih živalih, sorodstva pa pri njih nismo poznali.
u01 = a11 a12 a13 a14 a15 a16 a17 a18 a19 a110 a111
[1.40]
u0D = aD1 aD2 aD3 aD4 aD5 aD6 aD7 aD8 aD9 aD10 aD11
[1.41]
u02 = a21 a22 a23 a24 a25 a26 a27 a28 a29 a210 a211
[1.42]
u0B = aB1 aB2 aB3 aB4 aB5 aB6 aB7 aB8 aB9 aB10 aB11
[1.43]
[1.44]
u0 = u01 u02
V primeru, da imamo še dodatne živali iz porekla, za katere bi tudi radi napovedali plemensko vrednost
(aditivni genetski vpliv), živali vstavimo v vektor. V našem primeru bomo 4 prednike živali v poskusu
dodali na konec vektorja. Prikazali bomo le vektor u01 (1.45), ostali se prav tako ustrezno podaljšajo.
u01 = a11 a12 a13 a14 a15 a16 a17 a18 a19 a110 a111 a112 a113 a114 a115 [1.45]
10
11
Biometrija
1.6.2
Matrike dogodkov
Z matrikami dogodkov poskus natanko opišemo.
Vse živali pripadajo celotnemu vzorcu in bodo pri oceni “enakopravno” sodelovale.
Za sistematske vplive
Matriko dogodkov za sistematske vplive X1 za dnevni prirast nastavimo tako, da pred matriko nastavimo
vektor opazovanj y1 , da si s tem pomagamo pri nastavljanju vrstic. Nad stolpce pa si lahko napišemo
vektor parametrov β01 . Če parameter, ki označuje stolpec, prisostvuje pri meritvi, ki jo v dani vrstici
opisujemo, napišemo vrednost 1, v obratnem primeru pa 0.
0
 β1
506
 550

 532

 577


 512
y1 → 
 499

 466

 545

 549

 600
610
 →


















µ1  P11 P12
1
1
 1
1

 1
1

 1
1


1
0


0
 1

0
 1

 1
0

 1
0

 1
0
1
0
P13
0 0
0 0
0 0
0 0
1 0
1 0
1 0
0 1
0 1
0 1
0 1
M11
1
1
0
0
1
0
0
1
1
0
0
M12
0
0
1
1
0
1
1
0
0
1
1
F11 F12  F13
1 0 0
0 1 0 

0 0 1 

1 0 0 


0 1 0 

0 1 0 

0 0 1 

1 0 0 

0 0 1 

0 0 1 
0 1 0
← X1
[1.46]
Tudi pri debelini hrbtne slanine ravnamo enako. Le pri regresijskih koeficientih vpišemo vrednost neodvisne spremenljivke x. Če model tako zahteva, jo korigiramo na konstantno vrednost ali povprečje.

µ
2
















































































β02





















y2 → 



















→
12
15
15
14
19
23
26
25
21
22
23
13
14
16
12
17
24
24
27
19
23
15
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
P21 P22
1 0
1 0
1 0
1 0
0 1
0 1
0 1
0 0
0 0
0 0
0 0
1 0
1 0
1 0
1 0
0 1
0 1
0 1
0 0
0 0
0 0
0 0
P23
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
1
1
1
1
11
M21 M22
1 0
1
1 0
0
0 1
0
0 1
1
1 0
0
0 1
0
0 1
0
1 0
1
1 0
0
0 1
0
0 1
0
1 0
1
1 0
0
0 1
0
0 1
1
1 0
0
0 1
0
0 1
0
1 0
1
1 0
0
0 1
0
0 1
0
F21 F22 F23
b21 b22 b23

0 0
2.
0
0
1 0
−2. 0
0 

0 1
5.
0
0 

0 0
3.
0
0 

1 0
0 −4. 0 

1 0
0
1.
0 

0 1
0
3.
0 

0 0
0
0 −1. 

0 1
0
0
0. 

0 1
0
0 −3. 


1 0
0
0
2. 
 ← X2
0 0
2.
0
0 

1 0
−2. 0
0 

0 1
5.
0
0 

0 0
3.
0
0 

1 0
0 −4. 0 

1 0
0
1.
0 

0 1
0
3.
0 

0 0
0
0 −1. 

0 1
0
0
0. 

0 1
0
0 −3. 
1 0
0
0
2.
[1.47]
12
Biometrija
y→
y1
y2
β0 → β01 β02 X1 0
←X
0 X2
33x1
[1.48]
Za naključne vplive
0
 u1 → 
506
 550 


 532 


 577 




 512 
y1 → 

 499 


 466 


 545 


 549 


 600 
610




















y2 → 




















y→
u02 →
12
15
15
14
19
23
26
25
21
22
23
13
14
16
12
17
24
24
27
19
23
15
y1
y2
33x1
a11 a12
1
 0

 0

 0


 0

 0

 0

 0

 0

 0
0









































a13 a14 a15 a16 a17
0 0 0 0 0 0
1 0 0 0 0 0
0 1 0 0 0 0
0 0 1 0 0 0
0 0 0 1 0 0
0 0 0 0 1 0
0 0 0 0 0 1
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
a21 a22

1
 0

 0

 0

 0

 0

 0

 0

 0

 0


 0

 1

 0

 0

 0

 0

 0

 0

 0

 0

 0
0
a18
0
0
0
0
0
0
0
1
0
0
0
a23 a24 a25 a26 a27
0 0 0 0 0 0
1 0 0 0 0 0
0 1 0 0 0 0
0 0 1 0 0 0
0 0 0 1 0 0
0 0 0 0 1 0
0 0 0 0 0 1
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
1 0 0 0 0 0
0 1 0 0 0 0
0 0 1 0 0 0
0 0 0 1 0 0
0 0 0 0 1 0
0 0 0 0 0 1
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
u0 → u01 u02 Z1 0
←Z
0 Z2
a19 a110
0 0
0
0 0
0
0 0
0
0 0
0
0 0
0
0 0
0
0 0
0
0 0
0
1 0
0
0 1
0
0 0
1
a28
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
1
0
0
0
a111



















a29 a210 a211

0 0
0
0 0
0 

0 0
0 

0 0
0 

0 0
0 

0 0
0 

0 0
0 

0 0
0 

1 0
0 

0 1
0 


0 0
1 

0 0
0 

0 0
0 

0 0
0 

0 0
0 

0 0
0 

0 0
0 

0 0
0 

0 0
0 

1 0
0 

0 1
0 
0 0
1
← Z1
[1.49]
← Z2 [1.50]
[1.51]
12
13
Biometrija
1.6.3
Matrike varianc in kovarianc
Izpeljimo strukturo varianc in kovarianc za dnevni prirast y1 (fenotipske variance in kovariance).
V1 =
var (y1 ) =
var X1 β1 + Z1 u1 + e1 =
= cov X1 β1 , β01 X01
+ cov Z1 u1 , β01 X01 +
cov e1 , β01 X01 + cov X1 β1 , u01 Z01 +
|
{z
}
|
{z
}
|
{z
}
|
{z
}
0
0
0
0
[1.52]
+cov Z1 u1 , u01 Z01
+cov e1, u01 Z01 +
cov X1 β1 , e01 +
cov Z1 u1 , e01
| {z }
| {z }
| {z }
0
0
0
+cov e1 , e01
= Z1 var (u1 ) Z01 +
var (e1 )
= Z1 G1 Z01 + R1
Matrika varianc in kovarianc za ostanek (R) je pogosto enostavna (1.53) na diagonali so variance za
ostanek, nediagonalni elementi, ki predstavljajo kovariance med dvema meritvama, pa so enake nič.
0
 e1 → 
e11
 e 
 12 
 e 
 13 
 e 
 14 


 e15 
e1 → 

 e16 


 e17 


 e18 


 e19 


 e110 
e111
 e11 e12 e13 e14 e15 e16 e17 e18 e19 e110 e111 
σ2e1
0
0
0
0
0
0
0
0
0
0
 0 σ2
0
0
0
0
0
0
0
0
0 


e1
 0

2
0
σ
0
0
0
0
0
0
0
0


e1
 0
2
0
0
0
0
0
0 
0
0 σe1 0




0
0
0 σ2e1 0
0
0
0
0
0 
 0

 ← R1 = Iσ2e1 [1.53]
0
0
0
0 σ2e1 0
0
0
0
0 
 0


0
0
0
0
0 σ2e1 0
0
0
0 
 0


 0
0
0
0
0
0
0 σ2e1 0
0
0 


 0
0
0
0
0
0
0
0 σ2e1 0
0 


 0
0
0
0
0
0
0
0
0 σ2e1 0 
0
0
0
0
0
0
0
0
0
0 σ2e1
V izjemnem primeru, ko merimo na isti živali samo eno meritev in živali med seboj niso sorodne, je tudi
matrika varianc in kovarianc za naključne vplive (G1 ) enostavna (1.54). Vedeti pa moramo, da je to prej
izjema kot pravilo!
0
 u1 → 
a11
 a 
 12 
 a 
 13 
 a 
 14 


 a 
u1 →  15 
 a16 


 a17 


 a18 


 a19 


 a110 
a111
 a11 a12 a13 a14 a15 a16 a17 a18 a19 a110 a111 
σ2a1
0
0
0
0
0
0
0
0
0
0
 0 σ2
0
0
0
0
0
0
0
0
0 


a1
 0
0 σ2a1 0
0
0
0
0
0
0
0 


 0
0
0 σ2a1 0
0
0
0
0
0
0 




2
0
0
0
0
σ
0
0
0
0
0
0


a1

 ← G1 = Iσ2a1 [1.54]
0
0
0
0 σ2a1 0
0
0
0
0 
 0


0
0
0
0
0 σ2a1 0
0
0
0 
 0


 0
0
0
0
0
0
0 σ2a1 0
0
0 


 0
0
0
0
0
0
0
0 σ2a1 0
0 


 0
0
0
0
0
0
0
0
0 σ2a1 0 
0
0
0
0
0
0
0
0
0
0 σ2a1
V tem izjemnem primeru je tudi matrika fenotipskih varianc in kovarianc V diagonalna matrika, posamezni diagonalni elementi pa so vsota okoliške (σ2e1 ) in genetske (σ2a1 ) komponente variance.
V1 = Z1 G1 Z01 + R1 = I σ2a1 + σ2e1 = diag σ2a1 + σ2e1
[1.55]
Za debelino hrbtne slanine imamo dvakrat toliko opazovanj: na vsaki živali po dve. Ker smo merili
z istim aparatom, delo je opravljal isti delavec..., so meritve identično porazdeljene (imamo samo eno
13
14
Biometrija
varianco za ostanek). Vendar pa meritvi na isti živali praviloma nista neodvisni - žival smo pitali pod
istimi pogoji, zato je tudi okolje v enaki meri ponagajalo. Če se je žival zaradi tega bolj zredila, kot bi se
pod strogimi pogoji testa, bomo namerili tudi debelejšo slanino pri obeh ponovitvah. Med ponovitvama
na isti živali torej obstaja podobnost - kovarianca. Oblika matrike varianc in kovarianc za ostanek je
odvisna od razporedive meritev v vekorju y. Če razvrstimo meritve tako, da najprej nanizamo prve
meritve na vseh živalih in nato dodamo še druge meritve (prvi vektor za debelino hrbtne slanine v enačbah
(1.31), dobimo matriko iz enačbe (1.42). Ko pa razvrstimo ponovitvi po parih - znotraj živali (drugi
vektor za debelino hrbtne slanine v enačbah (1.31)), pa dobimo matriko iz enačbe (1.43) in (1.44).
R2 =
Iσ2e2
Iσe22
Iσe22
Iσ2e2
22x22
=
σ2e2
σe22
σe22
σ2e2
⊗ I11 = R0 ⊗ I11
2x2
14
[1.56]
e21 1
e22 1
e23 1
..
.







 e29 1

 e2101


e2 →  e2111
 ···

 e21 2

 e22 2

 e
 23 2

..

.

 e
 29 2
 e
2102
e2112

e02 →




























h
e21 1 e22 1 e23 1 · · · e29 1 e2101 e2111
2
 σe2


σ2e2



σ2e2


..

.



σ2e2


σ2e2



σ2e2



 ··· ··· ··· ··· ··· ··· ···

 σ
 e22


σe22



σe22


..

.



σe22



σe22

σe22
..
. e21 2 e22 2 e23 2
..
. σe22
..
.
σe22
..
.
σe22
..
.
..
.
..
.
..
.
..
. ··· ··· ···
..
. σ2e2
..
.
σ2e2
..
.
σ2e2
..
.
..
.
..
.
..
.
.
..
.
···
..
σ2e2
···
σe22
σ2e2
···
σe22

















σe22 


··· 


















2
σe2
· · · e29 2 e2102 e2112
i
← R2
[1.57]
Biometrija
15
15



















e2 → 



















e211
e212
······
e22 1
e22 2
······
e23 1
e23 2
······
..
.
..
.
······
e29 1
e29 2
······
e2101
e2102
······
e2111
e2112
e02 →





























































































h
16
···
···
···
···
···
···
···
···
···
···
···
···
σe22
σe22
σ2e1
σ2e1
e211 e212
..
.
. e22 1 e22 2 .. e23 1
..
..
.
.
..
..
.
.
..
.
. · · · · · · .. · · ·
..
.
. σ2e1 σe22 ..
..
.
. σe22 σ2e1 ..
..
.
. · · · · · · .. · · ·
..
..
.
. σ2e1
..
..
.
. σe22
..
.
. · · · · · · .. · · ·
..
..
.
.
..
..
.
.
..
.
. · · · · · · .. · · ·
..
..
.
.
..
..
.
.
..
.
. · · · · · · .. · · ·
..
..
.
.
..
..
.
.
..
.
. · · · · · · .. · · ·
..
..
.
.
..
..
.
.
..
.
.e23 2 .. · · · · · ·
..
..
.
.
..
..
.
.
..
.
· · · . · · · · · · ..
..
..
.
.
..
..
.
.
..
..
··· . ··· ··· .
.
..
σe22 ..
.
..
..
2
σe1 .
.
..
.
· · · . · · · · · · ..
.. . .
..
.
.
.
..
. . ..
. .
.
..
.
· · · . · · · · · · ..
..
..
.
.
..
..
.
.
..
.
· · · . · · · · · · ..
..
..
.
.
..
..
.
.
..
.
· · · . · · · · · · ..
..
..
.
.
..
..
.
.
..
. e29 1 e29 2
..
.
..
.
.
· · · · · · ..
..
.
..
.
.
· · · · · · ..
..
.
..
.
.
· · · · · · ..
..
.
..
.
.
· · · · · · ..
.
σ2e1 σe22 ..
.
σe22 σ2e1 ..
.
· · · · · · ..
..
.
..
.
.
· · · · · · ..
..
.
..
.
..
. e2101 e2102
..
.
..
.
.
· · · · · · ..
..
.
..
.
.
· · · · · · ..
..
.
..
.
.
· · · · · · ..
..
.
..
.
.
· · · · · · ..
..
.
..
.
.
· · · · · · ..
.
σ2e1 σe22 ..
.
σe22 σ2e1 ..
.
· · · · · · ..
..
.
..
.
···
σe22
σ2e1
σ2e1
σe22
···
···
···
···
···
···
···
···
···
···
···
i


























 ← R2


























..
. e2111 e2112

[1.58]
16
Biometrija
17
Biometrija
R2 = I11 ⊗
σ2e2
σe22
σe22
σ2e2
= I11 ⊗ R0
[1.59]
2x2
Ker so živali nesorodne, za debelino hrbtne slanine pa želimo samo eno plemensko vrednost, je matrika
varianc in kovarianc za direktni aditivni vpliv enostavna, kot jo prikazujemo v (1.60).
G2 = I11 σ2a2
[1.60]
Sedaj pa izračunajmo še matriko fenotipskih varianc in kovarianc V2 . Vzemimo primer, ko so nanizane
najprej prve meritve in nato še ponovitve. Rezultat (1.61) je izjemoma, zaradi že omenjenih predpostavk,
blokdiagonalna matrika.
V2 =
2
σa2
=
σ2a2
+ R2 =
σ2a2
⊗ I11 +
σ2a2
Z2 G2 Z02
I11
I11
I11 σ2a2
σ2e2
σe22
σe22
σ2e2
I11 I11
I11 I11 + R0 ⊗ I11 =
σ2a2 + R0 ⊗ I11 =
I
I
11
11
2
[1.61]
σa2 + σ2e2 σ2a2 + σe22
⊗ I11 =
⊗ I11 = V0 ⊗ I11
σ2a2 + σe22 σ2a2 + σ2e2
Sedaj pa za vajo ponovimo še izračun kovariance med meritvami za dnevni prirast y1 in ostanki e1 ter
med meritvami y1 in slučajnim vplivom u1 .
cov y1 , e01 = cov X1 β1 + Z1 u1 + e1 , e01 = Z1 cov u1 , e01 + var (e1 ) = R1
[1.62]
cov y1 , u01 = cov X1 β1 + Z1 u1 + e1 , u01 = cov X1 β1 , u01 + cov Z1 u1 , u01 + cov e1 , u01
[1.63]
= Z1 cov u1 , u01 = Z1 var (u1 ) = Z1 G1 = C1
Pričakovane vrednosti ter variance in kovariance za slučajne vplive so pogosto predstavljene v združeni
obliki. V nasednjih enačbah smo prikazali model (1.34) z obema lastnostima.

 

u1
0
E  e1  =  0 
y1
X1 β1

 
u1
G1
var  e1  =  0
y1
G1 Z01
[1.64]
0
R1
R1

G1

R1
0
Z1 G1 Z1 + R1
[1.65]
Vajo ponovite še za debelino hrbtne slanine in za model z obema lastnostima skupaj! Potrebovali bomo še
rezultate iz naslednje razpredelnice. Pripišite rezultate, da jih ne bomo kasneje iskali! Nato pa sestavite
enačbo za pričakovane vrednosti po zgledu (1.62) in prikažite strukturo varianc in kovarianc po zgledu
(1.63).
cov y2 , e02 =
cov y2 , u02 =
cov (y, e0 )=
cov (y, u0 )=
cov y, e02 =
cov y1 , u02 =
cov y2 , e01 =
cov y2 , u01 =
cov y1 , y02 =
cov y2 , y01 =
17
18
Biometrija
Pri dvolastnostnem modelu splošno obliko enačb še razčlenite, da bodo vidne povezave med lastnostima.
Izpopolnite naslednji dve enačbi!




u1
···············
 u2 

 

 e1   · · · · · · · · · · · · · · · 

 
E
 e2  =  · · · · · · · · · · · · · · · 
  ··············· 

 y1 
···············
y2


..
..
..
..
..
.
.
.
.
.


..
..
..
..
..


 ······ . ······ . ······ . ······ . ······ . ······ 


..
..
..
..
..




.
.
.
.
.


..
..
..
..
..

 

 ······ . ······ . ······ . ······ . ······ . ······ 
u1


..
..
..
..
..

 u2  
.
.
.
.
.
 



 e1  
.
.
.
.
.
 

var 
 e2  =  · · · · · · .. · · · · · · .. · · · · · · .. · · · · · · .. · · · · · · .. · · · · · · 
 


..
..
..
..
..

 y1  
.
.
.
.
.




.
.
.
.
.
y2
 · · · · · · .. · · · · · · .. · · · · · · .. · · · · · · .. · · · · · · .. · · · · · · 




..
..
..
..
..


.
.
.
.
.




 · · · · · · ... · · · · · · ... · · · · · · ... · · · · · · ... · · · · · · ... · · · · · · 


..
..
..
..
..
.
.
.
.
.
1.7
Determinanta
1.8
Inverzna matrika
1.9
Splošna inverza
Vzemimo, da imamo sistem enačb Ax = r. Rešitev za vektor neznanih parametrov x dobimo tako, da od
spredaj množimo z A−1 , kar lahko storimo ob pogoju, da ima matrika A poln rang. Vendar pa obstajajo
številni primeri, ko to ne drži: rang matrike A je manjši od reda matrike, determinanta matrike je enaka
nič. Sistem enačb v tem primeru nima ene same rešitve. Če ima rešitev, jih ima neskončno mnogo. Eno,
izbrano rešitev pa lahko dobimo tako, da uporabimo splošno inverzo. Označili jo bomo z A− . Izbrali pa
bomo tisto, pri kateri velja: AA− A = A. Praviloma pa niti AA− niti A− A nista enaka identični matriki I.
Matrika A ima neskončno mnogo splošnih inverz, če ima vsaj eno. Pri vsaki možni rešitvi sistema
uporabimo drugo splošno inverzo. Poglejmo pa si enostaven postopek, da najdemo prvo splošno inverzo.

  
2
3 −2 1
x1
 −2 0 1   x2  =  1 
1 −2 2
x3
3

[1.66]
• v matriki A poiščite vse odvisne vrstice, jih napolnite z ničlami. Z ničlami napolnimo tudi stolpec.
Pri simetričnih matrikah izberemo isto vrstico in isti stolpec.










3 −2 0
3 0 1
0 0 0
0 −2 1
3 0 1
 −2 0 0  ali  0 0 0  ali  0 0 1  ali  0 0 1  ali  −2 0 1  . . .[1.67]
0
0 0
1 0 2
0 −2 2
0 0 0
0 0 0
• ostane vam samo toliko neodvisnih vrstic in stolpcev, kot je rang sistema
18
19
Biometrija
• iz neodvisnih vrstic in stolpcev nastavite podmatriko in poiščite njeno inverzo
3 −2
3 1
0
1
−2 1
3 1
...
−2 3
1 3
−2 −2
0 1
−2 1
1
−
4
0 2
2 3
1
5
2 −1
−1 3
1
2
−2 −1
2
0
1
−
2
1 −1
0 −2
1
5
1 −1
2 3
[1.68]
...
[1.69]
• inverzi dodajte izpuščene vrstice in stolpce, ki so polni samih ničel










0 2 0
2 0 −1
0 0 0
0 1 −1
1 0 −1
1
1
1
1
1
0 0 0 
0 2 −1 
0 0 −2 
2 0 3  . . .[1.70]
−  2 3 0 
4
5
2
2
5
0 0 0
−1 0 3
0 2 3
0 0 0
0 0 0
Tako pripravljene inverze lahko uporabimo pri reševanju sistema enačb. Rešitev lahko dobimo neskončno
mnogo, objavili pa bomo le tisto, kar je enako pri vseh rešitvah - ocenljive funkcije.
1.10
Direktna vsota
A 0
A⊕B=
0 B
[1.71]
Možni so različni zapisi.

k


Σ⊕i Xi = Σ+i Xi = ⊕ Xi = Xi ⊕ Xi ⊕ · · · ⊕ Xi = 

i

Xi 0 · · · 0
0 Xi · · · 0
..
.. . .
.
. ..
.
.
0 0 · · · Xi




[1.72]
Za vključene matrike sploh ni potrebno, da bi bile istega ranga.

x0 0 0
x0 ⊕ X ⊕ z =  0 X 0 
0 0 z

[1.73]
Za matrike odgovarjajočega ranga drži
(A ⊕ B) + (C ⊕ D) =
A 0
0 B
+
C 0
0 D
=
A+C
0
0
B+D
=A+C⊕B+D
[1.74]
Če je Ai polnega ranga, velja naslednje:

⊕ −1 

Σi Ai
=

Ai 0 · · · 0
0 Ai · · · 0
..
.. . .
.
. ..
.
.
0 0 · · · Ai
−1







=

A−1
0 ··· 0
i
0 A−1
··· 0
i
..
..
..
..
.
.
.
.
0
0 · · · A−1
i



 = Σ⊕i A−1
i

[1.75]
Za determinanto pa velja:
k
⊕ Y
Σ Ai =
|Ai |
[1.76]
i
i=1
19
20
Biometrija
1.11
Kronecker produkt
Vzemimo primer, kjer imamo dve lastnosti (y in z) za vsako od dveh živali. Če lahko zapise opišemo z
linearnim modelom, imamo
 
µy
y1
 z2   µz
 

 y3  =  µy
µz
z4

 
ey1
uy1
  uz1   ez1
 
+
  uy2  +  ey2
ez2
uz2






[1.77]
 
σa12
a12 σ2a1 a12 σa12
σ2a1
uy1
2
 uz1   σa12
a12 σa12 a12 σ2a2
σa2
=
var 
 uy2   a12 σ2
σa12
a12 σa12
σ2a1
a1
2
a12 σa12 a12 σa2
σa12
σ2a2
uz2





2

σa1 σa12
σ2a1 σa12
a
 1
1G0 a12 G0
σa12 σ2a2 12 σa12 σ2a2 


= A ⊗ G0
=
 = a12 G0 1G0
σ2a1 σa12
σ2a1 σa12
1
a12
σa12 σ2a2
σa12 σ2a2
[1.78]

[1.79]
Matrika A predstavlja matriko sorodstva. Element a12 je koeficient sorodstva med obema živalima. Matrika G0 vsebuje genetske variance in kovariance med lastnostima, merjenima na isti živali.
Poglejmo sedaj še varianco za ostanek (1.80)! Lastnosti merjene na isti živali so med se
  2
ey1
σe1 σe12
0
0
 ez1   σe12 σ2
0
0
e2
 
var 
 ey2  =  0
0
σ2e1 σe12
ez2
0
0
σe12 σ2e2

σ2e1 σe12
0
 1 σe12 σ2
e2 2
=

σe1 σe12
1
0
σe12 σ2e2





[1.80]

σ2e1 σe12
1R
0R
σe12 σ2e2 
0
0
=
= I ⊗ R0 = R
σ2e1 σe12 
0R0 1R0
σe12 σ2e2
[1.81]
Navedimo še nekaj lastnosti Kronecker produkta. Vzemimo matriki A pxq in Bmxn .
A ⊗ B = C pm×qn
[1.82]
(A ⊗ B)0 = A0 ⊗ B0
[1.83]
x0 ⊗ y = yx0 = x0 ⊗ x0
[1.84]
k ⊗ A = kA = A ⊗ k
[1.85]
A1 A2
A⊗
⊗B=
A1 ⊗ B A2 ⊗ B
[1.86]
A ⊗ B1 A ⊗ B2
[1.87]
B1 B2
,
Če obstajajo produkti, velja:
(A ⊗ B) (X ⊗ Y) = AX ⊗ BY
[1.88]
20
21
Biometrija
(A ⊗ B)−1 = A−1 ⊗ B−1
[1.89]
rang (A ⊗ B) = rang (A) • rang (B)
[1.90]
tr (A ⊗ B) = tr (A) • tr (B)
[1.91]
|Mm×m ⊗ Nn×n | = |M|m |N|n
[1.92]
Lastna_vrednost (A ⊗ B) = Lastna_vrednost (A) • Lastna_vrednost (B)
[1.93]
(A ⊗ B) ⊗ C = A ⊗ (B ⊗ C)
[1.94]
kA ⊗ B = A ⊗ kB = k (A ⊗ B)
[1.95]
(A + B) ⊗ C = (A ⊗ C) + (B ⊗ C)
[1.96]
1.12
Odvajanje matrik
Pri odvajanju uporabimo splošni model (1.97), poljubno vrstico i pa bomo prikazovali na dva načina, kot
(1.98) ali (1.99).
y = Xβ + Zu + e
[1.97]
y1 = x0i β + z0i u + e0i
[1.98]
yi =
p
X
xi j β j +
j=1
1.12.1
q
X
zi j u j + ei
[1.99]
j=1
Odvod matrike po skalarju
Vzemimo matriko Y reda m × n, katere elementi so funkcije skalarja z. Potem je:
∂Y
=
∂z
1.12.2
∂yi j
∂z
red (Y) = m × n
red (z) = 1 × 1
red (A) = m × n
=A
[1.100]
Odvod skalarja po matriki
Naj bo skalar h (X) funkcija matrike X.

∂h (X)




∂x11

∂h (X) 
.
..
=

∂X


∂h (X)



∂xm1
···
···
∂h (X)
∂h (X)
..
.
∂x1n
∂xmn
red (X) = m × n
red (h (X)) = 1 × 1
red (A) = m × n







=A
[1.101]






[1.102]
21
22
Biometrija
1.12.3
Odvod vektorja po vektorju
.
.
. i
∂y h ∂y
∂y
∂y
·
·
·
=
=
∂z1
∂z2
∂zn
∂z0
. 
.
.

∂y
∂y1
∂y1
1
···
.∂z1
.∂z2
.∂zn 

 ∂y2

∂y2
∂y
2
···


∂z1
∂z2
∂zn 
=


..
..
..
..


.
.
.
.

. 
.
.
∂yk
∂yk
∂z1
∂z2
···
[1.103]
[1.104]
∂yk
∂zn
k×n
red (z0 ) = 1 × n
red (y) = k × 1
red (A) = k × n
[1.105]
Vzemimo sedaj model (1.97) in odvajajmo y najprej na β0 in nato še na β.
.
.
.
∂y
∂y
∂y
∂y
·
·
·
=
=
∂β p
∂β1
∂β2
∂β0
.
.
.


∂y1
∂y1
∂y
1
···


∂β1

x11 x12 · · · x1p
.∂β2
.∂β p 
 ∂y2 .

∂y2

  x21 x22 · · · x2p 
· · · ∂y2


∂β1
∂β2
∂β p  = 

  ..
=X
.
.
.
.
.
.
.
.
.
..

  .
.
.
. 
..
..
..
.


.
.
.


xn1 xn2 · · · xnp
∂yn
∂yn
· · · ∂yn
∂β1
∂β2
[1.107]
∂β p
red (y) = n × 1
red β0 = 1 × p
red (X) = n × p
[1.108]
Poglejmo si tipični element matrike odvodov (1.109) in nato še primer za
parameter v modelu (1.110).
P
Pq
p
∂
x
β
+
z
u
+
e
i
j
j
i
j
j
i
j=1
j=1
∂yi
=
= xik
∂βk
∂βk
P
Pq
p
∂
x
β
+
z
u
+
e
1
j=1 1 j j
j=1 1 j j
∂yi
=
= x12
∂β2
∂β2

 .
 
.
.
.
∂y1
∂y2
∂y
· · · ∂yn

 .∂β1  
∂β
∂β
x11 x12
.∂β1 

  ∂y1 . 1 ∂y2 . 1
 ∂y
∂yn





·
·
·
x21 x22
∂y 
∂β2
∂β2
∂β2  = 
∂β2  = 
=
  ..
 
..
.
.
.
.
..
  .
 
∂β 
..
..
..
.
.

 ...
 
.
.

 ∂y
  ∂y .
x p1 x p2
∂y2
1
· · · ∂yn
∂β p
[1.106]
∂β p
∂β p
prvo opazovanje in drugi
[1.109]
[1.110]

· · · x1n
· · · x2n 

0
..  = X [1.111]
..
.
. 
· · · x pn
∂β p
red (y) = n × 1
red (β) = p × 1
red (X0 ) = n × p
[1.112]
∂Zu
= Z0
∂u
[1.113]
22
23
Biometrija
1.12.4
Odvajanje produkta matrik
V skalarni algebri velja
∂uv
=
∂x
∂u
∂x
v+u
∂v
∂x
[1.114]
V skalarni algebri velja isto pravilo najdemo tudi v matrični algebri (1.115). Matrika U je reda m × n ter
matrika V reda n × q. Elementi matrik so funkcije skalarne spremenljivke x.
∂UV
=
∂x
∂U
∂x
V+U
∂V
∂x
[1.115]
PRIMER:
V sistemu normalnih enačb pri metodi najmanjših kvadratov (1.116) dobimo vsoto kvadratov za model
z izrazom (1.117).
b = X0 y
X0 Xβ
[1.116]
b0 X0 Xβ
b
β
[1.117]
Odvajajmo vsoto kvadratov za model na eno izmed ocen (npr. βi ):
b0 X0 Xβ
b ∂β
b0 X0
b
∂β
b+β
b0 X0 ∂Xβ
=
Xβ
∂β̂i
∂β̂i
∂β̂i
[1.118]
Poskusimo sedaj rešiti samo košček problema:


x1i

b 
∂Xβ
red (ti ) = n
 x2i 
=  .  = ti
.
i = 1, 2, . . . , p
 . 
∂β̂i
x4i
[1.119]
Sedaj bo pa že šlo:
∂β0 XXβ
=
∂βi
b +β
b0 X0 ti = 2t0 Xβ
b
t0i Xβ
i
| {z }
= | {z }
skalar skalar
[1.120]
Še malo posplošimo:


0 Xβ
b
2t
1
b X0 Xβ
b 
∂β


..
=
 = 2
.
b
∂β
b
2t0 Xβ
0

p

t01
..  Xβ
0 b
.  b = 2X Xβ
t0p
23
[1.121]
24
Biometrija
PRIMER:
Skupno vsota kvadratov (total sum of square, TSS) za opazovanja lahko odvajamo na dva načina. TSS
je skalar, vektor opazovanj y pa stolpični vektor reda n × 1, zato bo rezultat tudi stolpični vektor istega
reda. Ker vemo, da je TSS vsota kvadratov za opazovanja, lahko uberemo naslednjo pot.
 P .

∂ y21


 P .∂y1 
2y1
 ∂ y2

  2y2 
2
∂y0 y 



∂y2 
=
[1.122]
 =  ..  = 2y
.

  . 
∂y
..


 P 2.

2yn
∂ yn
∂yn
Po postopku za odvajanje produkta matrik po sklarju, moramo odvod najprej razbiti tako, da dobimo v
imenovalcu skalarje (1.123). Nato vsako vrstico odvajamo, kot to prikazuje (1.124). Pri tem si pomagamo še z enačbo (1.125). Dobljene vrednosti za posamezne vrstice vstavljamo nazaj v enačbo (1.123).
Rezultat je podoben kot pri skalarni algebri.




∂y0 y 

=

∂y



∂y0 y
∂y1
∂y0 y
∂y2
..
.
∂y0 y
∂yi
..
.
∂y0 y
∂yn


2y1
2y2
..
.

 

 

 

 

 
 = 2y
=
  2yi 
  . 
  . 
. 

2yn
[1.123]
∂y
∂y0 y ∂y0
=
y + y0
= t0i y + y0 ti = yi + yi = 2yi
∂yi
∂yi
∂yi
[1.124]
∂y0 = 0 0 · · · 1i · · · 0 = t0i
∂yi
[1.125]
1.12.5
Odvajanje inverze
Vzemimo matriko M s polnim rangom in inverzno matriko M−1 . Hitro lahko ugotovimo, da velja (1.126),
saj identična matrika ni funkcija skalarne spremenljivke z.
∂MM−1 ∂I
=
=0
∂z
∂z
[1.126]
Če bi zadevo poskusili rešiti na način, ki smo ga obdelali v prejšnjem poglavju (1.127), nam ostane
neznanka prav odvod inverzne matrike M−1 po skalarni spremenljivki z. Rezultat pa itak že poznamo.
∂MM−1 ∂M −1
∂M−1
=
M +M
=0
∂z
∂z
∂z
[1.127]
Sedaj pa nam ostane samo, da uganemo neznani odvod. Pravzaprav bomo (1.128) samo preoblikovali:
poznani prvi člen bomo prenesli na drugo stran enačbe (pridobimo negativen predznak) in obe strani od
spredaj množili z inverzno matriko M−1 .
∂M−1
∂M −1
= −M−1
M
∂z
∂z
[1.128]
24
25
Biometrija
1.12.6
Odvajanje splošne inverze
Splošna inverza je vsaka matrika G, ki zadovolji:
AGA = A
[1.129]
Matrika A je lahko katerakoli matrika, lahko je torej tudi vrstični ali stolpični vektor. Naj bosta matriki
A in G funkciji skalarja x. Sedaj pa poiščimo odvod matrike A po x-u.
∂A
∂AGA ∂A
∂GA ∂A
∂G
∂A
=−
=
GA + A
=
GA + A
A + AG
∂x
∂x
∂x
∂x
∂x
∂x
∂x
[1.130]
Poskusimo sedaj množiti od spredaj z AG in od zadaj z GA.
AG
∂A
∂A
∂G
∂A
GA − AG GA = A
A + AG GA
∂x
∂x
∂x
∂x
0=A
A
[1.131]
∂G
∂A
A + AG GA
∂x
∂x
[1.132]
∂G
∂A
A = −AG GA
∂x
∂x
[1.133]
Rezultat je podoben kot (1.128), če je G = A−1 .
1.12.7
Odvajanje funkcije determinante
Za matriko A s polnim rangom velja (Searle,1982)
−1
∂ |A|
= |A| A0
∂A
[1.134]
−1
∂ln |A|
1 ∂ |A| |A| (A0 )−1
=
•
=
= A0
∂A
|A| ∂A
|A|
[1.135]
∂ln |V|
∂ln|V|
= tr ∂x = tr ∂ln|V|
∂V •
∂x
| {z }
∂V
∂x
= tr V−1 ∂V
∂x
[1.136]
skalar
1.12.8
1.13
Chain-ovo pravilo
Sled matrike
Definicija: Sled matrike (ang. trace) je vsota diagonalnih elementov matrike.
X
A = ai j ⇒ tr (A) =
ai j
[1.137]
Zakon ciklične komutativnosti
tr A pxn Bnxm Cmxp = tr Cmxp A pxn Bnxm = tr Bnxm Cmxp A pxn
25
[1.138]
26
Biometrija
Sled skalarja je skalar.
tr σ2e = σ2e
[1.139]
Sled vsote matrik
tr (A + B) = tr (A) + tr (B)
[1.140]
Sled produkta matrike s skalarjem
tr (R) = tr I4 σ2e = σ2e tr (I4 ) = 4σ2e
[1.141]
Matematično upanje in sled matrike
E (tr (A)) = tr (E (A))
[1.142]
tr (B) = V sota lastnih vrednosti (eigenvalues) matrike B
[1.143]
P
∂tr (B) ∂ ni=1 bii
=
=I
∂B
∂B
[1.144]
∂tr (AB) ∂tr (BA)
=
= A,
∂B
∂B
[1.145]
∂tr (ABC) ∂tr (BCA)
=
= A, C,
∂B
∂B
[1.146]
∂tr (B, AB)
= BA + A, B
∂B
[1.147]
A = A, ⇒
∂tr (B, AB)
= 2AB
∂B
Etr (X) = E
n
X
i=1
!
xii
=
n
X
[1.148]
E (xii ) = trE (X)
[1.149]
i=1
26
27
Biometrija
PRIMER: Opravili smo dve meritvi na dveh nesorodnih živalih. Rezultati so v naslednji tabeli. Nastavimo matriko varianc in kovarianc za aditivni genetski vpliv (G), ostanek (R) in opazovanja (V)! Pri tem
predpostavimo naslednji model. Izračunajmo tudi sledi matrik G, R in V!
a1 a2
y11 y21
y12 y22
yi j = µ + ai + ei j
ai ∼ IID 0; σ2a ; ei j ∼ IID 0; σ2e
  2
σe
e11
 e12  
σ2e
 
R = Var 
 e21  = 
σ2e
σ2e
e22

G = Var
a1
a2
=
σ2a




σ2a
  2
y11
σe + σ2a
σ2a
2
2



y12  
σe + σ2a
σa
V = R + ZGZ, = Var (y) = Var 
=
 y21  
σ2e + σ2a
σ2a
y22
σ2a
σ2e + σ2a

tr (R) = tr I4 σ2e = σ2e tr (I4 ) = 4σ2e
tr (G) =
X
tr (V) =
X
σ2a = 2σ2a
σ2e + σ2a = 4 σ2e + σ2a
Slednje lahko izračunamo tudi po naslednjem postopku.
tr (V) = tr (R + ZGZ, ) = tr (R) + tr (ZGZ, ) = 4σ2e + tr Z, ZI2 σ2a = 4σ2e + 4σ2a
27




28
Biometrija
PRIMER:
y = Xβ + Zu + e
E (yi ) = xi β
Var (yi ) = σ2e + σ2u
Po definiciji je
V = E (yy, ) − E (y) E (y, )
E (yy, ) = V + E (y) E (y, )
E (yy, ) = E (tr (yy, )) = E tr (yy, ) = tr E (yy, ) =
!
β, X, Xβ
, ,
= tr (V + Xββ X ) = tr (V) + tr | {z }
skalar
P
= n σ2e + σ2u + β, X, Xβ = n σ2e + σ2u + β, X, Xβ
E (yy, ) = E (Xβ+Zu + e) (Xβ+Zu + e), = E (Xβ+Zu + e) (β, X, + u, Z, + e, )
= E (Xββ, X, ) + E (Zuβ, X, ) + E (eβ, X) + E (Xβu, Z, ) + E (Zuu, Z, ) +
+E (eu, Z, ) + E (Xβe, ) + E (Zue, ) + E (ee, )
= ZGZ, +R + Xββ, X, = V + Xββ, X,
1.14
KVADRATNE OBLIKE (QUADRATIC FORM)
Splošna oblika kvadratne oblike (quadratic form) je y, Qy. Matriko Q imenujemo matriko kvadratne
oblike. Predpostavimo lahko, da je simetrična. V primeru, da Q ni simetrična, lahko poiščemo drugo
matriko kvadratne oblike po enačbi (1.150).
Q + Q,
2
[1.150]
Za odvisne spremenljivke (opazovanja) v vektorju y naj velja, da so porazdeljene po naslednjem porazdelitvenem zakonu:
y ∼ (Xβ, V)
[1.151]
Pripravimo si še nekaj enačb
V = var (y) = var (y − Xβ) = E (y − Xβ) (y − Xβ), =
= E (yy, −yβ, X, −Xβy, + Xββ, X, ) = yy, − (Ey) β, X, − Xβ (Ey, ) + Xββ, X, =
= yy, −Xββ, X, −Xββ, X, +Xββ, X, = yy, −Xββ, X,
[1.152]
yy, = V + Xββ, X,
[1.153]
E (yy, ) = E (V + Xββ, X, ) = E (V) + E (Xββ, X, ) = V + Xββ, X,
[1.154]
V statistiki kvadratne oblike predstavljajo matrični zapis za vsote kvadratov. Da ocenimo posamezne
komponente variance, vsoto kvadratov izenačimo s pričakovano vrednostjo za vsoto kvadratov, zato si
28
29
Biometrija
oglejmo, kako dobimo pričakovane vrednosti.
E (y, Qy)
| {z }
skalar
= E tr (y, Qy) = E tr (Qyy, ) = tr E (Qyy, ) = tr QE (yy, ) =
= tr Q (V + Xββ, X, ) = tr (QV) + tr (QXββ, X, ) =
(β, X, QXβ)
= tr (QV) + tr | {z } = tr (QV) + β, X, QXβ
skalar
[1.155]
To velja ne glede na to, ali je porazdelitev normalna. Če pa je porazdelitev normalna, pa velja tudi
naslednje.
1.
var (y, Qy)
| {z }
skalar
2.
PRIMER:
yi = µ + ei
• Vsota kvadratov opazovanj
X
y2i = yy,
Q = I;
rank(Q) = n
• Vsota kvadratov za model
P 2
P 2
yi
yi
1
1
nȳ = n
=
= y, 1 • 1, y = y, Jn y
n
n
n
n
2
Q=
Jn
;
n
rank(Q) = 1
• Nepristranska ocena variance:
P
(yi − ȳ)2
=
n−1
1
Q=
n−1
P
J
I−
n
y2i − ( yi )
n−1
P
;
n
y, y − 1n y, Jn y
1 ,
J
=
=
y I−
y
n−1
n−1
n
rank(Q) = n − 1
29
30
Biometrija
PRIMER:
yi j = µ + A i + ei j ;
i = 1, A; j = 1, N; n = NA
y, = y,1 y,2 · · · y,A
Vir variabilnosti
µ
Vpliv A
Ostanek
Skupaj
Stopinje prostosti (d.f.)
1
A-1
A(N-1)
AN
Vsota kvadratov (SS)
CF - za povprečje
CBSS - med skupinami
ESS - za ostanek
TSS - skupna
Povprečni kvadrat (SS/d.f.)
CF/1
CBSS/(A-1)
ESS/(A(n-1))
• Skupna vsota kvadratov
TS S =
XX
i
y2ji = y, y
j
Q = I;
rank(Q) = AN
• Vsota kvadratov za “povprečje”
CF =
Q=
1 ,
y JNA y
AN
JAN
;
AN
rank(Q) = 1
• Vsota kvadratov UBSS:
=
U BS S
=
=
P A P N
1
N
1
N
i
= y,
Q=
i
N
j
2
=
1
N
P
N
j y1 j
2
2
N
y
+
j 2j
y,A 1N · 1,N yA
+
P
,
y1 1N · 1,N y1 + y,2 1N ·1,N y2 + · · · +
1N · 1,N

1N · 1,N
,
,
, 
y1 y2 · · · yA 

1
N
⊕
X
JN
yi j
P
⊕ JN
i N
..
.
··· +
P
N
j yA j

1N · 1,N




y1
y2
..
.
2 




yA
y
!
rank(Q) = A
;
• Vsota kvadratov CBSS:
CBS S = U BS S − CF = y,
⊕
X
JN
i
Q=
⊕
1 X
1
JN −
JAN
N
AN
N
!
1 ,
y−
y JAN y = y,
AN
!
;
rank(Q) = A − 1
i
• Vsota kvadratov za ostanek
ES S = T S S − MS S
30
⊕
1 X
1
JN −
JAN
N
AN
i
!
y
31
Biometrija
1.15
CHOLESKY DEKOMPOZICIJA (KVADRATNI KOREN)
31