Neliömuodoista, matriisin ominaisarvoista ja avaruuden kierroista

Neliömuodoista, matriisin ominaisarvoista ja avaruuden kierroista
Marko Moisio
1. Neliömuodoista ja matriisin ominaisarvoista
Tarkastellaan toisen asteen tasokäyrän määräävää yhtälöä
a, b, c, d
ax2 + by 2 + 2cxy = d,
missä
ovat vakioita. Tässä vasemmalla puolella esiintyvää polynomia kutsutaan neli-
ömuodoksi. Pyrimme sopivalla tason kierrolla saattamaan tämän yhtälön diagonaalimuo-
αu2 + βv 2 = d.
2
2
Yhtälö ax + by + 2cxy = d
toon
voidaan kirjoittaa matriisimuodossa
x
(x y)A
=d
y
(1)
missä
ac
A=
.
cb
Havaitaan, että
Olkoon
A
on symmetrinen ts.
P = (P1 P2 )
A = AT .
2 × 2-matriisi
x
u
=P
y
v
reaalinen ja säännöllinen
ja sijoitetaan yhtälöön (1)
jolloin yhtälön (1) vasen puoli on muotoa
T
u
u
u
T
AP
= (u v)(P AP )
.
P
v
v
v
P jolle P T AP = D,
α0
D=
, α, β ∈ R.
0β
Tavoitteena on siis löytää sellainen matriisi
missä
Tällöin (1) saadaan diagonaalimuotoon
αu2 + βv 2 = d.
(2)
P kuvauksena f : R2 → R2 , f (X) = P X , joka kuvaa
ax2 + by 2 + 2cxy = d. Mikäli f on tason kierto, niin käyrä
Voimme siis ajatella matriisia
käyrän
2
αx2 + βy 2 = d
2
ax + by + 2cxy = d
käyräksi
voidaan ajatella käyräksi, joka saadaan kun käyrää
kierretään origon suhteen kuvauksen
P
αx2 + βy 2 = d
määräämän kulman verran. Käsittelemme kiertoja
tarkemmin luvussa 2.
Kysymystä neliömuodon diagonalisoimisesta voidaan tarkastella yleisemminkin. Jatkossa samaistamme
n
R
.
n×1-matriisin X = (x1 x2 . . . xn )T
ja koordinaattivektorin
(x1 , . . . , xn ) ∈
2
Olkoon
h(x1 , . . . xn )
neliömuoto eli homogeeninen astetta kaksi oleva polynomi ts.
n
X
h(x1 , . . . xn ) =
aij xi xj = (x1 x2 . . . xn )A(x1 x2 . . . xn )T ,
i,j=1
missä
a11 a12 · · ·
 a21 a22 · · ·
A=
.
..
 ...
.
.
.

an1 an2 · · ·
on symmetrinen ts.
A = AT .
λ1 0 · · ·
 0 λ2 · · ·
D=
.
..
 ...
.
.
.
0
···
0
P
jolle
P T AP = D,
missä

0
0 

. .
.
.
λn
(x1 x2 . . . xn )T = P (u1 u2 . . . un )T
Tällöin nimittäin muuttujan vaihdolla
h(x1 , . . . , xn )
ann
Tavoitteena on löytää matriisi

neliömuoto

a1n
a2n 

.

.
.
saadaan
diagonaaliseksi neliömuodoksi
h(u1 , . . . , un ) = λ1 u21 + · · · + λn u2n .
Miten
ts.
P
tulisi valita? Oletetaan, että
P T P = I.
P
Tällöin
P = (P1 P2 . . . Pn ) on ortonormaali n×n-matriisi
on säännöllinen,
P −1 = P T
ja
P T AP = D ⇐⇒ P −1 AP = D ⇐⇒ AP = DP ⇐⇒ AP1 = λ1 P1 , . . . , APn = λn Pn .
Täten on voimassa seuraava tulos:
Lemma 1. Jos
yhtälöiden
P P T = I,
niin
P T AP = D
AX = λ1 X, . . . , AX = λn X
jos ja vain jos
λi
ja vektorit
Pi
ovat vastaavasti
jotkin ratkaisut joillakin reaaliluvuilla
Osoittautuu, että myös käänteinen tulos pätee ts. jos
massa reaaliluvut
P1 , . . . , P n
joille
APi = λi Pi
A
kaikilla
λ1 , . . . , λn .
on symmetrinen, niin on ole-
i = 1, . . . , n
ja
PPT = I
kun
P = (P1 P2 . . . Pn ).
Miten luvut
λ ja niitä vastaavat vektorit Xλ voidaan löytää? Kysymys on niin keskeinen,
että asetamme seuraavan yleisen määritelmän.
Määritelmä. Olkoon
BX = λX
B
n × n-matriisi ja λ ∈ C. Jos yhtälöllä
ratkaisu Xλ , sanotaan lukua λ matriisin B
kompleksilukukertoiminen
on jokin nollavektorista eroava
ominaisarvoksi ja vektoria
Xλ
siihen kuuluvaksi ominaisvektoriksi.
Edellinen kysymys voidaankin asettaa yleisemmässä muodossa: miten matriisin
B
omi-
naisarvot ja niihin liittyvät ominaisvektorit voidaan löytää? Vastaus on (ainakin periaatteessa) helppo: koska
X 6= 0,
niin
BX = λX ⇐⇒ (B − λI)X = 0 ⇐⇒ det(B − λI) = 0.
3
n-asteisen
Täten ominaisarvot ovat
naisarvoyhtälön) ratkaisut ja ominaisarvoon
(B − λI)X = 0
t=λ
Rajoitutaan nyt (hetkeksi) tapaukseen, missä
A=
A
(eli
B :n
omi-
kuuluvat ominaisvektorit ovat yhtälön
X ∈ R2 \ {0̄}.
ratkaisut
Lause 2. Matriisin
det(B − tI) = 0
polynomiyhtälön
ac
,
cb
A on reaalinen symmetrinen 2×2-matriisi
c 6= 0.
ominaisarvot ovat reaaliset ja erisuuret, ja niitä vastaavat ominais-
vektorit ovat toisiaan vasten kohtisuorassa.
Todistus. Nyt
det(A − tI) = 0 ⇔ (a − t)(b − t) − c2 = 0 ⇔ t2 − (a + b)t + ab − c2 = 0.
c 6= 0,
Koska
niin tämän yhtälön juuret
α=
a+b+
p
(a − b)2 + 4c2
2
ja
ovat reaaliset ja erisuuret. Koska matriisin
on
A:n
β=
A − λI
a+b−
p
(a − b)2 + 4c2
2
rivit ovat lineaarisesti riippuvat jos
λ
ominaisarvo, niin
c
(A − λI)Xλ = 0 ⇐⇒ (a − λ)x1 + cx2 = 0 ⇐⇒ Xλ = s
λ−a
∀s ∈ R.
Täten
Xα · Xβ = 0 ⇐⇒ c2 + (α − a)(β − a) = 0 ⇐⇒ c2 + αβ − (α + β)a + a2 = 0.
α+β =a+b
Koska
ja
αβ = ab − c2 ,
niin väite seuraa.
Lemman 1 ja Lauseen 2 nojalla saamme menetelmän matriisin
P
konstruoimiseksi ja
näin menetelmän yhtälön (1) diagonalisoimiseksi eli saattamiseksi muotoon (2):
α ja β ominaisarvoyhtälön det(A − tI) = 0 ratkaisut.
Olkoot Xα ja Xβ yhtälöryhmien (A − αI)X = 0 ja (A − βI)X = 0 nollavektorista
(5) Olkoot
(6)
eroavia ratkaisuja.
(7)
P = (P1 P2 ),
missä
P1 =
Xα
ja
||Xα ||
P2 =
Xβ
.
||Xβ ||
Yhtälöistä (6) riittää ratkaista vain toinen. Nimittäin, jos esim.
vektorien
Xα
ja
Xβ
kohtisuoruuden nojalla voidaan valita
Xα = (x1 x2 )T ,
T
Xβ = (−x2 x1 )
T
niin
.
(−x2 x1 ) on välttämättä ominaisarvoon β kuuluva ominaisvektori, sillä (−x2 x1 )T
2
kuuluu Xα :n virittämän R :n aliavaruuden ortogonaalikomplementtiin, joka puolestaan on
Nyt
Xβ :n
virittämä.
Voidaan siis valita (ks. Lauseen 2 todistus):
Xα =
√
missä
α=
a+b+
(a−b)2 +4c2
ts.
2
1
α−a
c
ja
Xβ =
− α−a
c
,
1
4
1
√
|c|
s + c s2 + 1
Xα =
missä
s=
ja
Xβ =
−s −
|c|
c
√
s2 + 1
1
,
b−a
.
2c
Täten yhtälön (1) diagonalisoiva matriisi
1
P =
||Xα ||
jota vastaava lineaarikuvaus
ī + (s +
|c|
c
√
s2 + 1)j̄
s+
f
1
√
|c|
c
kiertää
suuntainen ja
A=
√
s2 + 1
,
1
|c|
c
s2 + 1
xy -tason uv -tasoksi,
v -akseli on vektorin −(s +
Esimerkki 1. Diagonalisoidaan yhtälö
Tämän yhtälön matriisi
−s −
u-akseli on vektorin
√
2
s + 1)ī + j̄ suuntainen.
missä
|c|
c
5x2 + 4xy + 2y 2 = 1 ja tarkastellaan sen kuvaajaa.
2
5
, jonka ominaisarvot
2 2
α
ja
β
ovat yhtälön
det(A − tI) = (5 − t)(2 − t) − 4 = 0
juuret ts.
α =
7+5
2
= 6, β =
2
Koska nyt
s=
suuntainen ja
v -akseli
= 1.
6u + v = 1
koordinaatistossa muotoa
2−5
4
7−5
2
2
= −3/4,
niin
on vektorin
Täten yhtälö
− 12 ī + j̄
on vektorin
jonka ominaisarvot
α
ja
β
ī +
(− 43
+
q
9
16
+ 1)j̄ = ī + 12 j̄
arctan(1/2) ≈ 26.57◦
x2 − 12xy + 6y 2 + x + y = 2
x2 − 12xy + 6y 2
A=
uv -
suuntainen.
Kyseessä on siis tason kierto vastapäivään kulman
kuvaajaa. Nyt neliömuodon
on
ja vastaava tasokäyrä on siis ellipsi.
u-akseli
Esimerkki 2. Diagonalisoidaan yhtälö
5x2 + 4xy + 2y 2 = 1
matriisi on
1 −6
−6
6
,
ovat yhtälön
det(A − tI) = (1 − t)(6 − t) − 36 = 0
verran.
ja tarkastellaan sen
5
juuret ts.
5
− 12
−
13
12
α =
7+13
2
= 10, β =
= − 18
= − 23 ,
12
7−13
2
= −3.
Nyt
s =
b−a
2c
5
= − 12
ja
s+
|c|
c
√
1 + s2 =
joten
Xα =
1
−3/2
ja
3/2
Xβ =
1
ja
2
P =√
13
joka vastaa tason kiertoa kulman
Täten yhtälö
1
=√
13
arctan(3/2) ≈ 56.31◦
1
3/2
−3/2 1
2 3
−3 2
,
verran myötäpäivään. Lisäksi
x
u
1
2u + 3v
=P
=√
.
y
v
13 −3u + 2v
x2 − 12xy + 6y 2 + 3x + 2y = 2 on uv -koordinaatistossa
3
2
10u2 − 3v 2 + √ (2u + 3v) + √ (−3u + 2v) = 2
13
13
13
⇐⇒ 10u2 − 3v 2 + √ v = 2
13
!
√
13
⇐⇒ 10u2 − 3 v 2 −
v =2
3
√ !2
13
11
13
=2−
=
⇐⇒ 10u2 − 3 v −
6
12
12
√ !2
120 2 36
13
⇐⇒
u −
v−
=1
11
11
6
muotoa
Tätä yhtälöä vastaava käyrä on hyperbeli, jonka symmetriapisteen koordinaatit ovat
√
(u, v) = (0, 13/6)
eli
(x, y) = (1/2, 1/3).
Palataan sitten yleiseen tapaukseen missä
A
on reaalinen ja symmetrinen
n × n-matriisi.
6
Jos
n > 2,
niin suurin muutos tapaukseen
naisarvoyhtälöllä voi olla vähemmän kuin
n
n=2
verrattuna on se, että nyt
A:n
omi-
erisuurta juurta. Toisaalta Lause 2 yleistyy
Lauseiksi 3 ja 4:
Lause 3. Matriisin
Todistus. Olkoon
vektorin
X
A
ominaisarvot ovat reaaliset.
λ ∈ C A:n
ominaisarvo ts.
kompleksikonjugaatti ts.
AX = λX
X · X = ||X||2 .
jollakin
X ∈ Cn \ {0̄}.
Olkoon
X
Koska
X · AX = X · λX = λX · X = λ||X||2
ja toisaalta
T
X · AX = X AX = (AT X)T X = AT X · X = AX · X = λ̄X · X = λ̄||X||2 ,
niin
(λ − λ̄)||X||2 = 0.
Lause 4. Matriisin
A
Koska
X 6= 0,
niin
λ = λ̄
λ ∈ R.
ts.
eri ominaisarvoihin liittyvät ominaisvektorit ovat toisiaan vastaan
kohtisuorassa.
Todistus. Olkoot
α
ja
β A:n
ominaisarvoja,
α 6= β .
Koska
AT = A,
niin
βXα · Xβ = Xα · βXβ = Xα · AXβ = AXα · Xβ = αXα · Xβ
ja näin ollen
(α − β)Xα · Xβ = 0.
Seuraus. Matriisin
A:n
Koska
α 6= β ,
niin
Xα · Xβ = 0.
A ominaisvektoreista voidaan muodostaa Rn :n ortonormali kanta, jos
ominaisarvot ovat pareittain erisuuret.
Todistus. Algebran peruslauseen nojalla
A:lla
on
n
ominaisarvoa. Lauseen 3 nojalla ne
ovat kaikki reaalisia ja oletuksen ja Lauseen 4 nojalla niitä vastaavat ominaisvektorit ovat
pareittain toisiaan vastaan kohtisuorassa ja täten lineaarisesti riippumattomia.
−2x2 + 11y 2 + 5z 2 − 12xy + 12xz = 1.
−2x2 + 11y 2 + 5z 2 − 12xy + 12xz matriisi


−2 −6 6
A =  −6 11 0  ,
6
0 5
Esimerkki 3. Diagononalisoidaan yhtälö
ömuodon
Neli-
jonka ominaisarvoyhtälö on


−2 − t −6
6
−6 6 + (5 − t) −2 − t −6
11 − t
0  = 6 0 = (A − tI) =  −6
−6
11 − t 0 11 − t
6
0
5−t
= −t3 + 14t2 + 49t − 686.
Täten matriisin
ominaisvektorit:
A
ominaisarvot ovat
α = −7, β = 7, γ = 14.
Lasketaan vastaavat
7


  




5 −6 6
x1
0
x1
6
(A−αI)X = 0 ⇐⇒  −6 18 0   x2  =  0  ⇐⇒  x2  = t  2  , t ∈ R.
6
0 12
x3
0
x3
−3


  


 
−9 −6 6
x1
0
x1
2









−6 4
0
x2
0
x2
(A−βI)X = 0 ⇐⇒
=
⇐⇒
= t 3  , t ∈ R,
6
0 −2
x3
0
x3
6


  




−16 −6 6
x1
0
x1
−3
(A−γI)X = 0 ⇐⇒  −6 −3 0   x2  =  0  ⇐⇒  x2  = t  6  , t ∈ R,
6
0 −9
x3
0
x3
−2
Täten neliömuodon diagonalisoivaksi matriisiksi
P
voidaan valita (ks. Lemma 2) esim.


6 2 3
1
P =  2 3 −6  .
7
−3 6 2
−2x2 + 11y 2 + 5z 2 − 12xy + 12xz = 1 määräämä pinta on hyperboloidin
−7x2 + 7y 2 + 14z 2 = 1 kuva kuvauksessa f : R3 −→ R3 , f (X) = P (X). Luvussa 2
Siispä yhtälön
näemme, että kuvaus
ympäri kulman
f
vastaa avaruuden
◦
arccos(2/7) ≈ 73.4
2
2
R3
kiertoa (vektorin
2ī + j̄
suuntaisen suoran
verran vastapäivään).
2
−2x +11y +5z −12xy+12xz = 1 määräämä pinta on uvw-koordinaatiston
2
2
2
hyperboloidi −7u +7v +14w = 1, kun u-akseli on vektorin 6ī+2j̄ −3k̄ , v -akseli vektorin
Täten yhtälön
2ī + 3j̄ + 6k̄
ja
w-akseli
vektorin
3ī − 6j̄ + 2k̄
Tarkastellaan sitten yleistä tapausta, missä
suuntainen.
A:n ominaisarvot eivät olekaan välttämättä
pareittain erisuuria. Silloinkin pätee seuraava tulos:
Lause 5. Matriisin
A
ominaisvektoreista voidaan muodostaa
Rn :n
ortonormali kanta.
Tämä on melko syvällinen tulos ja sen todistamiseksi kehittelemme vielä hivenen lineaarialgebran koneistoa.
Olkoon
V
vektoriavaruuden
jokin kanta. Olkoon
suhteen ts.
f
Rn m-dimensioinen
lineaarikuvaus
f : V −→ V
aliavaruus ja
ja
Mf
V = {v̄1 , . . . , v̄m }
kuvauksen
f
sen
matriisi kannan
V
8
f (v̄i ) = a1i v̄1 + a2i v̄2 + · · · + ami v̄m , i = 1, . . . , m,
jos
a11
 a21
Mf = 
 ...
···
···
a12
a22


a1m
a2m 
.
.

.
.
.
.
.
am1 am2 · · ·
Jos nyt
f : V → V
lineaarikuvaus ja
on jokin nollavektorista eroava ratkaisu
ominaisarvoksi ja vektoria
vain jos
amm
x̄ = x1 v̄1 +· · ·+xm v̄m ∈ V , niin selvästi f (x̄) = Mf X , missä X = (x1 x2 . . . xm )T .
Määritelmä. Olkoon
Koska
niin
x̄λ
x̄λ ∈ V ,
λ ∈ R.
Jos yhtälöllä
sanotaan lukua
λ
f (x̄) = λx̄
lineaarikuvauksen
f
siihen kuuluvaksi ominaisvektoriksi.
f (x̄) = Mf X , niin vektori x̄ on reaalilukuun λ kuuluva f :n ominaisvektori jos ja
X on λ:aan kuuluva Mf :n ominaisvektori.
Määritelmä. Lineaarikuvaus
f :V →V
on symmetrinen jos
f (x̄) · ȳ = x̄ · f (ȳ)
kaikilla
x̄, ȳ ∈ V .
Lemma 2. Olkoon
kannan
V
f :V →V
suhteen. Tällöin
Todistus. Koska
V
f
lineaarikuvaus ja
Mf
sen matriisi jonkin ortonormaalin
on symmetrinen jos ja vain jos
on ortonormaali, niin
x̄ · ȳ = X · Y
Mf
kaikilla
on symmetrinen.
x̄, ȳ ∈ V .
Täten
f (x̄) · ȳ = x̄ · f (ȳ) ∀x̄, ȳ ∈ V
⇐⇒ Mf X · Y = X · Mf Y
∀X, Y ∈ Rm .
⇐⇒ (Mf X)T Y = X T Mf Y
∀X, Y ∈ Rm
⇐⇒ X T MtT Y = X T Mf Y
∀X, Y ∈ Rm
⇐⇒ X · MfT Y = X · Mf Y
∀X, Y ∈ Rm
⇐⇒ X · (MfT Y − Mf Y ) = 0 ∀X, Y ∈ Rm .
MfT Y − Mf Y = 0
Täten
kaikilla
Y ∈ Rm
eli
(MfT − Mf )Y = 0
kaikilla
Y ∈ Rm .
Siispä
MfT = Mf .
Lause 4'. Olkoon
sella
f
on
m
symmetrinen lineaarikuvaus, missä
Mf
kuvauksen
F
ominaisarvoa. Lemman 2 nojalla
f :n
Mf
m,
niin algebran peruslauseen nojalla sillä on
m
Mf :n
ja
on symmetrinen, joten Lauseen 4 nojalla
ominaisarvot ovat reaalisia.
Lauseen 5 todistus. Olkoon
AX .
Kuvauk-
matriisi jonkin ortonormaalin kannan suhteen. Koska
ominaisarvopolynomin aste on
täten
dim V = m.
ominaisarvoa (eivät välttämättä erisuuria) ja ne ovat reaalisia.
Todistus. Olkoon
Mf :n
f : V −→ V
f A:n
määräämä lineaarikuvaus ts.
Lemman 2 ja Lauseen 4' nojalla
f :llä
on
n
f : Rn −→ Rn , f (X) =
reaalista ominaisarvoa.
9
Olkoon
ruus. Nyt
U1 ominaisarvoon λ1 kuuluvan f :n ominaisvektorin ū1 virittämä Rn :n aliavaRn voidaan hajottaa suoraksi summaksi Rn = U1 ⊕ U1⊥ ja sille saadaan kanta
{ū1 , v̄2 , . . . , v̄n }
missä
Osoitetaan, että
v̄2 , . . . , v̄n ∈ U1⊥ .
f (U1⊥ ) ⊆ U1⊥ .
Olkoon
v̄ ∈ U1⊥ .
Nyt
f :n
symmetrisyyden nojalla
ū1 · f (v̄) = f (ū1 ) · v̄ = λ1 ū1 · v̄ = 0,
joten
f (U1⊥ ) ⊆ U1⊥ .
dim U1⊥ = n − 1
Koska
nojalla sillä (ja siis
f
ja
on symmetrinen myös rajoitettuna
U1⊥ :lle,
niin Lauseen 4'
A:lla) on n − 1 reaalista ominaisarvoa joihin kuuluvat ominaisvektorit
∈ U1⊥ .
Olkoon
Nyt
U2
ominaisarvoon
λ2
kuuluvan ominaisvektorin
⊥
n
R = U1 ⊕ U2 ⊕ (U1 + U2 )
⊥
(U1 + U2 ) . Lisäksi f :n
U2 )T ) ⊆ (U1 + U2 )T .
ja sillä on kanta
ū2
virittämä
{ū1 , ū2 , v̄3 , . . . , v̄n },
U1⊥ :n
missä
aliavaruus.
v̄3 , . . . , v̄n ∈
lineaarisuuteen nojautuen nähdään kuten edellä, että
Jatkamalla prosessia saadaan
Rn :lle
lopulta
A:n
ominaisvektoreista
f ((U1 +
ū1 , ū2 , . . . , ūn
orto-
gonaalinen kanta.
Esimerkki 4. Diagononalisoidaan yhtälö
Neliömuodon
58x2 + 85y 2 + 53z 2 − 36xy + 12xz − 24yz = 1.
58x2 + 85y 2 + 53z 2 − 36xy + 12xz − 24yz matriisi


58 −18 6
A =  −18 85 −12  ,
6 −12 53
jonka ominaisarvoyhtälö on

58 − t −18
6
0 = (A − tI) =  −18 85 − t −12  = t3 − 196t2 + 12005t − 235298
6
−12 53 − t

= (t − 49)2 (t − 98).
Täten matriisin
A
ominaisarvot ovat
α = 49, β = 49, γ = 98.
Lasketaan vastaavat omi-
naisvektorit käyttäen Lauseen 5 todistuksessa käytettyä menetelmää (vaikka ne voitaisiin
toki laskea ilmankin sitä). Ensinnäkin


  


 
11 −18 6
x1
0
x1
2
(A−αI)X = 0 ⇐⇒  −18 36 −12   x2  =  0  ⇐⇒  x2  = t  3  , t ∈ R.
6 −12 4
x3
0
x3
6
Valitaan
ū1 = 2ī + 3j̄ + 6k̄ .
Jos
kannaksi voidaan valita esim.
f (X) = AX ,
rajoitetaan se
U
U1
on tämän vektorin virittämä aliavaruus, niin
{v̄2 , v̄3 },
⊥
missä
v̄2 = 3ī − 2j̄
ja
v3 = 3ī − k̄ .
:lle ja lasketaan tämän rajoittuman matriisi
= 210ī − 224j̄ + 42k̄ = 112v̄2 − 42v̄3
Olkoon nyt
Mf .
f (v̄2 ) = 3f (ī) − 2f (j̄) = 3(58ī − 18j̄ + 6k̄) − 2(−18ī + 85j̄ − 12k̄)
U1⊥ :n
Koska
10
ja
f (v̄3 ) = 3f (ī) − f (k̄) = 3(58ī − 18j̄ + 6k̄) − (6ī − 12j̄ + 53k̄)
niin
Mf =
U ⊥:
koska
= 168ī − 42j̄ − 35k̄ = 21v̄2 + 35v̄3 ,
112 21
. Lasketaan ominaisarvoon β = 49
−42 35
(Mf − 49I)X = 0 ⇐⇒
63
21
−42 −14
x1
x2
=
0
0
liittyvä ominaisvekori
⇐⇒
x1
x2
=t
(U +
,
ū2 = −v̄2 + 3v̄3 = 6ī + 2j̄ − 3k̄ . Lopuksi valitsemme vektorin
T ⊥
U ) , joten voidaan valita ū3 = 3ī − 6j̄ + 2k̄ .
niin voidaan valita
avaruudesta
−1
3
ū2 ∈
P

Näin ollen neliömuodon diagonalisoivaksi matriisiksi

P =
ū3
voidaan valita
6 2 3
1
2 3 −6  ,
7
−3 6 2
joka sattuu olemaan täsmälleen sama matriisi kuin edellisessä esimerkissä.
Täten yhtälön
58x2 + 85y 2 + 53z 2 − 36xy + 12xz − 24yz = 1
uvw-koordinaatiston
ellipsoidi
6ī + 2j̄ − 3k̄ , v -akseli
vektorin
2
2
2
49u + 49v + 98w = 1,
missä jälleen
2ī + 3j̄ + 6k̄
vektorin
ja
w-akseli
määräämä pinta on
u-akseli
on vektorin
3ī − 6j̄ + 2k̄
suuntainen.
11
2. Avaruuden
Rn
kierroista
n × n-matriisit vastaavat avaruuden R kiertoja, kun n = 2, 3. Mitä on vaadittava esimerkiksi 2 × 2-matriisilta P , että
Edellisessä luvussa väitimme, että tietyt ortonormaalit
n
R2
sitä vastaava lineaarikuvaus olisi tason
kierto? Ainakin sen on säilytettävä vektorien
pituudet ja niiden väliset kulmat.
n positivinen kokonaisluku, P n×n-matriisi ja f : Rn −→ Rn , f (X) =
kuvauksia f jotka toteuttavat seuraavat ehdot:
Yleisemmin: olkoon
P X.
Tarkastellaan
||P X|| = ||X|| ∀X ∈ Rn ,
n
kulmat ts. ] P X, P Y = ](X, Y ) ∀X, Y ∈ R .
(1)
f
säilyttää vektorien pituudet ts.
(2)
f
säilyttää vektorien väliset
Osoittautuu, että ehdot (1) ja (2) toteutuvat jos ja vain jos matriisi
ts. pystyrivit
P1 , . . . , P n
muodostavat ortonormaalin joukon ts.
T
T
2
det(P P ) = det(P ) det(P ) = det(P )
matriisin determinantti on aina
Lause 1. Olkoon
PX
P
P P T = I.
Koska
P i · Pj = 0
Koska
1 =
, niin ehdot (1) ja (2) toteuttavan kuvauksen
f
±1.
P = (P1 P2 . . . Pn ) n×n-matriisi. Lineaarikuvaus f : Rn −→ Rn , f (X) =
säilyttää vektorien pituudet ja niiden väliset kulmat jos ja vain jos
Todistus. Olkoot
on ortonormaali
X, Y ∈ Rn ,
jos
i 6= j ,
jolloin
P X = x 1 P1 + · · · + x n P n
ja
P P T = I.
P Y = y1 P1 + · · · + yn Pn .
niin
=1
=1
z }| {
z }| {
||P X||2 = P X · P X = x21 ||P1 ||2 + · · · + x2n ||Pn ||2 = ||X||2
f
eli
säilyttää pituuden.
Osoitetaan, että
f
säilyttää pistetulon:
P :n
ortonormaalisuuden nojalla
P X · P Y = (x1 P1 + · · · + xn Pn ) · (y1 P1 + · · · + yn Pn ) = x1 y1 + · · · + xn yn = X · Y.
Nyt
](P X, P Y ) =
f
eli
säilyttää kulman.
Oletetaan sitten, että
f
PX · PY
X ·Y
=
= ](X, Y )
||P X|| ||P Y ||
||X|| ||Y ||
f
säilyttää vektorien pituudet ja niiden väliset kulmat. Tällöin
säilyttää pistetulon, joten
X · Y = P X · P Y = (P X)T P Y = X T P T P Y = X · P T P Y
∀X, Y ∈ Rn
ekvivalentisti
X · (Y − P T P Y ) = 0 ∀X, Y ∈ Rn .
Täten
T
Y − PTPY = 0
P P =I
eli
P
f (ū) = cū,
Y ∈ Rn
eli
(I − P T P )Y = 0
kaikilla
Y ∈ Rn
f : Rn+1 → Rn+1
joillakin
ū ∈ R
n+1
ja näin ollen
on ortogonaalinen.
Lemma 1. Olkoon
Jos
kaikilla
lineaarikuvaus, jonka matriisi
\ {0̄}
ja
c ∈ R,
niin on olemassa
P
on ortonormaali.
n+1
R
:n kanta jonka
12
suhteen
f :n
Q
matriisi
on muotoa
c 0 ···
 0 a11 · · ·
Q=
..
 ... ...
.

0 an1 · · ·

0
a1n 
,
.

.
.
ann
missä

A=
a11 · · ·
.
.
.
..
.
an1 · · ·
a1n

.
.
.

ann
on ortonormaali.
Todistus. Täydennetään joukko
{ū} avaruuden Rn+1 ortonormaaliksi kannaksi V = {ū, ū1 , . . . , ūn }.
Nyt
f (ū) = cū + 0 · ū1 + · · · + 0 · ūn
f (ū1 ) = u1 ū + a11 ū2 + · · · + an1 ūn
.
.
.
f (ūn ) = un ū + a1n ū2 + · · · + ann ūn
cuk = f (ū) · f (ūk ) = 0, kaikilla k = 1, . . . , n. Koska
välttämättä c 6= 0, niin nyt u1 = · · · = un = 0. Nyt myös 0 = f (ūi ) · f (ūj ) = a1i a1j + · · · +
Koska
f
ani anj
kaikilla
i 6= j ,
Täten
Q
ovat väitettyä muotoa.
säilyttää kulmat, niin
ja
A
Oletetaan että
ja
n = 2,
1 = ||f (ūj )|| = ||(a1j , . . . , anj )||
olkoon
f
koska
f
säilyttää myös pituudet.
ehdot (1) ja (2) täyttävä lineaarikuvaus ja
P =
sen matriisi luonnollisen kannan
a c
b d
{ī, j̄} suhteen. Koska P
on ortogonaalinen, niin
ac + bd =
0.
Jotta
(3)
f
f
olisi tason kierto, vaadimme ehtojen (1) ja (2) lisäksi, että pätee ehto:
säilyttää
x-
Esimerkki 1. Jos
ja
y -akselien
P =
0 1
, niin sitä vastaava kuvaus
1 0
muttei ehtoa (3), sillä se vaihtaa
peilaus suoran
y=x
keskinäisen järjestyksen.
x-akselin y -akseliksi
ja
f
toteuttaa ehdot (1) ja (2)
y -akselin x-akseliksi
kiertoa kiertona avaruudessa
ja
f (j̄)
f
on
suhteen.
Jotta saisimme laskennallisen kriteerin joka vastaa ehtoa (3), niin ajatellaan
f (ī)
eli
ja vektori
k̄
R3 : xy -tasoa
kierretään
z -akselin
xy -tason
ympäri niin, että vektorit
muodostavat oikeankätisen systeemin ts. vektorien
f (ī)
ja
f (j̄)
13
ristitulon on oltava vektorin
k̄
ī j̄ k̄
f (ī) × f (j̄) = a b 0
c d 0
f
Täten
vain jos
Täten
f (ī) = aī + bj̄ ja f (j̄) = cī + dj̄ ,
= (ad − bc)k̄ = det(P )k̄.
suuntainen. Koska
f (ī) × f (j̄)
det(P ) = 1.
toteuttaa ehdon (3) jos ja vain jos
det(P ) > 0
f
on
jos ja vain jos
xy -tason
P =
a2 + b2 = 1.
a = cos α
Koska tällöin
b = sin α
ja
1
0
P
=
P =
f
suuntainen jos ja
a −b
b a
a
, niin
b
P
on muotoa
,
f
kiertää tasoa kulman
α
verran missä
ts.
Entäpä jos
k̄
kierto eli toteuttaa ehdot (1), (2) ja (3) jos ja vain
missä
on vektorin
niin
cos α − sin α
sin α cos α
.
toteuttaa ehdot (1) ja (2) muttei ehtoa (3) ts.
det(P ) = −1?
Nyt
P
on
−1, joten se on muotoa
a b
1 0
a −b
P =
=
,
b −a
0 −1
b a
ortogonaalinen ja sen determinantti on
missä
a2 + b2 = 1.
xy -tasoa kulman arccos(a) verran ja sitten peilaa
sen x-akselin suhteen. Osoittautuu, kuitenkin että f voidaan ajatella pelkkänä peilauksena
Täten
suoran
`
f
on kuvaus, joka ensin kiertää
suhteen, jonka yhtälö seuraavassa määritetään.
Osoitetaan ensin, että
f (ū) = ū
jollakin
ū ∈ R2
ts.
PX = X
jollakin
X ∈ R2 .
Ensinnä-
kin
P X = X ⇐⇒ (P − I)X = 0 ⇐⇒
Koska
det(P − I) = −(a2 − 1) − b2 = 0,
riippuvat, ja täten on olemassa
x
ja
y
toteuttavat suoran
`
`:
kanta
{ū, v̄}
f
ū ∈ R
y=0
(a − 1)x + by = 0
on peilaus suoran
jonka suhteen
(P − I):n
f (ū) = ū.
jolle
f :n
A=
det(A) = det(P ) = −1,
Täten on todistettu seuraava:
`
jos
jos
vaakarivit ovat lineaarisesti
Lisäksi
P
x
y
=
x
y
jos ja vain jos
niin
c = −1.
a = 1,
a 6= 1.
suhteen. Lemman 1 nojalla on olemassa
matriisi
Koska
niin
x
0
=
.
y
0
yhtälön, kun
Osoitetaan sitten, että
2
a−1
b
b
−a − 1
1 0
0 c
.
14
f : R2 → R2
Lause 2. Olkoon
lineaarinen kuvaus joka toteuttaa ehdot (1) ja (2),
P
sen
λ = det(P ). Tällöin
a −b
1 0
cos α − sin α
=
.
b a
0 λ
sin α cos α
matriisi luonnollisen kannan suhteen ja
1 0
0 λ
P =
(a) Jos
λ = 1,
(b) Jos
λ = −1,
niin
f
toteuttaa ehdon (3) ja on
niin
f
xy -tason
ei toteuta ehtoa (3) ja on
kun
`:
y=0
(a − 1)x + by = 0
kierto kulman
xy -tason
jos
jos
α
verran.
peilaus suoran
`
suhteen,
a = 1,
a 6= 1.
xy -tasoa ensin kulman β verkulman α + β verran. Olkoon
Tarkastellaan vielä kahta peräkkäistä kiertoa: kierretään
ran ja sitten kulman
fα , fβ
ja
fα+β
α
verran, jolloin tasoa on kierretty
ko. kiertoja vastaavat lineaarikuvaukset. Koska
fα+β = fα ◦ fβ ,
niin nyt
Lauseen 2 nojalla
cos(α + β) − sin(α + β)
sin(α + β) cos(α + β)
=
cos α − sin α
sin α cos α
cos β − sin β
sin β cos β
.
Täten saamme seuraavat tutut kosinin ja sinin yhteenlaskukaavat:
cos(α + β) = cos α cos β − sin α sin β
sin(α + β) = sin α cos β + cos α sin β.
Oletetaan sitten, että
Lemma 2. Olkoon
jollakin
2
P
X ∈ R \ {0̄}
n = 3.
ortonormaali
ts.
3 × 3-matriisi.
f (ū) = det(P )ū,
Yhtälö
2
u∈R
jollakin
P X = det(P )X
on ratkeava
.
λ = det(P ) = ±1. Riittää osoittaa, että det(P − λI) = 0. Ensinnäkin
P (P − λI) = I − λP T = λ(λI − P T ) = λ(λI − P )T . Koska λ det(P T ) =
Todistus. Olkoon
havaitaan, että
T
λ det(P ) = λ2 = 1,
niin
det(P − λI) = λ det(P T ) det(P − λI) = λ det(P T (P − λI))
= λ det(λ(λI − P )T ) = λ4 det((λI − P )T )
= det(λI − P ) = −(P − λI),
ja näin ollen
Avaruuden
det(P − λI) = 0.
R3
kierrolla tarkoitamme kuvausta
origon kautta kulkevan suoran eli kiertoakselin
tainen vektori ja
a c
b d
joka kiertää avaruuden
ympäri ts. jos
ū
R3
jonkin
on kiertoakselin suun-
V = {ū, v̄, w̄} on jokin oikeakätinen ortonormaali joukko, niin f :n matriisi
tämän kannan suhteen on
missä
u
f,
vastaa
vw-tason


1 0 0
Q =  0 a c ,
0 b d
kiertoa.
15
Oletetaan, että
olemassa
3
ū ∈ R
f
joukko. Jotta
f
on ehdot (1) ja (2) täyttävä lineaarikuvaus ja oletetaan, että on
jolle
f (ū) = ū.
Olkoon
R3
olisi avaruuden
V = {ū, v̄, w̄}
jokin oikeakätinen ortonormaali
kierto, vaadimme nyt että ehtojen (1) ja (2) lisäksi
pätee ehto:
(3')
f
säilyttää joukon
V
oikeakätisyyden ts.
Lemman 1 nojalla kuvauksen
f
Q

matriisi
{f (ū), f (v̄), f (w̄)}
kannan
V suhteen

on oikeakätinen.
on muotoa
1 0 0

0 a c ,
Q=
0 b d
missä
A=
a c
b d
,
on ortonormaali.
Koska
{f (ū), f (v̄), f (w̄)}
on oikeakätinen, niin ristitulon
f (v̄) × f (w̄) = (ad − bc)ū =
det(A)ū on oltava vektorin f (ū) = ū suuntainen. Täten ehdon f (ū) = ū täyttävä lineaarikuvaus täyttää ehdon (3') jos ja vain jos
det(A) = 1
jos ja vain jos
det(P ) = det(Q) = 1.
Toisaalta Lemman 2 ja Lauseen 1 nojalla jokaisella ehdot (1) ja (2) täyttävällä lineaarikuvauksella
f : R3 −→ R3
f
Entäpä jos
on kiertoakseli ts. sellainen vektori
että
toteuttaa ehdot (1) ja (2) muttei ehtoa (3')? Nyt
mojen 1 ja 2 nojalla on olemassa ortonormaali kanta
Q
ū
{ū, v̄, w̄}
f (ū) = ū.
det(P ) = −1
ja Lem-
f :n
matriisi
jonka suhteen
on muotoa:


 
1 0 0
−1 0 0
−1 0 0
Q =  0 a c  =  0 0 0  0 a c ,
0 b d
0 0 0
0 b d

missä
A=
a c
b d
on ortonormaali ja
det(A) = 1.
Täten on todistettu seuraava:
Lause 3. Olkoon
koon
missä
3
ja
ū ∈ R
lineaarinen kuvaus joka toteuttaa ehdot (1) ja (2), ol-
f (ū) = λū. Olkoon V = {ū, v̄, w̄}
joukko. Silloin kannan V suhteen f :n matriisi on:

 

λ 0 0
λ
0
0
Q =  0 a −b  =  0 cos α − sin α  ,
0 b a
0 sin α cos α
λ = det(P )
ortonormaali
f : R3 → R3
, jolle
jokin oikeakätinen
f (v̄) = av̄ + bw̄.
λ = 1, niin f toteuttaa myös ehdon (3') ja f
ympäri kulman α verran.
(a) Jos
(b) Jos
λ = −1,
niin
f
ei toteuta ehtoa (3') ja
(u, v, w) 7→ (−u, v, w)
yhdistetty kuvaus.
f
on avaruuden
R3
kierto
u-akselin
on (a)-kohdan kierron ja peilauksen
16
Esimerkki 2. Esimerkin 1 peilausta voidaan ajatella avaruuden
f,
f (k̄) = −k̄ .
Täten kierron
f
√1 (ī
2
ū =
missä kiertoakseli on vektorin
matriisi
P
+ j̄)
suuntainen ts.
luonnollisen kannan

R3 180 asteen kiertona
f (ī) = j̄ , f (j̄) = ī ja
{ī, j̄, k̄}
suhteen on

0 1 0

1 0 0 .
P =
0 0 −1
Valitaan sitten
v̄ =
√1 (ī
2
− j̄)
ortogonnormaali, ja lasketaan
ja
f :n
w̄ = k̄ ,
matriisi
jolloin joukko
Q
V = {ū, v̄, w̄}
oikeakätinen ja
tämän kannan suhteen. Koska
f (ū) = ū,
1
1
1 f (v̄) = √ f (ī − j̄) = √ f (ī) − f (j̄) = √ j̄ − ī = −v̄,
2
2
2
niin


1 0
0
A =  0 −1 0  ,
0 0 −1
joka tosiaankin vastaa avaruuden
R3
180 asteen kiertoa vektorin
u
suuntaisen suoran
ympäri.
Esimerkki 3. Olkoon

6 2 3
1
P =  2 3 −6 
7
−3 6 2

ja tarkastellaan sen määräämää lineaarikuvausta
1,
joten
PX = X
jollakin
X ∈ R3 .
f : R3 → R3 , f (X) = P X . Nyt det(P ) =
Nyt
   

 
 
−1 2
3
x
x
6 2 3
0
x











0 ,
y
2 −4 −6
y
2 3 −6
⇐⇒
=7 y
P X = X ⇐⇒
=
−3 6 −5
z
0
−3 6 2
z
z
1
1
ja täten voidaan valita (x, y, z) = (2, 1, 0) ts. ū = √ 2ī+ j̄ . Valitaan lisäksi v̄ = √ ī−2j̄
5
5

ja
w̄ = −k ,
Q
tämän kannan suhteen.
jolloin
V = {ū, v̄, w̄}
on ortonormaali ja oikeakätinen. Lasketaan
f :n
Koska
7
1
7f (v̄) = √ f (ī) − 2f (j̄) = √ (6ī + 2j̄ − 3k̄) − (4ī + 6j̄ + 12k̄)
5
5
1
= √ (2ī − 4j̄ − 15k̄),
5
niin
1
1
7f (v̄) = cv̄ + dw̄ ⇐⇒ √ (2ī − 4j̄ − 15k̄) = c √ (i − 2j̄) − dk̄
5
5
√
⇐⇒ c = 2 ja d = 3 5,
matriisi
17
ja näin ollen
f (v̄) = 72 v̄ +
√
3 5
w̄. Siispä
7

1
0
0
√
2/7 −3 5/7  .
Q= 0 √
2/7
0 3 5/7

Täten
kulman
f
◦
arccos(5/14) ≈ 69.1
Olkoon
ts.
on kierto, joka kiertää avaruuden
R3
vektorin
ū
suuntaisen suoran ympäri
verran vastapäivään.
S avaruuden R3 toisen asteen pinta, jonka määräävä yhtälö on diagonaalimuotoa
S : ax2 + by 2 + cz 2 = 1,
S : X T DX = 1,


a 0 0
D =  0 b 0 .
0 0 c
ekvivalentisti
missä
X = (x y z)
ja
Havainnollistetaan animaatioiden avulla tällaisten pintojen kiertoa jonkin kiertoakselin
ympäri.
Olkoon siis
ū ∈ R3
ja
fα
avaruuden
kiertoakselin ympäri. Olkoon
R3
{ū, v̄, w̄},
kierto kulman
α
verran vektorin
ū
suuntaisen
jokin ortonormaali oikeakätinen joukko. Tämän
fα matriisi on


1
0
0
Qα =  0 cos α − sin α  .
0 sin α cos α
kannan suhteen lineaarikuvauksen
Olkoon
M
kannavaihdon
ū = M (0, 0, 1)T .
Koska
M
{ī, j̄, k̄} → {ū, v̄, w̄} matriisi ts. ū = M (1, 0, 0)T , v̄ = M (0, 1, 0)T ,
on nyt ortonormaali, niin
{ī, j̄, k̄}
luonnollisen kannan
M −1 = M T
ja kierron
fα
matriisi
suhteen on
Pα = M Q α M T .
U = Pα X jos ja vain jos X = PαT U , joten X T DX = 1 jos ja vain jos U T Pα DPαT U =
1. Täten fα on R3 :n kierto, joka kuvaa pinnan S pinnaksi
Nyt
Rα : X T Pα DPαT X = 1.
Esimerkki 4. Olkoon vaikkapa
√ 1 (11ī
266
ū =
√1 (ī
14
+ 2j̄ + 3k̄), v̄ =
− 3j̄ + k̄)
α
S : x2 − 3y 2 + 5z 2 = 1
w̄ =
kierretään
ū suuntaisen kiertoakselin ympäri, kun −2 ≤ x, y, z ≤ 2
arvosta 0 arvoon 6.2 ≈ 2π askelpituudella 0.1.
verran vektorin
kulkee (toistuvasti)
Tässä animaatiossa puolestaan kierretään kaksivaippaista hypeboloidia
5z 2 = 1
ja
+ 8j̄ − 9k̄).
Tässä animaatiossa yksivaippaista hypeboloidia
kulman
√1 (3ī
19
ja
α
S : x2 − 3y 2 −
saman kiertoakselin ympräri.
Tässä animaatiossa taasen kierrettävä objekti on ellipsoidi
−2 ≤ x, y, z ≤ 2
ja kiertoakseli on edelleen sama kuin edellä.
S : 2x2 + 3y 2 + 5z 2 = 1, kun