Osat 1-9: MAPU I + II

1. Vektorit
Projektioita Ax , . . . sanotaan vektorin koordinaateiksi tai
komponenenteiksi. Puhutaan myös vektorin
komponenttiesityksestä.
Koska vektorin paikalla ei ole merkitystä, voisimme
siirtää kaikki vektorit valitsemamme koordinaatiston
origoon, jolloin vektoria kuvaisivat sen kärjen
koordinaatit. Kääntäen, mitä tahansa avaruuden pistettä
voidaan pitää origosta lähtevän vektorin kärkenä. Tällöin
puhutaan usein paikka- eli radiusvektorista.
1.1 Vektorin käsite
Fysikaalisten suureiden spesifioimiseksi ei useinkaan
pelkkä suureen koko ole riittävä. Esimerkiksi liikettä
kuvattaessa on yleensä tarpeen kertoa myös liikkeen
suunta kolmiulotteisessa avaruudessamme. Liikkeen
puolestaan aiheuttaa johonkin suuntaan vaikuttava jonkin
suuruinen voima. Tällaisia suureita kuvaamaan on luotu
vektorit.
Vektori on suure, jolla on suunta ja suuruus. Skalaari
puolestaan on suure, jolla on vain suuruus.
Graafisesti vektori esitetään nuolena, jonka kärki osoittaa
vektorin suunnan ja pituus vektorin suuruuden.
A
x
z
A
A
C
z
A = ( A x,A y,A z)
z
C
r = P ( x ,y ,z ) = ( x ,y ,z )
y
x
Kuva 1.2 Paikkavektori
y
C = ( C x,C y,C z)
z
C
Esimerkiksi massapisteen paikkaa avaruudessa voisi
kuvata paikkavektori
y
y
B = ( B x,B y,B z)
x
B
r = (x, y, z).
Jos piste on liikkeessä, niin sen koordinaatit x, y ja z ovat
ajan funktioita, joten paikkavektorin r kärkikin liikkuu
ajan myötä:
z
x
B
B
x
y
r = r(t) = (x(t), y(t), z(t)).
Kuva 1.1 Vektorin esitys
Määritelmän mukaan vektorin paikalla avaruudessa ei ole
merkitystä. Esimerkiksi kuvan 1.1 kaikki kolme vektoria
ovat samoja, ts.
A = B = C.
r (t0)
r (t1)
Merkintöjä
Tekstissä vektoreita merkitään tavallisesti (mm. tässä esityksessä)
lihavoitetuilla symboleilla (A, r,β, . . .). Käsin kirjoitettaessa
vektoreiden päälle piirretään useimmiten yläviiva, Ā, joskus nuoli,
~
A.
Valitussa koordinaatistossa vektori voidaan spesifioida
esim.
Kuva 1.3 Liikkuva piste
• antamalla kaksi suuntakulmaa, vaikkapa vektorin ja
z-akselin välinen kulma sekä vektorin xy-tasolla
olevan projektion ja x-akselin välinen kulma, ja
vektorin pituus.
Liikkuvan pisteen nopeus v määräytyy ilmeisestikin
.
. sen
.
koordinaattien muutosnopeuksista x(t), y (t) ja z(t), ts.
.
.
.
v(t) = (x(t), y (t), z(t)).
• antamalla vektorin koordinaattiakseleilla olevien
projektioiden pituudet (merkki huomioiden).
Jos vielä sovimme, että vektori derivoidaan derivoimalla
sen komponentit, voimme kirjoittaa ytimekkäästi
.
Käytämme aluksi lähes yksinomaan jälkimmäistä esitystä.
Vektorin A spesifioivat siis sen projektiot
koordinaattiakseleille: kolmiulotteisessa avaruudessa
reaalilukukolmikko (Ax , Ay , Az ),
v(t) = r(t).
Vektorin määritelmän perusteella vektorit a = (ax , ay , az )
ja b = (bx , by , bz ) ovat yhtäsuuria jos ja vain jos niiden
vastinkomponentit ovat yhtäsuuria, ts. jos ja vain jos
ax = bx , ay = by ja az = bz . Tällöin merkitään a = b.
A = (Ax , Ay , Az ).
1
Vektorin ajatellaan olevan jotakin absoluuttista; vektori on
olemassa ja pysyy samana käytettiinpä millaista koordinaatistoa
tahansa tai toimittiinpa ilman koordinaatistoa. Vektorin esitys
komponenttimuodossa sen sijaan riippuu valitusta
koordinaatistosta. Mittakaava ja koordinaattiakseleiden suunnat
vaikuttavat vektorin komponentteihin. Esimerkiksi vektoreiden
yhtäsuuruudesta päätettäessä on pidettävä huoli siitä, että ne
esitetään samassa koordinaatistossa.
A
A
B
Määritellään nollavektori  siten, että
 = (0, 0, 0).
A + B
B
A -B
A
(1.1)
B
2
(A
A
+ A
x
(A
y
+ A
z
)1
/2
Kuva 1.5 Vektorien yhteen- ja vähennyslasku
A
A
x
x
A
2
2
2
+ A
y
Graafisesti kahden vektorin A ja B summa siis
muodostetaan siirtämällä esim. vektori B siten, että sen
kanta yhtyy vektorin A kärkeen. Summa- eli
resultanttivektori A + B on silloin vektorin A kannasta
vektorin B kärkeen ulottuva vektori. Erotusvektori
voidaan puolestaan muodostaa siten, että siirretään
molempien vektorien kannat samaan kohtaan. Erotus
A − B on nyt vektorin B kärjestä vektorin A kärkeen
ulottuva vektori.
z
2 1
/2
)
y
Kuva 1.4 Vektorin pituus
Laskutoimitusten ominaisuuksia
Vektorin suuruus on sama kuin vektorin pituus. Kuten
kuvasta 1.4 nähdään, on vektorin A = (Ax , Ay , Az )
pituus |A| Pythagoraan lauseen mukaan
q
|A| = A2x + A2y + A2z .
(1.2)
Suoraan määritelmistä on helppo todeta, että
• Vektoreiden yhteenlasku on kommutatiivinen, ts.
A + B = B + A.
• Vektoreiden yhteenlasku on assosiatiivinen, ts.
Hyvin usein vektorista käytetty symboli ilman
vektorimerkintää tarkoittaa ko. vektorin pituutta, esim.
A = |A|.
Ilmeisestikin A =  jos ja vain jos |A| = 0. Tämän vuoksi
hyvin usein jätetään vektorimerkintä pois nollavektorista.
A + (B + C) = (A + B) + C.
Sulut voidaan siis tämän kaltaisissa lausekkeissa
jättää merkitsemättä.
1.2 Vektorialgebra
• Skalaarilla kertominen on distributiivinen, ts.
Skalaarilla kertominen
λ(A + B) = λA + λB.
Olkoon A = (Ax , Ay , Az ) jokin vektori ja λ jokin
reaalinen vakio. Silloin λA on vektori
Yksikkövektorit
λA = (λAx , λAy , λAz ).
(1.3)
Yksikkövektori on sellainen√vektori, jonka pituus on yksi.
Esim. Vektorin A = (5, 3, 2) suuntainen yksikkövektori
Vektorin A pituus A on
q
√ 2 √
A = |A| = 52 + 32 + 2 = 36 = 6.
Skalaarilla λ kerrottaessa vektori siis säilyttää suuntansa
jos λ > 0 tai kääntyy vastakkaiseen suuntaan jos λ < 0.
Vektorin pituus muuttuu vakiolla λ kerrottaessa kuten
|λA| = |λ||A|.
Tällöin vektori
Yhteen- ja vähennyslasku
a=
Vektorien A = (Ax , Ay , Az ) ja B = (Bx , By , Bz ) summan
määrittelee yhtälö
A + B = (Ax + Bx , Ay + By , Az + Bz ).
on vektorin A suuntainen. Se on ilmeisestikin myös
yksikön mittainen, sillä
1 1
1
|a| = A = |A| = A = 1.
A
A
A
(1.4)
ja erotuksen yhtälö
A−B
=
=
A + (−1)B
(Ax − Bx , Ay − By , Az − Bz ).
√
1
1
5 1 1
A = (5, 3, 2) = ( , , √ )
A
6
6 2 3 2
(1.5)
2
Esim. Cauchy-Schwartzin epäyhtälö
Olkoot A ja B nollasta poikkeavia vektoreita ja λ
mielivaltainen skalaari. Tarkastellaan vektoreiden λA ja
B resultanttia λA + B ja erikoisesti sen pituuden neliötä
Yksikkövektorit erotetaan usein kirjoittamalla ˆ-merkki vektorin
yläpuolelle, kuten esim. b̂. Jos samassa yhteydessä puhutaan
myös vektorista b, niin silloin b̂ tarkoittaa yleensä vektorin b
suuntaista yksikkövektoria.
Koordinaattiakseleiden suuntaisia yksikkövektoreita
sanotáan yksikkökoordinaattivektoreiksi tai lyhyesti
kantavektoreiksi. Niitä merkitään usein kuten
ex
ey
ez
=
=
=
(1, 0, 0)
(0, 1, 0)
(0, 0, 1).
q(λ) = |λA + B|2 .
Kuten näimme, vektorin pituuden neliö on vektorin
skalaaritulo itsensä kanssa, ts.
(1.6)
q(λ)
=
=
. Toinen hyvin paljon käytetty merkitsemistapa on
i = ex , j = ey ja k = ez .
(1.7)
=
Koska vektori voidaan kirjoittaa kuten
A
=
=
(Ax , Ay , Az )
(Ax , 0, 0) + (0, Ay , 0) + (0, 0, Az )
=
Ax (1, 0, 0) + Ay (0, 1, 0) + Az (0, 0, 1),
=
=
Ax ex + Ay ey + Az ez
Ax i + Ay j + Az k.
1.3.1 Pistetulo
Vektoreiden A = (Ax , Ay , Az ) ja B = (Bx , By , Bz )
Pistetulon eli skalaaritulon A · B määrittelee kaava
Tämän muodon ensimmäinen termi on neliönä aina
ei-negatiivinen, joten funktiolla q(λ) on minimi kun
neliötermi on minimissään. Valitsemalla λ = −A · B/|A|2
saadaan neliötermi häviämään joten funktion q(λ) minimi
qmin on sama kuin jälkimmäinen termi. Pituuden neliönä
q(λ) ei voi olla negatiivinen olipa λ mitä hyvänsä, joten
myös sen minimille täytyy olla voimassa qmin ≥ 0. Siis on
(1.8)
Merkintä A2 tarkoittaa vektorin A skalaarituloa itsensä
kanssa eli
A2
=
=
λ2 A · A + λA · B + λB · A + B · B
λ2 |A|2 + 2λA · B + |B|2
A·B
2
2
|A| λ + 2λ
+ |B|2 ,
|A|2
Hieman sieventäen ja ryhmittäen voimme kirjoittaa
edellisen lausekkeen muotoon
2
A·B
2
q(λ) = |A| λ +
|A|2
1
|A|2 |B|2 − (A · B)2
+
2
|A|
1.3 Vektoreiden tulot
A · B = Ax Bx + Ay By + Az Bz .
(λA + B) · (λA + B)
missä olemme käyttäneet hyväksi skalaaritulon
ominaisuksia (distributiivisuus, kommutatiivisuus jne.).
Täydennetään sulkujen sisällä oleva lauseke neliöksi ja
saadaan
A · B (A · B)2
2
2
q(λ) = |A| λ + 2λ
+
|A|2
|A|4
2
(A · B)
+ |B|2 .
−
|A|2
saadaan sille komponenttiesitykset
A
=
A · A = A2x + A2y + A2z
|A|2 .
|A|2 |B|2 − (A · B)2 ≥ 0.
Vektorin pituus on siis ilmaistavissa skalaaritulon avulla
kuten
√
√
|A| = A · A = A2 .
Tämä on kirjoitettavissa Cauchy-Schwartzin epäyhtälönä
tunnettuun muotoon
Suoraan määritelmästä nähdään, että pistetulo
|A · B| ≤ |A||B|.
• on kommutatiivinen, ts. A · B = B · A.
Oletimme, että A 6=  ja B 6= 0. Jos nyt jompi kumpi tai
molemmat ovat nollia, niin epäyhtälö on edelleenkin
voimassa (yhtäsuuruutena).
Esim. Kolmioepäyhtälö
Vektorit A, B ja A + B muodostavat kolmion, jonka
sivujen pituudet ovat |A|, |B| ja |A + B|. Kääntäen,
• on distributiivinen: A · (B + C) = A · B + A · C.
• skalaarilla kerrottaessa toteuttaa relaatiot
λ(A · B) = (λA) · B = A · (λB).
3
(1.9)
jokainen kolmio voidaan esittää kahtena vektorina ja
niiden resultanttina.
A + B
Edelleen Pythagoraan lausetta soveltaen saamme
|A − B|2
B
A
=
=
=
Kuva 1.6 Kolmioepäyhtälö
=
=
≤
≤
=
(A + B) · (A + B)
|A|2 + 2A · B + |B|2
• vektorin A projektion pituus vektorilla B kertaa
vektorin B pituus tai
• vektorin B projektion pituus vektorilla A kertaa
vektorin A pituus.
Vektoreiden välisen kulman θ kosini on lausuttavissa
pistetulon avulla kuten
(1.10)
joka kertoo sen tutun tosiasian, että kolmiossa kahden
sivun summa on aina suurempi tai yhtäsuuri kuin kolmas
sivu.
cos θ =
A·B
.
|A||B|
(1.12)
Ilmeisestikin vektorit A ja B ovat kohtisuorassa toisiaan
vastaan jos A · B = 0 ja yhdensuuntaisia jos
A · B = |A||B|. Erikoisesti kantavektoreille i, j ja k on
voimassa
i·j=i·k=j·k=0
Pistetulon geometrinen merkitys
Tarkastellaan nyt vektoreiden A, B ja A − B
muodostamaa kolmiota.
A -B
eli ne ovat toisiaan vastaan kohtisuorassa, ts.
ortogonaalisia. Koska vielä on
B
h
(1.11)
Kuviosta 1.7 on luettavissa myös tulkinnat: A · B on
missä viimeistä edellisessä muodossa olemme soveltaneet
Cauchy-Schwarzin epäyhtälöä. Päädymme siten
kolmioepäyhtälönä tunnettuun relaatioon
A
A2 + B 2 − 2AB cos θ.
A · B = AB cos θ.
|A|2 + 2|A · B| + |B|2
|A|2 + 2|A||B| + |B|2
(|A| + |B|)2 ,
|A + B| ≤ |A| + |B|,
A2 − A2 cos2 θ
+B 2 + A2 cos2 θ − 2AB cos θ
Vertaamalla tätä aikaisempaan suureen |A − B|2
lausekkeeseen näemme, että
Nyt on
|A + B|2
h2 + (B − A cos θ)2
B -A c o sq
i · i = j · j = k · k = 1,
q
sanotaan näiden kantavektoreiden olevan ortonormaalisia.
Kirjoitetaan vektori A komponenttimuodossa
A c o sq
Kuva 1.7 Pistetulon geometrinen merkitys
A = Ax i + Ay j + Az k.
Sivun A − B pituuden neliö on
|A − B|2
=
=
=
Kantavektoreiden ortonormaalisuuden perusteella on mm.
(A − B) · (A − B)
A · i = Ax i · i + Ay j · i + Az k · i = Ax
|A|2 + |B|2 − 2A · B
A2 + B 2 − 2A · B,
Vektorin komponentit voidaan siten lausua skalaarituloina
Ax = A · i, Ay = A · j ja Az = A · k.
missä A ja B tarkoittavat vektoreiden A ja B pituuksia.
Kuviosta 1.7 nähdään, että vektoreiden A, B ja A − B
muodostaman kolmion korkeuden h neliö on
Kantavektoreiden ortonormaalisuudesta seuraa samoin se,
että muodossa A = Ax i + Ay j + Az k ja
B = Bx i + By j + Bz k esitettyjen vektoreiden skalaaritulo
on
A · B = Ax Bx + Ay By + Az Bz
h2 = A2 − A2 cos2 θ,
missä θ on vektoreiden A ja B välinen kulma.
4
Esim. Voiman F = 2i − j − k tekemä työ sen siirtäessä
kappaletta vektorin r = 3i + 2j − 5k kannasta kärkeen
Määritelmän mukaan voiman tekemä työ on siirroksen
suuntainen voima kerrottuna siirron pituudella.
eli yhtäpitävä määritelmän (1.8) kanssa.
A
k
g
a
F
b
j
i
q
Kuva 1.8 Suuntakulmat
r
F c o sq
Vektorin ja yksikkövektorin i välisen kulman eli vektorin
ja x-akselin välisen kulman α kosini on
Kuva 1.9 Voiman tekemä työ
A·i
Ax
cos α =
=
,
|A||i|
A
Kuvan mukaisesti voiman F tekemä työ on
W = (F cos θ)r. Pistetulon avulla tämä saadaan
kirjoitettua muotoon
missä A = |A|. Vastaavat lausekkeet saadaan vektorin ja
y-akselin välisen kulman β sekä vektorin ja z-akselin
välisen kulman γ kosineille. Näemme siis, että vektori on
kirjoitettavissa suuntakulmiensa α, β ja γ avulla mm.
muodossa
A = A(cos α, cos β, cos γ).
W = F · r.
Tässä tapauksessa työ on siis
W
Olkoon nyt a vektori
a=
1
A.
A
(2i − j − k) · (3i + 2j − 5k)
(2)(3) + (−1)(2) + (−1)(−5)
6 − 2 + 5 = 9.
Esim. Vektoria A = 2i + 3j + 6k vastaan kohtisuorassa
Ensinnäkin on
olevan ja vektorin B = i + 5j + 3k kärjen kautta kulkevan
tason yhtälö
1
A2 = 1
A2
ja toiseksi vektorien a ja A väliselle kulmalle θaA on
voimassa
a·a=
cos θaA =
=
=
=
1
1
a·A
= A · A = 1,
|a||A|
A
A
A
joten a on vektorin A suuntainen yksikkövektori.
Vektorin B projektio p vektorin A suuntaan voidaan nyt
lausua yksikkövektorin a avulla kuten
r
1
p = A · B = a · B.
A
B = 4i − 4j + 7k
Vektorin B suuntainen yksikkövektori on
b
=
=
B
4i − 4j + 7k
=p
B
42 + (−4)2 + 72
4
4
7
i − j + k.
9
9
9
Kuva 1.10 Tason yhtälö
Olkoon r jokin tason piste. Tällöin vektori B − r on
jonkin vektoreitten r ja B kärkien kautta kulkevan tason
suuntainen. Koska tason piti olla kohtisuorassa vektoria A
vastaan, täytyy vektorin B − r olla kohtisuorassa vektoria
A vastaan osoittipa r mihin tahansa tason pisteeseen.
Saamme siis ehdon
Vektorin A projektio tähän suuntaan on
p
=
=
B
O
Esim. Vektorin A = i − 2j + k projektio vektorille
B -r
4
4
7
A · b = (i − 2j + k) · ( i − j + k)
9
9
9
4
7
19
4
.
(1)( ) + (−2)(− ) + (1)( ) =
9
9
9
9
(B − r) · A = 0
5
tason pisteille r. Sijoittamalla tähän r = xi + yj + zk
sekä vektoreiden A ja B eksplisiittiset lausekkeet saadaan
0 =
=
=
3. kuhunkin valitun rivin tai sarakkeen alkioon liittyy
2 × 2-alideterminantti, joka muodostetaan alkuperäisestä
determinantista pyyhkimällä siitä pois ko. alkion kautta
kulkeva vaaka- ja pystyrivi.
((1 − x)i + (5 − y)j + (3 − z)k)
4. käydään läpi kaikki valitun rivin tai sarakkeen alkiot kertoen
keskenään alkio varustettuna siihen liittyvällä merkillä ja
sen alideterminantti. Muodostettujen termien summa on
determinantin arvo.
·(2i + 3j + 6k)
−2x − 3y − 6z + (1)(2) + (5)(3) + (3)(6)
−2x − 3y − 6z + 35.
Esim. Determinantti
Kysytyn tason yhtälö on siis
D=
2x + 3y + 6z = 35.
+(−2) A × B = (Ay Bz − Az By , Az Bx − Ax Bz , Ax By − Ay Bx ).
(1.13)
Vektoritulon muodostamista auttanee muistisääntö:
Tulo A × B lasketaan siten, että kolmirivisen
determinantin ylimmäksi riviksi kirjoitetaan kantavektorit
i, j ja k (tässä järjestyksessä), keskimmäisen rivin
muodostavat vektorin A komponentit Ax , Ay ja Az (tässä
järjestyksessä) sekä alimman rivin vektorin B
komponentit Bx , By ja Bz (tässä järjestyksessä), ts.
i
j
k A × B = Ax Ay Az .
(1.14)
Bx By Bz a12
a22
.
.
.
an2
···
···
..
.
···
a1n
a2n
.
.
.
ann
a12
a22
mukaisesti.
+
−
+
2. valitaan jokin vaaka- tai pystyrivi.
= (−2)[(1)(−3) − (4)(−2)] = −10.
2
4
2
1
1
−3
1
−2
= −3[(2)(−3) − (1)(4)] = 30
= 4[(2)(−2) − (1)(1)] = −20.
D = (−10) + (30) + (−20) = 0.
Determinantteihin liittyy useita laskusääntöjä. Tässä vaiheessa
meille riittänee tieto siitä, että
• determinantin merkki vaihtuu vaihdettaessa kaksi vaakariviä
(tai kaksi pystyriviä) keskenään.
• determinantti on nolla, jos sen kaksi vaakariviä (tai kaksi
pystyriviä) ovat samoja.
Kehitetään determinantti (1.14) ylimmän rivin mukaan,
jolloin
i
j
k Ax Ay Az = i Ay Az − j Ax Az By Bz Bx Bz Bx By Bz Ax Ay +k Bx By =
(Ay Bz − Az By )i
−(Ax Bz − Az Bx )j
+(Ax By − Ay Bx )k.
Nähdään, että tämä todellakin yhtyy määritelmään
(1.13).
Determinanttiesityksestä nähdään mm. ominaisuus
i
i
j
k j
k
A × B = Ax Ay Az = − Bx By Bz
Bx By Bz Ax Ay Az
= −B × A.
1. kuhunkin determinantin alkioon liittyy merkki taulukon
−
+
−
Determinantin arvo D on näiden termien summa eli
ts. kaksirivisen determinantin arvo saadaan vähentämällä
lävistäjäalkioden tulosta sivulävistäjäalkioiden tulo.
Kolmirivinen determinantti lasketaan helpoimmin kehittämällä se
alideterminanttien avulla:
+
−
+
+(4) =a a −a a ,
11 22
12 21
−2
−3
ja alin alkio termin
Meidän tarkoituksiimme riittävät kaksi- ja kolmiriviset
determinantit. Kaksirivisen determinantin arvon määrittelee kaava
a11
a21
1
4
−(3) olevia taulukoita. Niissä siis sarakkeiden ja rivien lukumäärä on
sama. Puhutaan n × n-determinanteista tai n-rivisisistä
determinanteista. Determinanteilla on lukuarvo.
−2
3
4
Vastaavasti kehityssarakkeen toinen alkio antaa termin
Determinanteista
Determinantit ovat muotoa
a11
a21
.
.
.
an1
1
−2
−3
Kehitetään vaikkapa oikeanpuoleisimman sarakkeen mukaan.
Tämän ylimpään alkioon −2 liittyy merkki +. Vastaava
alideterminantti saadaan pyyhkimällä pois ylin rivi ja
oikeanpuoleisin sarake. Päädymme termiin
1.3.2 Ristitulo
Vektoreiden A = (Ax , Ay , Az ) ja B = (Bx , By , BZ )
ristitulon eli vektoritulon A × B määrittelee kaava
2
1
4
6
Siten ristitulon merkki vaihtuu vaihdettaessa tekijöiden
järjestystä:
(1.15)
A × B = −B × A.
Ristitulon geometrinen merkitys
Vektorin A × B pituuden neliö on
|A × B|2
Ristitulo ei siis ole kommutatiivinen. Ominaisuudesta
(1.15) seuraa mm.
|A × B|2
joten vektorin ristitulo itsensä kanssa on nolla,
(1.16)
=
=
(1.17)
|A × B|2 = A2 B 2 (1 − cos2 θ) = A2 B 2 sin2 θ.
Näemme siis, että ristitulovektorin A × B pituus on
(1.18)
|A × B| = AB| sin θ|.
Vektoreiden A × B ja A skalaaritulo on
A · (A × B)
(1, 0, 0) × (0, 1, 0) = (0 − 0, 0 − 0, 1 − 0)
(0, 0, 1) = k.
=
=
=
k
i
j
=
=
Samalla tavoin voimme todeta, että muutkin kaavoista
i×j
j×k
k×i
−(Ax Bx + Ay By + Az Bz )2 .
missä jälleen A ja B tarkoittavat vektoreiden A ja B
pituuksia. Kirjoitetaan pistetulo vektoreiden välisen
kulman θ avulla, jolloin
Katsotaan, millaisia ovat yksikkövektoreiden ristitulot
toistensa kanssa. Lasketaan esimerkkinä
i×j
(A2x + A2y + A2z )(Bx2 + By2 + Bz2 )
|A × B|2 = A2 B 2 − (A · B)2 ,
Skalaarilla kerrottaessa ristitulo noudattaa yhtälöä
λ(A × B) = (λA) × B = A × (λB).
=
Tämä taas on sama kuin
Suoraan määritelmästä nähdään vektoritulon
distributiivisuus
A × (B + C) = A × B + A × C.
(Ay Bz − Az By )2 + (Az Bx − Ax Bz )2
+(Ax By − Ay Bx )2 .
Suoraviivainen lasku osoittaa, että tämä voidaan
kirjoittaa muotoon
A × A = −A × A,
A × A = 0.
=
Ax (Ay Bz − Az By )
+Ay (Az Bx − Ax Bz )
+Az (Ax By − Ay Bx )
0.
Samoin nähdään, että B · (A × B) = 0. Vektori A × B on
siis kohtisuorassa molempia tekijöitään vastaan eli
kohtisuorassa tekijöiden muodostamaa tasoa vastaan.
Tulovektorin suunta on pääteltävissä yksikkövektoreitten
ristituloista (1.19):
Vektoreiden A ja B ristitulo on
(1.19)
pitävät paikkansa. Koordinaatistoa, jonka kantavektorit
toteuttavat relaatiot (1.19) sanotaan oikeakätiseksi.
z
A × B = (|A||B| sin θ)n,
(1.20)
missä θ on vektoreiden välinen kulma ja n vektoreiden
muodostamaa tasoa vastaan kohtisuorassa oleva sellainen
yksikkövektori että vektoreiden A, B ja n kolmikko (tässä
järjestyksessä) muodostaa oikeakätisen systeemin. Oikean
käden kolmisormisääntö lienee havainnollisempi: Jos A
osoittaa oikean käden peukalon suuntaan ja B etusormen
suuntaan niin A × B osoittaa keskisormen suuntaan (ja
on kohtisuorassa vektoreita A ja B vastaan).
y
x
Kuva 1.11 Oikeakätinen koordinatisto
A ´ B
Oikeakätisessä xyz-koordinaatistossa z-akselin suuntainen
oikeakätinen ruuvi postiiviseen kiertosuuntaan
kierrettäessä (kierretään lyhintä kautta positiiviselta
x-akselilta positiiviselle y-akselille) etenee positiivisen
z-akselin suuntaan. Sama asia voidaan ilmaista myös ns.
oikean käden kolmisormisääntönä:
oikean käden peukalon osoittaessa x-akselin suuntaan ja
etusormen y-akselin suuntaan osoittaa keskisormi
z-akselin suunnan.
B
q
|A ´ B |
A
Kuva 1.12 Ristitulon geometrinen merkitys
7
Kuvassa 1.12 vektoreiden A ja B muodostaman kolmion
korkeus on B sin θ jos kolmion kantana pidetään vektoria
A. Tämän kolmion pinta-ala on siten 21 AB sin θ, joten
ristitulo on suuruudeltaan tekijävektoreiden
muodostaman suunnikkaan pinta-ala.
Esim. A = 2i − 3j − k ja B = i + 4j − 2k, a) A × B, b)
B × A ja c) (A + B) × (A − B)
a)
i
j
k A × B = 2 −3 −1 1
4 −2 −3 −1 − j 2 −1 + k 2 −3 = i 4 −2
1 −2
1
4 = 10i + 3j + 11k.
Vääntömomentin suunnasta on sovittu, että voiman
kiertämä vaikutuspisteeseen asetettu vaikutustasoa
(vektoreiden r ja F muodostama taso) vastaan
kohtisuorassa oleva oikeakätinen ruuvi etenee
vääntömomentin suuntaan. Voimme siis kirjoittaa
M = r × F.
w
B×A
=
=
=
c)
(A + B) × (A − B)
=
=
=
=
=
r s in q
r
q
O
w
Kuva 1.14 Kulmanopeus ja lineaarinen nopeus
Esim. Lineaarinen nopeus pyörivässä
kappaleessa: Oletetaan, että kiinteä kappale pyörii origon
O kautta kulkevan akselin ω ympäri kulmanopeudella ω.
Vektori ω orientoidaan siten, että vektorin suuntaan
katsottuna kappale pyörii myötäpäivään. Tarkastellaan
kappaleen pistettä P . Kappaleen pyöriessä piste P seuraa
sellaisen ympyrän kehää, joka on kohtisuorassa
keskipisteensä kautta kulkevaa vektoria ω vastaan. Jos
nyt r on pisteen P paikka sekä θ vektorien r ja ω välinen
kulma, niin tämän ympyrän säde on r sin θ.
Ympyräliikkeen lineaarinen nopeus on suuruudeltaan
ympyrän säde kertaa kulmanopeus, ts. rω sin θ.
Lineaarisen nopeuden suunta taas on ympyrän tangentin
suuntainen eli nyt kohtisuorassa vektoreita ω ja r
vastaan. Oikean käden kolmisormisäännön perusteella
voimme siten kirjoittaa
4 −3 A × (A − B)
+B × (A − B)
A×A−A×B
+B × A − B × B
−A×B−A×B−
−2A × B
−20i − 6j − 22k.
v = ω × r.
M
P
v
P
b)
i
j
k 1
4 −2 2 −3 −1 1
1 −2 4 −2 + k − j
i
2
2 −1 −3 −1 −10i − 3j − 11k = −A × B.
r s in q
1.3.3 Kolmitulot
Skalaarikolmitulo
F
r
Tarkastellaan muotoa A · (B × C) olevia kolmen vektórin
tuloja. Vektoreiden A ja B × C pistetulona tämä on
skalaari. Siksi sitä nimitetäänkin skalaarikolmituloksi.
Skalaarikolmitulon geometrinen merkitys selvinnee alla
olevasta kuvasta.
q
Kuva 1.13 Vääntömomentti
Esim. Vääntömomentti: Määritelmän mukaan voiman
B × C
F vääntömomentti pisteen P suhteen on suuruudeltaan F
kertaa pisteen P kohtisuora etäisyys voiman
vaikutussuorasta. Olkoon nyt r pisteestä P voiman
vaikutuspisteeseen suunnattu vektori ja θ tämän vektorin
ja voiman välinen kulma. Kuvasta nähdään, että pisteen
P kohtisuora etäisyys vaikutussuorasta on r| sin θ|, joten
vääntömomentti on suuruudeltaan
A
h
C
B
M = F r| sin θ| = |r × F|.
Kuva 1.15 Skalaarikolmitulo
8
Vektoreiden A, B ja C muodostaman suuntaissärmiön
tilavuus on pohjasuunnikkaan pinta-ala |B × C| kertaa
särmiön korkeus h. Korkeus taas on vektorin A projektio
pohjatasoa vastaan kohtisuoralle suunnalle, esim.
vektorille B × C. Särmiön tilavuus V on siis
V = |A · (B × C)|.
Vektorikolmitulo
Vektorikolmitulolla tarkoitetaan kolmen vektorin
ristituloja A × (B × C) ja (A × B) × C. Nämä ovat
yleensä erisuuria, joten sulkumerkit ovat oleellisia.
Käsitellään edellistä muotoa olevia kolmituloja
(jälkimmäisen käsittely menee samalla tavoin). Koska
kyseessä on vektoreiden A ja B × C vektoritulo, on
tuloskin vektori. Lasketaan näytteeksi sen x-komponentti:
(1.21)
Komponenttimuodossa skalaarikolmitulo on
A · (B × C)
=
=
=
=
eli
(A × (B × C))x
= i · (A × (B × C))
1
0
A
A
x
y
= By Bz − Bx Bz Cx Cz Cy Cz (Ax i + Ay j + Az k) ·
i
j
k Bx By Bz Cx Cy Cz (Ax i + Ay j + Az k) ·
Bx Bz By Bz − j
i
Cx Cz Cy Cz B
By +k x
Cx Cy B Bz − Ay Bx Bz
Ax y
Cx Cz
Cy Cz
B
By +Az x
Cx Cy Ax Ay Az Bx By Bz Cx Cy Cz Ax
A · (B × C) = Bx
Cx
Ay
By
Cy
Az Bz .
Cz = Ay (Bx Cy − By Cx ) + Az (Bx Cz − Bz Cx )
= Bx (Ax Cx + Ay Cy + Az Cz )
−Cx (Ax Bx + Ay By + Az Bz )
= (A · C)(B · i) − (A · B)(C · i)
= i · [(A · C)B − (A · B)C] .
Samalla tavoin voisimme laskea niin tämän kolmitulon
muut komponentit kuin myös jälkimmäisen muodon
komponentit jolloin päätyisimme yhtälöihin
A × (B × C)
(A × B) × C
=
=
(A · C)B − (A · B)C
(A · C)B − (B · C)A.
(1.24)
Muistamista helpottanee molempiin tapauksiin soveltuva
sääntö:
vektorikolmitulo = (kauempi·ulko)lähempi
-(lähempi·ulko)kauempi,
missä ”ulko”tarkoitaa sulkujen ulkopuolista tekijää,
”lähempi”lähempänä ja ”kauempi”kauempana
”ulko”-tekijästä olevaa sulkujen sisäpuolista vektoria.
(1.22)
Koska vaihdettaessa kaksi riviä keskenään determinantti
vaihtaa merkkinsä, saamme
Ax Ay Az A · (B × C) = Bx By Bz Cx Cy Cz Cx Cy Cz = − Bx By Bz Ax Ay Az Cx Cy Cz = Ax Ay Az = C · (A × B).
Bx By Bz Koska skalaaritulo on kommutatiivinen, voimme
kirjoittaa tämän myös muotoon
A · (B × C) = (A × B) · C
0
Az
Bx By
Cx Cy
(1.23)
eli skalaarikolmitulossa pisteen ja ristin paikan voi vaihtaa
(sulkumerkkien paikat toki vaihtuvat tässä operaatiossa).
9
2. Raja-arvo ja derivaatta
Lineaarinen riippumattomuus
Vektorit v1 , v2 , . . . vn ovat lineaarisesti riippumattomia,
jos
n
X
ak vk = 0 vain jos a1 = . . . = an = 0
(1.25)
k=1
Muussa tapauksessa vektorit ovat lineaarisesti riippuvia.
Kolmiulotteisessa avaruudessa on enintään 3 vektorin
joukko keskenään lineaarisesti riippumaton.
Esim. kantavektorit i, j, k ovat lineaarisesti
riippumattomia:
2.1 Raja-arvon määritelmä
Funktiolla f (x) on raja-arvo f0 pisteessä x0 jos f (x)
lähestyy arvoa f0 kun x lähestyy arvoa x0 .
Merkitään
f (x) → f0 kun x → x0
(2.1)
tai
lim f (x) = f0 .
x→x0
(2.2)
Raja-arvo matemaattisemmin:
a1 i + a2 j + a3 k = 0
Intuitiivisesti raja-arvon käsite on varsin selvä. Matemaattisesti se
määritellään seuraavasti: funktiolla f (x) on raja-arvo f0 pisteessä
x0 , jos
vain jos a1 = a2 = a3 = 0.
Esim. v1 = i, v2 = j, v3 = i + j ovat lineaarisesti
riippuvia:
∀ǫ ∃δ > 0 siten että |f (x) − f0 | < ǫ
jos 0 < |x − x0 | < δ
Tässä merkintä “∀: kaikille”, “∃: on olemassa”.
v3 = v1 + v2 ⇒ v 1 + v2 − v3 = 0
Jos vektorit ovat lineaarisesti riippuvia, ainakin yksi
vektoreista voidaan kirjoittaa lineaarikombinaationa
muista.
Skalaarikolmitulon ja lineaarisen riippumattomuuden
välillä on seuraava yhteys:
Vektorit a, b ja c ovat lineaarisesti riippumattomia jos ja
vain jos a · (b × c) 6= 0.
Esim. i · (j × k) = 1, joten i, j, k ovat lineaarisesti
riippumattomia.
Esim. a = (1, 0, 1), b = (1, 2, 3), c = (3, 2, 5):
1 0 1 a · (b × c) = 1 2 3 3 2 5 2 3 1 3 1 2 = 1
− 0
+ 1
2 5 3 5 3 2 =
Eli: f on mielivaltaisen lähellä f0 :aa, jos x on riittävän lähellä
x0 :aa.
Raja-arvo on selkeä esim. tapauksissa
lim x2 + x = 2,
x→1
x→π/4
xa
= 0, a ∈ R
x→∞ ex
1
= 0,
x→∞ x
lim
lim
(Huom: eksponenttifunktio pesee minkä tahansa
potenssin!)
Kavalia ovat esim. tapaukset jotka lähenevät muotoa
∞
0
, 0 × ∞,
, ∞ − ∞, 00 , . . .
0
∞
Esim:
2x4
2x4 + x2 + 1
= lim
= −2
4
3
x→∞ −x4
x→∞ −x + x
lim
4−0−4=0
Vektorit eivät ole lineaarisesti riippumattomia. Helposti
nähdään että a = (c − b)/2.
Huom: jos meillä on kolme lineaarisesti riippumatonta
vektoria v1 , v2 , v3 , niin mielivaltainen vektori voidaan
esittää näiden lineaarikombinaationa:
a = a1 v1 + a2 v2 + a3 v3 . Sanotaan että vektorit vi
virittävät 3-ulotteisen avaruuden.
Tutuin esimerkki näistä on tietysti i, j, k.
√
lim sin x = sin π/4 = 1/ 2,
(2.3)
Suurin potenssi voittaa kun x → ∞. (vastaavasti pienin
jos x → 0).
Usein raja-arvojen laskemisessa auttavat seuraavat
approksimaatiot, kun |x| on pieni:
(1 + x)a
=
1
x − x3 + O(x5 )
6
1 2
1 − x + O(x4 )
2
1 + ax + O(x2 )
ln(1 + x)
ex
=
=
x + O(x2 )
1 + x + O(x2 )
sin x
=
cos x
=
(2.4)
(2.5)
(2.6)
(2.7)
(2.8)
Tässä merkintä O(xn ) tarkoittaa että kaikissa lopuissa
termeissä
√ x:n potenssi on vähintään n.
Esim. 1 + x = 1 + x/2 + O(x2 )
10
2.3 Derivaatan määritelmä
Esim.
sin x
lim
x→0 x
=
=
Funktion f (x) derivaatalla f ′ (x0 ) pisteessä x0
tarkoitetaan raja-arvoa
x − x3 /6 + O(x5 )
lim
x→0
x
lim (1 − x2 /6 + O(x4 )) = 1.
f ′ (x0 )
x→0
Määritellään vielä oikeanpuoleinen raja-arvo:
f0 = lim f (x)
Ilmeisesti limx→0+ θ(x) = 1, mutta limx→0− θ(x) = 0.
Huom: askelfunktiolla ei ole tavallista raja-arvoa pisteessä
x = 0!
Huom: merkitään myös ilmeiset raja-arvot
1
= ∞,
x
lim
x→0−
1
= −∞,
x
y = f(x )
a
Eli x lähestyy arvoa x0 vasemmalta (negatiiviselta)
puolelta.
Epäjatkuvalla funktiolla oikeanpuoleinen ja
vasemmanpuoleinen raja-arvo voivat olla erilaiset:
Esim. askelfunktio eli Heavisiden funktio:

x>0
 1,
1/2, x = 0
θ(x) =
(2.11)

0
x<0
lim
lim x = ∞
x→∞
2.2 Jatkuva funktio
Funktio f (x) jatkuva pisteessä x0 , jos f on määritelty
jossain pisteen x0 ympäristössä ja
x
=
lim [f (x)/g(x)]
=
x→x0
x→x0
3
f ′ (x0 ) =
df (x) .
dx x=x0
Kun kyseessä on derivointi ajan suhteen, käytetään fysiikassa
usein merkintää
.
d
f (t) = f (t).
dt
x→x0
x→x0
lim f (x)/ lim g(x)
x→x0
x
d
df (x)
f (x) =
= Dy = Df (x).
dx
dx
Monesti jätetään funtion f argumenttikin merkitsemättä. Kun
halutaan painottaa, että derivaattafunktio f ′ (x) halutaan laskea
nimenomaan pisteessä x0 , merkitään joskus
lim f (x) lim g(x)
x→x0
2
f ′ (x) = y ′ =
lim f (x) + lim g(x)
x→x0
x
Olkoon y = f (x) jokin derivoituva funktio. Derivaattaa f ′ (x)
merkitään usein myös
pisteessä x = 0, mutta on jatkuva kaikissa pisteissä x 6= 0.
Esim. Funktio f (x) = 1/x2 ei ole jatkuva pisteessä x = 0
(ei edes määritelty)
Raja-arvoille pätevät myös seuraavat ominaisuudet: jos
funktioilla f (x) ja g(x) on raja-arvot kun x → x0 , niin
lim [f (x)g(x)]
1
Merkintöjä
Fysiikassa funktiot ovat jatkuvia (melkein) kaikkialla.
x→x0
x
Määritelmässä (2.14) ei ole spesifioitu lähestymissuuntaa,
ts. voi olla joko x > x0 tai x < x0 . Molempien
lähestymistapojen täytyy johtaa samaan lopputulokseen.
Raja-arvo (2.14) ei välttämättä aina ole yksikäsitteinen
tai sitä ei ole olemassa. Tällaisessa tapauksessa
derivaattaa ei ole määritelty. Jos raja-arvo (2.14)on
(yksikäsitteisenä) olemassa, sanotaan, että funktio on
derivoituva pisteessä x0 .
Esim. funktio f (x) = |x| on jatkuva kaikilla x ∈ R. Jos
x > 0, on
f (y) − f (x)
= 1,
f ′ (x) = lim
y→x
y−x
ja vastaavasti jos x < 0 on f ′ (x) = −1. Pisteessä x = 0 ei
raja-arvoa ole olemassa (on vain vasemman- ja
oikeanpuoleiset raja-arvot), eikä |x| ole derivoituva
pisteessä x = 0.
Esim. Heavisiden askelfunktio (2.11) ei ole jatkuva
=
0
f '( x 0 ) = ta n a
Kuva 2.1 Derivaatan geometrinen tulkinta
(2.12)
lim f (x) = f (x0 )
x→x0
lim [f (x) + g(x)]
(2.14)
(2.10)
x→x0 −
x→0+
(2.13)
Geometrisesti derivaatta on funktion kuvaajan tangentin
kulmakerroin derivointipisteessä.
tai f (x) → f0 , kun x → x0 +. Merkintä tarkoittaa että x
lähestyy arvoa x0 oikealta (positiiviselta) puolelta.
Vastaavasti vasemmanpuoleinen:
f0 = lim f (x)
lim
x→x0
=
(2.9)
x→x0 +
f (x) − f (x0 )
x − x0
f (x0 + h) − f (x0 )
lim
h→0
h
=
Leibnitzin merkintätapa
x→x0
df
dx
on intuitiivisin:
funktion muutos
kun muutos → 0
muuttujan muutos
missä viimeisin edellyttää että limx→x0 g(x) 6= 0.
11
Huom:
f ′ (x) = 0: funktio vaakasuora pisteessä x
f ′ (x) = 1: funktion kulmakerroin = 1 (45◦ ) pisteessä x)
f ′ (x) → ∞: funktio lähestyy pystysuoraa
joten
cos ∆x − 1
lim
∆x→0
∆x
=
=
2.4 Derivaattojen lasku
=
Derivaatta suoraan määritelmästä
Lasketaan esimerkiksi potenssifunktion f (x) = xn
derivaatta. Määritelmän mukaan derivaatta f ′ (x) on
raja-arvo
f ′ (x)
=
=
f (y) − f (x)
y−x
f (x + ∆x) − f (x)
.
lim
∆x→0
∆x
− 21 (∆x)2 + O (∆x)4
lim
∆x→0
∆x
lim O (∆x)
∆x→0
0
ja
sin ∆x
lim
∆x→0 ∆x
∆x − O (∆x)3
lim
∆x→0
∆x
lim 1 − O (∆x)2
=
=
lim
y→x
∆x→0
=
1.
Derivaataksi saamme siis
d
sin x = cos x.
dx
Tässä tapauksessa on siis laskettava raja-arvo
(x + ∆x)n − xn
.
∆x→0
∆x
f ′ (x) = lim
Trigonometristen funktioiden yhteenlaskukaavoja
Sini- kosinifunktiot toteuttavat yhteenlaskukaavat
Käyttäen (1 + δ)a = 1 + aδ + O(δ 2 ) (2.6) saamme
sin(x + y)
cos(x + y)
∆x n
∆x
∆x 2
(x + ∆x)n = xn (1 +
) = xn [1 + n
+ O((
) )]
x
x
x
=
=
sin x cos y + cos x sin y
cos x cos y − sin x sin y.
Koska
sin x
,
cos x
voidaan tangentin yhteenlaskukaava kirjoittaa mm. muotoon
tan x =
joten
(x + ∆x)n − xn
∆x→0
∆x
lim
=
=
lim [nxn−1 + xn−1 O(
∆x→0
n−1
nx
∆x
)]
x
tan(x + y) =
.
tan x + tan y
sin x cos y + cos x sin y
=
.
cos x cos y − sin x sin y
1 − tan x tan y
Erikoistapauksena saadaan kaksinkertaisille kulmille kaavat
n
sin 2x
cos 2x
tan 2x
n−1
.
Siis saimme dx
dx = nx
Käsitellään toisena esimerkkinä funktion f (x) = sin x
derivaatan laskua. Nyt
=
=
=
2 sin x cos x
cos2 x − sin2 x
2 tan x
.
1−tan2 x
Pythagoraan lauseen perusteella on
sin(x + ∆x) = sin x cos ∆x + cos x sin ∆x,
sin2 x + cos2 y = 1.
Kaksinkertaisen kulman kosini voidaan siten kirjoittaa myös
muotoihin
joten derivaatan määritelmän mukaan on
f ′ (x)
=
=
=
sin(x + ∆x) − sin x
∆x
sin x cos ∆x + cos x sin ∆x − sin x
lim
∆x→0
∆x
sin ∆x
cos ∆x − 1
,
+ cos x
lim sin x
∆x→0
∆x
∆x
cos 2x = 2 cos2 x − 1 = 1 − 2 sin2 x.
lim
∆x→0
Muutamien tavallisimpien funktioiden derivaattoja on
esitetty taulukossa
f (x)
c (vakio)
xn
ex
ln x
sin x
cos x
tan x
missä olemme käyttäneet sinin ja kosinin
yhteenlaskukaavoja.
Pienillä argumentin arvoilla trigonometriset funktiot
käyttäytyvät kuten (2.4,2.5):
sin δ
=
cos δ
=
1
δ − δ3 + O δ5
6
1
1 − δ2 + O δ4 ,
2
12
Df (x)
0
nxn−1
ex
.
1/x
cos x
− sin x
1/cos2 x = 1 + tan2 x
(2.15)
d
d
sin ex = cos(ex ) ex = cos(ex )ex
dx
dx
Derivaatan laskusääntöjä
Olkoot f ja g derivoituvia funktioita ja a ja b vakioita.
Tällöin on voimassa
d
[af (x) + bg(y)] = af ′ (x) + bg ′ (x).
dx
d x
x
dx
(2.16)
=
=
Derivointi on lineaarinen operaatio. Funktioiden tulo
f (x)g(x) derivoidaan kuten
d x ln x
d
e
= ex ln x x ln x
dx
dx
1
xx (1 ln x + x ) = xx (1 + ln x)
x
Käänteisfunktion derivaatta
d
[f (x)g(x)] = f ′ (x)g(x) + f (x)g ′ (x)
dx
Olkoon meillä funktion y = f (x), käänteisfunktio
x = f −1 (y). Nyt käänteisfunktion derivaatta saadaan
funktion derivaatan avulla seuraavasti:
(2.17)
ja osamäärä f (x)/g(x) kuten
d f (x)
f ′ (x)g(x) − f (x)g ′ (x)
=
.
dx g(x)
g 2 (x)
Df −1 (y) =
(2.18)
1
f ′ (f −1 (y))
=
1
f ′ (x)
.
(2.20)
Leibnitzin notaatiolla tämä on yksinkertaisesti
Tulon derivointi
dx
1
= dy
dy
dx
Osoitetaan tulon derivoimissääntö. Suoraan derivaatan
määritelmästä nähdään
f (x + h) − f (x) = hf ′ (x) + O(h2 )
Nyt
d
(f (x)g(x))
dx
f (x + h)g(x + h) − f (x)g(x)
= lim
h
h→0
(f (x) + hf ′ (x))(g(x) + hg ′ (x)) − f (x)g(x) + O(h2 )
= lim
h→0
h
h(f ′ (x)g(x) + f (x)g ′ (x)) + O(h2 )
= lim
h
h→0
= f ′ (x)g(x) + f (x)g ′ (x)
(miten todistetaankin käänteisfunktion derivoimissääntö,
kun ajatellaan raja-arvoja ∆x, ∆y.)
Esim. Johdetaan logaritmin derivoimissääntö. Nyt
y = ex , x = ln y:
d ln y
dy
=
1
1
1
dx
1
= dy = dex = x =
dy
e
y
dx
dx
tai D ln y = 1/(Dex ) = 1/ex = 1/y.
Syklometriset funktiot
Trigonometrisillä funktioilla ei ole yksikäsitteistä
käänteisfunktiota. Esimerkiksi yhtälön
Yhdistetyn funktion f (g(x)) derivointiin soveltuu
ketjusääntö
d
f (g(x)) = f ′ (g(x))g ′ (x).
dx
(2.21)
sin x =
1
2
ratkaisee mikä tahansa äärettömän joukon
(2.19)
x=
Tämä tulee erityisen selväksi käyttäen Leibnitzin
notaatiota: jos merkitään y = f (z) ja z = g(x), saadaan
π
+ 2nπ
6
5π
+ 2nπ,
6
n kokonaisluku
π
π
≤x≤ ,
2
2
on yhtälöllä sin x = a yksikäsitteinen ratkaisu, jota nimitetään
arkussiniksi ja merkitään
π
π
x = arcsin a, − ≤ x ≤ .
2
2
luvuista. Kun rajoitetaan sinin argumentti välille −
dy
dy dz
d
f (g(x)) =
=
= f ′ (g(x))g ′ (x)
dx
dx
dz dx
Tämän avulla nähdään muun muassa että
Arkussini on siis se sinin käänteisfunktio, jonka arvoalue on
π
π
rajoitettu välille − ≤ x ≤ + . Kosinilla puolestaan on
2
2
yksikäsitteinen arkuskosiniksi sanottu käänteisfunktio, kun
rajoitetaan kosinin argumentti välille 0 ≤ x ≤ π. Tästä käytetään
merkintää
x = arccos z, 0 ≤ x ≤ π.
d
[f (x)]µ = µ[f (x)]µ−1 f ′ (x)
dx
d f (x)
e
= ef (x) f ′ (x)
dx
f ′ (x)
d
ln f (x) =
dx
f (x)
Tangentin käänteisfunktio on nimeltään arkustangentti. Sen
arvoalue on
π
π
y = arctan x, − ≤ y ≤ .
2
2
Koska sinin ja kosinin arvoalueet kattavat välin [−1, 1], voivat
arkussinin ja arkuskosinin argumenttit olla väillä [−1, 1].
Arkustangentin argumentti taas voi olla mikä tahansa reaaliluku,
sillä tangentin arvoalueena on koko reaaliakseli.
Esimerkkejä:
2 d
2
d x2
e = ex
x2 = ex 2x
dx
dx
13
Joskus halutaan määritellä trigonometristen funktioiden
käänteisfunktiot monikäsitteisiksi, esim. halutaan että
z = arcsin x antaa kaikki ne arvot z, joilla sin z = x. Tällöin
π
π
rajattua arkussiniä sanotaan ko.
arvoalueelle − ≤ arcsin x ≤
2
2
funktion päähaaraksi. Päähaarasta käytetään merkintää arcsin x.
Vastaavat nimitykset ja merkinnät ovat käytössä muillekin
trigonometrisille käänteisfunktioille.
Trigonometristen funktioiden käänteisfunktioita sanotaan
syklometrisiksi funktioiksi tai useimmiten niiden nimen mukaisesti
tuttavallisesti arkus-funktioiksi.
Lasketaan esimerkkinä funktion arcsin x derivaatta. Nyt
arcsin on sinifunktion käänteisfunktio, ts. jos x = sin y
niin y = arcsin x. Säännön (2.20) perusteella on
1
1
=
.
D arcsin x =
D sin y
cos y
Trigonometristen funktioiden ominaisuuksien perusteella
voidaan kirjoittaa
q
p
cos y = 1 − sin2 y = 1 − x2 ,
joten saamme
d
1
arcsin x = √
.
dx
1 − x2
(2.22)
2.6 Sovelluksia
Differentiaalilaskennan lukemattomista käyttökohteista
käsitellään muutamia fysiikan kannalta ehkä tärkeähköjä
sovelluksia.
Suureiden muodostus
Intuitiivisesti nopeudella ymmärretään aikayksikössä
kuljettua matkaa. Matemaattisen täsmälliseksi nopeuden
käsite saadaan määrittelemällä se rajarvona
∆t→0
v(t) =
=
=
2
dv(t)
d x(t)
dt =.. dt2
.v(t)
x(t).
=
(2.27)
Muista lukemattomista derivaattojen avulla määritellyistä
fysiikan käsitteistä mainittakoon vaikkapa sähkövirta
2.5 Korkeamman kertaluvun derivaatat
I=
′
Jos funktion f (x) derivaatta f (x) on myöskin
derivoituva, voimme laskea senkin derivaatan:
dQ
dt
sähkövarauksen Q muuttuessa ajan t funktiona tai teho
(2.24)
Sanomme, että funktio f (x) on kahdesti derivoituva ja
suure Df ′ (x) funktion f (x) toinen derivaatta. Jos vielä
tämä toinen derivaattakin on derivoituva, voisimme
edelleen määrätä sen derivaatan DDf ′ (x) jne. Vastaavasti
funktion sanotaan tällöin olevan kolmesti, . . ., n kertaa,
derivoituva ja puhutaan kolmansista, . . ., n:stä
derivaatoista.
P =
Olkoon funktio f (x) n-kertaisesti derivoituva. Sen n:ttä
derivaattaa merkitään mm. kuten
dn f (x)
f (n) (x) = Dn f (x) =
.
dxn
Alhaisen kertaluvun derivaatoista voidaan myös käyttää sellaisia
merkintöjä kuin
dW
,
dt
missä W on hetkeen t mennessä tehty työ tai, kolmantena
esimerkkinä kappaleen tilavuuden V muutoksesta
aiheutuvasta paineen P muutoksesta kertova
puristusmoduuli (kompressibiliteetti)
B=−
Merkintöjä
1 dP
.
V dV
Approksimaatio
Derivaatan määritelmästä (2.14)
f ′ (x) = lim
∆x→0
f (x + ∆x) − f (x)
∆x
voidaan ratkaista f (x + ∆x) likimääräisesti:
Jos kyseessä on derivointi ajan suhteen, merkitään usein
..
d2 f (t)
= f (t).
2
dt
(2.26)
(2.23)
Kaavat (2.22,2.23) ovat hyödyllisiä integraalien laskuissa.
f (2) (x) = f ′′ (x) = DDf (x).
dx(t)
.
= x(t).
dt
Kiihtyvyys puolestaan on nopeuden muutos aikayksikössä.
Derivaattojen avulla ilmaistuna on siis pitkin x-akselia
liikkuvan kappaleen kiihtyvyys a kirjoitettavissa kuten
Samoin voidaan osoittaa
f ′ (x + ∆x) − f ′ (x)
.
Df ′ (x) = lim
∆x→0
∆x
(2.25)
kun oletetaan tarkasteltavan objektin liikkuvan pitkin
x-akselia ja sen olevan paikassa x(t) hetkellä t.
Derivaatan määritelmästä (2.14) nähdään, että nopeus
v(t) hetkellä t on
a(t)
d
1
arctan x =
.
dx
1 + x2
x(t + ∆t) − x(t)
,
∆t
v(t) = lim
f (x + ∆x) ≈ f (x) + f ′ (x)∆x.
(2.28)
Tämä relaatio on sitä tarkempi mitä pienempi ∆x on.
14
Väliarvolause
Ääriarvot
Tarkasti ottaen on voimassa ns. väliarvolause:
Funktion maksimikohta on sellainen piste, että
poistuttaessa siitä mihin tahansa suuntaan funktion arvo
pienee. Vastaavasti minimikohdasta poistuttaessa
funktion arvo kasvaa. Maksimi (minimi) on paikallinen eli
lokaali, jos funktiolla on muita arvoltaan tätäkin
suurempia (pienempiä) maksimeja (minimejä). Jos
kyseessä on funktion suurin (pienin) arvo, puhutaan
globaalista tai absoluuttisesta maksimista (minimistä).
Esim. kuvassa 2.3 minimi kohdassa x0 ja maksimi
kohdassa x1 ovat paikallisia. Kohdan x2 minimi saattaisi
olla globaali.
Olkoon f derivoituva funktio. Tällöin pisteiden x ja x + ∆x
välissä on olemassa sellainen piste x0 että
f ′ (x0 ) =
f (x + ∆x) − f (x)
.
∆x
Lauseen mukaan on siis tarkasti voimassa
f (x + ∆x) = f (x) + f ′ (x0 )∆x,
missä x < x0 < x + ∆x (olettaen, että ∆x > 0).
Esim. sin x kun x on pieni
Kaavan (2.28) mukaan on
f(x )
sin x ≈ x sin′ 0 = x cos 0 = x.
Esim. Newton-Raphsonin menetelmä
Tehtävänä on etsiä funktion f (x) nollakohta, ts. ratkaista
yhtälö
f (x) = 0.
Oletetaan, että f (x) on derivoituva. Olkoon x0 jokin
likiarvo ratkaisulle (saatu esim. arvaamalla tai piirtämällä
funktion kuvaaja). Approksimoidaan funktiota pisteen x0
läheisyydessä (ks. kuva 2.2) lineaarisella kuvaajalla
f (x) ≈ f (x0 ) + f ′ (x0 )(x − x0 ).
Tämän suoran ja x-akselin leikkauspiste
x1 = x0 −
f (x0 )
f ′ (x0 )
x
x
1
x
2
x
3
x
Kuva 2.3 Funktion ääriarvot
Derivoituvan funktion f (x) ääriarvokohdissa, ts.
maksimeissa ja minimeissä funktion tangentti on
x-akselin suuntainen (ks. kuva 2.3) eli
Derivoituvan funktion derivaatta ääriarvopisteissä on
nolla.
Tarkasti ottaen derivaatta häviää sellaisissa ääriarvopisteissä,
jotka sijaitsevat funktion määrittelyalueen sisällä. Jos esim.
funktio f (x) on määritelty siten, että
on (yleensä) parempi nollakohdan likiarvo kuin
alkuperäinen x0 .
f (x) = x2 , kun − 1 ≤ x ≤ 1,
f(x )
x
0
maksimit (arvoltaan 1) sijaitsevat reunapisteissä x = ±1.
Pisteitä, joissa derivaatta häviää sanotaan kriittisiksi
pisteiksi. Derivaatan häviäminen on siis ääriarvon
välttämätön ehto. Se ei kuitenkaan ole riittävä. Esim.
kuvassa 2.3 kohdan x3 vasemmalla puolen funktio on
pienempi ja oikealla puolen suurempi kuin pisteessä x3 .
Jos funktio on kahdesti derivoituva, voimme toisesta
derivaatasta päätellä kriittisen pisteen luonteen:
2
x
1
x
0
x
Kuva 2.2 Newton-Raphsonin iteraatio
• Jos toinen derivaatta on negatiivinen, siirryttäessä
pisteen yli vasemmalta oikealle ensimmäinen
derivaatta pienenee positiivisesta negatiiviseksi, ts.
kyseessä on maksimi.
Toistetaan sama menettely käyttäen pistettä x1
lähtöarvona, jolloin saadaan taas (toivottavasti) parempi
likiarvo x2 . Jatketaan samalla tavoin iteroiden, ts.
lasketaan likiarvosta xn likiarvo
xn+1 = xn −
• Jos toinen derivaatta on positiivinen, siirryttäessä
pisteen yli vasemmalta oikealle ensimmäinen
derivaatta kasvaa negatiivisesta positiiviseksi, ts.
minimi.
f (xn )
,
f ′ (xn )
niin kauan kunnes f (xn ) on halutulla tarkkuudella nolla
tai kunnes xn+1 poikkeaa riittävän vähän edellisestä
arvosta xn .
• jos toinen derivaatta on nolla kriittisessä pisteessä,
täytyy tarkastella korkeampia derivaattoja: jos pienin
nollasta poikkeava derivaatta on:
15
A) parillista kertalukua (2,4,. . . ), kyseessä on
maksimi/minimi jos derivaatan etumerkki on -/+.
B) pariton (1,3,. . . ), kyseessä ei ole ääriarvo.
Esim. limx→0 sin2 2x/x2
l’Hospitalin sääntö on ilmeisestikin sovellettavissa ja
saamme
sin2 2x
x→0
x2
Esim. Funktion f (x) = 3x4 − 4x3 kriittiset pisteet
=
lim
Derivaatta on nyt
=
f ′ (x) = 12x3 − 12x2 = 12x2 (x − 1).
Kriittiset pisteet saadaan asettamalla f ′ (x) = 0, ts.
ratkaistaan yhtälö
12x2 (x − 1) = 0.
Kriittiset pisteet ovat siten 0 ja 1. Funktion toinen
derivaatta on
f ′′ (x) = 36x2 − 24x,
joten f ′′ (0) = 0 ja f ′′ (1) = 12. Piste 1 on siis minimi.
mutta piste 0 ei ole maksimi eikä minimi.
l’Hospitalin sääntö
Hyvin monesti raja-arvoja laskettaessa päädytään
muotoa 0/0, ∞/∞ tai 0 · ∞ oleviin lausekkeisiin. Jos
kyseessä ovat derivoituvat funktiot, voidaan useimmiten
soveltaa l’Hospitalin sääntöä
Jos
f ′ (x)
lim ′
=A
x→a g (x)
ja jos joko
Päädymme siten edelleen muotoa 0/0 olevaan
lausekkeeseen. Sovelletaan tähän uudelleen l’Hospitalin
sääntöä, jolloin saadaan
lim 2
x→0
lim x ln x = lim
x→0+
f (x)
= A.
x→a g(x)
Tarkastellaan esimerkkinä tapausta, missä a on äärellinen ja missä
sekä f (a) = 0 että g(a) = 0. Voimme siis kirjoittaa
lim
x→a
f (x)
g(x)
=
=
=
=
lim
x→a
f (x) − f (a)
.
g(x) − g(a)
[f (x) − f (a)]/(x − a)
.
[g(x) − g(a)]/(x − a)
limx→a [f (x) − f (a)]/(x − a)
.
limx→a [g(x) − g(a)]/(x − a)
lim
f ′ (x)
g ′ (x)
Esim. limx→0 sin x/x
Sekä osoittaja että nimittäjä lähestyvät nollaa
argumentin lähestyessä nollaa ja funktiot ovat
derivoituvia. Voimme siis soveltaa l’Hospitalin sääntöä:
lim
1
x
.
x→0+
= lim (−x) = 0.
x→0+
Implisiittinen derivointi
Joskus funktiota y(x) määritellään esim. ehdolla
F (x, y) = F (x, y(x)) = c,
(2.29)
missä c on vakio. Periaatteessa tästä yhtälöstä voitaisiin
(ehkä) ratkaista muuttuja y. Tämä ratkaisu riippuisi
tietenkin muuttujasta x. Voimme siis ajatella, että yhtälö
(2.29) määrää implisiittisesti funktion y(x).
Funktion y(x) derivaatta voidaan usein ratkaista suoraan
derivoimalla ehtoa F :
x→a
jos derivaatat ovat olemassa.
x→0
1
x
x→0+ − 12
x
lim x ln x = lim
lim
Perusteluja
ln x
x→0+
Nyt sekä osoittaja että nimittäjä lähestyvät ääretöntä ja
l’Hospitalin sääntö on jälleen käyttökelpoinen:
tai
niin
cos 2x
sin 2x
= lim 4
= 4.
x→0
x
1
Esim. limx→0+ x ln x
Tässä merkintä x → 0+ tarkoittaa, että x lähestyy nollaa
positiiviselta puolelta. Tämä rajoitus on asetettu, jotta
logaritmifunktio olisi määritelty. Nyt x → 0 ja
ln x → −∞, joten l’Hospitalin säännön soveltamiseksi
kirjoitetaan raja-arvo muotoon
f (x) → 0 ja g(x) → 0 kun x → a
g(x) → ±∞ kun x → a,
4 sin 2x cos 2x
2x
sin 2x
sin 2x
lim
2 cos 2x = lim 2
.
x→0
x→0
x
x
lim
x→0
sin x
cos x
1
= lim
= = 1.
x→0
x
1
1
d
F (x, y(x)) = 0
dx
ja ratkaisemalla y ′ (x).
Esim. Tason origokeskeinen ympyrä x2 + y 2 = a2
määrittelee implisiittisesti funktion y(x).Nyt
d 2
(x + y(x)2 ) = 2x + 2y(x)y ′ (x) = 0
dx
⇒ y ′ (x) = −x/y
mikä on ympyrän tangentin kulmakerroin.
16
(2.30)
d
F (x, y(x))
dx
=
=
=0
3. Potenssisarjoja
dy
dx
yhtälöstä
sin(xy) + y = x
Tässä tapauksessa siis F (x, y(x)) = sin(xy) + y − x = 0, ja
Esim. Muodosta implisiittisesti derivaatta
d
(sin(xy) + y − x)
dx
dy
dy
+
−1
cos(xy) y + x
dx
dx
3.1 Äärettömät sarjat
Olkoon {an } jokin lukujono. Summaa
S=
∞
X
n=0
an = a0 + a1 + a2 + · · · + an + · · ·
sanotaan äärettömäksi sarjaksi. Lukuja
Hieman ryhmittäen voidaan kirjoittaa
Sn =
dy
(1 + x cos(xy))
= 1 − y cos(xy),
dx
Alkaako sarja nollannesta, ensimmäisestä, toisesta tai jostakin
P∞
muusta termistä on vain numerointikysymys. Summat
a ,
k=1 k
P∞
P∞
P∞
a
,
.
.
.
tai
lyhyemmin
a
,
a
,
.
.
.
ovat
myöskin
k
k
k
k=2
1
2
(äärettömiä) sarjoja.
Parametrisesti annetun funktion derivaatta
Esim. x = cos t ja y = sin t määrittelee parametrisesti
funktion (yksikköympyrän kaari) y(x) (kun 0 ≤ t ≤ π).
Yleisemmin: olkoon annettu x = g(t) ja
y = f (t) = f (g −1 (x)). Nyt ketjusäännön mukaan
Katsotaan esimerkkinä geometrista sarjaa
Osasummat ovat
Sn
(2.31)
=
=
dy
=
dx
Ympyrälle siis
√
1 − x2
cos t
dy
=
=−
dx
− sin t
x
n
X
0
Tai yksinkertaisesti
dy
dt
dx
dt
ak
kutsutaan osasummiksi. Äärettömän sarjan, tai lyhyesti
vain sarjan, sanotaan suppenevan (konvergoituvan) jos
raja-arvo limn→∞ Sn on olemassa. Jos raja-arvoa ei ole,
sarja hajaantuu (divergoi).
1 − y cos(xy)
dy
=
.
dx
1 + x cos(xy)
d
1
y (t)
dy
= f ′ (t) g −1 x = f ′ (t) ′
= ′
dx
dx
g (t)
x (t)
n
X
k=0
josta saamme derivaataksi
′
(3.1)
(2.32)
=
P∞
0
xn .
xk = 1 + x + · · · + xn
1 − xn+1
1−x
xn+1
1
−
.
1−x 1−x
Tiedämme, että xn+1 → 0 kun |x| < 1. Tällöin siis
lim Sn =
1
.
1−x
Toisaalta sarja selvästikin hajaantuu kun |x| ≥ 1.
Olemme siis saaneet tuloksen
∞
X
xn =
0
1
, kun |x| < 1.
1−x
(3.2)
Se, että sarjan termit lähestyvät nollaa, ei takaa sarjan
suppenemista. Esimerksi harmoninen sarja
∞
X
n=1
hajaantuu.
1
1
1
= 1 + + ··· + + ···
n
2
n
On olemassa useita testejä, joilla sarjojen suppenemista
voi tutkia.
P Näistä ehkä käytetyin on suhdetesti:
Olkoon
an sellainen positiivisten termien sarja, että
raja-arvo
lim an+1 /an = q
n→∞
on olemassa. Silloin
17
• jos q < 1, niin sarja suppenee,
Sarja siis suppenee, jos muuttuja x toteuttaa ehdon
• jos q > 1, niin sarja hajaantuu ja
|x| <
an
• jos q = 1, niin sarja voi supeta tai hajaantua.
Vaikka suhdetesti käsitteleekin vain positiivitermisiä
sarjoja, sitä voidaanP
soveltaa yleisempiinkin tapauksiin.
Sanotaan
että
sarja
an suppenee itseisesti jos sarja
P
|an | suppenee. Voidaan osoittaa, että sarjan supetessa
itseisesti myös itse sarja suppenee. Jos siis suhdetestillä
todetaan sarjan suppenevan itseisesti niin voidaan
päätellä sarjan suppenevan sellaisenaankin.
P∞ (−1)n n
Esim. Osoita, että sarja
suppenee
1
2n
Kyseessä on ns. vuorotteleva sarja: joka toinen termi on
positiivinen ja joka toinen negatiivinen.
Osoitetaan, että
P∞ (−1)n n sarja suppenee itseisesti, ts. että 1 2n suppenee.
Nyt an = 2nn ja
1
(n + 1)2n
1
an+1
1+
=
=
an
n2n+1
2
n
1
→
< 1.
2
Suhdetestin mukaan sarja suppenee itseisesti ja niin ollen
suppenee sellaisenaankin.
3.2 PotenssisarjatP
Geometrinen sarja (3.2) 0 xn esittää funktiota
1/(1 − x). Itseasiassa hyvin monet funktiot voidaan
esittää tyyppiä
∞
X
an (x − x0 )n
joten suppenemissäde R on
Esim. Sarjan
Nyt
n
Potenssisarjan suppeneminen riippuu yleensä muuttujan
x arvosta. Voidaan osoittaa, että
On olemassa sellainen
P luku R ≥ 0 (mahdollisesti +∞,
että potenssisarja n an xn suppenee itseisesti, kun
−R < x < R ja hajaantuu kun |x| > R.
Lukua R sanotaan suppenemissäteeksi.
Tärkein suppenemissäteen määräämismenetelmä on
jälleen suhdetesti:
P
Olkoon sarja n an xn sellainen, että raja-arvo
lim |an+1 /an | = q on olemassa. Suppenemissäde on silloin
R = 1/q.
P
n
Suhdetestin mukaan sarja
a x suppenee itseisesti, jos
n n
termien suhteelle on voimassa
an+1 xn+1 = lim an+1 |x| < 1.
lim
n
an x
an
P
n
R = lim = lim an
an+1
an
an+1
,
.
xn /n! suppenemissäde
an+1 n!
1
an = (n + 1)! = n + 1 ,
joten suhdetestin q on 0. Suppenemissäde on niin ollen
ääretön eli sarjaPsuppenee kaikilla muuttujan x arvoilla.
∞ 10n n
Esim. Sarjan
1
n x suppenemissäde
Suhdetesti antaa
10n
an n
=
an+1 10n+1
n+1
=
n+1 1
1
1
·
→
= = R.
n
10
10
q
Kuten todettua potenssisarjoja voidaan pitää
argumenttinsa funktioina. Potenssisarjafunktioilla on mm.
ominaisuudet:
P
Suppenemissäteen sisällä sarjan
an xn esittämä funktio
• on jatkuva,
• voidaan integroida integroimalla sarja termeittäin,
• voidaan derivoida (mielivaltaisen monesti)
derivoimalla sarja termeittäin.
0
olevina potenssisarjoina. Jatkossa käsittelemme
enimmäkseen tapauksia, joissa x0 = 0, sillä vaihtamalla
muuttujaan x′ = x − x0 mikä tahansa potenssisarja
saadaan muotoon
∞
X
n
an x ′ .
a1 lim n+1 3.3 Taylorin sarjat
Olkoon funktio f (x) äärettömän monta kertaa
derivoituva pisteen x0 ympäristössä. Tällöin se voidaan
esittää Taylorin sarjana pisteen x0 suhteen kehitettynä
suppenemissäteen sisällä:
f (x) =
∞
X
f (n) (x0 )
(x − x0 )n
n!
n=0
(3.3)
Tässä siis f (n) (x0 ) on funktion n:s derivaatta pisteessä
x0 , ja f (0) (x0 ) = f (x0 ). Luku
n! ≡ n(n − 1)(n − 2) . . . 1,
0! ≡ 1
on n:n kertoma.
Jos x0 = 0, Taylorin sarja saadaan usein esiintyvään
muotoon
∞
X
f (n) (0) n
x
f (x) =
(3.4)
n!
n=0
18
Todistus: Olkoon meillä potenssisarja
f (x) =
∞
X
n=0
=
f (x) =
∞
X
0
Asettamalla tässä x = x0 nähdään a1 = f (x0 ) = f
Derivoimalla k kertaa saamme
=
=
y = x suhdetestille sopivaan muotoon
a y . Tämä sarja
n n
suppenee kun muuttuja y on itseisarvoltaan pienempi kuin testin
antama suppenemissäde R. Muuttujalle x = y 1/β
suppenemissäde on niin ollen R1/β .
∞
∞
X
n=0
∞
X
n=k
an
(1)
Kääntäen, jos tunnetaan funktion f (x) Taylorin sarja
f (x) =
(x0 ).
mistä jälleen seuraa f (k) (x0 ) = k!ak , mikä jo osoittaakin
tuloksen (3.3).
Esim. Kosinifunktion Taylorin sarja
Nyt
=
− sin x
=
− cos x
=
sin x
=
cos x
f (xβ ) =
d2n+1
cos x =
dx2n+1
..
.
(n − 1)!
dn
ln x = (−1)n−1
; (n > 0),
dxn
xn
divergoi kun x = 0, emme voi origon (x0 = 0)
ympäristössä Taylorin sarjaa muodostaa.
Kehittämällä sen sijaan Taylorin sarja (3.3) pisteen
x0 = 1 ympäristössä, saame sarjan
ln x
cos x =
=
=
f (2) (0) 2
x
2!
f (3) (0) 3 f (4) (0) 4
+
x +
x + ···
3!
4!
1
1
1 − x2 + x4 + · · ·
2
4!
(x − 1)2
2
(x − 1)3
(x − 1)4
+
−
+ ···
3
4
∞
X
(x − 1)n
(−1)n−1
.
n
n=1
ln 1 + (x − 1) −
mikä on tapana esittää muodossa (y = x − 1)
(−1)n+1 sin x
Nähdään, että tässä tapauksessa parittomat derivaatat
f (2n+1) (0) häviävät ja jäljelle jäävät ainoastaan parilliset
f (2n) (0) = (−1)n .
Funktion cos x Taylorin sarja on niin ollen
an xβn
Katsotaan nyt, miten muodostaisimme logaritmifunktion
Taylorin sarjan. Koska sen jokainen derivaatta,
=
(−1)n cos x
X
n
..
.
d2n
cos x =
dx2n
an xn
ja sen suppenemissäde R, niin funktion f (xβ ) Taylorin sarja on
yksinkertaisesti
ja sen suppenemissäde R1/β .
an n(n − 1) . . . (n − k + 1)(x − x0 )n−k
X
n
dk
(x − x0 )n
dxk
d
cos x
dx
d2
cos x
dx2
d3
cos x
dx3
d4
cos x
dx4
x2n
.
(2n)!
Suhdetestin avulla todetaan helposti, että tämän sarjan
suppenemissäde on ääretön.
P
Tarkasti ottaen suhdetestillä määrätään sarjan
a xn
n n
P
βn
suppenemissäde. Sarja
a x
saadaan muuttujan vaihdolla
n n
P
β
n
X
d
an n(x − x0 )n−1 .
an (x − x0 )n =
dx
1
′
f (k) (x)
(−1)n
n=0
an (x − x0 )n .
Asettamalla x = x0 vain ensimmäinen termi on nollasta
poikkeava, ja nähdään heti a0 = f (x0 ) = f (0) (x0 ).
Potenssisarjojen ominaisuuksien mukaan sarjaa voidaan
derivoida termeittäin. Silloin ensimmäinen derivaatta
suppenemissäteen sisällä on
′
∞
X
ln(1 + y) =
∞
X
(−1)n−1
n=1
yn
n
Näiden sarjojen suppenemissäde on 1 (suppenee jos
|y| = |x − 1| < 1)
Taylorin sarjat funktioiden approksimaatioina
Kirjoitetaan funktion f Taylorin sarja muotoon
f (0) + f (1) (0)x +
f (x) = f (0) + f (1) (0)x + · · · +
f (n) (0) n
x + R(x).
n!
Intuitiivisesti on ilmeistä (ja voidaan osoittaa), että mitä
pienempi on argumetti x ja mitä suurempi on n sitä
pienempi on jäännöstermi R(x). Tämän perusteella
19
voimme approksimoida funktioita katkaistuilla Taylorin
sarjoilla:
f (n) (0) n
(3.5)
x .
n!
Approksimaatio on siis sitä tarkempi mitä pienempi on x
tai mitä suurempi on n. Yleensä approksimoitaessa
tyydytään lineaarisiin tai neliöllisiin termeihin.
Katkaistaessa yleistetty Taylorin sarja (3.3) tarkkuus on
vastaavasti sitä parempi mitä lähempänä argumentti on
kehityspistettä. Jotta tarkkuus olisi sitä parempi mitä
pienempi argumentti on, useimmiten muutetaan
tarkasteltavaa funktiota sen sijaan että kehitettäisiin
origosta poikkeavassa pisteessä.
Esimerkiksi logaritmifunktion tapauksessa saadaan
approksimaatio
f (x) ≈ f (0) + f (1) (0)x + · · · +
ln(1 + x) = x −
Jos µ on positiivinen kokonaisluku, sarjassa on äärellinen
määrä termejä (n = 0 . . . µ). Muussa tapauksessa sarjan
suppenemissäde on |x| < 1.
x3
x2
+
+ O(x4)
2
3
tai sinille
x3
+ O(x5 ).
6
Alla olevaan taulukkoon on kerätty muutamia usein
tarvittavia Taylorin sarjoja.
P
f (x)
a xn
P nxn
x
e
P0 n! n x2n+1
(−1) (2n+1)!
sin x
P0
n x2n
cos x
0 (−1) (2n)!
P x2n+1
(3.6)
sinh x
0 (2n+1)!
P x2n
cosh x
P0 (2n)!n−1 xn
ln(1 + x)
1 (−1)
n , |x| < 1
x3
2 5
tan x
x + 3 + 15 x + · · · , |x| < π2
sin x = x −
Näistä saamme suoraan aiemmin esitetyt approksimaatiot
(2.4–2.8).
Eksponenttifunktion sarjasta
X xn
ex =
n!
0
seuraa
d x
dx e
= ex , jos sitä ei muuten tunnettaisi:
d X xn
dx n n!
=
=
X nxn−1
n
∞
X
n!
X xk
xn−1
=
(n − 1)!
k!
n=1
k
missä k = n − 1.
Toistuvasti derivoimalla saadaan myös sarja
(1 + x)µ
=
=
µ(µ − 1) 2
x + ...
2!
∞
X
µ(µ − 1) . . . (µ − n + 1) n
x
n!
n=0
1 + µx +
20
Z
4. Integraalilaskentaa
4.1 Integraalifunktio
Z
Funktio F on funktion f integraalifunktio (integraali), jos
F ′ (x) = f (x).
Z
(4.1)
Integraalifunktion laskeminen (integrointi) on siis
derivoinnin käänteisoperaatio. Integraalifunktiosta on
tapana käyttää merkintää
Z
F (x) = f (x) dx
(4.2)
Funktiota f sanotaan integroitavaksi.
Integraalifunktio ei ole yksikäsitteinen: Olkoon f
integroituva funktio, jonka eräs integraalifunktio on F .
Tällöin jokainen funktion f integraalifunktio on muotoa
F (x) + C.
Todistus:
1. (F (x) + C)′ = F ′ (x) = f (x), joten F (x) + C on
integraalifunktio.
2. Olkoon G(x) toinen f (x):n integraalifunktio. Nyt
(F (x) − G(x))′ = F ′ (x) − G′ (x) = f (x) − f (x) = 0, joten
F (x) − G(x) on vakio.
Yleisesti integrointi on huomattavasti vaikeampaa kuin
derivointi: alkeisfunktioiden derivaatat ovat
alkeisfunktioita, mutta alkeisfunktioiden integraalit eivät
yleisesti ottaen ole!
Koska derivointi on lineaarinen operaatio, myös
integrointi on lineaarinen, ts.
Z
Z
Z
[αf (x) + βg(x)] dx = α f (x) dx + β g(x) dx, (4.3)
missä α ja β ovat vakioita.
Etenkin fysiikassa käytetään usein merkintää missä dx
tulee välittömästi integraalimerkin jälkeen, siis
Z
Z
dxf (x) ≡ f (x) dx
4.1.1 Tavallisia integraaleja
Johto seuraaville: derivoimalla!
Z
xµ+1
+ C, µ 6= 1
xµ dx =
µ+1
Z
a dx = ax + C, a vakio
Z
1
dx = ln |x| + C = ln |Ax|, missä C = ln |A|.
x
Z
ex dx = ex + C
Z
ax
+C
ax dx =
ln a
Z
Z
sin x dx
= − cos x + C
cos x dx
= sin x + C
tan x dx
= − ln | cos x| + C
cosh x dx
= sinh x + C
sinh x dx
= cosh x + C
Usein esiintyvät myös
Z
1
dx
1+x
Z
1
dx
1 + x2
Z
1
dx
1 − x2
Z
1
√
dx
1 − x2
Z
1
√
dx
2
x ±1
=
ln |1 + x| + C
=
arctan x + C
1 1 + x ln +C
2
1 − x
=
=
arcsin x + C
=
ln |x +
p
x2 ± 1| + C
4.2 Integraalien lasku
Toisin kuin derivointi integrointi ei yleensä ole
suoraviivainen mekaaninen toimenpide. Läheskään kaikki
alkeisfunktioista muodostetut funktiot eivät ole
integroituvia alkeisfunktioiden avulla! Integraalifunktion
etsinnässä on käytössä lukuisia menetelmiä, joista
tärkeimmät ovat muuttujan vaihto ja osittaisintegrointi.
Polynomit ja sarjat
Koska integrointi on lineaarinen operaatio, voimme laskea
esim. minkä tahansa polynomin integraalin. Jos polynomi
on muotoa,
P (x) = a0 + a1 x + a2 x2 + · · · an xn ,
on sen integraali
Z
1
1
an xn+1 . (4.4)
P (x) dx = C + a0 x + a1 x2 + · · · +
2
n+1
Samoin P
jos tunnemme funktion Taylorin sarjan,
f (x) = n an xn , saamme välittömästi integraalifunktion
sarjan
Z
X an
(4.5)
xn+1
f (x) dx = C +
n
+
1
n
Tämä sarja ei välttämättä vastaa mitään alkeisfunktiota.
4.2.1 Ketjusäännön käyttö
Derivoinnin ketjusäännön (2.19)
d
g(f (x)) = g ′ (f (x))f ′ (x)
dx
21
mukaan on
Z
g ′ (f (x))f ′ (x) dx = g(f (x)).
Jos g(x) = x2 , saadaan usein esiintyvä
Z
1
f ′ (x)f (x) dx = f (x)2 + C
2
Tai jos g(x) = ln x,
Z ′
f (x)
dx = ln |f (x)| + C
f (x)
Yleisemmin
Z
f ′ (x)(f (x))n dx =
(4.6)
Sijoitetaan t = ln x, jolloin dt = 1/x dx eli
dx = xdt.
(4.7)
(4.8)
1
(f (x))n+1 +C, n 6= −1 (4.9)
n+1
Esimerkkejä:
Z
Z
1
sin x cos x dx = sin x(sin x)′ dx = sin2 x + C
2
Z
Z
sin x
−(cos x)′
dx =
dx = − ln | cos x| + C
cos x
cos x
4.2.2 Muuttujan vaihto
Ketjusääntöön perustuu myös muuttujanvaihto- eli
sijoitustekniikka. Olkoon F funktion f integraalifunktio,
joka siis toteuttaa relaation
d
F (x) = f (x).
dx
Oletetaan nyt että x on parametrin t funktio, x(t).
Ketjusäännön mukaan on
d
F (x(t)) = F ′ (x(t))x′ (t) = f (x(t))x′ (t).
dt
Integroimalla yhtälö puolittain saadaan siten
Z
F (x(t)) = f (x(t))x′ (t) dt,
jonka voimme myös kirjoittaa muotoon
Z
Z
f (x) dx = f (x(t))x′ (t) dt.
(4.10)
Lyhyesti, tämä vastaa sijoitusta
dx =
Valaistaan muuttujan vaihtoa esimerkillä: integroidaan
Z
ln x
dx.
x
dx
dt
dt
eli siis muuttuja x “ylennetään” muuttujan t funktioksi.
Muuttujan vaihdon jälkeen integraali voi olla helpompi
laskea. Tulos on t’n funktio, mutta saadaan x:n funktioksi
kääntämällä x = x(t).
Integraali on siten
Z
ln x
dx =
x
Z
t
x dt =
x
Z
t dt
1 2
t .
2
Sijoitetaan takaisin t = ln x, jolloin saadaan lopulta
Z
ln x
1
dx = ln2 x.
x
2
=
Integroinnin tulos kannattaa yleensä tarkistaa derivoimalla.
Äskeisessä esimerkissä derivointi antaa
h
i
1
1
ln x
d 1 2
ln x = 2 ln x =
dx 2
2
x
x
kuten pitääkin.
Ongelma: kuinka löytää sopiva sijoitus t(x)? Löytyy
lukuisia sääntöjä, mutta yleispätevää ei. Kannattaa
yrittää tunnistaa sopiva kokonaisuus integroitavasta
funktiosta.
tyypillisistä sijoituksista:
REsimerkkejä
(ax + b)µ dx:
kokeillaan t = ax + b, dt = adx, joten
Z
Z
dt
µ
(ax + b) dx = tµ
a
µ+1
(ax + b)µ+1
t
+C =
+C
=
a(µ + 1)
a(µ + 1)
R
Esim. (5x − 6)6 dx. Sijoitetaan t = 5x − 6,
dt = 5dx ⇒ dx = dt/5, ja
Z
Z
1
11 7
1
(5x − 6)6 dx = t6 dt =
t +C =
(5x − 6)7 + C
5
57
35
vaiheessa sijoitetaan x takaisin.
√
RViimeisessä
a2 − x2 dx:
kokeillaan x = a sin
p t, dx = a cos tdt. (Miksi tämä sijoitus?
√
Syy: a2 − x2 = a2 − a2 sin2 t = |a cos t|.)
Z
Z p
a2 − x2 dx = a cos t a cos tdt
Z
Z
a2
= a2 cos2 tdt =
(1 + cos 2t)dt
2
a2
1
= (t − sin 2t) + C
2 2
x 1
x
a2
arcsin − sin(2 arcsin ) + C
=
2
a 2
a
!
r
2
x2
a
x x
=
arcsin +
1− 2 +C
2
a
a
a
22
missä viimeisessä käytettiinpcos 2t = 2 cos2 t − 1 ja
2
Rsin√2t = 2 sin t cos t = 2 sin t 1 − sin t.
2
2
a + x dx:
p
Tässä toimii x = a sinh t, sillä 1 + sinh2 x = cosh x
(vertaa
edelliseen).
R
1
ex +e−x dx:
Kokeillaan y = ex , dy = ex dx ja
Z
Z
1
1
1
dx =
dy
ex + e−x
y + 1/y y
Z
1
dy = arctan y + C = arctan ex + C
=
1 + y2
R √
3x 1 − 2x2 dx:
Kokeillaan u = 1 − 2x2 , du = −4xdx ⇒ xdx = − 14 du
Z
Z
p
3 √
2
udu
3x 1 − 2x dx = −
4
32
1
= − u3/2 + C = − (1 − 2x2 )3/2 + C
43
2
Huom: sijoitukset eivät useinkaan ole√yksikäsitteisiä.
Esim. yllä voidaan kokeilla myös t = 1 − 2x2 ,
1
dt = −2x(1 − 2x2 )−1/2 dx = − 2x
t dx ⇒ xdx = − 2 tdt:
Z
Z
p
1
2
3x 1 − 2x dx = 3t(− t)dt
2
1
1 3
= − t + C = − (1 − 2x2 )3/2 + C
2
2
Vinkki: juurilausekkeen sisältävässä integraalissa
kannattaa kokeilla uudeksi muuttujaksi joko juuren
sisäpuolta
tai juurilauseketta kokonaisuudessaan
R dx
√
:
1+x
√
Kokeillaan s = 1 + x, ds = 12 (1 + x)−1/2 dx ja
Z
Z
√
dx
√
= 2ds = 2s + C = 2 1 + x + C
1+x
Usein juurilausekkeita sisältävät funktiot eivät ole
integroitavissa alkeisfunktioiden avulla.
Rkuitenkaan
√ x+2 dx:
x+1+1 √
sijoitus t = x + 1 ⇒ x = t2 − 1, dx = 2tdt:
Z
Z 2
x+2
t −1+2
√
2tdt
dx =
t+1
x+1+1
Z 3
t +t
=2
dt
t+1
Koska rationaalilausekkeen osoittaja on korkeampaa
kertalukua kuin nimittäjä, voimme “jakaa” lausekkeen
muotoon polynomi + jakojäännös. Tästä tarkemmin
rationaalifunktioiden integroinnin yhteydessä.
Tarkistamalla nähdään että integraali on
Z 2
2
t −t+2−
=2
dt
t+1
1
1
= 2( t3 − t2 + 2t − 2 ln(t + 1) + C
3
2
2
= (x + 1)3/2 − (x + 1) + 4(x + 1)1/2
3 √
−4 ln( x + 1 + 1) + C
4.2.3 Osittaisintegrointi
Integroimalla tulon derivointisäännön
d
[f (x)g(x)] = f ′ (x)g(x) + f (x)g ′ (x)
dx
saamme osittaisintegrointisäännön
Z
Z
′
f (x)g(x) dx = f (x)g(x) − f (x)g ′ (x) dx.
(4.11)
R
Sovelletaan osittaisintegrointia integraaliin x ln x dx.
Olkoon säännön (4.11) f ′ (x) = x ja g(x) = ln x. Silloin on
f (x) = 1/2 x2 ja g ′ (x) = 1/x ja saamme
Z
Z
1 2
1
1
x ln x dx =
x2 dx
x ln x −
2
2
x
Z
1
1 2
=
x ln x −
x dx
2
2
1
1 2
x ln x − x2 .
=
2
4
Kuten nähtiin, funktiot “f ” ja “g” täytyy valita
huolellisesti että osittaisintegrointi johtaisi helpommin
ratkeavaan integraaliin! Väärä valinta johtaa vain
huonompaan
lopputulokseen.
R
Esim.
arctan xdx. Valitaan nyt g(x) = arctan x ja
′
2
f ′ (x)
Z = 1! Tästä seuraa g (x) =Z1/(1 + x ) ja f (x) = x, ja
x
arctan xdx = x arctan x −
dx =
1 + x2
1
x arctan x − ln(1 + x2 ) + C
2
missä x/(1 + x2 ) on muotoa 12 u′ (x)/u(x). Tapaus f ′ = 1
on yleisesti
R käytetty osittaisintegroinnissa.
Esim.
ln xdx: valitaan jälleen f ′ = 1, g = ln x, jolloin
′
f=
Z x, g = 1/x, ja Z
1
ln xdx = x ln x − x dx = x ln x − x + C.
x
R
Esim.
x cos xdx: valitaan f ′ = cos x, g = x, jolloin
′
f=
eroon x:n potenssista. Siis
Z sin x, g = 1 ja pääsemme
Z
x cos xdx = x sin x − 1 sin xdx = x sin x + cos x + C.
Esimerkin vuoksi katsotaan mitä tapahtuisi jos valitaan
f ′ Z= x, g = cos x: nyt f = x2Z/2, g ′ = − sin x ja
1 2
1
x sin xdx
x cos xdx = x2 cos x +
2
2
Saatu integraali on pahempi kuin alkuperäinen! Funktiot
siis kannattaa valita huolella.
Osittaisintegrointia
voi joutua toistamaan:
R 2
Esim.
x sin xdx:kuten edellä, otetaan f ′ = sin x,
g = x2 , joten f = − cos x, g ′ = 2x ja
23
Z
x2 sin xdx = −x2 cos x +
Z
2x cos xdx =
−x2 cos x + 2x sin x + 2 cos x + C
missä saatu integraali laskettiin jo edellä.
Yleisesti:
MuotoaZ
Z
Z
xm sin xdx,
xm cos xdx,
xm ex dx
usein integroida standardisijoituksella
t = tan
(Tämän olisi nähnyt nopeamminkin käyttämällä
sin2 x = 21 (1 − cos 2x))
R
Yleisemmin: tyyppiä sinn xdx olevat integraalit voidaan
laskea palautuskaavan avulla: valitaan f ′ = sin x,
g = sinn−1 x, joten f = − cos x, g ′ = (n − 1) sinn−2 x cos x
Z
sinn xdx
Z
n−1
= − cos x sin
x + (n − 1) cos2 x sinn−2 xdx
Z
= − cos x sinn−1 x + (n − 1) (1 − sin2 x) sinn−2 xdx
Z
n−1
= − cos x sin
x + (n − 1) sinn−2 xdx
Z
−(n − 1) sinn xdx
Saimme siis jälleen alkuperäisen integraalin.
Ratkaisemalla
se saamme
Z
Z
1
n−1
sinn xdx = − cos x sinn−1 x +
sinn−2 xdx
n
n
Näin siis sinn x:n integraali saatiin palautettua sinn−2 x:n
integraaliksi. Toistamalla tätä päästään aina n = 1 tai 0,
ja sin1 x ja sin0 x integraalit tunnetaan.
Samalla menetelmällä saamme cosn x:n integraalille
palautuskaavan.
Näin
Z
Z esim.
3
1
3
4
sin2 xdx =
sin xdx = − cos x sin x +
4
4
Z
3 1
1
1
3
sin0 xdx) =
− cos x sin x + (− cos x sin x +
4
4 2
2
3
3
1
− cos x sin3 x − cos x sin x + x + C
4
8
8
(4.12)
Tällöin
olevat integraalit voidaan laskea osittaisintegroimalla m
kertaa R
Esim.
sin2 xdx: otetaan
f ′ Z= g = sin x ⇒ f = − cos x, Zg ′ = cos x ja
sin2 xdx = − cos x sin x + cos2 xdx = − cos x sin x +
Z
Z
(1 − sin2 x)dx = − cos x sin x + x − sin2 xdx
Saimme siis alkuperäisen integraalin, joka voidaan
ratkaista yhtälöstä:
Z
1
sin2 xdx = (− cos x sin x + x) + C
2
x
2
dt
=
cos x
=
=
sin x
=
=
x 1
2
) dx ⇒ dx =
dt,
2 2
1 + t2
x
x
x
cos 2 = cos2 − sin2
2
2
2
1
− tan2 x2
x
x
1 − t2
cos2 (1 − tan2 ) =
=
2
2
1 + t2
1 + tan2 x2
x
x
x
x
2 sin cos = 2 tan cos2
2
2
2
2
tan x2
2t
=
2
1 + t2
1 + tan2 x2
(1 + tan2
Tällä ratkeavat kaikki sin x, cos x rationaalifunktiot.
Esim:
Z
Z
Z
1 + t2 2
1
1
dx =
dt =
dt = ln |t| + C =
sin x
2t 1 + t2
t
x
ln | tan | + C
2
Helpompia sijoituksia usein kuitenkin ovat t = sin x,
t = cos x, t = tan x, joita voi myös kokeilla.
Monet trigonometrisia funktioita sisältävät integraalit
voidaan laskea helpommin kompleksilukujen ja Eulerin
kaavan avulla:
cos x
=
sin x
=
eix
=
1 ix
(e + e−ix )
2
1 ix
(e − e−ix )
2i
cos x + i sin x
(4.13)
(4.14)
(4.15)
Näiden käyttö nojautuu siihen että ex :n integraalit ovat
helppoja laskea. Imaginääriyksikö i on vakio, joka
toteuttaa i2 = −1. Tästä puhutaan tarkemmin
kompleksilukujen yhteydessä.
Esim.
Z
=
sin ax cos bxdx
Z =
1
4i
=
1
4i
=−
4.2.4 Trignonometristen funktioiden integrointi:
jos integroitava funktio sisältää sin x, cos x, se voidaan
24
Z
eiax − e−iax eibx + e−ibx
2i
2
dx
(ei(a+b)x + ei(a−b)x − e−i(a−b)x − e−i(a+b)x )dx
ei(a+b)x
ei(a−b)x
e−i(a−b)x
e−i(a+b)x
+
+
+
i(a + b)
i(a − b)
i(a − b)
i(a + b)
1 cos(a + b)
1 cos(a − b)
−
+C
2 a+b
2 a−b
+C
4.2.5 Rationaalifunktion integrointi
Viimeisenä menetelmänä tarkastelemme muotoa
R=
Pn
Qm
S
,
Qm
missä Tn−m on astetta n − m oleva osamääräpolynomi ja
S jakojäännöspolynomi. Polynomi Tn−m on helppo
integroida, joten jäljelle jää jälleen muotoa Pn /Qm oleva
murtofunktio, missä nyt on n < m.
Kaikki muotoa
Pn
R=
; (n < m)
Qm
olevat rationaalifunktiot voidaan integroida, mikäli
tunnetaan polynomin Qm nollakohdat. Tällöin
rationaalifunktio voidaan hajoittaa osamurtoihin.
Polynomien jakolasku
Kuinka polynomit jaetaan? Esim. jakokulmassa, kuten
numerotkin. Esim:
x2 + 5x − 3
P (x)
=
=?
Q(x)
x−1
x+6
x2 + 5x − 3
x2 − x
6x − 3
– 6x − 6
3
Jakolaskun tulos on siis
x−1
–
2
x + 5x − 3
3
=x+6+
x−1
x−1
mikä on helppo tarkistaa laventamalla.
Toinen esimerkki:
2x4 + 6x2 + 2
=?
x2 + x + 1
2
x2 + x + 1
–
? = 2x2 − 2x + 6 +
−4x − 4
x2 + x + 1
Polynomi in välittömästi integroitavissa. Entä
jakojäännöksenjä jäävä rationaalifunktio?
olevien murtolausekkeiden integrointia, kun Pn ja Qm
ovat asteen n ja m polynomeja (siis suurimmat niissä
esiintyvät potenssit ovat m ja n). Jos osoittaja on
asteluvultaan suurempi kuin nimittäja, voidaan tehdä
polynomien jakolasku ja päädytään lausekkeeseen
R = Tn−m +
Siis
2x − 2x + 6
2x4
+ 6x2
+2
2x4 + 2x3 + 2x2
−2x3 + 4x2
+2
–
−2x3 − 2x2 − 2x
6x2 + 2x + 2
– 6x2 + 6x + 6
−4x − 4
Jako osamurtoihin
1-kertaiset reaalijuuret: Oletetaan että yhtälöllä
Q(x) = 0 on vain 1-kertaisia reaalijuuria; olkoon nämä
juuret x1 , x2 , . . . xn (huom: Q:n asteluku on n, joten
löytyy n juurta.)
Tällöin voimme jakaa rationaalilausekkeen osamurtoihin
n
P (x) X Ai
=
Q(x)
x − xi
i=1
(4.16)
missä Ai ovat vakioita. Selvästi oikea puoli voidaan nyt
integroida.
Esim: jaetaan 4/(x2 − 1) osamurtoihin: nimittäjän
nollakohdat ovat x = ±1, mitkä ovat reaalisia ja
yksinkertaisia (x2 − 1 = (x − 1)(x + 1)). Siis
x2
4
a
b
=
+
−1
x−1 x+1
ja määräämme vakiot a ja b siten, että yhtälö on
voimassa kaikilla muuttujan x arvoilla. Kerrotaan yhtälö
(x + 1)(x − 1):llä, joten
4 =
a(x + 1) + b(x − 1) = (a + b)x + (a − b)
Jotta tämä olisi yhtäsuuri alkuperäisen lausekkeen kanssa,
täytyy olla a + b = 0 ja a − b = 4, joten a = 2 ja b = −2.
Osamurtojen avulla integraali
Z
4
dx.
2
x −1
on heti laskettavissa:
Z
4
dx =
2
x −1
=
=
=
Z
2
2
dx −
dx
x−1
x+1
2 ln |x − 1| − 2 ln |x + 1| + C
ln(x − 1)2 − ln(x + 1)2 + C
2
x−1
+ C.
ln
x+1
Z
Sovelletaan edellistä integraaliin
Z 3
x −2
F (x) =
dx
x2 − 1
Osoittaja on korkeampaa kertalukua, joten tehdään ensin
polynomien jakolasku. Nähdään että
x−2
x3 − 2
=x+ 2
2
x −1
x −1
25
Jäännöslausekkeen nimittäjän nollakohdat ovat x = ±1,
1-kertaisia. Siis voimme jakaa
x−2
x2 − 1
x−2
=
=
⇒
⇒
a
b
+
⇒
x−1 x+1
a(x + 1) + b(x − 1) = (a + b)x + (a − b)
=
=
=
a1
a2
a3
b
3x2 − 37x + 83
=
+
+
+
(x − 2)3 (x + 5)
x − 2 (x − 2)2
(x − 2)3
x+5
Lavennetaan nimittäjät pois:
3x2 − 37x + 83 = a1 (x − 2)2 (x + 5)
+a2 (x − 2)(x + 5) + a3 (x + 5) + b(x − 2)3
a + b = 1, a − b = −2
a = −1/2, b = 3/2
Siis
F (x)
Siis
Z −1/2
3/2
dx
+
x−1 x+1
1 2 1
3
x − ln |x − 1| + ln |x + 1| + C
2
2 2
1 2 1 (x + 1)3 +C
x + ln 2
2
x−1 x+
Moninkertainen juuri: Yleisemmässä tapauksessa
polynomilla voi olla moninkertaisia juuria (joiden edelleen
oletamme olevan reaalisia). Yleisesti polynomi Q(x)
voidaan kirjoittaa muotoon
Q(x) = A(x − x1 )n1 (x − x2 )n2 . . .
missä xi ovat polynomin nollakohtia, ni nollakohdan xi
kertaluku ja A vakio. Tässä tapauksessa
osamurtolausekkeella on yleinen muoto
n
n
k=1
k=1
2
1
X
P (x) X
bk
ak
+
+ ...
=
Q(x)
(x − x1 )k
(x − x2 )k
missä ak , bk . . . ovat vakioita.
Esim.
1
b
a1
a2
+
=
+
2
2
(x − 1) (x + 2)
x − 1 (x − 1)
x+2
x = 1 on 2-kertainen nollakohta, ja x = −2 1-kertainen.
Määrätään vakiot kertomalla (x − 1)2 (x − 2):lla:
1 = a1 (x − 1)(x + 2) + a2 (x + 2) + b(x − 1)2
Tästä voidaan ratkaista vakiot vaatimalla että yhtälön
kaikkien x:n potenssien kertoimet ovat samat molemmin
puolin (x0 , x1 , x2 ). Kuitenkin usein nopeampi menetelmä
on sijoittaa x 7→ xi :
x = 1 ⇒ 1 = a2 (1 + 2) ⇒ a2 = 31
x = −2 ⇒ 1 = b(−2 − 1)2 = b9 ⇒ b = 91
a1 saadaan esim. x2 :n kertoimista: 0 = a1 + b ⇒ a1 = − 91 .
Esimerkki: integroidaan
Z
3x2 − 37x + 83
F (x) =
(x − 2)3 (x + 5)
Osoittaja (2) on alempaa astetta kuin nimittäjä (4), joten
voidaan jakaa suoraan osamurtoihin. Nimittäjän
nollakohdat ovat
x1
x2
=
=
2,
−5,
3-kertainen
1-kertainen
Tästä tulee 4 yhtälöä 4 vakiolle (x:n potenssit x0 . . . x3 ),
jotka ovat suoraan ratkaistavissa.
Määrätään kuitenkin vakiot jälleen käyttämällä
“pikamenetelmää” ja sijoitetaan nollakohdat:
x = 2: 3 · 4 − 37 · 2 + 83 = a3 7 ⇒ a3 = 3
x = −5: 3 · 25 + 37 · 5 + 83 = −b73 ⇒ b = −1
Muut vakiot vaativat muita ehtoja, helpoin lienee x:n
korkeimman potenssin kerroin, mikä voidaan lukea
suoraan:
x3 : 0x3 = a1 x3 + bx3 ⇒ a1 = −b = 1
Jäljelle jää a2 . Tämän saa esim x2 :n kertoimesta tai
sijoittamalla esim.
x = 0: 83 = a1 4 · 5 − a2 2 · 5 + a3 5 − b8 ⇒ a2 = −4
Siis saimme a1 = 1, a2 = −4, a3 = 3, b = 1, ja
Z 1
−4
3
−1
F (x) =
dx
+
+
+
x − 2 (x − 2)2
(x − 2)3
x+5
3
= ln |x − 2| + 4(x − 2)−1 − (x − 2)−2
2
− ln |x + 5| + C
x − 2
4
1
3
+C
=
−
+ ln x − 2 2 (x − 2)2
x + 5
Kompleksijuuret: Yleisimmässä tapauksessa polynomin
Q(x) juuret ovat kompleksisia. Esim.
x2 + 1 = 0 ⇒ x = ±i
Kompleksijuurisen rationaalifunktion integraalin voi
laskea yllä olevia sääntöjä noudattaen, ottaen vain
huomioon että joistain kertoimista tulee kompleksilukuja.
Näitä varten voidaan myös johtaa omat
integrointisäännöt. Tätä ei käsitellä MAPU I:llä
tarkemmin.
4.3 Määrätty integraali
Tarkastellaan suljetulla välillä [a, b] määriteltyä
paloittain jatkuvaa rajoitettua funktiota f (x). Jaetaan
väli [a, b] n yhtäsuureen h-mittaiseen osaan,
h=
b−a
n
(4.17)
ja merkitään
xk = a + kh,
(4.18)
ts.
x0 = a, x1 = a + h, x2 = a + 2h, . . . , xn = b.
26
(4.19)
f(x )
Integrointirajojen vaihto
Määrittelimme (4.21) integraalin ”vasemmalta oikealle”eli
integroimisvälissä [a, b] oli a ≤ b. Tällöin jakoväli
h = (b − a)/n on positiivinen. Voimme myös ajatella
integrointia ”oikelta vasemmalle”, jolloin jakovälistä
(4.17) tulee negatiivinen. Tämän huomioonottaen
määrittelemme
Z a
Z b
f (x) dx.
f (x) dx = −
(4.23)
f(x 4)
A
x
1
x
2
h
{
x 0= a
b = x
4
x
6
x
7
Jakoon (4.19) liittyvä porrassumma on
Sn = h
n−1
X
f (xk ).
Additiivisuus
(4.20)
k=0
Jos c on integroimisvälin [a, b] sisäpiste, nähdään
määritelmästä (4.21) että voimme koostaa integraalin
paloista, kuten
Geometrisesti summan jokainen termi
Z
Ak = hf (xk )
esittää suorakaiteen, leveydeltään h ja korkeudeltaan
f (xk ), pinta-alaa. Koska jakovälin pituus h on
positiivinen, pinta-ala Ak on positiivinen jos f (xk ) on
positiivinen ja negatiivinen jos f (xk ) on negatiivinen.
Summa Sn (4.20) approksimoi siten välillä [a, b] käyrän
y = f (x) ja x-akselin väliin jäävää pinta-alaa siten, että
x-akselin yläpuolinen osa lasketaan positiivisena ja
alapuolinen osa negatiivisena. Tämä approksimaatio on
ilmeisestikin sitä tarkempi mitä tiheämpi jako on, ts. mitä
pienempi on h tai mitä suurempi on n.
Voidaan osoittaa, että jaon (4.19) tihentyessä summa
(4.20) lähestyy äärellistä raja-arvoa, ts. raja-arvo
S = lim Sn
n→∞
on olemassa ja äärellinen. Tätä raja-arvoa sanotaan
funktion f (x) määrätyksi integraaliksi välillä [a, b]. Sitä
merkitään kuten
Z b
n−1
X
f (xk ).
f (x) dx = lim h
(4.21)
n→∞
a
b
a
Kuva 4.1 Porrassumma
b
f (x) dx =
a
Z
c
f (x) dx +
a
Z
b
f (x) dx.
(4.24)
c
Ottaen huomioon rajojen vaihto-ominaisuuden (4.23)
näemme, että additiivisuus (4.24) on voimassa olivatpa a,
b ja c mitä tahansa funktion määrittelyalueen pisteitä.
Lineaarisuus
Integraalin määritelmästä (4.21) nähdään, että integrointi
on lineaarinen operaatio, ts.
Z
b
[αf (x) + βg(x)]dx = α
a
Z
b
f (x) dx + β
a
Z
b
g(x) dx.
a
(4.25)
Integroimismuuttujan vaihto
Rb
Integraalin a f (x) dx arvo (käyrän ja x-akselin välinen
pinta-ala) ei ilmeisestikään riipu muuttujasta x. On siis
aivan samantekevää, millä symbolilla funktion
argumenttia merkitään, ts.
Z
b
f (x) dx =
a
Z
b
f (s) ds.
(4.26)
a
k=0
Geometrisesti määrätty integraali on ilmeisestikin käyrän
y = f (x) ja x-akselin väliin jäävä pinta-ala.
4.3.1 Määrätyn integraalin ominaisuuksia
Tyhjä integroimisväli
Olkoon integrointiväli [a, a], ts. se sisältää vain yhden
pisteen. Tällöin on
Z a
(4.22)
f (x) dx = 0,
a
sillä integraalin määritelmässä (4.21) jakoväli
h = (a − a)/n on aina nolla riippumatta jakopisteiden
lukumäärästä.
4.3.2 Kertymäfunktio
Funktion f kertymäfunktio K on
Z x
f (t) dt.
K(x) =
(4.27)
a
Ilmeisestikin pisteessä a kertymäfunktio on nolla, sillä
Z a
f (t) dt = 0.
K(a) =
a
Kertymäfunktio (4.27) ilmoittaa käyrän ja x-akselin
välisen pinta-alan kohdasta a kohtaan x. Annetaan
kertymäfunktion argumentille (pieni) lisäys ∆x.
27
Vastaava kertymäfunktion muutos
Esim.
Z
∆K = K(x + ∆x) − K(x)
on silloin suuruudeltaan likimain kuvan 4.2 varjostetun
alueen pinta-ala ∆A = ∆xf (x), ts.
K(x + ∆x) − K(x) ≈ ∆xf (x).
b
ex dx = / ex = eb − ea
a
a
Esim.
Z
2π
2π
sin xdx = − / cos x = − cos 2π + cos 0 = 0
0
0
Rx
d
f (t)dt = f (x), on ketjusäännön
Huom: koska dx
a
mukaan
Z g(x)
Z g
d
dg d
f (t)dt =
f (t)dt = f (g(x))g ′ (x)
dx a
dx dg a
f(x )
D A
K (x )
b
Esim.
a
x
d
dx
x + D x
Kuva 4.2 Kertymäfunktion derivaatta
K(x + ∆x) − K(x)
= f (x)
∆x→0
∆x
d
K (x) =
dx
Z
0
(4.28)
L→∞
Esim.
Z
a
Täten siis kertymäfunktio K(x) on f (x):n
integraalifunktio, katso (4.1), riippumatta määrätyn
integraalin alarajasta a. Kertymäfunktiokin on siis
muotoa
Z x
f (t) dt = F (x) + C.
K(x) =
b
a
Z
Z
a
Integroimisvakio C määräytyy nyt alkuehdosta
Z
eli
C = −F (a),
∞
1
∞
(4.29)
Tämä ominaisuus on ilmeisestikin voimassa olipa F mikä
hyvänsä funktion f integraalifunktio.
Määrättyjä integraaleja laskettaessa käytetään usein
sijoitusmerkintää:
Z b
b
f (t) dt = / F (t) = F (b) − F (a).
(4.30)
a
b
−1
1 1
= −
x
a b
a
∞
1
1
dx =
x2
∞
−1
=1
x
1
∞
1
dx = / ln x hajaantuu
x
1
1
Z
b
a
1
dx =
x2
∞
√
√
dx
√ = 2 x = lim (2 L − 2) hajaantuu
L→∞
x
1
joten saamme yhteyden määrätyn integraalin
(kertymäfunktion) ja integraalifunktion välille:
f (x) dx = F (b) − F (a).
a
Esim.
K(a) = F (a) + C = 0
Z
d2x
= 2 sin 2x
dx
Jos raja-arvo on olemassa, sanotaan että integraali
suppenee, muuten hajaantuu.
x
f (t) dt = f (x).
sin xdx = sin(2x)
a
lim
′
2x
Epäoleellinen integraali on määrätty integraali jossa
ainakin toinen raja = ∞:
Z L
Z ∞
f (x)dx
(4.31)
f (x)dx ≡ lim
Tämä relaatio on ilmeisestikin sitä tarkempi mitä
pienempi ∆x on, joten saamme
eli
Z
1
0
1 √
dx
√ = 2 x=2
x
0
Huom: kuten edellä, määrätty integraali voi olla olemassa
vaikka integroitava → ∞ jossain pisteessä!
Esim. Seuraava kaunis tulos pätee (ei näytetä tässä)
Z ∞
√
2
e−x = π
−∞
Esim. Oletetaan p 6= −1:
Z
a
28
∞
1
p
x dx =
∞
1
xp+1
1
=
( lim Lp+1 − 1)
p+1
p + 1 L→∞
=
Z
1
xp dx =
0
∞
1/(p + 1)
1
jos p > −1
jos p < −1
Esim. I =
′
=
1
xp+1
=
(1 − lim ap+1 )
a→0
p+1
p+1
ln xdx:
0
a→0
jos p > −1
jos p < −1
1/(p + 1)
∞
1
valitaan f = 1 ja g = ln x, joten f = x ja g ′ = 1/x:
Z 1
1
1
1
x dx = (0 − 0) − / x = 1
I = / x ln x −
x
0
0
0
Huomaa että tässä on käytetty “0 ln 0 = 0”, sillä
lim a ln a = 0.
0
Z
Derivointi parametrin suhteen
4.3.3 Muuttujan vaihto määrätyssä integraalissa
Integrointimenetelmät määrätylle integraalille ovat samat
kuin integraalifunktiollekin, mutta lisäksi tulee ottaa
huomioon kuinka integroimisalueen rajat käyttäytyvät!
Integraalissa
Z b
f (x)dx
I=
Usein näppärä keino integraalien sieventämisessä on
derivoida integroitavaa jonkun parametrin suhteen: jos
f (x, t) on kahden muuttujan funktio, voimme määritellä
Z b
f (x, t)dt
I(x) =
a
jolloin
I ′ (x) =
a
sijoitetaan x = g(t), jolloin dx = g ′ (t)dt ja kun x = a tai
b, on
a
b
g(ta ) ⇒ ta = g −1 (a)
g(tb ) ⇒ tb = g −1 (b)
=
=
b
a
∂f (x, t)
dt
∂x
Tässä osittaisderivaatta ∂f (x, t)/∂x tarkoittaa että f
derivoidaan muuttujan x suhteen pitäen t vakiona.
Esim. halutaan integroida
Z ∞
t2 e−at dt
0
Siis
I=
Z
g −1 (b)
′
f (g(t))g (t)dt =
g −1 (a)
Z
tb
′
f (g(t))g (t)dt
(4.32)
0
0
π/2
0
1
(cos 2t + 1)dt =
2
π/2
π
1 1
( sin 2t + t) =
2 2
4
b
a
b
f ′ (x)g(x)dx = / f (x)g(x) −
a
Esim. I =
Z
∞
Z
(4.33)
I (a)
=
Z
=
e−at dt =
0
∞
−
1
e−at
=
a
a
0
∞
Z0 ∞
(−te−at )dt = −
t2 e−at dt =
0
1
a2
1
a3
Derivointi parametrin suhteen korvaa usein
osittaisintegrointia, mutta voi olla huomattavasti
nopeampi.
Funktio y = f (x) määrittelee (x, y) -tason käyrän kun
x ∈ [a, b]. Kun x muuttuu dx:n verran, y muuttuu
dy
= f ′ (x)dx:n verran.
dy = dx
ds
dy
Kuva 4.3
a
xe−x dx:
0
′′
≡
∞
dx
f (x)g ′ (x)dx
olkoon f ′ = e , g =Z x, joten f = −e−x , g ′ = 1:
∞
∞
∞
(−e−x )dx = (0 − 0) − e−x =
I = x(−e−x ) −
0
I ′ (a)
b
0
−x
−(0 − 1) = 1
I(a)
Z
Käyrän pituus
0
4.3.4 Määrätyn integraalin osittaisintegrointi
Kuten arvata saattaa, on osittaisintegrointisääntö
määrätylle integraalille
Z
Tämän voisi integroida osittain, mutta vaihtoehtoisesti
voimme määritellä
ta
Rajojen vaihto on helppo muistaa seuraavasti: jos x:n
rajat ovat a, b, niin korvataan ne vain niitä vastaavilla t:n
arvoilla.
R1√
Esim. I = 0 1 − x2 dx:
sopiva sijoitus on x = sin t, ja dx = cos tdt. Nyt kun
x = 0, on t = 0, ja kun x = 1 on t = π/2. Siis
Z π/2
Z π/2 p
2
1 − sin t cos tdt =
cos2 tdt =
I=
Z
Z
0
Tästä saadaan käyrän pituuden differentiaali
p
p
ds = (dx)2 + (dy)2 = 1 + [f ′ (x)]2 dx
ja siis koko käyrän (funktion kuvaajan) pituus
Z bp
L=
1 + [f ′ (x)]2 dx
a
29
√
Esimerkki: olkoon y = 1 − x2 , kun 0 ≤ x ≤ 1 (ympyrän
neljännes). Mikä on kaaren pituus?
Z 1p
1 + y ′ (x)2 dx
L =
0
Z 1s
−x 2
1+ √
=
dx
1 − x2
0
Z 1r
x2
1+
dx
=
1 − x2
0
Z 1
dx
√
=
1 − x2
0
1
π
= / arcsin(x) =
2
0
ja tilavuus
V
=
−R
π
R
Z
i2
hp
R2 − x2 dx = π
R
−R
(R2 − x2 )dx
1
4
(R2 x − x3 ) = πR3
3
3
Toinen mahdollisuus on käyttää symboliseen laskentaan tehtyjä
tietokoneohjelmia. Näistä tunnetuimpia ovat Maple ja
Mathematica. Nämä osaavat huomattavasti enemmän
integrointitemppuja kuin MAPUlla on kuvattu.
Jos näitä ei ole saatavilla, löytyy Mathematicaan pohjautuva
ilmaiseksi käytettävä “laskin” www-sivulta
www.wolframalpha.com (ainakin v. 2010). Tämäkin tuntee
kaikki integointitemput mitkä Mathematicakin, ja sen avulla
kannattaa muun muassa tarkistaa MAPUn kotitehtävät.
r
x
Oletetaan että käyrä r = f (x) > 0 pyörähtää x-akselin
ympäri. Kun rajoitutaan a ≤ x ≤ b, käyrä rajaa
pyörähdyskappaleen pinnan, päädyissä x = a, x = b
olevien ympyröiden kanssa. Nyt käyrän pyyhkäisemän
pinnan alan differentiaali on
p
dA = 2πrds = 2πf (x) 1 + [f ′ (x)]2 dx
joten alaksi saadaan
Z b
p
2πf (x) 1 + f ′ (x)2 dx + πf (a)2 + πf (b)2
A=
a
Samoin pyörähdyskappaleen tilavuuden differentiaali on
(ympyräkiekon tilavuus)
dV = πr2 dx = πf (x)2 dx
ja tilavuudeksi tulee
b
π[f (x)]2 dx
a
√
R2 − x2 , −R ≤ x ≤ R,
pyörähtää x-akselin ympäri määritellen
pyörähdyskappaleen (mikä on tässä tapauksessa tietysti
pallo). Sen pinta-ala on
s
Z R
2
p
−x
dx
2π R2 − x2 1 + √
A =
R 2 − x2
−R
Z R
R
2πRdx = 2πR / x = 4πR2
=
Esim. Ympyrän kaari r =
−R
π
Kun omat neuvot eivät riitä, voi turvautua apuvälineisiin.
Integraaleja on taulukoitu lukuisiin kirjoihin, joista paras ja
tunnetuin lienee Gradshteyn and Ryzhik: Table of Integrals,
Series, and Products.
y
Z
R
Integroinnin apuvälineet
Pyörähdyskappaleen pinta-ala ja tilavuus
V =
Z
−R
mikä on tietysti tunnettu tulos.
z
=
−R
30
4.3.5 Numeerinen integrointi
puolisuunnikassäännöllä
Usein integraalifunktiota ei osata (tai voida) laskea, vaan
joudutaan turvautumaan integraalin numeeriseen
laskemiseen. Lasku perustuu määrätyn integraalin
tulkintaan pinta-alana, lasketaan siis porrassumman
kaltainen summa äärellisellä askelvälillä. Porrassumma
(4.20) ei kuitenkaan ole käytännössä suositeltava tapa
laskea integraalia, sillä se on hyvin tehoton.
Yksinkertaisin suositeltava tapa on käyttää ns.
puolisuunnikassääntöä: Olkoon laskettavana integraali
Z
tässä x1 = xi , x2 = xi+1 ):
Z x2
h
f (x)dx − [f (x1 ) + f (x2 )]
V (h) =
2
x1
Z x1 +h
[f (x1 ) + f ′ (x1 )(x − x1 )
=
x1
b
f (x)dx
a
=
• Jaetaan integroimisväli (a, b) N :ään tasaväliin
x0 , x1 , . . . xN (tässä x0 = a ja xN = b). Yhden välin
pituus on siis h = (b − a)/N .
y
f(x)
=
1
+ f ′′ (x1 )(x − x1 )2 + . . .
2
h
− [f (x1 ) + [f (x1 ) + f ′ (x1 )h
2
1 ′′
2
+ f (x1 )h + . . .]
2
1
1
1
f (x1 )h + f ′ (x1 ) h2 + f ′′ (x1 ) h3
2
2
3
1
h
− [2f (x1 ) + f ′ (x1 )h + f ′′ (x1 )h2 ] + O(h4 )
2
2
1
− h3 f ′′ (x0 ) + O(h4 )
12
Siis virhe yhden välin pinta-alassa on O(h3 ). Koko
summassa virhe tulee siis olemaan
V = N O(h3 ) = O(N h3 ) = O(
x0
x1
x2
xN x
Kuva 4.4
• Approksimoidaan integraalia summaamalla kunkin
välin ala puolisuunnikkaan pinta-alan avulla:
Z xi+1
1
f (x)dx ≈ h [f (xi ) + f (xi+1 )]
2
xi
f( xi+1)
f( xi)
xi
xi+1
Kuva 4.5 Puolisuunnikkaan ala
sillä h = (b − a)/N = O(1/N ).
Siis: jos lisäämme jakopisteiden määrää tekijällä 2
(N → 2N ), virhe pienenee tekijällä 4.
Harjoitustehtävä: mikä virhe tulee jos arvoidaan
integraalia summalla suorakaiteita, eli
Z xi+1
f (x)dx = hf (xi ) ?
xi
Hiven tarkempi tulos integroinnissa saadaan jos
käytetään puolisuunnikassäännön sijasta Simpsonin
sääntöä: siinä arvoidaan funktiota sovittamalla siihen
parabeli (toisen asteen käyrä). Tässä tapauksessa virhe
koko integraalissa on vain O(1/N 4 ).
Vielä hienostuneemmat menetelmät eivät jaa
integroimisaluetta tasaväleihin, vaan tihentävät jakoa
niissä kohdissa missä funktio muuttuu nopeimmin.
Lisätietoja numeerisesta integroinnista saa erinomaisesta
kirjasta N umerical Recipes (Cambridge University
Press), ja sen verkkosivulta www.nr.com. Tämä kirja on
jokaisen numeriikkaa harrastavan perusteos!
• Näin siis koko integraaliksi tulee
Z
b
a
f (x)dx ≈
1
)
N2
N
−1
X
h
h
f (xk ) + f (xN )
f (x0 ) + h
2
2
k=1
Kuinka suuri virhe tehdään? Tätä voidaan estimoida
kehittämällä yhden välin virhe Taylorin sarjaksi (olkoon
31
5. Kompleksiluvut
5.1 Lukualueen laajennus
Luonnolliset luvut N : 1, 2, 3, . . .
Luonnollisille luvuille on määritelty
Reaalilukujen joukosta löytyy myös vastaus kysymykseen
paljonko on x, kun x · x = a ja a ≥ 0.
Kysymykseen, onko olemassa sellainen x ∈ R, että
x · x = a kun a < 0, vastaus on edelleenkin kielteinen.
Laajennetaan lukualuetta kompleksilukuihin C lisäämällä
imaginääriluvut.
• yhteenlasku: a + b ∈ N , kun a, b ∈ N .
• kertolasku: a · b ∈ N , kun a, b ∈ N .
Kysymys: Löydetäänkö aina sellainen x ∈ N , että
a + x = b kun a, b ∈ N ?
Vastaus: ei aina (esim. a = 5, b = 2).
Laajennetaan lukualuetta lisäämällä 0 ja negatiiviset
luvut.
Kokonaisluvut Z : . . . , −2, −1, 0, 1, 2, . . .
5.2 Kompleksilukujen esitys ja algebra
5.2.1 Imaginääriyksikkö
Määritellään imaginääriyksikkö i siten, että
i2 = −1.
Jos nyt a ∈ R on jokin reaaliluku, niin ia on
imaginääriluku, joka toteuttaa relaation
Kokonaisluvuille on määritelty
• yhteenlasku: a + b ∈ Z, kun a, b ∈ Z.
• vähennyslasku: a − b = a + (−b) ∈ Z, kun a, b ∈ Z.
(ia)2 = i2 a2 = −1 · a2 = −a2 .
Kompleksiluku z ∈ C voidaan esittää mm. reaaliluvun ja
imaginääriluvun summana
z = a + ib,
• kertolasku: a · b ∈ Z, kun a, b ∈ Z.
Vähennyslasku a − b vastaa kysymykseen: paljonko on x,
jos x + b = a.
Kysymys: Onko olemassa sellainen x ∈ Z, että a · x = b,
kun a, b ∈ Z?
Vastaus: ei aina (esim. a = 3, b = 2).
Laajennetaan lukualuetta lisäämällä murtoluvut.
Rationaaliluvut Q :
a
; a, b
b
∈ Z, b 6= 0
Rationaaliluvuille on määritelty
• yhteenlasku: a + b ∈ Q, kun a, b ∈ Q.
• vähennyslasku: a − b ∈ Q, kun a, b ∈ Q.
• kertolasku: a · b ∈ Q, kun a, b ∈ Q.
• jakolasku:
a
b
Re z
Im z
• vähennyslasku: a − b ∈ R, kun a, b ∈ R.
• kertolasku: a · b ∈ R, kun a, b ∈ R.
• jakolasku:
a
b
∈ R, kun a, b ∈ R ja b 6= 0.
a
b,
(5.3)
ax2 + bx + c = 0
ratkaisut ovat
x=
p
1
(−b ± b2 − 4ac)
2a
Jos b2 ≥ 4ac, ratkaisut ovat reaalisia.
√
Jos b2 < 4ac, niin ( )2 < 0 ja
x=
p
p
1
1
(−b ± −(4ac − b2 )) =
(−b ± i 4ac − b2 )
2a
2a
z 2 − 2z + 5 = 0
Reaaliluvuille on määritelty
• yhteenlasku: a + b ∈ R, kun a, b ∈ R.
=
=
kun z = a + ib.
Tutustuimme kompleksilukuun 2. asteen yhtälön
ratkaisuissa: yhtälön
Esim.
Reaaliluvut R
(5.2)
missä a, b ∈ R. Sanotaan, että a on luvun z reaaliosa ja b
sen imaginääriosa. Kompleksiluvun reaaliosaa ja
imaginäärisosaa merkitään kuten
∈ Q, kun a, b ∈ Q ja b 6= 0.
Jakolasku ab vastaa kysymykseen: paljonko on x, kun
x · b = a?
Kysymys: Onko olemassa sellainen x ∈ Q, että x · x = a,
kun a ∈ Q ja a > 0?
Vastaus: ei aina (esim. a = 2).
Laajennetaan lukualuetta lisäämällä irrationaaliluvut.
(5.1)
ratkaisut ovat
√
√
z = 12 (2 ± 4 − 20) = 12 (2 ± −16) = 1 ± 2i.
Kompleksiluku z on (puhtaasti) reaalinen, jos Im z = 0 ja
(puhtaasti) imaginäärinen, jos Re z = 0.
Kompleksiluvut ovat yhtäsuuria, jos niiden reaali- ja
imaginääriosat ovat yhtäsuuria, ts. u = v tarkoittaa, että
Re u = Re v ja Im u = Im v. Kompleksiluku on nolla jos ja
32
vain jos sen reaali- ja imaginääriosat ovat nollia, ts. z = 0
on sama kuin Re z = Im z = 0.
Kompleksiluvun z = a + ib liittoluku eli
kompleksikonjugaatti z ∗ on
z ∗ = a − ib,
(5.4)
Jakolasku
Jakolasku on hieman monimutkaisempi. Lavennetaan
ensin murtolauseke u/v nimittäjän
kompleksikonjugaatilla, jolloin päädytään reaaliseen (ja
positiiviseen) nimittäjään:
ts. konjugoitaessa vaihdetaan imaginääriosan merkki.
Kompleksiluvun z normi |z|2 on
|z|2 = zz ∗ = (Re z)2 + (Im z)2 .
a + ib
(a + ib)(c − id)
u
=
=
.
v
c + id
(c + id)(c − id)
(5.5)
Normin laskusäännön (5.5) mukaan nimittäjä on nyt
Normi on siis aina ei-negatiivinen ja nolla vain jos luku
itse on nolla.
z ∗ on fyysikoiden käyttämä merkintä. Matemaatikot piirtävät
kompleksikonjugoidun suureen päälle viivan, z̄.
Normiksi kutsutaan silloin tällöin myös suuretta
siitä käytetään merkintää |z|.
p
|z|2 ,
|v|2 = vv ∗ = (c + id)(c − id) = c2 + d2 ∈ R
ja osoittaja
jolloin
Insinöörit puolestaan merkitsevät imaginääriyksikköä symbolilla j.
5.2.2 Algebra
Kompleksilukujen algebra saadaan soveltamalla
reaalilukujen algebraa summiin z = a + ib muistaen
kuitenkin, että i2 = −1. Tarkastellaan kompleksilukuja
u = a + ib ja v = c + id.
(a + ib)(c − id) = ac + bd + i(bc − ad).
Tämän jälkeen jakolasku on helppoa, jaetaan vain
osoittajan reaali- ja imaginääriosat reaalisella
nimittäjällä, ts.
u
v
u
Im
v
Re
=
=
Yhteenlasku
Vastaavasti kompleksiluvun z käänteisluku z −1 =
saadaan seuraavasti: jos z = x + iy, niin
Summa u + v voidaan muodostaa kuten
u + v = a + ib + c + id = (a + c) + i(b + d),
z −1
eli
Re (u + v) =
Im (u + v) =
Re u + Re v
Im u + Im v.
(5.6)
=
Vastaavasti vähennyslasku antaa
z −1 =
u − v = a + ib − c − id = (a − c) + i(b − d)
Re (u − v) =
Im (u − v) =
Re u − Re v
Im u − Im v.
(5.7)
1
x − iy
=
x + iy
(x + iy)(x − iy)
x
y
x − iy
= 2 −i 2
2
2
x +y
|z|
|z|
=
=
(a + ib)(c + id)
ac + (ib)(id) + (ib)c + a(id)
=
=
ac + i2 bd + i(bc + ad)
(ac − bd) + i(ad + bc)
=
=
3 − i2 + (−1 + i) = 3 − 1 + i(−2 + 1)
2−i
u−v
=
3 − i2 − (−1 + i) = 3 + 1 + i(−2 − 1)
ja
(Re u)(Re v) − (Im u)(Im v)
(Re u)(Im v) + (Re v)(Im u).
=
4 − 3i,
Kertolasku taas antaa
tai
=
=
1
1 − 2i
1
2
=
= −i
1 + 2i
(1 + 2i)(1 − 2i)
5
5
u+v
Kahden kompleksiluvun tulo puolestaan on
Re (uv)
Im (uv)
1
z
Esim. Olkoot u = 3 − i2 ja v = −1 + i. Laske u + v,
u − v, uv ja u/v
Yhteen- ja vähennyslasku antavat
Kertolasku
u·v
=
(5.9)
Esim. Luvun z = 1 + 2i käänteisluku on
Vähennyslasku
eli
(Re u)(Re v) + (Im u)(Im v)
|v|2
(Im u)(Re v) − (Re u)(Im v)
.
|v|2
uv
(5.8)
33
=
=
(3 − i2)(−1 + i) = −3 + 3i + 2i − 2ii
−1 + 5i
myös napakoordinaatteja, ns. polaariesitystä:
ja jakolasku
5.2.3 Kompleksitaso
Kompleksiluku voidaan esittää myös x, y-tason pisteinä
(vektoreina): z = x + iy 7→ (x, y) = (Re z, Im z). Tässä siis
y-akselin yksikkönä on i.
Tasoa, jossa kompleksilukuja esitetään sanotaan
kompleksitasoksi. Tason akseleita kutsutaan yleensä
reaali- ja imaginääriakseleiksi. Kääntäen, jokaista
(kompleksi)tason pistettä vastaa kompleksiluku.
z = ( x ,y )
{
r
f
R e z
Kuva 5.1 Kompleksitaso
x = r c o s f
Kuva 5.2 Polaariesitys
Polaariesityksessä (r, φ)
• r on kompleksiluvun itseisarvo |z| = modz,
• φ on luvun z vaihekulma eli argumentti.
Kuvassa 5.1 r on pisteen etäisyys origosta. Pythagoraan
teoreeman mukaan on
x
y
=
=
r cos φ
r sin φ,
(5.12)
ts.
r2 = x2 + y 2 = |z|2
z = x + iy = r cos φ + ir sin φ = reiφ
(5.13)
missä viimeisessä kohdassa käytettiin Eulerin kaavaa
ja
r = |z| =
Suure
R e z
Jotta reaali- ja imaginääriosien merkit saataisiin oikein,
on tällä kertaa arkustangenttia pidettävä
monikäsitteisenä funktiona. Kaikista mahdollisista
kulman φ = arctan xy arvoista on valittava se, jolla sekä
cos φ ja x keskenään että sin φ ja y keskenään ovat saman
merkkisiä. Kääntäen napakoordinaateista (r, φ) päästään
luvun z = x + iy karteesisiin koordinaatteihin kaavoilla
r
x
z = ( r c o s f ,r s in f )
Polaariesityksessa kompleksiluvun z = x + iy koordinaatit
ovat
p
r = |z| = x2 + y 2
(5.11)
φ = arctan xy .
z
y
z
{
=
=
Im
Im
3 − 2i
3 − 2i −1 − i
−3 − 3i + 2i − 2
=
·
=
−1 + i
−1 + i −1 − i
1+i−i+1
5 1
−5 − i
= − − i.
2
2 2
y = r s in f
u
v
p
(Re z)2 + (Im z)2 =
|z| =
√
zz ∗ .
eiφ = cos φ + i sin φ.
(5.10)
p
√
zz ∗ = |z|2
on kompleksiluvun z itseisarvo, luvun suuruus. Joskus
puhutaan myös modulista ja käytetään merkintää
|z| = modz.
Kun z on puhtaasti reaalinen, on
Tämä osoitetaan myöhemmin.
√
Esim. Luku 2 + 2 3i polaariesityksessä
Nyt moduli on
√
√
r = |2 + 2 3i| = 4 + 12 = 4.
Vaihekulma on
φ = arctan
√
√
2 3
π
= arctan 3 = .
2
3
Nyt siis
|z| =
p
(Re z)2 = |Re z|
eli itseisarvon määritelmä yhtyy tässä tapauksessa
reaaliluvun itseisarvon määritelmään.
Huom: kompleksikonjugointi z → z ∗ vastaa heijastusta
x-akselin suhteen: iy → −iy.
Kompleksitason pisteiden esityksessä voidaan käyttää
√
π
π
2 + 2 3i = 4eiπ/3 = 4 cos + 4i sin .
3
3
√
Esim. Luku −2 + 2 3i polaariesityksessä
Kuten edellä, moduli on r = 4. Vaihekulma on nyt
√
√
2 3
φ = arctan
= arctan(− 3).
−2
34
(5.14)
Tangetille on voimassa
tan(φ + nπ) = tan φ.
Jos siis φ = arctan x, niin on myös φ + nπ = arctan x.
Vaihekulmaa määrättäessä on näistä mahdollisista
arvoista valittava sellainen, että reaali- ja
imaginäärisosien merkit tulevat oikein. Nyt vaihekulma on
√
Esimerkiksi w = f (z) = z 2 on yksiarvoinen. Funktio
w = f (z) = z 1/2 on puolestaan moniarvoinen
(kaksiarvoinen), mm. piste z = 1 kuvautuu pisteiksi
w = ±1.
Ellei toisin mainita, funktio tarkoittaa jatkossa
yksiarvoista funktiota.
Tulkinta
Olkoon w = f (z) jokin kompleksifunktio. Kirjoitetaan
π
φ = arctan(− 3) + nπ = − + nπ.
3
Reaaliosa on negatiivinen ja imaginääriosa positiivinen,
joten vaihekulma on välillä π/2 ≤ φ ≤ π, ts. on valittava
n = 1 eli
2π
.
φ=
3
Polaariesitys on siis
w = u + iv, u, v ∈ R
ja
z = x + iy, x, y ∈ R.
Nyt
w = u + iv = f (z) = f (x + iy),
ts. funktion reaali- ja imaginääriosat,
√
2π
2π
−2 + 2 3i = 4ei2π/3 = 4 cos
+ 4 sin
i.
3
3
Huom: polaariesitys helpottaa kompleksilukujen kerto- ja
jakolaskuja:
Olkoon z1 = r1 eiθ1 ja z2 = r2 eiθ2 . Nyt
z1 z2 = r1 r2 ei(θ1 +θ2 )
normaalien eksponenttifunktioiden laskusääntöjen
mukaan. Samoin
r1
z1
= ei(θ1 −θ2 )
z2
r2
u = u(x, y) ja v = v(x, y),
ovat muuttujien x ja y funktioita. Voidaan siis ajatella,
että kompleksifunktio kuvaa kompleksitason (z-tason)
pisteen (x, y) toisen kompleksitason (w-tason) pisteeksi
(u, v).
Funktion reaali- ja imaginääriosat
Tehtävänä on nyt jakaa funktio f (z) reaali- ja
imaginääriosiinsa. Polynomien ja polynomien
murtolausekkeiden tapauksessa kompleksilukujen algebra
määrää jaon. Esimerkiksi w = z 2 jakautuu reaali- ja
imaginääriosiinsa kuten
Myös potenssit ovat helppoja:
z n = (reiθ )n = rn einθ
Sen sijaan yhteen- ja vähennyslasku on hankala suorittaa
polaariesityksessä.
Huom: jos z = reiθ , niin z ∗ = re−iθ .
z ∗ z = re−iθ reiθ = r2 = |z|2 .
5.3 Kompleksifunktiot
Tarkastellaan funktiota f (z), joka kuvaa kompleksiluvun
z kompleksiluvuksi w, ts.
w = f (z).
Sanotaan, että f (z) on
• yksiarvoinen funktio, jos ja vain jos jokainen z
kuvautuu täsmälleen yhdeksi luvuksi w.
• moniarvoinen funktio, jos ja vain jos jotkin
muuttujan z arvot kuvautuvat useammaksi kuin
yhdeksi luvuksi w.
w = u + iv = (x + iy)2 = x2 − y 2 + 2ixy,
joten
u =
v =
x2 − y 2
2xy.
Usein halutaan jatkaa (analyyttisesti) reaalimuuttujan
reaaliarvoinen funktio kompleksitasoon siten, että
alkuperäinen ja jatkettu funktio yhtyvät reaaliakselilla.
Jos reaalifunktio f (x) voidaan esittää Taylorin sarjana
(3.3), korvataan sarjassa reaalimuuttuja x
kompleksimuuttujalla.
Koska kompleksiluvut noudattavat samoja laskusääntöjä
kuin reaaliluvut, säilyttää analyttinen jatkaminen
funktionaaliset ominaisuudet. Esimerkiksi jatkettu
eksponenttifunktio toteuttaa edelleenkin relaation
ez1 +z2 = ez1 ez2 , z1 , z2 ∈ C.
Samoin trigonometristen funktioiden yhteenlaskukaavat
ovat voimassa jatketuillekin funktioille.
35
Eulerin kaava
Tarkastellaan eksponenttifunktiota w = ez . Koska
jatkaminen säilyttää funktionaaliset ominaisuudet, on
missä siis r = |z| ja φ = arctan Im z/Re z. Kuten edellä
mainittiin, polaariesityksen avulla kompleksilukujen
kerto- ja jakolaskut ovat suoraviivaisia:
w = ex+iy = ex eiy .
z1 z2
Tässä ex on vanha tuttu reaalinen eksponenttifunktio.
Selvitetään siis, mitä on eix , kun x ∈ R.
Eksponenttifunktion Taylorin sarja (3.6) on
z3
z4
z5
z2
+
+
+
+ ···.
e =1+z+
2!
3!
4!
5!
z
=
r1 r2 ei(φ1 +φ2 )
=
r1 r2 (cos(φ1 + φ2 ) + i sin(φ1 + φ2))
ja
z1
z2
(5.15)
=
=
Sijoitetaan tähän z = ix. Imaginääriluvun ix potenssit
ovat
r1 i(φ1 −φ2 )
e
r2
r1
(cos(φ1 − φ2 ) + i sin(φ1 − φ2)) .
r2
Potenssifunktiot
(ix)2
(ix)3
=
=
i2 x2 = −x2
ix(ix)2 = −ix3
(ix)4
(ix)5
=
=
..
.
ix(ix)3 = −i2 x4 = x4
ix(ix)4 = ix5
(ix)2n
(ix)2n+1
=
=
..
.
(−1)n x2n
i(−1)n x2n+1
Kertolaskun erikoistapauksena saadaan
potenssiinkorotukselle De Moivren kaavana tunnettu
lauseke
zn
=
=
x2
x3
x4
x5
−i +
+ i + ···
2!
3!
4!
5!
x2
x4
1−
+
+ ···
4!
2!
x3
x5
+i x −
+
+ ··· .
3!
5!
ei(φ+n2π)
1 + ix −
x
e = e (cos y + i sin y),
=
=
eiφ ei2nπ
eiφ (cos 2nπ + i sin 2nπ)
=
=
eiφ (1 + i0)
eiφ .
z = reiφ+i2nπ , n = 0, ±1, ±2, . . . .
(5.16)
Luvun z n:s juuri w = z 1/n on se luku mikä toteuttaa
wn = z. Käyttäen polaariesitystä
w = ρeiφ ,
z = reiθ
nähdään että on oltava voimassa
Yleisesti kompleksinen eksponenttifunktio on siten
z
(5.19)
Kompleksiluku z voidaan siis esittää kuten
Vertaamalla reaali- ja imaginääriosia Taylorin sarjoihin
(3.6) todetaan niiden esittävän kosini- ja sinifunktioita.
Päädymme Eulerin kaavaan
eix = cos x + i sin x.
rn (cos φ + i sin φ)n = rn eniφ
rn (cos nφ + i sin nφ).
Polaariesityksen napakulma ei ole yksikäsitteinen. Jos
nimittäin φ on luvun z napakulma, niin on myös mikä
tahansa muotoa φ + n2π, n = 0, ±1, ±2, . . . , oleva kulma,
sillä Eulerin kaavan mukaan on
Sijoitetaan nämä potenssit Taylorin kehitelmään (5.15),
jolloin saadaan
eix
=
=
ρn = r ⇒ ρ =
(5.17)
√
n
r
ja
kun z = x + iy.
Muistetaan, että polaariesityksessa (5.13) kompleksiluku
z voitiin kirjoittaa muotoon
z = r cos φ + ir sin φ.
koska ei k 2π = 1. Siis saamme
√
z 1/n = n rei(θ/n+k 2π/n) , k ∈ N
(5.20)
Helposti nähdään, että vain luvut k = 0, 1, . . . (n − 1)
tuottavat erisuuruisen tuloksen:
josta, Eulerin kaavaa (5.16) soveltaen saamme
standardimuodon polaariesitykselle:
z = reiφ ,
einφ = eiθ ⇒ nφ = θ + k 2π, k ∈ N
e0 , ei2π/n , ei4π/n , . . . , ei2(n−1)π/n
(5.18)
36
(5.21)
Toisaalta positiivinen kokonaisluku k voidaan aina
kirjoittaa muodossa k = qn + r, missä q on jakolaskun
k/n osamäärä ja r, 0 ≤ r < n, sen jakojäännös. On siis
voimassa
ei2kπ/n = ei2rπ/n ei2qπ = ei2rπ/n ,
joten jokainen muotoa exp(i2kπ/n), k ≥ 0, oleva
kompleksiluku on joukossa (5.21). Samalla tavoin voidaan
todeta, että myös luvut exp(i2kπ/n) kokonaisluvun k
ollessa negatiivinen ovat nekin joukossa (5.21). Siis,
kompleksiluvulla z = reiφ , r 6= 0, on täsmälleen n
erilaista n:ttä juurta:
z 1/n
=
r1/n eiφ/n , r1/n ei(φ+2π)/n ,
r1/n ei(φ+4π)/n , . . . ,
r1/n ei(φ+2(n−1)π)/n .
(5.22)
Hyperboliset kosini- ja sinifunktiot määritellään kaavoilla
cosh x
sinh x
2 = 2e
= 2e
= 2e
4πi
= 2e
6πi
(ex + e−x )
(ex − e−x ) .
(5.24)
Analogisesti hyperbolinen tangentti määritellään kuten
tanh x =
sinh x
ex − e−x
= x
.
cosh x
e + e−x
(5.26)
Trigonometristen ja hyperbolisten funktioiden välillä
vallitsee yhteys
cosh iφ
sinh iφ
tanh iφ
Kirjoitetaan Eulerin kaavaa käyttäen
2πi
1
2
1
2
Myös tangenttifunktio voidaan kirjoittaa eksponenttien
avulla:
sin φ
eiφ − e−iφ
tan φ =
(5.25)
=
.
cos φ
i(eiφ + e−iφ )
Esim. Luvun 2 neljännet juuret
0i
=
=
.
Näemme, että neljännet juuret ovat
21/4 , 21/4 eπi/2 , 21/4 eπi ja 21/4 e3πi/2 .
Eulerin kaavan mukaan on mm.
1
1
eπi/2 = cos π + i sin π = i
2
2
Samoin voimme
todeta, että exp(πi) = −1 ja
exp 23 πi = −i. Kysytyt juuret ovat niin ollen
21/4 , 21/4 i, −21/4 ja − 21/4 i.
Huomattakoon, että jonossa seuraava termi,
2 = 2 exp(8πi), antaisi neljänneksi juureksi
21/4 exp(2πi) = 21/4 . Tämä esiintyy jo juurilistassamme.
Trigonometriset funktiot
Eulerin kaavan (5.16)
eiφ = cos φ + i sin φ
mukaan on
e−iφ = cos(−φ) + i sin(−φ) = cos φ − i sin φ.
Ratkaistaan näistä yhtälöistä sini- ja kosinifunktiot:
cos φ = 12 eiφ + e−iφ (5.23)
1
sin φ = 2i
eiφ − e−iφ .
Voimme itse asiassa tästä lähtien pitää näitä lausekkeita
sini- ja kosinifunktioiden määritelminä. Nämä
määritelmät ovat voimassa siinäkin tapauksessa, että
argumenttikulma φ on kompleksinen.
37
=
=
=
cos φ
i sin φ
i tan φ.
(5.27)
6. Differentiaaliyhtälöistä
Kompleksiluvun logaritmi:
ln z = w ⇔ z = ew
Jos nyt z = reiθ = reiθ ein2π , missä n ∈ Z, niin saadaan
w = ln z = ln r + iθ + in2π,
n∈Z
Logaritmi on siis äärettömän moniarvoinen funktio.
Helposti nähdään että ew = z kaikilla n.
Logaritmin päähaaraksi sanotaan valintaa n = 0 ja
0 ≤ θ < 2π:
lnz = ln r + iθ,
Newtonin toisen lain mukaan kappaleeseen vaikuttava
voima on yhtäsuuri kuin kappaleen massa kerrottuna sen
kiihtyvyydellä. Korkeudella h putoamisliikkeessä olevan
2
kappaleen kiihtyvyys on ddt2h ja siihen vaikuttava
gravitaatiovoima −mg, kun kappaleen massa on m.
Newtonin lain mukaan on siis
m
tai
0 ≤ θ < 2π
Jos nyt z ∈ R, ja z on positiivinen (> 0):
lnz = ln r
Jos taas z on negatiivinen reaaliluku,
lnz = ln r + iπ
Esim. (päähaara-arvot):
ln(−1) = ln eiπ ) = iπ
ln i = ln eiπ/2 = i π2
√
ln(1 + i) = ln( 12 + 12 eiπ/4 ) = 21 ln 2 + i π4
d2 h
= −mg
dt2
d2 h
= −g.
dt2
Tämä on korkeutta h hallitseva differentiaaliyhtälö, ts.
siinä esiintyy tuntemattoman funktion derivaattoja.
Differentiaaliyhtälön ratkaisemisella tarkoitetaan yhtälön
toteuttavan funktion etsimistä.
Putoamisliikkeen tapauksessa ratkaisu on helppo löytää.
Integroidaan differentiaaliyhtälön
d2 h
= −g
dt2
molemmat puolet, jolloin saadaan
dh
= −gt + c1 .
dt
Tämä on edelleenkin differentiaaliyhtälö ja edelleenkin
voimme integroida sen puolittain. Päädymme ratkaisuun
1
h = − gt2 + c1 t + c2 .
2
Terminologiaa
Putoamisliikkeen ratkaisussa on kummastakin
integroinnista aiheutuneet integrointivakiot otettu
mukaan. Vakioiden arvot määräytyvät alkuehdoista.
Tässä tapauksessa tieto kappaleen korkeudesta ja
nopeudesta alkuhetkellä t = 0 riittää.
Kun yhtälössä on jonkin muuttujan derivaattoja jonkin
toisen muuttujan suhteen, sanotaan edellistä muuttujaa
riippuvaksi ja jälkimmäistä riippumattomaksi (vapaaksi).
Riippuva muuttuja on siis sama kuin funktio mikä
halutaan ratkaista.
Jos differentiaaliyhtälössä esiintyy derivaattoja vain
yhden riippumattoman muuttujan suhteen, puhutaan
tavallisesta differentiaaliyhtälöstä. Jos yhtälössä on
osittaisderivaattoja useamman kuin yhden vapaan
muuttujan suhteen, kyseessä on
osittaisdifferentiaaliyhtälö.
Esimerkiksi differentiaaliyhtälö
dx
d2 x
2 + a dt + kx = 0
dt
38
on tavallinen. Sen riippuva muuttuja on x ja riippumaton
t. Yhtälö
∂u ∂u
+
= x − 3y
∂x ∂y
on puolestaan osittaisdifferentiaaliyhtälö, jonka
riippumattomat muuttujat ovat x ja y. u on tämän
yhtälön riippuva muuttuja.
Yhtälön kertaluku on korkein siinä esiintyvien
derivaattojen kertaluvuista. Esimerkiksi yhtälön
2
d h
= −g
dt2
kertaluku on 2.
Differentiaaliyhtälö on lineaarinen, jos riippuva muuttuja
(y) ja sen derivaatat esiintyvät yhtälön kaikissa termeissä
joko ensimmäisessä potenssissa tai ei ollenkaan. Jos
differentiaaliyhtälö ei ole lineaarinen, sen sanotaan olevan
epälineaarinen. Esimerkiksi yhtälö
d2 y
+ y = x4
dx2
on lineaarinen mutta yhtälöt
d2 y
+ sin y = 0,
dx2
y ′ + 2yy ′ = 0 ja y ′ =
Esim. φ(x) = c1 e−x + c2 e2x on yhtälön y ′′ − y ′ − 2y = 0
ratkaisu
Nyt φ′ (x) = −c1 e−x + 2c2 e2x ja φ′′ (x) = c1 e−x + 4c2 e2x .
Sijoitetaan nämä yhtälöön, jolloin
(c1 e−x + 4c2 e2x ) − (−c1 e−x + 2c2 e2x )
−2(c1 e−x + c2 e2x )
= (c1 + c1 − 2c1 )e−x + (4c2 − 2c2 − 2c2 )e2x = 0.
Tämä on ilmeisestikin voimassa koko reaaliakselilla, joten
φ(x) = c1 e−x + c2 e2x on yhtälön ratkaisu välillä (−∞, ∞)
olivatpa c1 ja c2 mitä tahansa vakioita.
dy
+ 1 + yexy = 0 ratkaisu
Esim. Yhtälön (1 + xexy ) dx
määräytyy yhtälöstä x + y + exy = 0
Suoraviivainen menettely olisi ratkaista y yhtälöstä
x + y + exy = 0 ja sijoittaa tämä differentiaaliyhtälöön.
Valitettavasti vain emme osaa tätä ratkaisua muodostaa.
Derivoidaan sen sijaan yhtälö x + y + exy = 0
implisiittisesti, jolloin
dy
dy
= 0.
+ exy y + x
1+
dx
dx
Uudestaan ryhmittäen voidaan kirjoittaa
x
y
ovat epälineaarisia.
Mikä tahansa kertaluvun n tavallinen differentiaaliyhtälö
on kirjoitettavissa muotoon
dn y
dy
, . . . , n = 0.
F x, y,
dx
dx
Olkoon I jokin lukuväli ((a, b), [a, b], . . .).
Jos sijoitettaessa y = f (x) yhtälöön
dn y
dy
,..., n = 0
F x, y,
dx
dx
se toteutuu kaikilla x ∈ I, sanotaan että f (x) on ko.
yhtälön ratkaisu välillä I.
Esim. Yhtälön y ′′ − x22 y = 0 ratkaisu on f (x) = x2 − x−1
Nyt derivaatat f ′ (x) = 2x + x−2 ja f ′′ (x) = 2 − 2x−3 ovat
määriteltyjä aina kun x 6= 0. Sijoitetaan f yhtälöön,
jolloin saadaan
(1 + xexy )
joten yhtälö x + y + exy = 0 todellakin määrää
implisiittisesti ko. differentiaaliyhtälön ratkaisun.
Osoittautuu, että kertalukua n olevien
differentiaaliyhtälöiden ratkaisuihin liittyy aina n
mielivaltaista vakiota. Useimmissa tapauksissa vakiot
ovat määrättävissä, jos tunnetaan funktio ja sen n − 1
ensimmäisen derivaatan arvot jossakin ratkaisuvälin I
pisteessä.
Differentiaaliyhtälöön
dy
dn y
F x, y,
,..., n = 0
dx
dx
liittyvä alkuarvoprobleema kuuluu: Etsi välillä I se
differentiaaliyhtälön ratkaisu, joka pisteessä x0 ∈ I
toteuttaa n ehtoa
y(x0 )
dy
(x0 )
dx
=
y0
=
y1
..
.
2 2
(x − x−1 )
x2
(2 − 2x−3 ) − (2 − 2x−3 )
0.
(2 − 2x−3 ) −
=
=
dy
+ 1 + yexy = 0,
dx
dn−1 y
(x0 )
dxn−1
=
yn−1 ,
missä suureet y0 , y1 , . . . , yn−1 ovat vakioita.
Yhtälö siis toteutuu kun x 6= 0 eli f (x) = x2 − x−1 on
yhtälön ratkaisu alueissa (−∞, 0) ja (0, ∞).
Nimitys alkuarvo on peräisin mekaniikasta, missä y(x0 ) = y0
tarkoittaa usein kappaleen paikkaa alkuhetkellä x0 ja y ′ (x0 ) = y1
sen nopeutta samalla hetkellä.
39
Esim. Määrää se yhtälön y ′′ − y ′ − 2y = 0 ratkaisu, joka
toteuttaa alkuehdot y(0) = 2 ja y ′ (0) = −3
Aiemmin näimme, että φ(x) = c1 e−x + c2 e2x on ko.
yhtälön ratkaisu olivatpa vakiot c1 ja c2 mitä tahansa.
Määrätään nämä kertoimet siten, että alkuehdot
toteutuvat:
φ(0)
′
φ (0)
=
c 1 e0 + c 2 e0 = 2
=
−c1 e0 + 2c2 e0 = −3,
eli
c1 + c2
=
2
−c1 + 2c2
=
−3.
Vastaavanlaisia lauseita on olemassa myös korkeamman
kertaluvun differentiaaliyhtälöille.
Lause siis kertoo, milloin ratkaisu on löydettävissä ja että
ratkaisun löydyttyä ei tarvitse etsiä muita ratkaisuja
koska niitä ei ole olemassa. Graafisesti olemassaolo
tarkoittaa, että lauseen suorakaiteen jokaisen pisteen
kautta kulkee jokin ratkaisu ja yksikäsitteisyys sitä, että
kunkin pisteen (x0 , y0 ) kautta kulkee täsmälleen yksi
ratkaisu. Tästä johtuen ratkaisujen kuvaajat eivät
koskaan leikkaa toisiaan. Valitettavasti lause kertoo vain
että ratkaisu on olemassa pisteen x = x0 ympäristössä,
mutta ei kerro tämän ympäristön suuruutta.
Fysiikan mallintamisessa alkuarvotehtävän ratkaisun olemassaolo
ja yksikäsitteisyys ovat ensiarvoisen tärkeitä. Ensinnäkin
todellisessa maailmassa ”jotakin tapahtuu”joten mallinnettaessa
maailmaa aluarvoprobleemoina olisi ratkaisujen syytä olla
olemassa. Toiseksi, jos saman kokeen toisto samoilla ehdoilla
johtaa aina samaan tulokseen, täytyy kokeeseen liittyvän
mallinkin olla yksikäsitteinen. Mekaniikka on hyvä esimerkki
deterministisestä mallista: tulevaisuus määräytyy tarkasti jos
alkutila tunnetaan tarkasti.
Yhtälöryhmän ratkaisuna saadaan c1 = 7/3 ja c2 = −1/3.
Alkuarvot toteuttava ratkaisu on siis
φ(x) =
7 −x 1 2x
e − e .
3
3
tavallisimmat differentiaaliyhtälöt:
Seuraavat differentiaaliyhtälöt esiintyvät usein fysiikassa
ja muissa sovelluksissa:
d2 y
dx2
6.1.1 Separoituvat yhtälöt
Jos differentiaaliyhtälö voidaan kirjoittaa muodossa
dy
= ay, a ∈ R ⇒ y = Ceax
dx
dy
= q(x)p(y)
dx
d2 y
= a2 y, ⇒ y = C1 eax + C2 e−ax
dx2
ts. oikea puoli on kirjoitettavissa kahden funktion tulona,
joista toinen riippuu vain muuttujasta x ja toinen vain
muuttujasta y, sanotaan että yhtälö on separoituva tai
että yhtälön muuttujat ovat erotettavissa.
Luonnollisesti myös muotoa
=
−a2 y, ⇒ y = C1 cos(ax) + C2 sin(ax)
=
D1 eiax + D2 e−iax
Viimeinen yhtälö on esim. harmonisen värähtelijän
yhtälö: jos kappale liikkuu x-akselia pitkin voiman
F = −kx vaikutuksessa, Newtonin lain mukaan (F = ma)
d2 x
F = −kx = 2
dt
6.1 Ensimmäisen kertaluvun yhtälöt
Ensimmäisen kertaluvun differentiaaliyhtälöille voidaan
todistaa olemassaolo- ja yksikäsitteisyyslause:
Olkoot funktio f (x, y) ja sen osittaisderivaatta ∂f
∂x (x, y)
jatkuvia pisteen (x0 , y0 ) sisältävässä suorakaiteessa
R = {(x, y)|a < x < b, c < y < d}.
Silloin alkuarvoprobleemalla
dy
= f (x, y),
dx
q(x)
dy
p(y)
dy
=
tai
=
dx
p(y)
dx
q(x)
(6.1)
(6.2)
ovat separoituvia.
Separoituva yhtälö
q(x)
dy
=
dx
p(y)
ratkeaa muuttujien separoinnilla:
kerrotaan molemmat puolet funktiolla p(y) ja
differentiaalilla dx, jolloin
p(y) dy = q(x) dx,
ja integroimalla näin saatu yhtälö,
Z
Z
p(y) dy = q(x) dx.
(6.3)
Jos integraalit osataan laskea, voidaan ratkaista y = f (x).
y(x0 ) = y0
on yksikäsitteinen ratkaisu φ(x) jollakin välillä
x0 − h < x < x0 + h, missä h > 0.
Näytetään että (6.3) antaa oikean ratkaisun: Olkoot P (y)
ja Q(x) funktioiden p(y) ja q(x) integraalifunktioita, ts.
P ′ (y) = p(y),
40
Q′ (x) = q(x)
Tälloin yhtälö (6.3) on ekvivalentti yhtälön
P (y) = Q(x) + C
kanssa. Kirjoittamalla y = y(x) ja derivoimalla x:n
suhteen saamme
d
d
P (y(x)) = P ′ (y(x))y ′ (x) =
Q(x) ⇒
dx
dx
p(y)y ′ = q(x)
mikä oli alkuperäinen differentiaaliyhtälö.
dy
= x−5
Esim. Ratkaise dx
y2
Kerrotaan yhtälö puolittain tekijällä y 2 dx, jolloin saadaan
y 2 dy = (x − 5) dx.
1 1
y = − − x.
2 2
6.1.2 Lineaariset yhtälöt
Ensimmäisen kertaluvun lineaarinen yhtälö on muotoa
a1 (x)
x2 sin x − (cos x)y = (sin x)
x2
y3
=
− 5x + C.
3
2
y=
3x2
− 15x + 3C
2
y
1/3
.
Koska vakio C voi olla mielivaltainen reaaliluku niin
sellainen on myös 3C. Voimme siis aivan hyvin korvata
sen vaikkapa symbolilla K:
y=
3x2
− 15x + K
2
dy
dx
(6.4)
dy
dx
on selvästikin lineaarinen. Yhtälö
Ratkaistaan y:
dy
+ a0 (x)y = b(x),
dx
missä kertoimet a1 (x), a0 (x) ja oikea puoli b(x) voivat
riippua vain vapaasta muuttujasta x mutta eivät
riippuvasta muuttujasta y.
Esimerkiksi yhtälö
Integrointi molemmin puolin antaa
Z
Z
2
y dy = (x − 5) dx
eli
Merkitään vakiota ±K jälleen symbolilla C, joka voi nyt
siis olla mielivaltainen reaaliluku. Saamme silloin
differentiaaliyhtälön ratkaisuksi y = 1 + C(x + 3).
Alkuehto oli y(−1) = 1 + C(−1 + 3) = 0 eli C = −1/2.
Alkuarvotehtävän siis ratkaisee funktio
1/3
sen sijaan ei ole lineaarinen, sillä sen lisäksi että
derivaatan kertoimena on riippuva muuttuja y esiintyy
yhtälössä muuttujan y kuutiollinen termi.
Olettaen, että kerroin a1 (x) yhtälössä (6.4) on
tarkasteltavalla välillä nollasta poikkeava, ensimmäisen
kertaluvun yhtälö on kirjoitettavissa standardimuotoon
dy
+ p(x)y = q(x).
dx
.
y−1
x+3
=
Esim. Ratkaise alkuarvotehtävä
Muuttujien erottaminen johtaa yhtälöön
dy
+ (sin x)y 3 = ex + 1
dx
kun y(−1) = 0
dx
dy
=
.
y−1
x+3
Tämän integrointi antaa
Jos asetetaan q(x) = 0 yhtälöä sanotaan homogeeniseksi,
alkuperäistä täydelliseksi. Homogeenisen yhtälön kaikissa
termeissä esiintyy siis ainoastaan y:n tai y ′ ensimmäistä
potenssia.
Ratkaisussa kannattaa lähteä liikkeelle homogeenisen
yhtälön ratkaisusta:
I) Homogeeninen yhtälö (HY):
dy
+ p(x)y = 0
dx
ln |y − 1| = ln |x + 3| + C.
Eksponentioidaan yhtälön molemmat puolet ja saadaan
Ratkeaa separoimalla:
eln |y−1| = eln |x+3|+C
eli
⇒
|y − 1| = eC |x + 3| = K|x + 3|,
missä olemme merkinneet K = eC > 0. Riippuen
muuttujien y ja x arvoista on |y − 1| = ±(y − 1) ja
|x + 3| = ±(x + 3). Voimme siis kirjoittaa
y − 1 = ±K(x + 3) tai y = 1 + (±K)(x + 3).
(6.5)
⇒
dy
= −p(x)dx
y
Z
ln |y| = − p(x)dx + A
Z
y = C exp − p(x)dx
missä C = ±eA on integroimisvakio. Tämä on HY:n
yleinen ratkaisu.
41
II) Täydellinen yhtälö (TY):
Nyt riittää löytää joku ratkaisu TY:lle, olkoon se y0 (x).
Tällöin TY:n yleinen ratkaisu on HY:n ja TY:n
ratkaisujen summa,
yTY (x) = yHY (x) + y0 (x)
missä yHY on yllä lasketty HY:n yleinen ratkaisu.
Todistus:
1. yTY (x) on selvästi TY:n ratkaisu
2. Olkoon y1 (x) TY:n mielivaltainen ratkaisu. Tällöin
y1 (x) − y0 (x) on selvästi HY:n joku ratkaisu, joten
y1 (x) = yHY (x) + y0 (x).
Kuinka TY:n ratkaisu löydetään?
Arvaus: toimii usein, mutta pitää keksiä!
Esim. y ′ + xy = x: selvästi yksi TY:n ratkaisu on y = 1.
Vakion variointi: Etsitään ratkaisua niin että HY:n
ratkaisun vakio “ylennetään” x:n funktioksi:
R
y = C(x)e− p(x)dx
R
R
y ′ = C ′ e− pdx − Cpe− pdx
R
= C ′ e− pdx − py
Sijoitetaan tämä TY:hyn:
R
C ′ e−
⇒
⇒
pdx
R
− py + py = q
C ′ = qe pdx
Z
R
C = qe pdx dx
Siis TY:n yleinen ratkaisu saadaan muotoon
Z
R
R
pdx
− pdx
C + qe
dx
y(x) = e
Siis TY:n yleinen ratkaisu on siis näiden kahden ratkaisun
summa:
y = (C + sin x)x2
Vakio C määräytyy nyt alkuehdosta.
Esim. Etsi yhtälön y ′ − 2y = 2 yleinen ratkaisu
Yhtälö on lineaarinen:
HY:
⇒
⇒
TY: Täydellisen yhtälön ratkaisu voidaan etsiä vakion
varioinnilla, mutta tässä tapauksessa nähdään helposti
että y = −1 toteuttaa TY:n. Siis yleinen ratkaisu on
y = Ce2x − 1 .
Esim. Putoava kappale:kappale jonka massa on m putoaa
ilmassa maan vetovoiman vaikutuksesta. Hetkellä t = 0
kappale on levossa. Mikä on kappaleen nopeus ajan
funktiona?
Kappaleeseen vaikuttavat voimat:
maan vetovoima: mg
ilmanvastus: −kv (pitää paikkansa jos nopeus v on pieni).
Newtonin liikelaki
F = ma ⇒ m
(6.6)
Tässä C -termi on HY:n yleinen ratkaisu. Tätä muotoa ei
kannata muistaa, menetelmä kyllä!
dy
− x2y2 = x cos x yleinen ratkaisu
Esim. Etsi yhtälön x1 dx
Yhtälö on lineaarinen, joten kirjoitetaan se ensin
standardimuotoon kertomalla se tekijällä x:
dy
2
− y = x2 cos x.
dx x
Nyt homogeeninen yhtälö on siis y ′ − x2 y = 0, joka
ratkeaa separoimalla:
2
dy
= dx ⇒ ln |y| = 2 ln |x| + A ⇒ y = Cx2
y
x
Täydellinen yhtälö ratkeaa vakion varioinnilla:
y = Cx2 ⇒ y ′ = C ′ x2 + C2x
dv
= mg − kv
dt
Kyseessä on lineaarinen 1. kertaluvun differentiaaliyhtälö.
HY on
mv ′ = −kv ⇒
⇒
ln |v| = −
1
k
dv = − dt
v
m
k
t + A ⇒ v = Ce−kt/m
m
TY:n yksittäisratkaisu saadan vakion varioinnilla, tai
jälleen arvaamalla: selvästi v = mg/k toteuttaa TY:n,
joten yleinen ratkaisu on
v(t) = Ce−kt/m + mg/k
Hetkellä t = 0 nopeus v(0) = 0 ⇒ C = −mg/k, joten
alkuehdon toteuttava ratkaisu on
v(t) =
mg
(1 − e−kt/m )
k
Kun t on pieni (t ≪ m/k), kappaleen nopeus v ≈ gt,
mutta kun t → ∞, nopeus lähestyy raja-arvoa mg/k.
ja TY:
C ′ x2 + C2x −
dy
− 2y = 0
dx
dy
= 2dx
y
ln |y| = 2x + A ⇒ y = Ce2x
2
Cx2 = x2 cos x ⇒ C ′ = cos x ⇒ C = sin x
x
42
6.2 Lineaariset toisen kertaluvun yhtälöt
Toisen kertaluvun differentiaaliyhtälöt ovat tuntuvasti
hankalampia ratkaista kuin ensimmäinen.
Käsittelemmekin tässä vain tärkeintä erikoistapausta,
toisen kertaluvun lineaarista ja vakiokertoimista
differentiaaliyhtälöä.
Toisen kertaluvun lineaarinen differentiaaliyhtälö on
muotoa
lineaarisesti riippumatonta HY:n ratkaisua. Tässä
tapauksessa lineaarinen riippumattomuus tarkoittaa että
a1 y1 (x) + a2 y2 (x) = 0 vain jos a1 = a2 = 0
kaikilla x ∈ I.
Helposti nähdään että jos y1 ja y2 ovat HY:n ratkaisuja
niin yHY on myös ratkaisu.
Normaalisti ratkaisujen lineaarinen riippumattomuus on selvää.
Tarkemmin se voidaan laskea Wronskin determinantista:
dy
d2 y
+ a0 (x)y = b(x),
a2 (x) 2 + a1 (x)
dx
dx
W [y1 , y2 ](x)
=
ts. se sisältää enintään y:n toista derivaattaa (toinen
kertaluku) ja sen termit ovat verrannollisia ainoastaan y 1
tai y 0 (lineaarinen differentiaaliyhtälö). (siinä ei siis
esiinny termejä y 2 , y ′ y, ey jne.)
Jos kertoimet a0 , a1 ja a2 ovat vakioita, sanotaan yhtälön
olevan vakiokertoimisen.
Lineaarisen toisen kertaluvun yhtälön standardimuoto on
dy
d2 y
2 + p(x) dx + q(x)y = g(x),
dx
dy
d2 y
2 + p(x) dx + q(x)y = 0.
dx
(6.8)
Jos standardimuotoisessa yhtälössä (6.7) g(x) 6= 0,
sanotaan yhtälön olevan ei-homogeeninen tai täydellinen.
2. kertaluvun lineaarisen dy:n ratkaisujen
ominaisuuksia
y1 (x) y2 (x) y1′ (x) y2′ (x) y1 (x)y2′ (x) − y2 (x)y1′ (x)
(6.10)
Käytännössä lineaarista riippuvuutta ei useinkaan testatata
Wronskin determinantilla, ei ainakaan silloin kun on kyse tutuista
funktioista. On helppo nähdä, että esimerkiksi kaikki eri
potenssifunktiot (xr , potenssit r erisuuria) ovat toisistaan
lineaarisesti riippumattomia. Tästä seuraa se, että kaikki eri
eksponenttifunktiotkin (erx , eri kertoimet r) ovat toisistaan
riippumattomia sen lisäksi, että ne ovat riippumattomia myös
potenssifunktioista. Samoin sini- ja kosinifunktiot ovat toisistaan
rippumattomia. Sen sijaan esim. kosinifunktio riippuu lineaarisesti
(kompleksisista) eksponenttifunktioista (Eulerin kaava:
cos x = 21 (eix + e−ix )). Tästä voidaan toisaalta päätellä, että
funktiot cos rx (kertoimet r itseisarvoltaan erisuuria) ovat
riippumattomia sekä toisistaan että funktioista sin rx.
Esim. Funktiot y1 (x) = e2x cos 3x ja y2 (x) = e2x sin 3x
ratkaisevat homogeenisen yhtälön y ′′ − 4y ′ + 13y = 0. Etsi
ratkaisu, joka toteuttaa alkuehdot y(0) = 2 ja y ′ (0) = −5
y1 ja y2 ovat lineaarisesti riippumattomia. Yleinen
ratkaisu on siis
y(x) = c1 e2x cos 3x + c2 e2x sin 3x
Tämän derivaatta on
y ′ (x)
Toisen kertaluvun lineaarisen differentiaaliyhtälön
ratkaisu etenee samaan tapaan kuin ensimmäisen
kertaluvun:
=
c1 (2e2x cos 3x − 3e2x sin 3x)
+c2 (2e2x sin 3x + 3e2x cos 3x).
Asetetaan y(0) = 2 ja y ′ (0) = −5, jolloin saadaan yhtälöt
1. Etsitään homogeenisen yhtälön yleinen ratkaisu,
yHY (x).
2. Etsitään täydellisen yhtälön joku ratkaisu y0 (x). Nyt
täydellisen yhtälön yleinen ratkaisu on muotoa
yTY (x) = yHY (x) + y0 (x).
Tämä ominaisuus seuraa samalla perusteella kuten 1. kl:n
yhtälölläkin.
Voidaan osoittaa, että homogeenisen yhtälön (HY) (6.8)
yleinen ratkaisu (jossain joukossa x ∈ I) voidaan
kirjoittaa muodossa
yHY (x) = C1 y1 (x) + C2 y2 (x)
on = 0 jos ja vain jos y1 ja y2 ovat lineaarisesti riippuvia
ratkaisuja.
(6.7)
missä p(x) = a1 (x)/a2 (x), q(x) = a0 (x)/a2 (x) ja
g(x) = b(x)/a2 (x) (olettaen, että a2 (x) 6= 0
tarkasteltavalla välillä).
Standardimuotoon (6.7) liittyvä homogeeninen yhtälö on
=
(6.9)
missä C1 , C2 ovat vakioita jotka voidaan kiinnittää
alkuehdoista ja y1 (x) ja y2 (x) ovat kaksi mielivaltaista
c1
=
2
2c1 + 3c2
=
−5.
Ratkaisut ovat c1 = 2 ja c2 = −3. Alkuehdot toteuttava
differentiaaliyhtälön ratkaisu on siten
y(x) = 2e2x cos 3x − 3e2x sin 3x.
6.2.1 Vakiokertoimiset toisen kertaluvun
homogeeniset lineaariset yhtälöt
MAPUlla rajoitumme ratkaisemaan vakiokertoimisia 2.
kertaluvun differentiaaliyhtälöitä. Nämä ratkaistaan
ratkaisemalla ensin homogeeninen yhtälö (HY), mikä on
muotoa
ay ′′ + by ′ + cy = 0,
(6.11)
43
missä a, b ja c ovat vakiota ja a 6= 0. Yhtälön mukaan siis
vakioilla kerrotun funktion ja sen derivaattojen summan
pitäisi olla identtisesti nolla. Ratkaisua kannattaisi
varmaankin etsiä sellaisten funktioiden joukosta, joiden
derivaatat ovat keskenään ja itse funktion kanssa samaa
muotoa, mahdollisesti vakiotekijöillä kerrottuna. Ratkaisu
saattaisi siten löytyä funktioiden erx joukosta (r vakio).
Sijoitetaan tämä yrite yhtälöön (6.11), jolloin saadaan
ar2 erx + brerx + cerx = 0.
Koska eksponenttifunktio erx on aina nollasta poikkeava,
voimme jakaa yhtälön sillä ja päädytään ns.
karakteristiseen yhtälöön
ar2 + br + c = 0.
Alkuehdot johtavat yhtälöihin
y(0) = c1 e0 + c2 e0 = c1 + c2
√
√
−1 = y ′ (0) = (−1 + 2)c1 e0 + (−1 − 2)c2 e0
√
√
= (−1 + 2)c1 + (−1 − 2)c2 ,
√
√
joiden ratkaisuina ovat c1 = − 2/4 ja c2 = 2/4.
Alkuarvoprobleeman siis toteuttaa funktio
√
√
2 (−1+√2)x
2 (−1−√2)x
y(x) = −
+
.
e
e
4
4
0 =
Tapaus 2: b2 < 4ac
Nyt karakteristisen yhtälön
(6.12)
Toisen asteen yhtälönä karakteristinen yhtälö on helppo
ratkaista:
√
−b + b2 − 4ac
r1 =
√2a
−b − b2 − 4ac
r2 =
.
2a
Funktiot y1 = er1 x ja y2 er2 x ratkaisevat siten
differentiaaliyhtälön (6.11).
ar2 + br + c = 0
juuret ovat kompleksiset:
p
1
(−b ± i |b2 − 4ac|) ≡ α ± iβ
2a
√
missä α = −b/(2a) ja β = 4ac − b2 /(2a) ovat reaalisia.
Juuret ovat siis toistensa liittolukuja, r1 = r2∗ . Nyt siis
differentiaaliyhtälön yleinen ratkaisu saadaan edelleen
eksponenttifunktioiden summasta
r1,2 =
y
2
Tapaus 1: b > 4ac:
Tässä tapauksessa karakteristisen yhtälön ratkaisut r1 ja
r2 ovat reaalisia, ja r1 6= r2 . Tällöin er1 x ja er2 x ovat
lineaarisesti riippumattomia. (Nähdään myös Wronskin
determinantista). Yleinen ratkaisu y on näiden
superpositio
y(x) = c1 er1 x + c2 er2 x .
Esim. Yhtälön y ′′ + 5y ′ − 6y = 0 yleinen ratkaisu
Karakteristinen yhtälö on nyt
r2 + 5r − 6 = 0
−5 ±
√
25 + 24
1
=
−6.
2
Yleinen ratkaisu on siten
y(x) = c1 ex + c2 e−6x .
Esim. Alkuarvotehtävä y ′′ + 2y ′ − y = 0, kun y(0) = 0 ja
y ′ (0) = −1
2
Karakteristisen
√ yhtälön r +√2r − 1 = 0 ratkaisut ovat
r1 = −1 + 2 ja r2 = −1 − 2. Yleinen ratkaisu on niin
ollen
√
√
y(x) = c1 e(−1+ 2)x + c2 e(−1− 2)x .
C 1 er1 x + C 2 er 2 x
=
=
eαx (C1 eiβx + C2 e−iβx )
eαx (A cos βx + B sin βx)
missä nyt A = C1 + C2 ja B = iC1 − iC2 . Yllä viimeisin
muoto antaa reaalisen ratkaisun (y(x) ∈ R), jos A, B ∈ R.
Esim. Yhtälön y ′′ + 2y ′ + 4y = 0 yleinen ratkaisu
Karakteristisen yhtälön r2 + 2r + 4 = 0 ratkaisut ovat
√
√
−2 ± 4 − 16
= −1 ± i 3.
r=
2
Silloin funktiot
y1 (x) = e−x cos
ja sen ratkaisut
r1,2 =
=
√
3x ja y2 (x) = e−x sin
√
3x
ovat yhtälön lineaarisesti riippumattomia ratkaisuja.
Yleinen ratkaisu on siten
√
√
y(x) = c1 e−x cos 3x + c2 e−x sin 3x.
Esim. Vaimennettu harmoninen värähtelijä
Olkoon meillä kappale (massa m) joka liikkuu x -akselia
pitkin ja joka on kiinnitetty jousella kiintopisteeseen.
Olkoon kappaleen paikka x(t). Jousi aiheuttaa
kappaleeseen harmonisen voiman Fjousi = −kx (k > 0),
missä x = 0 on piste missä kappale on levossa. Lisäksi
kappaleeseen vaikuttaa nopeuteen verrannollinen
kitkavoima γv = −γx′ (t).
44
Newtonin lain mukaan F = ma = mx′′ ⇒
Sijoitetaan tähän r0 = −b/2a ja nähdään että
−kx − γx′ = mx′′
Tämä on 2. kertaluvun lineaarinen homogeeninen
vakiokertoiminen differentiaaliyhtälö. Karakteristinen
yhtälö on
2ar0 + b = −2a
ja
ar02 + br0 + c
p
1
(−γ ± γ 2 − 4mk)
−k − γr = mr2 ⇒ r =
2m
x(t) = Aer1 t + Ber2 t
missä
r1,2 =
ovat reaalisia.
p
1
(−γ ± γ 2 − 4mk) < 0
2m
ratkaisu on v(x) = C1 x + C2 . Tästä nähdään että
y(x) = xer0 x on niin ollen eräs alkuperäisen yhtälömme
ratkaisu, ja on helppo nähdä, että tämä on lineaarisesti
riippumaton ratkaisusta er0 x .
Olemme saaneet aikaan reseptin:
Jos yhtälöön
ay ′′ + by ′ + cy = 0
liittyvän karakteristisen yhtälön
ar2 + br + c = 0
Karakteristisen yhtälön
ar2 + br + c = 0
juuret ovat yhtäsuuret, jos b2 − 4ac = 0. Ainoa juuri on
tällöin reaalinen ja suuruudeltaan
b
r0 = −
2a
ja er0 x on siten ainoa muotoa erx oleva ratkaisu.
Tiedämme toisaalta, että toisen kertaluvun yhtälöllä on
aina kaksi lineaarisesti riippumatonta ratkaisua.
Etsitään toinen ratkaisu vakion varioinnilla: yrite
molemmat juuret ovat yhtäsuuret, r0 , niin yleinen
ratkaisu on
y(x) = C1 er0 x + C2 xer0 x .
Esim. Yhtälön y ′′ + 4y ′ + 4y = 0 yleinen ratkaisu
Karakteristinen yhtälö on
r2 + 4r + 4 = (r + 2)2 = 0,
jonka molemmat juuret ovat −2. Yleinen ratkaisu on
silloin
y(x) = c1 e−2x + c2 xe−2x .
y(x) = v(x)er0 x
Vakion variointi soveltuu yleisemminkin tilanteisiin, missä
tunnetaan jokin erikoisratkaisu ja pitäisi etsiä toinen tästä
lineaarisesti riippumaton ratkaisu.
vie differentiaaliyhtälömme
Olkoon g jokin yhtälön
ay ′′ + by ′ + cy = 0.
y ′′ + py ′ + qy = 0
Sijoitamme tähän yritteemme ja derivaatat
y
y ′′
=
=
b
b2
b2
−b +c=− +c
2
4a
2a
4a
b2 − 4ac
−
= 0,
4a
a
koska diskriminantti oli b2 − 4ac = 0. Päädymme siten
yhtälöön
av ′′ = 0
Tapaus 3: b2 = 4ac
′
=
=
Jos γ 2 < 4km (pieni vaimennus), ratkaisu on
x(t) = e−γt/(2m) (A cos ωt + B sin ωt)
p
missä ω = 4mk − γ 2 /(2m). Kappale siis värähtelee
vaimenevasti taajuudella ω. Jos γ = 0, värähtely ei
vaimene.
Jos taas γ 2 > 4km (voimakas vaimennus), ratkaisu on
b
+b=0
2a
′ r0 x
ratkaisu. Sijoittamalla tähän y(x) = g(x)v(x) päädytään yhtälöön
r0 x
gv ′′ + 2g ′ v ′ + g ′′ v + pg ′ v + pgv ′ + qgv = 0.
v e + r0 ve
v ′′ er0 x + 2r0 v ′ er0 x + r02 ver0 x .
Uudelleen ryhmittäen voidaan kirjoittaa
gv ′′ + (2g ′ + pg)v ′ + (g ′′ + pg ′ + qg)v = 0.
Hieman ryhmittäen saadaan
Koska g toteutti alkuperäisen yhtälön, g ′′ + pg ′ + qg = 0, saamme
av ′′ + (2ar0 + b)v ′ + (ar02 + br0 + c)v er0 x = 0.
gv ′′ + (2g ′ + pg)v ′ = 0.
Funktion v täytyy siis toteuttaa yhtälö
Tämä on funktiolle v ′ = u ensimmäisen kertaluvun yhtälö
av ′′ + (2ar0 + b)v ′ + (ar02 + br0 + c)v = 0.
g(x)
45
du
+ [2g ′ (x) + p(x)g(x)]u = 0.
dx
2
Tämä separoitavissa yhtälöksi
Z
du
=−
u
jolloin saadaan
Z
ln |u| = ln
2g ′ (x) + p(x)g(x)
dx,
g(x)
1
−
[g(x)]2
Eksponenttiointi antaa
v ′ (x) = u(x) =
Z
d
d
, D2 ≡ dx
missä D ≡ dx
2 on merkintätapa.
HY:n karakteristinen yhtälö on r2 + ar + b = 0, jonka
ratkaisut ovat r1 , r2 . Näiden juurien avulla voimme
kirjoittaa karakteristisen polynomin muotoon
r2 + ar + b = (r − r1 )(r − r2 )
p(x) dx.
1
−
e
[g(x)]2
Täten differentiaaliyhtälökin voidaan kirjoittaa
R
p(x) dx
(D2 + aD + b)y(x) = (D − λ1 )(D − λ2 )y(x) = f (x)
,
josta vielä kerran integroimalla saadaan v.
Määritellään nyt u ≡ (D − λ2 )y, jolloin saamme dy:n:
6.2.2 Epähomogeeninen vakiokertoiminen
lineaarinen toisen kertaluvun differentiaaliyhtälö
Nyt differentiaaliyhtälö (täydellinen yhtälö, TY) on
muotoa
ay ′′ + by ′ + cy = f (x)
(6.13)
Helposti nähdään että jos y1 on TY:n joku ratkaisu ja y0
on homogeenisen yhtälön (HY, f (x) = 0) joku ratkaisu
niin y = y0 + y1 on myös TY:n ratkaisu. Koska 2.
kertaluvun lineaarisen yhtälön täydellinen ratkaisu
riippuu kahdesta vakiosta, saadaan
TY:n täydellinen ratkaisu = HY:n täydellinen ratkaisu +
TY:n joku yksittäisratkaisu.
Kuinka siis löytää TY:n yksittäisratkaisu?
1. Arvaus/yrite:
toimii hyvin etenkin jos f (x) on polynomi. Tällöin
kannattaa yrittää y(x) polynomi, jonka asteluku = f :n
asteluku.
Esim. y ′′ + ay ′ + by = c: yritetään y = α, vakio. Siis
by = bα = c ⇒ α = c/b.
Arvaus toimii myös usein jos f (x) = eαx , sillä f :n kaikki
derivaatat ovat verrannollisia eαx :ään:
(D − λ1 )u = f (x)
Tämä on lineaarinen 1. kl:n vakiokertoiminen dy, mikä
ratkeaa edellä kuvatulla menetelmällä. Nyt voimme sitten
ratkaista y:n yhtälöstä
(D − λ2 )y = u(x)
mikä siis antaa alkuperäisen TY:n ratkaisun.
Esim. y ′′ + y ′ − 2y = ex HY:n karakteristinen yhtälö on
r2 + r − 2 = 0 ⇒ r =
Täten voimme kirjoittaa
y ′′ + y ′ − 2y = (D − 1)(D + 2)y = ex
1.vaihe: olkoon nyt u(x) = (D + 2)y, jolloin u:n
differentiaaliyhtälö on
(D − 1)u(x) = u′ (x) − u(x) = ex
tämän HY:
y ′′ + ay ′ + by = eαx
u′ − u = 0 ⇒
Yrite: y = Aeαx , sijoitus yhtälöön antaa
A(α2 + aα + b)eαx = eαx ⇒ A = (α2 + aα + b)−1
Tämä toimii jollei eαx satu olemaan HY:n ratkaisu
(jolloin α2 + aα + b = 0). Tällöin kannattaa kokeilla
yritettä Axeαx , ellei sekin satu olemaan HY:n ratkaisu
(tällöin α on HY:n karakterisen polynomin
kaksinkertainen juuri). Siinä tapauksessa yrite on Ax2 eαx .
2. Integrointi kahdessa vaiheessa:
Tämä on yleisempi menetelmä täydellisen yhtälön
ratkaisuun. Tässä menetelmässä yhtälöä ryhmitellään
muotoon jossa sitä voidaan integroidan suoraan, ja
homogeenista yhtälöä ei tarvitse ratkaista erikseen.
Kirjoitetaan yhtälö ensin muotoon (jaetaan y ′′ :n
kertoimella, jos tarpeen)
y ′′ + ay ′ + by = (D2 + aD + b)y = f (x)
√
1
1 3
(−1 ± 1 + 8) = − ± = 1, −2
2
2 2
Z
du
=
u
Z
dx ⇒ u(x) = Cex
TY:n ratkaisu saadaan vakion varioinnilla:
u(x) = C(x)ex ⇒ u′ (x) = C ′ ex + Cex , joten sijoitus
(C ′ + C)ex − Cex = ex ⇒ C ′ = 1 ⇒ C = x + A
Siis TY:n täydellinen ratkaisu on
u(x) = Cex + xex
2.vaihe: ratkaistaan y yhtälöstä
(D + 2)y = y ′ + 2y = u(x) = (C + x)ex
HY: y ′ = −2y ⇒ y = Be−2x
TY: jälleen vakion varioinnilla B → B(x):
y ′ = B ′ e−2x − 2Bex .
46
Sijoitus differentiaaliyhtälöön antaa
⇒
⇒
(B ′ − 2B)e−2x + 2Be−2x = (C + x)ex
B ′ = (C + x)e3x
Z
Z
C
x
1 3x
B = (C + x)e3x dx = e3x + e3x −
e
3
3
3
C
1
x
= ( − )e3x + e3x + D
3
9
3
x 3x
3x
= Ee + e + D
3
missä viimeisessä vaiheessa otettiin käyttöön uusi vakio
E = C/3 − 1/9.
Siis TY:n ratkaisu on
x
x
y = (Ee3x + e3x + D)e−2x = De−2x + (E + )ex
3
3
Nyt ei2x ei ole HY:n ratkaisu, joten TY:n
yksittäisratkaisu löytyy yrittellä z = Aei2x :
⇒
Siis TY:n yleinen ratkaisu on
z = C1 ex + C2 e−2x +
y = Im z = A1 ex + A2 e−2x −
missä A1 = Im C1 , A2 = Im C2 .
y ′′ + y ′ − 2y = ex
voi myös soveltaa arvausmenetelmää. HY:n
karakteristinen yhtälö on r2 + r − 2 = 0, minkä juuret
ovat r = 1, −2. Koska nyt siis ex on HY:n ratkaisu, TY:n
yksittäisratkaisu voidaan löytää yritteellä
y = Axex :
y ′ = A(ex + xex ), y ′′ = A(2ex + xex )
Nyt dy tulee muotoon
A(2 + x)ex + A(1 + x)ex − 2Axex = ex ⇒ 3A = 1
Siis TY:n yksittäisratkaisu on y = x3 ex , ja TY:n
täydellinen ratkaisu on HY:n täydellisen ratkaisun ja
TY:n yksittäisratkaisun summa:
x x
e
3
Eksponenttifunktioyritteestä on usein myös hyötyä jos
f (x) ∼ sin x, cos x (esim. värähtelevä pakkovoima
harmonisella oskillaattorilla).
Esim: y ′′ + y ′ − 2y = 4 sin 2x
Tämän voi toki ratkaista integroinnilla kahdessa
vaiheessa, mutta kirjoitammekin yhtälön muotoon
z ′′ + z ′ − 2z = 4ei2x .
Tällöin ottamalla imaginaariosa yhtälöstä saadaan
alkuperäinen yhtälö, ja y = Im z.
HY:n karakteristinen yhtälö on
r2 + r − 2 = 0 ⇒ r =
−3 − i i2x
e
5
ja
mikä onkin myös TY:n yleinen ratkaisu. Vakion variointi
antaakin yleisesti koko ratkaisun kaupan päälle
yksittäisratkaisun lisäksi, vakioista riippuvat osat ovat
HY:n yleinen ratkaisu.
Edellisen esimerkin yhtälöön
y = Aex + Be−2x +
A[(2i)2 + 2i − 2]ei2x = 4ei2x
4
2(−3 − i)
−3 − i
A=
=
=
−6 + 2i
(−3 + i)(−3 − i)
5
√
1
(−1 ± 1 + 8) = 1, −2
2
joten HY:n ratkaisu on
zHY = C1 ex + C2 e−2x
47
1
3
cos 2x − sin 2x
5
5
7. Vektorit ja differentiaalilaskenta
Esim. Nopeus v, v, kiihtyvyys a ja a kun paikka on
r = sin t i + cos t j + k
Nopeus on nyt
7.1 Yhden muuttujan vektorifunktiot
Liikkuvan kappaleen paikka avaruudessa muuttuu ajan
kuluessa. Matemaattisesti voimme ilmaista tämän
sanomalla, että kappaleen paikkaa kuvaava radiusvektori
r on ajan t funktio r(t), ts. vektorin
v
=
=
dr
dy(t)
dz(t)
. dx(t)
=r=
i+
j+
k
dt
dt
dt
dt
cos t i − sin t j.
Vauhti puolestaan on
r(t) = x(t)i + y(t)j + z(t)k
komponentit x, y ja z riippuvat yhdestä muuttujasta t.
Samoin yhden muuttujan, ajan, vektorifunktioita ovat
myös kyseisen kappaleen nopeus ja kiihtyvyys. Usein
puhutaan lyhyesti vain vektorifunktioista kun
tarkoitetaan yhden muuttujan vektoriarvoisia funktioita.
7.1.1 Vektorifunktion derivaatta
Olkoon A(u) jokin yhden muuttujan u vektorifunktio
v = |v| =
p
cos2 t + sin2 t = 1.
Kiihtyvyys saadaan derivoimalla nopeus,
a
=
dv
. ..
= v = r = − sin t i − cos tj,
dt
ja sen itseisarvo on
a = |a| =
A(u) = Ax (u)i + Ay (u)j + Az (u)k.
p
sin2 t + cos2 t = 1.
Derivaatan ominaisuuksia
A (u )
Olkoot A(u) ja B(u) muuttujan u vektorifunktioita.
Lasketaan pistetulon A · B derivaatta:
A (u + D u )-A (u )
dA · B
du
A (u + D u )
=
=
=
Kuva 7.1 Vektorin derivaatta
Vektorifunktion derivaatta määritellään analogisesti
skalaarifunktion derivaatan kanssa eli
dA(u)
A(u + ∆u) − A(u)
= lim
.
∆u→0
du
∆u
(7.1)
=
Kirjoitetaan määritelmä (7.1) komponenteittain,
dA(u)
du
=
=
Ax (u + ∆u) − Ax (u)
lim
i
∆u→0
∆u
Ay (u + ∆u) − Ay (u)
+
j
∆u
Az (u + ∆u) − Az (u)
k
+
∆u
dAy (u)
dAz (u)
dAx (u)
i+
j+
k,
du
du
du
d
(Ax Bx + Ay By + Az Bz )
du
dBx
dAx
Bx + Ax
du
du
dBy
dAy
By + Ay
+
du
du
dBz
dAz
Bz + Az
+
du
du
dAx
dAy
dAz
i+
j+
k ·
du
du
du
(Bx i + By j + Bz k)
+(Ax i + Ay j + Az k) ·
dBx
dBy
dBz
i+
j+
k
du
du
du
dA
dB
·B+A·
.
du
du
Näemme, että pistetulon derivointiin soveltuu
skalaarifunktioista tuttu derivointisääntö (2.17) kunhan
vain korvataan tavallinen tulo pistetulolla.
Yleensäkin on helppo todeta, että luonnollisella tavalla
modifioidut tutut säännöt ovat voimassa myös vektoreille:
d
(αA + βB)
du
d(φA)
du
d(A · B)
du
d(A × B)
du
jolloin nähdään, että vektorifunktio derivoidaan
derivoimalla sen komponentit.
48
=
=
=
=
dA
dB
α
+β
du
du
dφ
dA
A+φ
du
du
dA
dB
·B+A·
du
du
dA
dB
×B+A×
.
du
du
(7.2)
Tässä α ja β ovat mielivaltaisia skalaarivakioita ja φ(u)
mielivaltainen derivoituva muuttujan u skalaarifunktio.
Analogisesti skalaarifunktion differentiaalin kanssa
määrittelemme vektorifunktion differentiaalin:
dA = i dAx + j dAy + k dAz .
Koska vektorin komponentit Ai ovat nyt vain yhden
muuttujan u funktioita, ovat niiden differentiaalit muotoa
dAi
du du ja vektorin A(u) differentiaali niin ollen
dA = du
dAy
dAz
dAx
i+
j+
k
du
du
du
=
dA
du.
du
on käyrän tangentin suuntainen. Tämän vektorin pituus
on
dr p
= (2t)2 + 16 + (4t − 6)2 ,
dt joten yksikkötangentti on
2ti + 4j + (4t − 6)k
dr dr =p
.
T=
dt dt (2t)2 + 16 + (4t − 6)2
Erikoisesti pisteessä, missä t = 2, yksikkötangentti on
2
1
2
4i + 4j + 2k
= i + j + k.
T= √
2
2
2
3
3
3
4 +4 +2
(7.3)
dr
Koska derivaatta du
on yksikkötangentin suuntainen, niin
toki silloin myös differentiaali
7.1.2 Avaruuskäyrät
Tangentti
dr = du
Olkoon
r(u) = x(u)i + y(u)j + z(u)k
muuttujasta u riippuva paikkavektori. Muuttujan u
käydessä läpi arvoalueensa vektorin r kärki piirtää
dr
käyrän kolmiulotteisessa avaruudessamme. Derivaatta du
on konstruktionsa perusteella (kuva 7.1) ilmeisestikin
tämän käyrän pisteeseen r(u) piirretyn tangentin
suuntainen. Käyrän tangentin suuntainen yksikkövektori
T on niin ollen
dr dr
/| |.
T=
(7.4)
du du
d r
on yksikkötangentin suuntainen. Voimme siis kirjoittaa
dr = T ds
missä olemme symbolilla ds merkinneet differentiaalin dr
pituutta
p
ds = |dr| = dx2 + dy 2 + dz 2 .
Voimme siis kirjoittaa yksikkötangentin myös muodossa
Differentiaali ds oli infinitesimaalisen muutoksen dr
suuruus. Koska muutos dr oli käyrän tangentin
suuntainen, on ds siten käyrän kaaren pituuden s
infinitesimaalinen muutos.
s
Esim. Käyrän x = t2 + 1, y = 4t − 3, z = 2t2 − 6t
yksikkötangentti kun t = 2
Käyrän piirtää vektorin
=
=
xi + yj + zk
(t2 + 1)i + (4t − 3)j + (2t2 − 6t)k
kärki kun t käy läpi kaikki arvonsa (kun muuta ei ole
sanottu, arvoalueena on yleensä koko reaalilukualue).
Paikkavektorin derivaatta
dr
dt
=
=
d 2
d
d
(t + 1) + j (4t − 3) + k (2t2 − 6t)
dt
dt
dt
2ti + 4j + (4t − 6)k
i
(7.5)
Kaaren pituus
Kuva 7.2 Käyrän tangentti
r
dr
.
ds
T=
T
r(u )
dr
du
0
s s+ d s
d r
C
Kuva 7.3 Käyrän kaaren pituus
Käyrän C kaaren pituus s saadaan summaamalla pitkin
käyrää laskettuja differentiaalisia kaaren pituuksia.
Formaalisti voimme ilmaista tämän, kuten
Z
s=
ds.
(7.6)
C
49
Käyrän ulottuessa äärettömyyteen on yleensä on myös
spesifioitava integroinnin alkukohta eli kaaren pituuden
nollakohta. Kuvassamme tämä voisi olla vaikkapa piste s0 .
Laskettaessa kaaren pituutta kaavalla (7.6) integroinnin
suunnaksi otetaan differentiaalin dr suunta eli tangentin
suunta. Pituus s siis kasvaa kun edetään käyrällä
tangentin osoittamaan suuntaan. Jos nyt käyrän yhtälö
on annettu muodossa
Vektori T on sekin kaaren pituuden s funktio, joten
voimme laskea derivaatan
dT
d2 r
= 2.
ds
ds
Olkoon nyt N vektorin
dT
ds
suuntainen yksikkövektori
N=
r = r(u),
missä on merkitty
niin tangentti osoittaa vektorin
dr
du = r(u + du) − r(u)
dr =
du
suuntaan eli suuntaan johon u kasvaa. Pituus s on siten
ds
muuttujan u kasvava funtio ja derivaatta du
silloin
positiivinen. Differentiaali ds oli määritelty itseisarvona
|dr|, joten on
dr ds = |dr| = du,
du
ds
kun du > 0. Toisaalta derivaatta du
oli positiivinen, joten
voimme kirjoittaa
dr = ds .
(7.7)
du du
Jos ratkaisemme relaatiosta s = s(u) muuttujan u
pituuden s funktiona, u = u(s), niin voimme pitää käyrää
piirtävää vektoriakin kaaren pituuden funktiona: r = r(s).
Esim. Käyrän x = sin t, y = cos t, z = 0 kaaren pituus
lähtien pisteestä, missä t = 0
Käyrän piirtää vektori
Voimme siis kirjoittaa
Suuretta κ sanotaan käyrän kaarevuudeksi ja sen
käänteisarvoa
1
1
ρ = = dT
κ
ds (7.8)
(7.9)
(7.10)
käyrän kaarevuussäteeksi. Yksikkötangentti T on nimensä
mukaisesti yksikön mittainen, joten on
T2 = T · T = |T|2 = 1.
Derivoidaan relaatio T · T = 1 kaaren pituuden suhteen,
jolloin saadaan
d
(T · T)
ds
=
=
dT
dT
dT
·T+T·
= 2T ·
ds
ds
ds
2κT · N = 0,
kun on sijoitettu lauseke (7.9). Päädymme yhtälöön
Differentiaali dr on
dr
dt = (i cos t − j sin t) dt
dt
ja differentiaali ds siten
p
√
ds = |dr| = cos2 t + sin2 t dt = 1 dt = dt,
kun etenemme muuttujan t kasvavaan suuntaan (dt > 0).
Kaaren pituus on siis
s(t) =
dT κ = .
ds
dT
= κN.
ds
r = i sin t + j cos t + 0k = i sin t + j cos t.
dr =
1 dT
,
κ ds
Z
ds =
C
Z
t
dt = t.
0
T · N = 0,
eli vektori N on kohtisuorassa tangenttia T vastaan ja
siten myös kohtisuorassa ko. avaruuskäyrää vastaan.
Tämän vuoksi vektoria N sanotaan käyrän
päänormaaliksi.
Esim. Käyrän x = 3 cos t, y = 3 sin t, z = 4t
yksikkötangentti, päänormaali, kaarevuus ja
kaarevuussäde
Käyrän
r = i3 cos t + j3 sin t + k4t
eräs tangentti on
Kaarevuussäde
dr
= −i3 sin t + j3 cos t + k4.
dt
Avaruuskäyrän r = r(s), s kaaren pituus,
yksikkötangentti on kaavan (7.5) mukaisesti
T=
dr
.
ds
(7.11)
Normitetaan tämä, ts. muodostetaan yksikön mittainen
saman suuntainen vektori jakamalla vektori pituudellaan.
50
Tangentin pituus on
p
dr =
(−3 sin t)2 + (3 cos t)2 + 42
dt q
=
9(sin2 t + cos2 t) + 16
√
9 + 16 = 5.
=
ja kaarevuussäde
ρ=
−i3 sin t + j3 cos t + k4
dr Ajan t funktiona massapisteen paikkavektori olkoon
r = r(t). Nopeus on tällöin
dt
=
3
4
3
−i sin t + j cos t + k .
5
5
5
Yksikkötangentiksi saatiin siis
3
3
4
T = −i sin t + j cos t + k .
5
5
5
Derivoidaan tämä muuttujan t suhteen:
3
3
dT
= −i cos t − j sin t.
dt
5
5
Toisaalta, koska kaaren pituus s on jokin muuttujan t
funktio, voimme ketjusäännön perusteella kirjoittaa
v=
r · r = R2 .
Tämän derivointi antaa
.
2r · r = 2v · r = 0.
Nopeus on kohtisuorassa radiusvektoria r vastaan (eli
kohtisuorassa ympyrän sädettä vastaan, ympyrän
tangentin suuntainen).
Tarkastellaan erikoisesti sellaista xy-tason liikettä, missä
r = iR cos ωt + jR sin ωt
joten
dT
dT
=
ds
dt
ds
dt
Aikaisemmin (kaava (7.7)) totesimme, että kaaren
pituuden derivaatta käyrää parametrisoivan muuttujan
suhteen noudattaa kaavaa
ds dr = dt
dt
dT
dT
=
ds
dt
dr dt Määritelmän (7.9) mukaan on siis
dT dr dT
=
κN =
ds
dt dt =
−i 53
=
−i
cos t −
5
j 35
dr
.
= r.
dt
Kun piste kulkee pitkin origokeskeisen R säteisen
ympyrän kehää, on vektorin r pituus vakio R: |r| = R tai
dT
dT ds
=
,
dt
ds dt
eli
1
25
=
.
κ
3
Esim. Ympyräliike
Yksikkötangentti on siten
T =
Kaarevuus on silloin
s 2
3
3
(sin2 t + cos2 t) =
κ=
25
25
sin t
3
3
cos t − j sin t.
25
25
Koska N on yksikön mittainen, on voimassa
dT = |κ||N| = κ, κ ≥ 0.
ds kun ω on vakio. Nyt
q
|r| = R2 (cos2 ωt + sin2 ωt) = R,
joten kyseessä on ympyräliike.
Nopeus on
.
v = r = −iRω sin ωt + jRω cos ωt.
Kuten todettiin, tämä on kohtisuorassa paikkavektoria r
vastaan. Vauhti on nyt
q
|v| = (ωR)2 (cos2 ωt + sin2 ωt) = ωR,
joten liikkeen vauhtikin on vakio. Kiihtyvyys taas on
.
a = v = −iRω 2 cos ωt − jRω 2 sin ωt.
Vauhdin vakioisuudesta (v · v = ω 2 R2 = vakio) seuraa
että kiihtyvyys on kohtisuorassa nopeutta vastaan (ja
siten joko radiusvektorin suuntainen tai sille
vastakkaissuuntainen). Itseasiassa näemme, että
a = −ω 2 r.
Kiihtyvyyden suuruus on sekin vakio, sillä
|a| = | − ω 2 r| = ω 2 R.
51
7.2 Gradientti, divergenssi, roottori
jyrkimmin. |∇φ|:n pituus on korkeuden kulmakerroin
∇φ:n suuntaan.
Osittaisderivaatta ja kentät
φ=vakio
Olkoon f koordinaattipisteen r = (x, y, z) funktio,
f (r) = f (x, y, z). funktion osittaisderivaattaa esim.
muuttujan x suhteen merkitään
φ=vakio
∆
ja se lasketaan derivoimalla x:n suhteen pitämällä muut
muuttujat vakiona.
Esim. Olkoon f (x, y, z) = xyz + x2 y. Nyt
∂f
= yz + 2xy,
∂x
∂f
= xz + x2 ,
∂y
∂f
= xy
∂z
Kuva 7.4 Gradientti ∇φ
Avaruudessa (x, y, z) ∈ R3 tai sen osajoukossa
määriteltyä funktiota kutsutaan usein kentäksi.
Jos f on reaaliluku, f (r) ∈ R, kyseessä on skalaarifunktio
eli skalaarikenttä, jos taas funktio on vektori,
~v (r) = ivx (r) + jvy (r) + kvz (r) ∈ R3 , kyseessä on
vektorifunktio eli v ektorikenttä.
Esim. skalaarikenttiä (-funktioita) ovat ilman paikallinen
lämpötila T (r), paine p(r), sähkövarauksen tiheys ρ(r).
Vektorikenttiä ovat esim. kaasun (nesteen) virtausnopeus
v(r), sähkökenttä E(r), sähkövirran tiheys J(r). . .
Nabla
Määritellään “derivaattavektori” nabla:
∇≡i
X
∂
∂
∂
∂
+j
+k
=
êi
∂x
∂y
∂z
∂x
i
i
(7.12)
Nabla ∇ on siis yhtä aikaa derivaatta ja vektori. Sillä
voidaan operoida skalaari- tai vektorifunktioihin:
∇f (r) gradientti (vektori)
∇ · v(r) divergenssi (skalaari)
∇ × v(r) roottori (vektori)
7.2.1 Gradientti
Olkoon φ(r) skalaarifunktio. Funktion gradientti on
vektorifunktio
∇φ =
X ∂φ
∂φ
∂φ
∂φ
i+
j+
k=
êi
∂x
∂y
∂z
∂ri
i
φ
tangenttitaso
∂f (r)
∂f (x, y, z)
=
= ∂x f (r)
∂x
∂x
(7.13)
Graafisesti: gradientti ∇f (r) on vektori, joka on
kohtisuorassa pintaa f (r) = vakio vastaan, ja |∇f | kertoo
kuinka nopeasti funktio muuttuu ko. suuntaan.
Vielä havainnollisemmin: kartta ja korkeuskäyrät
(kahdessa ulottuvuudessa): olkoon φ(x, y) maaston
korkeus koordinaattipisteessä (x, y). Nyt yhtälö
φ(x, y) = vakio määrittelee korkeuskäyrän, jossa korkeus
on vakio, ja ∇φ osoittaa suuntaan mihin φ kasvaa
Todistus: tehdään pieni muutos r → r + ∆r. Nyt
f (r + ∆r)
=
=
=
f (x + ∆x, y + ∆y, z + ∆z)
∂f
∂f
∂f
f (r) +
∆x +
∆y +
∆z + O(∆2 )
∂x
∂y
∂z
f (r) + (∇f ) · (∆r)
Pistetulosta näkee, että funktion muutos
∆f = f (r + ∆r) − f (r)
on suurin, kun ∆r k ∇f
on = 0, kun ∆r ⊥ ∇f
Siis:
– pinnan f = vakio yksikkönormaali on ∇f /|∇f |
– pinnan f = vakio tangenttitaso on vektoria ∇f
kohtisuoraan
– funktion f kasvunopeus suuntaan n̂ on n̂ · ∇f (n̂
yksikkövektori)
Näistä viimeisimmän näkee valitsemalla yllä ∆r k n̂.
Esim. Funktion φ(x, y, z) = 3x2 y − y 3 z 2 gradientti ∇φ
pisteessä (1, −2, −1)
Gradientti mielivaltaisessa pisteessä (x, y, z) on
∂
∂
∂
∇φ =
i
(3x2 y − y 3 z 2 )
+j
+k
∂x
∂y
∂z
∂
∂
= i (3x2 y − y 3 z 2 ) + j (3x2 y − y 3 z 2 )
∂x
∂y
∂
+k (3x2 y − y 3 z 2 )
∂z
= 6xyi + (3x2 − 3y 2 z 2 )j − 2y 3 zk,
joten pisteessä (1, −2, −1) se on
∇φ
=
=
6(1)(−2)i + (3(1)2 − 3(−2)2 (−1)2 )j
−2(−2)3 (−1)k
−12i − 9j − 16k.
Suunnattu derivaatta
Edellisestä esimerkistä yleistäen voimme todeta, että
skalaarikentän φ muutos pituusyksikköä kohti suunnassa
52
n, |n| = 1, on ∇φ · n. Sanomme, että suure
n · ∇φ = (∇φ) · n, |n| = 1
Katsotaan esimerkkinä nesteen virtausta tarkemmin. Jokaisessa
avaruuden pisteessä (ajattelemme nestettä jatkuvasti
jakautuneena aineena unohtaen sen atomaarisen rakenteen)
r = (x, y, z) neste virtaa paikasta riippuvalla nopeudella
(7.14)
on funktion φ suunnattu derivaatta (suuntaan n). Kuten
olemme nähneet, suunnattu derivaatta on suurimmillaan
gradientin suunnassa.
Huom: voimme kirjoittaa derivaattaoperaattorin
suuntaan n
X
∂
n·∇=
ni
∂r
i
i
v = v(r) = vx (x, y, z)i + vy (x, y, z)j + vz (x, y, z)k.
µ
Jos nesteen massatiheys on ρ (kg/m3 ), massavirtatiheys
((kg/m3 )(m/s)=kg/(m2 s)) pisteessä r on
µ = ρv .
m
Jos esim. n k i, saamme tavallisen osittaisderivaatan x:n
suuntaan.
Esim. Funktion φ = x2 yz + 4xz 2 derivaatta pisteessä
(1, −2, −1) suuntaan 2i − j − 2k
Gradientti pisteessä (1, −2, −1) on
∇φ
=
=
=
=
A
=
A
2
i−
3
=
=
=
Katsotaan, mitä massavirralle tapahtuu pisteen r
infinitesimaalisessa ympäristössä. Kuvitellaan tätä tarkoitusta
varten ko. piste sijoitetuksi sellaisen suorakulmaisen särmiön
keskelle, jonka särmien pituudet ovat dx, dy ja dz. Virta µ tuo
särmiön pohjan kautta materiaa virtatiheydellä µz (x, y, z − dz/2),
joten kaiken kaikkiaan pohjan läpi virtaa aikayksikössä särmiöön
materiaa määrä µz (x, y, z − dz/2)dx dy (kg/s). Vastaavasti
kannen läpi poistuu aikayksikössä materiamäärä
µz (x, y, z + dz/2)dx dy. Näiden virtausten seurauksena särmiön
nestemäärän vähenemä aikayksikössä on
2i − j − 2k
√
22 + 12 + 22
1
2
j − k.
3
3
∇φ · a
dmz
1
2
2
(8i − j − 10k) · ( i − j − k)
3
3
3
37
16 1 20
+ +
=
.
3
3
3
3
=
=
=
µz (x, y, z + dz/2)dx dy
−µz (x, y, z − dz/2)dx dy
∂µz (x, y, z) dz
dx dy
∂z
2
i
h
dz
∂µz (x, y, z)
− µz (x, y, z) +
−
dx dy
∂z
2
∂µz
=
dx dy dz.
∂z
Differentiaalien tulo dx dy dz on infinitesimaalisen särmiömme
(infinitesimaalinen) tilavuus
=
7.2.2 Divergenssi
Olkoon nyt v(r) = (vx (r), vy (r), vz (r)) vektorikenttä.
Vektorikentän divergenssi on
∇ · v)
d z
d y
Kuva 7.5 Divergenssin tulkinta
Tähän suuntaan laskettu derivaatta on
∇a φ
y
d x
2
Vektorin A = 2i − j − 2k suuntainen yksikkövektori on
=
m
x
( x ,y ,z )
m ( x ,y ,z - d z /2 )
+(1) (−1)j + ((1) (−2) + 8(1)(−1))k
8i − j − 10k.
a
z
m
(2xyz + 4z 2 )i + x2 zj + (x2 y + 8xz)k
(2(1)(−2)(−1) + 4(−1)2 )i
2
m ( x ,y ,z + d z /2 )
m
∂
∂
∂
+j
+ k ) · (ivx + jvy + kvx )
∂x
∂y
∂z
∂vx
∂vy
∂vz
+
+
∂x
∂y
∂z
h
µz (x, y, z) +
i
dV = dx dy dz.
(i
Pohjan ja pinnan läpi suuntautuvien virtausten aiheuttama
massan nettomuutos (nettopoistuma) aikayksikössä tilavuudessa
dV on siten
∂µz
dV.
dmz =
∂z
Vastaava lasku osoittaa, että xz- ja yz-suuntaisten pintojen läpi
kulkevat virrat aiheuttavat aikayksikössä nettopoistumat
Graafisesti: vektorikentän divergenssi on
(yksikkötilavuudessa) syntyvän vuon (vesi!) määrä:
∂µy
dV
∂y
∂µx
dV.
dmx =
∂x
Massan kokonaismuutos aikayksikössä tilavuusalkiossa dV on
siten
dmy
∇ · v > 0, lähde (source))
∇ · v < 0, nielu (sink)
Jos ∇ · v = 0 koko määrittelyjoukossa, sanotaan että
vektorikenttä v on lähteetön
dm
=
=
53
=
dmx + dmy + dmz
∂µy
∂µz
∂µx
dV.
+
+
∂x
∂y
∂z
Vektorimerkintää käyttäen voimme kirjoittaa tämän muotoon
dm =
∂
∂
∂
i +j +k
∂x
∂y
∂z
· (µx i + µy j + µz k)dV.
Kun huomaamme, että skalaaritulon ensimmäinen tekijä on
operaattori ∇, saamme tämän kompaktimpaan muotoon
∇ × v = i(∂y z − ∂z y) − j(∂x z − ∂z x) + k(∂x y − ∂y x) = 0
Kyseessä on pyörteetön kenttä
Esim. v = −yi + xj
dm = ∇ · µ dV.
∇ · v = 0 lähteetön
∇ × v = 2k 6= , pyörre
Esim. Maxwellin yhtälöt:kuvaavat sähködynamiikkaa
Massatieyden muutos dm/dV pisteessä (x, y, z)
dm/dV = ∇ · µ
voi aiheutua mm. siitä, että
• neste puristuu kokoon tai laajenee, jolloin
∂ρ
∂t
6= 0,
∇·E=
• ko. pisteeseen ruiskutetaan lisää nestettä eli pisteessä on
lähde tai ko. pisteestä poistetaan nestettä eli pisteessä on
nielu.
Massatiheyden muutos (pienennys) voidaan siten ilmaista kahden
termin summana
∂ρ
+ ψ,
dm/dV = −
∂t
missä jälkimmäinen termi ψ kuvaa nielujen ja lähteiden
vaikutusta. Näin olemme johtaneet nesteiden (ja kaasujen)
virtausta hallitsevan kontinuiteettiyhtälön
∂ρ
= ψ,
∂t
muistaen, että massavirtatiheys oli µ = ρv.
∇ · (ρv) +
∇·B=0
=
∇·B
=
(7.15)
1
ρ
ǫ0
0
Tässä E on sähkökenttä, B magneettikenttä, ρ
sähkövaraustiheys (lähde sähkökentälle!). Magneettisia
varauksia ei ole olemassa (magneettinen monopoli), joten
magneettikentän lähdetermi = 0, ja magneettikenttä on
lähteetön.
7.2.3 Roottori
Vektorikentän v(r) roottori ∇ × v lasketaan seuraavasti:
i
j k (7.16)
∇ × v = ∂x ∂y ∂z vx vy vz =
+
i
∇ × r = ∂x
x
j
∂y
y
k
∂z
z
=0
Esim. Gradientti ∇f (r) on pyörteetön:
∇ × (∇f ) = (∇ × ∇)f = 0
(näin voidaan tehdä, sillä ∇:n vektorikomponentit
menevät tavallisen ristitulon tapaan, ja derivaatat kaikki
vaikuttavat f :ään.)
Huom: usein käytetään derivaattaoperaattoreita v · ∇ ja
v × ∇. Näissä ei derivoida v:tä, derivaatta ei ole vielä
operoinut!PSiis esim.
v · ∇ = i vi ∂i
v × ∇ = i(vy ∂z − vz ∂y ) + j . . .
Laplacen operaattori
Määritellään
i(∂y vz − ∂z vy ) − j(∂x vz − ∂z vx )
k(∂x vy − ∂y vx )
(7.17)
Tämä on siis tavallinen ristitulo vektoreille, mutta
derivaatta vaikuttaa aina eteenpäin, “alariville”:
∂x ∂y vx vy = ∂x vy − ∂y vx
1 ∂E
= µ0 j
c2 ∂t
∂B
=0
∇×E+
∂t
∇×B−
E sähkö, B magneettikenttä, ρ sähkövaraustiheys, j
sähkövirrantiheys, c valon nopeus, ǫ0 tyhjiön
permittiivisyys ja µ0 permeabiliteetti (vakioita).
Vektorikenttä v on pyörteetön, jos ∇ × v = 0.
Esim. r on pyörteetön:
Sähkömagnetismi, Maxwellin yhtälöt:
∇·E
1
ρ
ǫ0
∇ · ∇ ≡ ∇2 = ∂x2 + ∂y2 + ∂z2 =
X ∂2
∂ri2
i
Tämä on skalaaridifferentiaalioperaattori, jota käytetään
usein fysiikassa.
Roottori mikroskooppisesti
Roottori kuvaa vektorikentän pyörteisyyttä:
Tarkastellaan jälleen ρ-tiheyksisen nesteen virtausta. Kun
virtausnopeus pisteessä r = (x, y, z) on v(r), on µ = ρv
massavirtatiheys tässä pisteessä. Tutkitaan tällä kertaa, miten
pyörteellistä virtaus on. Katsotaan esimerkkinä pisteen (x, y, z)
ympäri kiertyvää virtausta. Lasketaan erikseen nettokiertymät
kunkin koordinaattitason suuntaisissa virtauksissa, esimerkkinä
Esim. v = xi + yj + zk
∇ · v = 3 lähde (kaikilla r!)
54
Siis
xy-tason suuntainen taso.
( x ,y )
Laskusääntöjä
m y( x + d x /2 ,y )
m y( x - d x /2 ,y )
m x( x ,y + d y /2 )
m x( x ,y - d y /2 )
Kuva 7.6 Virtauksen kiertymä
Kuvitellaaan piste (x, y, z) (kuvassa z-koordinaattia ei ole
merkitty) sijoitetuksi tässä tasossa dx dy-sivuisen suorakaiteen
keskelle. Suorakaiteen alalaidalla kokonaisvirtaus positiiviseen
kiertosuuntaan on µx (x, y − dy/2, z)dx, oikeanpuoleista laidalla
µy (x + dx/2, y, z)dy, ylälaidalla −µx (x, y + dy/2, z)dx ja
vasemmanpuoleisella laidalla −µy (x − dx/2, y, z)dy. z-akselin
ympäri kiertyvä kokonaisvirtaus dSz (kg/(ms)) on näiden neljän
termin summa
dSz
=
µx (x, y − dy/2, z)dx + µy (x + dx/2, y, z)dy
=
[µy (x + dx/2, y, z) − µy (x − dx/2, y, z)] dy
−µx (x, y + dy/2, z)dx − µy (x − dx/2, y, z)dy
− [µx (x, y + dy/2, z) − µx (x, y − dy/2, z)] dx
∂µx
∂µy
dx dy −
dy dx
=
∂x
∂y
i
h
∂µx
∂µy
dx dy.
(7.18)
−
=
∂x
∂y
Jakamalla tämä suorakaiteen pinta-alalla dx dy saamme z-akselin
ympäri aikayksikössä kiertyväksi massatiheydeksi
∂µy
∂µx
dSz
=
−
.
sz =
dx dy
∂x
∂y
Menettelemme samoin kuin kulmanopeuden tapauksessa ja
muodostamme pyörteisyydeksi sanotun vektorisuureen sz , jonka
pituus ilmoittaa aikayksikössä kiertyvän massatiheyden määrän ja
suunta kiertoakselin, ts.
h
i
∂µy
∂µx
s z = sz k =
k.
−
∂x
∂y
Vastaavasti x- ja y-akseleiden suuntaiset pyörteisyydet ovat
i
h
∂µy
∂µz
i
−
sx =
∂y
∂z
h
i
∂µx
∂µz
sy =
j.
−
∂z
∂x
Vektoreiden sx , sy ja sz resultantin s pituus kertoo silloin
pisteeseen (x, y, z) asetetun resultanttivektorin ympäri
aikayksikössä kiertyvän massatiheyden kokonaismäärän.
Virtauskentän pyörteisyys on siis
i
h
i
h
∂µy
∂µx
∂µz
∂µz
i+
j
−
−
s =
∂y
∂z
∂z
∂x
h
i
∂µy
∂µx
+
k.
−
∂x
∂y
Nähdään helposti että
muotoon
s = s on µ:n roottori.
s voidaan kirjoittaa determinantin avulla
i
j
k ∂
∂
∂ ∂x
∂y
∂z = ∇ × µ
µx µ y µ z Nablalle on helppo näyttää mm. seuraavat laskusäännöt:
∇(a + b) = ∇a + ∇b
∇(ab) = (∇a)b + a(∇b)
∇ · (u + v) = ∇ · u + ∇ · v
∇ · (au) = (∇a) · u + a∇ · ~u
∇ × (u + v) = ∇ × u + ∇ × v
∇ × (au) = (∇a) × u + a∇ × u
∇ × (∇a) = ∇ × ∇a = 0 eli ∇a on pyörteetön
∇ · (∇ × v) = (∇ × ∇) · v = 0 eli ∇ × v on lähteetön
(tässä käytettiin skalaarikolmituloa,
a · (b × c) = (a × b) · c
Joskus esiintyy myös
∇ × (∇ × u) = ∇(∇ · u) − (∇ · ∇)u
missä käytettiin vektorikolmitulon laskusääntöä.
Siis sääntö: derivaattaosa - käytä derivoimissääntöjä,
vektoriosa - vektoreiden laskusääntöjä.
Huom: jos kehität ∇-lausekkeita skalaari- tai kolmitulon
avulla, muista järjestys:
Esim: u × (∇ × v) = ∇(uc · v) − (u · ∇)v
missä siis uc pidetään vakiona derivoinnissa.
Samoin esim.
∇·(u×v) = ∇·(u×vc )+∇·(uc ×v) = v·(∇×u)+u·(∇×v).
Esim. Olkoon u = xyi + yzj + zxk.Nyt
∇×(∇×u) = ∇(∇·u)−∇2 u = ∇(y +z +x)−0 = i+j+k
Tai suoraan
ja
i
∇ × u = ∂x
xy
j
∂y
yz
i
∇ × (∇ × u) = ∂x
−y
k
∂z
zk
= −iy − jz − kx
j
∂y
−z
k
∂z
−x
Esim. ∇ × A pisteessä (1 − 1, 1), kun
=i+j+k
A = xz 3 i − 2x2 yzj + 2yz 4 k
Nyt
∂
∂
∂
i+
j+
k ×
∇×A =
∂x
∂y
∂z
=
=
55
(xz 3 i − 2x2 yzj + 2yz 4 k)
i
j
k ∂
∂
∂
∂y
∂z
∂x
xz 3 −2x2 yz 2yz 4 ∂
∂
4
2
(2yz ) −
(−2x yz) i
∂y
∂z
∂
∂
4
3
−
(2yz ) −
(xz ) j
∂x
∂z
∂
∂
2
3
+
(−2x yz) −
(xz ) k
∂x
∂y
=
=
=
(2z 4 + 2x2 y)i + 3xz 2 j − 4xyzk
4
2
ja
2
(2(1) + 2(1) (−1))i + 3(1)(1) j
−4(1)(−1)(1)k
∇2
3j + 4k.
Jos pätee ∇2 f = 0, funktio f (r) on harmoninen.
Samoin edelleen
Esim. ∇ × (∇ × A), kun A = x2 yi − 2xzj + 2yzk
Nyt
∇ × (∇ × A)
=
=
=
=
i
∂
∇ × ∂x
x2 y
j
∂
∂y
−2xz
∇2 f (r)
k ∂
∂z 2yz =
(2x + 2)j.
7.2.4 Paikkavektorin derivaatat
Paikkavektori on
p
r = xi + yj + zk, r = x2 + y 2 + z 2 = |r|
i
∇×r
=
∇r
=
(7.19)
i
0 (ks. aiemmin)
(7.20)
r
= r̂ r:n suuntainen 1-vektori (7.21)
r
Viimeisin tulee siitä, että
∂x r = 21 (x2 + y 2 + z 2 )−1/2 2x = x/r, joten
X
X ri
r
∇r =
êi ∂i r =
êi =
r
r
i
i
Jos nyt f (r) on r:n funktio, niin ketjusääntö saa muodon
∇f (r) = f ′ (r)∇r = f ′ (r)
r
r
Tämä tulee suoraan tavallisesta ketjusäännöstä:
i∂x f (r) = if ′ (r)∂x r = if ′ (r)r/r.
Näin esim
∇ · (rf (r))
=
=
=
∂x (xf (r)) + ∂y (yf (r)) + ∂z (zf (r))
x
y
z
3f (r) + xf ′ (r) + yf ′ (r) + zf ′ (r)
r
r
r
3f (r) + rf ′ (r)
tai suoraan:
∇ · (rf (r)) = f (r)∇ · r + r · ∇f (r) = 3f (r) + rf ′ (r)
Usein tavataan
1
d
∇ =
r
dr
=
=
∇ × [(2x + 2z)i − (x2 + 2z)k]
i
j
k
∂
∂
∂
∂x
∂y
∂z
2x + 2z 0 −x2 − 2z Nyt saamme heti tulokset
X
X
∇·r =
∂i ri =
1=3
3
r r
1
r
1
= ∇ · (∇ ) = ∇ · ( 3 ) = 3 − 3 4 · = 0
r
r
r
r
r r
1 r
1
r
∇r = − 2 = − 3
r
r r
r
56
r
∇ · ∇f (r) = ∇ · (f ′ (r) )
r
r
3
r r
r
f ′′ (r) ) · + f ′ (r) − f ′ (r) 2 ·
r r
r
r r
2
f ′′ (r) + f ′ (r)
r
8. Viiva-, pinta- ja
tilavuusintegrointi
8.1 Viivaintegraali
Luvussa 7.1.2 käsiteltiin viivan pituuden integrointia.
Tässä luvussa yleistetään integrointi avaruuskäyrää,
viivaa pitkin. Olkoon meillä käyrä C, jonka piirtää
paikkavektori
Integrointitiellä on määrätty suunta: kussakin käyrän
pisteessä etenemissuunta on sama kuin käyrällä lasketun
differentiaalin suunta. Kun siis tien C kuvaaja on
r = r(u), niin integrointi etenee parametrin u kasvavaan
suuntaan. Jos nyt −C on muuten sama käyrä kuin C
mutta suunnaltaan päinvastainen, niin näemme että
Z
Z
F · dr = −
F · dr,
(8.2)
−C
r = r(u) = x(u)i + y(u)j + z(u)k.
Oletamme edelleen, että pistettä A vastaa paikkavektori
r(a) ja pistettä B paikkavektori r(b). Käyrällä C laskettu
differentiaali dr on
dr
du
dr = idx + jdy + kdz =
du
ja osoittaa, kuten aiemmin olemme nähneet (ks. (7.4)),
käyrän tangentin suuntaan.
Käyrää C pitkin voidaan muodostaa useita viiva- eli
polkuintegraaleja:
Jos f (r) on skalaarifunktio, saamme f :n integraalin
viivan pituuden suhteen
Z
Z b
ds
f (r) du
f (r)ds =
du
a
C
missä
r
dr drx 2
ds
dry 2
drz 2
= =
+
+
du du du
du
du
Jos f (r) = 1, integraali antaa käyrän C pituuden.
Jos nyt F(r) on vektorifunktio, saamme erittäin yleisen
viivaintegraalin
sillä käyrällä C laskettu differentiaali on
vastakkaisuuntainen käyrällä −C lasketulle
differentiaalille.
C :
r(u r (b )= r (a + b -a )
)
-C
: r
B
(a +
A
b -u
)
r(a )= r(a + b -b )
Kuva 8.2 Suunnan vaihto
Kuvassa integroinnin alku- ja loppupisteitä yhdistävä tie
on C : r(u). Kuvan mukaisesti pistettä A vastaa
paikkavektori r(a) ja pistettä B paikkavektori r(b). Jos
nyt a > b, niin käyrän ja siis integroinnin suunta on
pisteestä A pisteeseen B. Integroinnin suunnan kääntö
voidaan toteuttaa helposti esimerkiksi vaihtamalla
parametri u käyrän C kuvaajassa parametriksi a + b − u,
ts. käännettyä integrointisuuntaa vastaava tie on
−C : p(u) = r(a + b − u).
Vielä selvemmäksi geometrinen merkitys käy, kun
kirjoitamme differentiaalin dr muotoon
F
dr = T(r) ds.
A
B
C
r(a )
Tässä T on käyrän yksikkötangentti ja s käyrän kaaren
pituus (mitattuna jostakin pisteestä). Viivaintegraalissa
esiintyvä skalaaritulo on tällöin
r(b )
d r
r(u )
F(r) · dr = |F(r)||T(r)| cos θ ds = F (r) cos θ ds,
missä θ on vektorin F ja integrointitien tangentin välinen
kulma. Viivaintegraali saadaan nyt muotoon
Z
Z
F(r) · dr =
F (r) cos θ ds.
O
Kuva 8.1 Viivaintegraali
Z
F(r) · dr
C
Z
=
(Fx dx + Fy dy + Fz dz)
C
Z b
C
(8.1)
dy(u)
dz(u)
dx(u)
du.
+ Fy
+ Fz
du
du
du
a
R
Geometrisesti viivaintegraali C F · dr tarkoittaa vektorin
F käyrän C tangentin suuntaisten projektioiden summaa.
=
C
Fx
C
Tästä muodosta nähdään esimerkiksi, että vektorin F
ollessa massapisteeseen vaikuttava voima tarkoittaa
viivaintegraali tehtyä työtä siirrettäessä massapistettä
pitkin käyrää C. R
Esim. Integraali C F · dr pitkin xy-tason käyrää y = 2x2
pisteestä (0, 0) pisteeseen (1, 2), kun F = 3xyi − y 2 j
Parametrisoidaan käyrä C siten, että x = t ja y = 2t2 .
Tällöin alkupisteessä t = 0 ja loppupisteessä t = 1.
57
Differentiaali dr on
Tehty työ on
dr
=
dx i + dy j
dx
dy
dt
i
+j
dt
dt
(i + 4tj)dt.
=
=
W =
=
C
Z 1
0
=
=
Z
(6t3 − 16t5 )dt =
1 6 4 16 6
t − t
4
6
dy =
1
dx.
2
0
B
3 8
7
− [0] = − .
−
2 3
6
y = x /2
A
Kuva 8.3 Integrointitie a)
Tehty työ on nyt
y = y(x).
Wa
F · dr pitkin xy-tason käyrää y = 2x2
C
pisteestä (0, 0) pisteeseen (1, 2), kun F = 3xyi − y 2 j
Otetaan käyrää C parametrisoivaksi muuttujaksi x,
jolloin y = 2x2 . Alkupisteessä x = 0 ja loppupisteessä
x = 1. Differentiaali dr on
R
dr
=
dx i + dy j
dy
dx
dx i + j
dx
(i + 4xj)dx.
=
=
=
Z
(xy dx − y 2 dy)
"
#
2
1
1
1
x x dx −
x
dx
2
2
2
0
=
C
Z 2
=
Z
2
0
3 2
x dx =
8
=
C
Z 1
0
=
=
Z
x3
= 1.
8
b) Integroidaan ensin pitkin y-akselia pisteestä (0, 0)
pisteeseen (0, 1) ja sitten x-akselin suuntaisesti pisteestä
(0, 1) pisteeseen (2, 1).
B
(3x(2x2 )i − (2x2 )2 j) · (i + 4xj)dx
1
3
0
2
0
Viivaintegraali on siis
Z
Z
(3xyi − y 2 j) · (dx i + dy j)
F · dr =
C
C
(xy dx − y 2 dy).
1
x,
2
jolloin
Käyrää parametrisoivaksi muuttujaksi voidaan usein
ottaa jokin muuttujista x, y tai z. Esimerkiksi xy-tason
käyrät esitetään monesti muodossa
Esim. Integraali
Z
y=
(3(t)(2t2 )i − (2t2 )2 j) · (i + 4tj)dt
1
0
C
F · dr =
a) Otetaan integrointitieksi suora
Viivaintegraali on siis
Z
Z
F · dr =
(3xyi − y 2 j) · (dx i + dy j)
C
Z
5
(6x − 16x )dx =
1 6 4 16 6
x − x
4
6
0
7
3 8
− [0] = − .
−
2 3
6
Esim. Tehty työ siirrettäessä kappale xy-tasossa pisteestä
A = (0, 0) pisteeseen B = (2, 1), kun kappaleeseen
vaikuttava voima on F = xyi − y 2 j
Nyt
A
Kuva 8.4 Integrointitie b)
Reitillä (0, 0) → (0, 1) on x = 0 ja dx = 0. Reitillä
(0, 1) → (2, 1) taas on y = 1 ja dy = 0. Työ on siten
Z 1
((0)y(0) − y 2 dy)
Wb =
y=0
Z 2
+
F · dr = (xyi − y 2 j) · (dx i + dy j) = xy dx − y 2 dy.
x=0
58
(x(1)dx − (1)(0))
=
1 y3
−
3
0
+
2
1
5
x2
=− +2= .
2
3
3
Näemme siis, että kenttä φ toteuttaa ehdon
∇φ ·
0
du
du
=F·
dt
dt
tai
Konservatiiviset kentät
Edellisen esimerkin tapauksessa tehty työ riippui
siirtoreitistä. Toisaalta hyvin monissa kiinnostavissa
fysikaalisissa syteemeissä työ riippuu ainoastaan
siirroksen alku- ja loppupisteistä mutta ei lainkaan näitä
pisteitä yhdistävästä reitistä. Tällöin siis pisteitä P1 ja P2
yhdistävää käyrää myöten laskettu voiman F
viivaintegraali
Z P2
F · dr
W =
P1
on tiestä riippumaton ja voimakentän F sanotaan olevan
konservatiivinen.
Oletetaan nyt, että kenttä F on konservatiivinen. Silloin
pisteitä P1 = (x1 , y1 , z1 ) ja P = (x, y, z) yhdistävää tietä
myöten laskettu viivaintegraali
φ(x, y, z) =
Z
Konservatiivinen kenttä on siis esitettävissä jonkin
skalaarikentän gradienttina.
Oletetaan nyt, että vektorikenttä F on skalaarikentän φ
gradientti, ts.
F = ∇φ.
Lasketaan pisteestä P1 pisteeseen P2 pitkin käyrää C
viivaintegraalia
Z P2
Z P2
∇φ · dr.
F · dr =
W =
P1
P1
(x,y,z)
(x1 ,y1 ,z1 )
du
= 0.
dt
Koska u(t) oli mielivaltainen pisteitä P1 ja P yhdistävä
käyrä, täytyy olla
F = ∇φ.
(∇φ − F) ·
F · dr
määrittelee yksikäsitteisesti integrointitiestä
riippumattoman ja vain integroinnin loppupisteestä
(pidetään alkupistettä kiinnitettynä) riippuvan
skalaarikentän φ. Olkoon
r = u(t)
jokin sellainen pisteitä P1 ja P yhdistävä käyrä, että
(x1 , y1 , z1 ) = u(t1 ) ja (x, y, z) = u(t).
Skalaarifunktion φ differentiaali on
dφ(x, y, z) = ∇φ · dr,
joten työ W on kirjoitettavissa muotoon
Z P2
dφ.
W =
P1
Olkoon nyt
r = r(t)
sellainen käyrän C parametriesitys, että
Tällä käyrällä on
du
dt,
dr =
dt
joten tätä käyrää myöten laskettuna kentän φ arvoksi
saadaan
Z t
du
F·
φ(x, y, z) =
dt.
dt
t1
(x1 , y1 , z1 ) = r(t1 ) ja (x2 , y2 , z2 ) = r(t2 ).
Tällä käyrällä kenttä φ saa arvot φ(x(t), y(t), z(t)) eli
voimme pitää käyrällä kenttää yhden muuttujan t
funktiona
ψ(t) = φ(x(t), y(t), z(t)).
Käyrällä laskettu differentiaali on
Kentän φ argumentteja voidaan näin pitää
integrointimuuttujan t funktioina. Tällöin ensinnäkin
integraalifunktion määritelmän (4.1) mukaan on
du
dφ
=F·
.
dt
dt
Toiseksi, koska kentän φ differentiaali käyrällä r = u(t) on
dφ = dψ(t) =
eli pitkin käyrää C tehty työ on nyt
Z t2
Z P2
dψ(t)
dφ =
dt
W =
dt
t1
P1
t2
=
dφ = ∇φ · du,
derivaatta parametrin t suhteen on kirjoitettavissa myös
muotoon
dφ
du
= ∇φ ·
.
dt
dt
dψ(t)
dt,
dt
/ ψ(t) = ψ(t2 ) − ψ(t1 )
t1
=
φ(x2 , y2 , z2 ) − φ(x1 , y1 , z1 ).
Integraalin arvo riippuu näin ollen ainoastaan
päätepisteistä eikä lainkaan valitusta integrointitiestä.
59
Olemme johtaneet lauseen
RP
Integraali P12 F · dr on riippumaton integrointitiestä (ts.
F on konservatiivinen) jos ja vain jos kenttä F on
esitettävissä jonkin skalaarifunktion φ gradienttina
F = ∇φ.
Eräs operaattoriin ∇ liittyvä ominaisuus oli
Muuttujan y suhteen osittaisderivaatta on
Z z
∂φ
∂Fz (x, y, z)
= Fy (x, y, z1 ) +
dz
∂y
∂y
z1
Z z
∂Fy (x, y, z)
dz
= Fy (x, y, z1 ) +
∂z
z1
z
∇ × (∇φ) = 0
=
olipa φ mikä tahansa skalaarikenttä. Jos siis kenttä F on
konservatiivinen ja siten ilmaistavissa jonkin
skalaarikentän gradienttina, sen roottori häviää:
=
=
∇ × F = 0.
Oletetaan nyt että kentän F roottori on nolla, ts.
i
j
k ∂
∂
∂ ∇ × F = ∂x ∂y
∂z Fx Fy Fz ∂Fz
∂Fx
∂Fy
∂Fz
=
i+
j
−
−
∂y
∂z
∂z
∂x
∂Fy
∂Fx
k
+
−
∂x
∂y
= 0.
z1
y
z
=
Fx (x, y1 , z1 ) + / Fx (x, y, z1 ) + / Fx (x, y, z)
=
Fx (x, y1 , z1 ) + Fx (x, y, z1 ) − Fx (x, y1 , z1 )
z1
y1
∂Fy ∂Fx
∂Fz
∂Fy
∂Fx
∂Fz
=
,
=
ja
=
.
∂y
∂z
∂z
∂x
∂x
∂y
C
Fy (x, y, z1 ) + Fy (x, y, z) − Fy (x, y, z1 )
Fy (x, y, z),
missä olemme käyttäneet hyväksi roottorin häviämisestä
seuranneita ehtoja.
Funktion φ osittaisderivaatta muuttujan x suhteen on
Z y
∂φ
∂Fy (x, y, z1 )
= Fx (x, y1 , z1 ) +
dy
∂x
∂x
y1
Z z
∂Fz (x, y, z)
+
dz
∂x
z1
Z y
∂Fx (x, y, z1 )
dy
= Fx (x, y1 , z1 ) +
∂y
y1
Z z
∂Fx (x, y, z)
+
dz
∂z
z1
Kentän komponenttien osittaisderivaatat toteuttavat siis
ehdot
Lasketaan viivaintegraali
Z
Z
F · dr =
(Fx dx + Fy dy + Fz dz)
Fy (x, y, z1 ) + / Fy (x, y, z)
=
+Fx (x, y, z) − F (x, y, z1 )
Fx (x, y, z),
missä jälleen olemme käyttäneet osittaisderivaattojen
välisiä ehtoja.
Kenttä F voidaan siis kirjoittaa muodossa
C
pisteestä P1 = (x1 , y1 , z1 ) pisteeseen P = (x, y, z) pitkin
käyrää C. Valitaan erikoisesti täksi käyräksi
koordinaattiakselien suuntaiset viivasegmentit pisteestä
(x1 , y1 , z1 ) pisteeseen (x, y1 , y2 ), siitä pisteeseen (x, y, z1 )
ja tästä lopuksi pisteeseen (x, y, z). Olkoon φ(x, y, z) tätä
käyrää myöten laskettu viivaintegraalin arvo, ts.
Z x
Fx (x, y1 , z1 )dx
φ(x, y, z) =
x1
Z y
Fy (x, y, z1 )dy
+
+
Z
y1
z
Fz (x, y, z)dz.
F=
Skalaarikentän gradienttina kenttä F on siten edellisen
lauseemme mukaisesti konservatiivinen.
Olemme saaneet kentän konservatiivisuudelle kätevän
kriteerin:
Vektorikenttä on konservatiivinen (ts. esitettävissä
skalaarifunktion gradienttina) jos ja vain jos sen roottori
häviää.
Lausetta
johtaessamme muodostimme sellaisia derivaattoja kuin
R
∂
∂y
φ(x, y)dx siirtämällä derivoinnin integraalin sisälle, ts.
∂
∂y
z1
Z
φ(x, y)dx =
Z
∂φ(x, y)
dx.
∂y
Tämä on sallittua silloin kun integraalit ovat kyllin
”siistejä”(tasaisesti suppenevia). Fysikaalisissa systeemeissä
voidaan useimmiten näin olettaa.
Tästä esityksestä funktion φ osittaisderivaataksi
muuttujan z suhteen saadaan
∂φ
= Fz (x, y, z).
∂z
∂φ
∂φ
∂φ
i+
j+
k = ∇φ.
∂x
∂y
∂z
Konservatiivista kenttää vastaavaa skalaarifunktiota
sanotaan kentän potentiaaliksi.
60
Jos integrointitie C on suljettu, ts. integrointitien
alkupiste yhtyy loppupisteeseen, on viivaintegraalista
tapana käyttää merkintää
I
Z
F · dr =
F · dr.
(8.3)
C
C
F · dr = 0.
(8.4)
Tämä on voimassa myös toisin päin. Oletetaan siis, että
mitä tahansa suljettua käyrää myöten laskettu
viivaintegraali häviää. Olkoot Pa ja Pb kaksi avaruuden
pistettä ja C1 jokin pisteestä Pa pisteeseen Pb kulkeva
käyrä. Jos C2 on jokin toinen käyrä välillä Pa −→ Pb , niin
I
Z
Z
F · dr
F · dr =
F · dr −
C
C2
C1
=
0,
Pa −→ Pb −→ Pa .
C1
=
2xy + z 3
=
x2
=
3xz 2 .
Integroimalla nämä lausekkeet saamme
 2
 x y + xz 3 + f (y, z)
x2 y
+ g(x, z)
φ=

xz 3 + h(x, y)
Tulokset ovat yhtäpitäviä, kun valitsemme f (y, z) = 0,
g(x, z) = xz 3 ja h(x, y) = x2 y. Haettu skalaaripotentiaali
on siis
φ = x2 y + xz 3 ,
mihin voidaan vielä lisätä mielivaltainen vakio.
Esim. Tehty työ siirrettäessä massapistettä pisteestä
P1 = (1, −2, 1) pisteeseen P2 = (3, 1, 4), kun vaikuttava
voima on F = (2xy + z 3 )j + x2 j + 3xz 2 k
Konservatiivista kenttää F vastaava skalaaripotentiaali on
edellisen esimerkin perusteella
kun C on yhdistetty suljettu käyrä
Pa
∂φ
∂x
∂φ
∂y
∂φ
∂z
C
Jos kenttä on konservatiivinen, niin pitkin mitä tahansa
suljettua käyrää C myöten laskettu viivaintegraali on
nolla,
I
Viivaintegraali
Z Pb
On siis etsittävä sellainen φ, että
−C2
φ = x2 y + xz 3 .
F · dr =
Z
C1
F · dr =
Z
C2
F · dr
ei siis riipu lainkaan integrointitiestä, joten kenttä F on
konservatiivinen.
Esim. Onko kenttä F = (2xy + z 3 )j + x2 j + 3xz 2 k
konservatiivinen?
Lasketaan kentän roottori
i
j
k ∂
∂
∂
∇ × F = ∂x
∂y
∂z
2xy + z 3 x2 3xz2 ∂(3xz 2 ) ∂(x2 )
=
i
−
∂y
∂z
∂(2xy + z 3 ) ∂(3xz 2 )
j
−
+
∂z
∂x
∂(x2 ) ∂(2xy + z 3 )
k
−
+
∂x
∂y
= 0,
joten kenttä F on konservatiivinen.
Esim. Kenttää F = (2xy + z 3 )j + x2 j + 3xz 2 k vastaava
skalaaripotentiaali
Edellisen esimerkin perusteella F on konservatiivinen,
joten on olemassa sellainen potentiaali φ, että
F = ∇φ.
Voiman konservatiivisuudesta johtuen tehty työ on
W
Z
=
P2
P1
F · dr = φ(3, 1, 4) − φ(1, −2, 1)
201 − (−1) = 202.
=
Muita viivaintegraaleja
R
R
Edellä käsittelimme integraaleja C f ds C F · dr.
Muunkinnäköisiä yhdistelmiä esiintyy:
Z
Z
Z
f dr,
Fds,
F × dr
C
C
C
Nämä kaikki muunnetaan tavallisiksi integraaleiksi
käyräparametrin u yli: r(u) = (x(u), y(u), z(u)). Näistä
esim
Z
Z b
Z b i
j
k dr
Fx Fy Fz du =
F×
F × dr =
du =
du
a
C
a x′
y′ z′ Z
b
a
[i(Fy z ′ − Fz y ′ ) + j . . .]
Esim. (x, y)-tason käyrän C rajoittaman alueen
ala:Olkoon r käyrän C koordinaattivektori, ja dr
differentiaali C:n suuntaisesti. Näiden vektoreiden
61
virittämän kolmion ala on 21 |r × dr|. Koko alueen ala
saadaan integroimalla (piirrä kuva!)
I
I
1
1
(r × dr)z =
(xdy − ydx)
2 C
2 C
Tämä toimii riippumatta siitä onko origo käyrän C sisällä
vai ei.
8.2 Pintaintegraali tasoalueen yli
Olkoon meillä funktio f (x, y) jonka haluamme integroida
yli tason alueen A:
y (x)
2
y-akselin (vakio x) suuntaiset suorat enintään 2 kertaa.
Jos näin ei ole, alue täytyy joko jakaa kahteen tai
useampaan säännölliseen osaan tai vaihtaa
integroimismuuttujia. Usein riittä että vaihdetaan vain x,
y-integrointijärjestystä.
8.2.1 Muuttujien vaihto pintaintegraalissa
Usein kannattaa vaihtaa koordinaatistosysteemi johonkin
muuhun kuin karteesiseen (x, y)-koordinaatistoon,
integroimisalueen tai funktion mukaan. (esim. integraali
riippuu vain vektorin r pituudesta, ei suunnasta).
1-ulotteisessa tapauksessa muuttujan vaihto x → u
tapahtui muuttamalla differentiaalia: du = du
dx dx. Tämä
yleistyy myös tasolle (tai useampaankin ulottuvuuteen:
jos vaihdetaan muuttujat (x, y) ↔ (u, v), niin
v
y
y (x)
1
x
x1
2
Kuva 8.5 Pintaintegraali
I
Z
=
f (x, y)da =
A
Z x2
=
u
dx
x1
Z
y2 (x)
Z Z
x
f (x, y)dxdy
Kuva 8.6 Koordinaattien vaihto
dyf (x, y)
y1 (x)
Tämä palautuu siis kahdeksi sisäkkäiseksi integraaliksi.
Tässä da = dxdy on infintesimaalinen pinta-alaelementti.
Huom: joskus pintaintegraaleja
kahdella, joskus yhdellä
R
R merkitään
R
integraalimerkillä: f dxdy =
f dxdy. Kaksi integraalimerkkiä
on tarpeen jos merkitään eksplisiittisesti muuttujien rajat. Näissä
muistiinpanoissa käytetään pääsääntöisesti vain yhtä
integraalimerkkiä.
tai kääntäen,
0
=
=
Z
1
dx
0
x
0
1 1 3
1
x =
2 0
2
Z
1
0
∂x
∂u
∂y
∂u
∂x
∂v
∂y
∂v
dudv
dudv = ∂u
∂x
∂v
∂x
∂u
∂y
∂v
∂y
dudv
Jos u → u + du, v vakio, r:n muutos on
∆u r = ∂u rdu = (∂u xi + ∂u y j)du.
Samoin jos v → v + dv, r:n muutos on
∆v r = ∂v rdv = (∂v xi + ∂v y j)dv.
Vektorien ∆u r ja ∆v r virittämän suunnikkaan pinta-ala on
1
dx(x2 + x2 )
2
R
R y (x)
R
Huom: jako A da = dx y12(x) dy toimii vain jos alue on
riittävän säännöllinen, ts. että suljettu käyrä C leikkaa
dxdy = Osoitetaan tämä: tutkitaan kuinka kuvautuu pinta-alan
differentiaali dudv xy-tasolle. Olkoon r = x(u, v)i + y(u, v)j
tason koordinaattivektori.
0
1
(xy + y 2 ) =
2
x = x(u, v)
y = y(u, v)
(||J||, determinantin itseisarvo). Determinanttia
kutsutaan Jacobin determinantiksi.
R
Esim: Alueen A pinta-ala on A dxdy
Esim: Olkoon A pisteiden (0,0), (1,0), (1,1) määräämä
kolmio, ja f (x, y) = x + y. Nyt
Z
Z 1 Z x
dy(x + y)
dx
f dxdy =
A
tai kääntäen
Differentiaaleille pätee
R
On syytä huomata että . . . dxdy ei spesifioi integrointien
suoritusjärjestystä eikä myöskään kerro eksplisiittisesti
integrointirajoja. Nämä valitaan tilanteen mukaan, useista
vaihtoehdoista tietenkin helpoimmin laskettava. Usein
R käytetään
R
myös sellaisia samaa tarkoittavia merkintöjä kuin dx dy . . ..
Vastaavia merkintöjä käytetään myös kolmi- ja useampiulotteisille
integroinneille.
u = u(x, y)
v = v(x, y)
|∆u r×∆v r| = | i
j
∂u x
∂v x
∂u y
∂u y
k 0 |dudv = | 0 ∂u x
∂v x
∂u y
∂u y
|dudv
Siis: jos vaihdetaan muuttujia (x, y) → (u, v), eli
sijoitetaan x = x(u, v), y = y(u, v),
Z
Z
∂(x, y) |dudv
f (x(u, v), y(u, v))| f (x, y)dxdy =
∂(u, v) A′
A
62
√
π.
missä A′ on sama alue mutta ilmaistu u, v-koordinaateilla.
Siis saamme I =
8.2.2 Napakoordinaatisto
Kaksiulotteisen tason rφ-napakoordinaatiston
määrittelevät yhtälöt
8.2.3 Tilavuusintegraalit
Tilavuusintegraali yleistyy suoraan tasointegraalista:
x
y
y
e
e
f
r
=
=
r cos φ
r sin φ.
(8.5)
f (x, y, z)dV =
V
x
Z
r = v a k io
dV
=
V
Tämän muunnoksen Jacobin determinantti on
∂r x ∂φ x cos φ −r sin φ =
∂r y ∂φ y sin φ r cos φ = r
Siis saamme tuloksen dxdy = rdrdθ, ja
Z
Z
f (x, y)dxdy =
f rdrdφ
A′
Esim. Integroidaan f = r =
p
x2 + y 2 1-ympyrän alan
yli:
1. karteesisissa (x, y)-koordinaateissa:
Z 1 Z √1−x2 p
ei yksinkertainen!
dy x2 + y 2 = . . .
dx √
− 1−x2
0
2. napakoordinaatistossa:
Z 2π Z
dφ
0
1
0
=
=
Z
−∞
dθdrre
R2
2π
∞
0
−r 2
=
Z
2
1
− e−r = π
2
z2
2π
dθ
0
Z
Z
dz
z1
=
=
Z
1
dz
0
1
dz
0
1
0
Z
Z
1−z
dy
0
y2 (z)
dy
y1 (z)
Z
x2 (y,z)
dxf (x, y, z)
x1 (y,z)
drre−r
1−y−z
dx
0
dy(1 − y − z) =
0
Z
1
dz
0
1−z
1
(1 − z)y − y 2
2
0
1
1
dz[(1 − z)2 − (1 − z)2 ] =
2
6
Muuttujan vaihto: tapahtuu jälleen Jacobin
determinantin avulla, (x, y, z) → (u, v, t):
∂ u x ∂ v x ∂ t x
∂r dxdydz = | |dudvdt = ∂u y ∂v y ∂t y
∂u
∂ u z ∂ v z ∂ t z
dudvdt
Kaksi tärkeää erikoistapausta: sylinterikoordinaatisto ja
pallokoordinaatisto
8.2.4 Sylinterikoordinaatisto
Sylinterikoordinaatiston ρφz määrittelevät yhtälöt
x
y
z
R2
∞
Z
1−z
2π
drrr =
3
Helppoa! Kannattaa valita siis koordinaatisto ongelman
mukaan!
R∞
2
Esim. Mikä on I = −∞ e−x dx?Käytetään tässä
seuraava temppua ja muutetaan integraali
tasointegraaliksi:
Z
Z ∞
Z ∞
2
2
2
2
dye−y =
dxe−x
dxdye−(x +y )
I2 =
−∞
Z
Z
Kuva 8.7 Napakoordinaatisto
A
Z
(tai joku muu x, y, z-järjestys!). Jos f = 1, integraali
antaa suoraan alueen V tilavuuden. Tässä tilavuuden
differentiaali dV = dxdydz.
Esim. Määritellään tilavuus niin että x, y, z > 0, ja
x + y + z < 1 (tetraedri). Lasketaan tämän tilavuus. Nyt
kiinteällä z, 0 < z < 1, pätee 0 < y < 1 − z. Samoin
kiinteällä y, z 0 < x < 1 − y − z. Siis
f = v a k io
( x ,y )
f
Z
z
z
f
e
r = v a k io
z = v a k io
r
f
0
r
ρ cos φ
ρ sin φ
z.
r = v a k io
f = v a k io
e
z
z
2
=
=
=
e
r
f
f = v a k io
z = v a k io
r
y
x
Kuva 8.8 Sylinterikoordinaatisto
63
(8.6)
Kuten kuvasta nähdään, on ρ pisteen xy-tasolla olevan
projektion etäisyys origosta, φ tämän projektion
napakulma ja z pisteen korkeus xy-tasosta mitattuna.
Koordinaattikäyrät ovat
olevan projektion ja x-akselin välisenä atsimuuttikulmana
φ.
z
• ρ-käyrät: z-akselia vastaan kohtisuorat (= xy-tason
suuntaiset) ja sitä leikkaavat suorat.
r si
n q
yksikkövektorit nähdään suoraan
(8.7)
Kuvasta nähdään, että pallokoordinaateista rθφ
siirrytään karteesisiin koordinaatteihin kaavoilla
x
y
z
f
Siis: dV = ρdρdφdz.
Tämän näkee myös tutkimalla suoraan
tilavuuselementtiä:
r v a k io
f v a k io
Kuva 8.11 Pallokoordinaatiston
koordinaattikäyrät
Pallokoordinaatiston koordinaattikäyrät ovat
• r-käyrät: origon kautta kulkevat suorat.
Kuvasta nähdään, että sylinterikoordinaattien
differentiaalisia muutoksia dρ, dφ ja dz vastaa
tilavuuselementti
dV = ρ dρ dφ dz.
R
Esim. laske V f dV , kun V on sylinteri 0 ≤ z ≤ 1,
x2 + y 2 = ρ2 ≤ 1, ja f = ρ2 :
2π
dφ
0
r
q
x
tossa
V
r
q v a k io
f v a k io
f
Kuva 8.9 Tilavuuselementti sylinterikoordinaatis-
ρ2 dV =
(8.8)
y
r d f
Z
r sin θ cos φ
r sin θ sin φ
r cos θ.
d z
d V
Z
=
=
=
z
r v a k io
q v a k io
q
d f d r
r
rs
in
Kuva 8.10 Pallokoordinaatit
i cos φ + j sin φ
−i sin φ + j cos φ
k.
Sylinterikoordinaatistossa tilavuuden differentiaali antaa
Jacobin determinantin
cos φ −ρ sin φ 0 dV = dxdydz = | sin φ ρ cos φ 0 |dρdφdz = ρdρdφdz
0
0
1 z
q
r s in q s in f
x
y
f
co
s
f
• z-käyrät: z-akselin suuntaiset suorat.
r c o sq
• φ-käyrät: z-akselikeskeiset ja sitä vastaan kohtisuorat
ympyrät.
Sylinterikoordinaatiston
kuvasta:
eρ =
eφ =
ez =
r
q
Z
1
dz
0
Z
1
dρρρ2 =
0
• θ-käyrät: origokeskiset ympyrät, joiden halkaisijana
on z-akselin suuntaiset origokeskiset janat (= joiden
taso on kohtisuorassa xy-tasoa vastaan).
• φ-käyrät: z-akselikeskeiset ja sitä vastaan
kohtisuorassa olevat (= xy-tason suuntaiset)
ympyrät.
π
2
8.2.5 Pallokoordinaatisto
Pallokoordinaatistossa pisteen paikka ilmoitetaan
etäisyytenä r origosta, paikkavektorin ja z-akselin
välisenä korkeuskulmana θ sekä paikkavektorin xy-tasolla
Pallokoordinaatistossa Jacobin determinantti on
∂(x, y, z) 2
∂(r, θ, φ) = r sin θ
Siis nyt dV = r2 sin θdrdθdφ = r2 drd(cos θ)dφ.
64
R
Esim. Laske integraali V f dV , kun tilavuus V on
pallonkuori 1 ≤ r ≤ 2 ja f = 1/r2 :
Z 1
Z 2π Z π
Z
1
1
drr2 2 = 4π
dθ
sin
θ
dφ
dV
=
2
r
r
0
0
0
V
• Kantavektorit
Tässä siis
R
4π
dω =
= −i sin φ + j cos φ.
eφ
Usein merkitään kulmaosia yhdessä avaruuskulmalla Ω:
Z
Z
Z
dV =
dΩ drr2
V
= i sin θ cos φ + j sin θ sin φ + k cos θ
= i cos θ cos φ + j cos θ sin φ − k sin θ
er
eθ
• Gradientti
∇ψ = er
4π
R 2π
0
dφ
Rπ
eφ ∂ψ
∂ψ eθ ∂ψ
+
+
.
∂r
r ∂θ
r sin θ ∂φ
dθ sin θ
0
• Divergenssi
8.2.6 Nabla sylinteri- ja pallokoordinaatistoissa:
Samoin kuin integaaleja voidaan sylinteri- ja
pallokoordinaateissa, joskus on edullista laskea myös
differentiaaleja ko. koordinaateissa. Näiden osoittaminen
on varsin suoraviivaista mutta työlästä, joten annetaan
tässä vain tulokset:
∇·A
• Muunnoskaavat
=
=
ρ cos φ
ρ sin φ
z
=
z.
1 ∂
∂
1
r2 Ar +
(Aθ sin θ)
r2 ∂r
r sin θ ∂θ
1 ∂Aφ
.
+
r sin θ ∂φ
• Laplacen operaattori
∂
1 ∂
1
2 ∂ψ
2
2 ∂ψ
∇ ψ =
r
+ 2 2
sin θ
r2 ∂r
∂r
∂θ
r sin θ ∂θ
2
1
∂ ψ
.
+ 2 2
r sin θ ∂φ2
Sylinterikoordinaatisto
x
y
=
8.3 Pintaintegraali yli käyrän pinnan
• Kantavektorit
eρ
= i cos φ + j sin φ
eφ
ez
= −i sin φ + j cos φ
= k.
• Gradientti
∇ψ = eρ
∂ψ
1 ∂ψ
∂ψ
+ eφ
+ ez
.
∂ρ
ρ ∂φ
∂z
• Divergenssi
∇·A=
8.3.1 Skalaarifunktion integraalit
Olkoon φ(x, y, z) on jokin skalaarifunktio, A jokin
kolmiulotteisen avaruuden pinta ja dA tämän pinnan
infinitesimaalinen pinta-alkio. Tehtävänä on nyt laskea
pintaintegraali
Z
I=
Samalla tavoin kuin tavallisen yhden muuttujan
integraalinkin tapauksessa tämä tarkoittaa sitä, että
1. jaetaan pinta A pieniin ∆A suuruisiin palasiin,
1 ∂Aφ
∂Az
1 ∂
(ρAρ ) +
+
.
ρ ∂ρ
ρ ∂φ
∂z
2. lasketaan kussakin palasessa funktion φ(x, y, z) arvo
ja kerrotaan tämä palasen pinta-alalla ∆A,
• Laplacen operaattori
1 ∂
∂ψ
1 ∂2ψ ∂2ψ
2
+
.
∇ ψ=
ρ
+ 2
ρ ∂ρ
∂ρ
ρ ∂φ2
∂z 2
Pallokoordinaatisto
• Muunnoskaavat
x
=
r sin θ cos φ
y
z
=
=
r sin θ sin φ
r cos θ.
φ(x, y, z)dA.
A
3. summataan yhteen kaikki termit φ(x, y, z)∆A ja
4. annetaan palasten pinta-alan lähestyä nollaa.
Pintaintegraali on usein helpompi laskea palauttamalla se
koordinaattien yli suoritettaviksi integroinneiksi. Jos
esimerkiksi pinta A voidaan esittää muodossa z = f (x, y),
kannattaa yleensä integroida muuttujien x ja y yli, ts.
viedä integraali muotoon
Z y1 Z x1
φ(x, y, f (x, y))h(x, y)dx dy.
I=
y0
65
x0
Tässä h(x, y) on skaalaustekijä, jolla xy-tason pinta-alkio
dA0 = dx dy on kerrottava, jotta saataisiin pinnan alkio
dA. Integrointien rajat riippuvat pinnasta. Se,
kannattaako ensin integroida muuttujan x (kuten yo.
lausekkeessa) vai muuttujan y yli riippuu paitsi pinnasta
niin myös funktiosta φ.
k
z
g
n
d A
y
x
0
d y
g = 0.
Tällöin kaavassa (8.10) tarvittavat osittaisderivaatat ovat
∂f ∂g
∂f
∂g
∂g
=
,
=
ja
=1
∂x
∂x ∂y
∂y
∂z
ja pintaelementin skaalaustekijä vastaavasti
s 2
2
∂f
∂f
1
+
+ 1.
= |∇g| =
cos γ
∂x
∂y
A
d A
pinnan yhtälö on
d x
Kuva 8.12 Pintaintegraali
Kuten kuvasta nähdään, xy-tason pinta-alkiota dA0 ja
sitä pinnalla A vastaavaa alkiota sitoo toisiinsa relaatio
dA0 = dx dy = dA cos γ,
(8.9)
missä γ on pinnan normaalin n ja z-akselin välinen
kulma. Tässä tapauksessa pintaintegraali on siis
kirjoitettavissa muotoon
Z
Z
dx dy
I=
φ dA = φ(x, y, z)
.
cos γ
A
Pinta-integraali I on nyt
s 2
Z
2
∂f
∂f
I = φ(x, y, f (x, y))
+
+ 1dx dy.
∂x
∂y
(8.11)
Esim. Funktion φ = z integraali puolipallon
x2 + y 2 + z 2 = R2 , z ≥ 0 pinnan yli
Nyt
p
z = R2 − x2 − y 2 = f (x, y),
jolloin
Oletetaan nyt, että pinnan A yhtälö on annettu muodossa
Kyseessä on siis skalaarikentän g eräs tasa-arvopinta.
Kuten gradientin yhteydessä näimme, on skalaarin
gradientti kohtisuorassa tasa-arvopintaa vastaan. Eräs
pinnan A normaali on niin ollen ∇g ja normaalin
suuntainen yksikkövektori silloin
∇g
.
|∇g|
∂f
∂y
=
1
cos2 γ
−p
−p
x
R2
− x2 − y 2
y
R 2 − x2 − y 2
2 2
∂f
∂f
+
∂x
∂y
2
2
x +y
= 1+ 2
R − x2 − y 2
R2
.
=
2
R − x2 − y 2
= 1+
Integrointialueena xy-tasossa on puolipallon pinnan
projektio eli kehän
Tämän projektio z-akselille on
n · k = cos γ =
=
ja
g(x, y, z) = C.
n=
∂f
∂x
∂g
∂z
|∇g|
x2 + y 2 = R 2 ; z = 0
.
Pintaintegraalimme on nyt kirjoitettavissa muotoon
Z
|∇g|
I = φ(x, y, z) ∂g dx dy.
(8.10)
rajoittama ympyrä. xy-tason integraali kannattaa tehdä
nyt napakoordinaatteja käyttäen: ρ2 = x2 + y 2 :
I
=
∂z
Jos pinta A on annettu muodossa
=
z = f (x, y),
=
niin asettamalla
g = z − f (x, y)
66
2π
R
1
dρρz
cos
γ
0
0
A
s
Z R
p
R2
dρρ R2 − ρ2
2π
2
R − ρ2
0
Z
φdA =
Z
dφ
R
1
2π / R ρ2 = πR3
2
0
Z
8.3.2 Vuointegraalit: vektoreiden pintaintegraalit
Tavallisin tapaus pintaintegraaleista on laskea
vektorikentän vuo pinnan läpi: Tarkastellaan pintaa A ja
sillä pisteessä P (x, y, z) olevaa pinta-alkiota dA.
Määritellään vektoriaalinen pinta-alkio dA siten, että
dA = n dA,
eli radiusvektorin suuntainen yksikkövektori.
Edelleen
∇ × F · dA = 2k · n dA = 2 cos θ dA,
missä θ on radiusvektorin ja z-akselin välinen kulma.
z
missä n on pisteessä P laskettu pinnan normaalin
suuntainen yksikkövektori. Olkoon F(x, y, z) jokin
(integroituva) vektorikenttä. Eräs vektorikentän F
pintaintegraali on
Z
Z
F · dA =
F · n dA.
(8.12)
A
r s in q
d f
r
q
A
Tämä integraali kuvaa vektorin F vuota pinnan A läpi.
Huom: jos kyseessä on suljettu pinta, integraalia
merkitään
I
A
F · dA.
Jos pinta ei ole suljettu, sillä on luonnollisesti reunaviiva.
Esim. Nesteen virtaus
Jos ρ on nesteen tiheys ja v sen nopeus, niin
r d q
d A
r s in q d f
d q
Kuva 8.13 Pintaelementti pallolla
Kuvassa φ radiusvektorin xy-tasolla olevan projektion ja
x-akselin välinen kulma. Kuten kuvasta nähdään, pallon
pinnalla pallokoordinaattien θ ja φ differentiaalisia
muutoksia dθ ja dφ vastaava pintaelementti dA on
dA = r2 sin θ dθ dφ.
(8.13)
ρv · dA = ρv · n dA
on pintaelementin dA läpi aikayksikössä kulkevan
nesteen
R
määrä. Vektorin µ = ρv vuo pinnan A läpi, A µ · dA, on
aikayksikössä pinnan A läpi kulkevan nesteen määrä.
Muunlaisia pintaintegraaleja ovat esim.
Z
Z
Z
Z
F × dA =
F × n dA;
φ dA;
φ dA.
A
A
A
A
Esim. Radiaalikenttä pallokuoren yli:
Olkoon v = rf (r), ja pallonkuori |r|2 = r2 = R2 . Nyt
n = r/r, ja
I
I
I
dA = 4πR3 f (R)
f (R)r·r/RdA = f (R)R
v·dA =
A
Puolipallon pinnalla kulmat θ ja φ saavat arvot
=
=
2
missä käytettiin
tietoa pallon ala = 4πR .
R
Esim. I = A (∇ × F) · dA, kun F = −yi + xj + zk, ja A
on puolipallon x2 + y 2 + z 2 = R2 ; z ≥ 0 pinta
Nyt
i
j
k ∂
∂
∂ ∇ × F = ∂x ∂y
∂z = 2k.
−y x
z Pinnan A yhtälö on
g = x2 + y 2 + z 2 = R 2 ,
joten
∇g = 2xi + 2yj + 2zk = 2r.
Pallopinnan A yksikkönormaali n on siis
∇g
r
xi + yj + zk
n=
= =
,
|∇g|
r
r
θ
0≤
φ
π
2
≤ 2π.
≤
Integraali I on siis
Z
I =
∇ × F · n dA
A
A
0≤
=
Z
A
π/2
dθ
0
4πR2
4πR2
Z
Z
2π
dφ 2 cos θ R2 sin θ
0
π/2
0
π/2
cos θ sin θ dθ
sin2 θ
= 2πR2 .
2
0
8.4 Gaussin lause
Edellä laskettiin vektorikentän v = rf (r) vuo R-säteisen
pallon pinnan läpi, tuloksella
I
v · dA = 4πR3 f (R)
A
Lasketaan nyt ∇ · v integroituna pallon tilavuuden yli: nyt
∇·v = ∇·(rf (r)) = f (r)∇·r +r·f ′ (r)∇r = 3f (r)+rf ′ (r)
67
Siis
Z
Z
Z
∇·vdV = dΩ
V
R
drr2 (3f (r)+rf ′ (r)) = 4π
0
Z
R
alapinnalla:
dr∂r (r3 f (r)) = 4πR3 f (R)
joten
Z
(8.14)
V
missä A on alueen V pinta. Tämä tulos pätee yleisesti,
kaikille vektorikentille ja tilavuuksille, ja sitä sanotaan
Gaussin laiksi: vektorin v normaalikomponentin integraali
yli suljetun pinnan on sama kuin sen divergenssin
integraali pinnan sulkeman tilavuuden yli.
Toisin: kentän v vuo suljetun pinnan läpi = kentän v
lähteet pinnan sisällä!
Gaussin laki on 3-ulotteinen yleistys 1-ulotteisia
integraaleja koskevalle totuudelle
Z
b
a
[Fz (x, y, f2 ) − Fz (x, y, f1 )] dxdy
R
=
=
Z
Z
Fz k · n2 dA2 +
A2
Fz k · n dA.
∂Fz
dV =
∂z
V
ZZZ
Z ZV Z
∂Fy
dV
∂y
=
∂Fx
dV
∂x
=
Z
Z
Fy j · n dA
A
Fx i · n dA,
A
joten kaiken kaikkiaan on
ZZZ
ZZZ ∂Fz
dV.
∂z
∂Fx
∂Fy
∂Fz
+
+
∂x
∂y
∂z
V
V
=
2
eli
2
ZZZ
Z
dV
Fx i + Fy j + Fz k · n dA,
A
∇ · F dV =
V
Z
F · n dA =
A
Z
F · dA.
A
1
Esim. Vektorin r vuo a-säteisen ja h-korkuisen sylinterin
pinnan läpi
Olkoon A sylinteriä rajoittava pinta (mukaan lukien
pohjat) ja V sylinterin tilavuus.
z
1
d y
Fz k · n dA.
A
V
ja tarkastellaan integraalia
A
Z
Vastaavasti voidaan osoittaa, että
F = Fx i + Fy j + Fz k,
n
Fz k · n1 dA1
A1
A
ZZZ
df
dx = f (b) − f (a)
dx
A
Z
Saamme siis
Gaussin lauseen tarkempi todistus
Kirjoitetaan vektori F komponenteittain:
n
dxdy = −k · n1 dA1
dxdy = k · n2 dA2
dxdy = k · n dA,
yläpinnalla:
pinnalla:
0
Saimme siis tuloksen
I
Z
v · dA =
∇ · vdV
A
Olkoon n pinnan A yksikkönormaali, n1 alapinnan A1
yksikkönormaali ja n2 yläpinnan A2 yksikkönormaali. Nyt
d x R
Kuva 8.14 Gaussin lauseen todistus
Olkoot A1 ja A2 tilavuutta V ympäröivän suljetun pinnan A alaja yläpinta, joita esittävät yhtälöt
A1
:
z = f1 (x, y)
A2
:
z = f2 (x, y).
a
Olkoon R pinnan A (tai A1 tai A2 ) projektio xy-tasolla.
Tällöin
ZZZ
∂Fz
dV
∂z
=
ZZZ
∂Fz
dzdxdy
∂z
f2 (x,y)
=
Z Z
R
=
Z
R
y
x
Kuva 8.15 Sylinteri
V
V
h
f1 (x,y)
∂Fz
dz
∂z
dxdy
[Fz (x, y, f2 ) − Fz (x, y, f1 )] dxdy
a) Divergenssilauseen perusteella vuo I on
Z
Z
I=
r · dA =
∇ · r dV.
A
68
V
Koska
jolloin
r = xi + yj + zk,
on
∂x ∂y ∂z
+
+
= 3,
∂x ∂y ∂z
∇·r=
joten
I=3
Z
∇ · K = −∇2 φ = −4πGρ.
dV = 3V = 3πa h.
yläpinta
r · n dA =
Z
h dA = πa2 h.
(ii) Pohjalla n = −k ja
r · n = −z = 0,
joten
Z
V
∇ · K dV
pohja
n=
xi + yj
,
a
ρ dV
V
−4πGM.
V
A
kun A on tilavuutta V rajoittava pinta.
Oletetaan, että M -massainen kappale on
pallosymmetrinen ja otetaan tilavuudeksi V ko. kappaleen
sisäänsä sulkeva r-säteinen kappalekeskinen pallo. Tällöin
ilmeisestikin |K| on vakio pallon pinnalla ja K on
radiusvektorin suuntainen (tai vastakkaissuuntainen), ts.
voidaan kirjoittaa
K = K(r)er ,
missä er on radiusvektorin suuntainen yksikkövektori.
Vektori er on tietystikin myös yksikkönormaali ko. pallon
pinnalla, joten
Z
sillä vaipan yhtälö on
f = x 2 + y 2 = a2 ,
r-säteinen pallo
K · dA
=
=
ja niin ollen vektori
=
∇f = 2xi + 2yj
Z
Toisaalta Gaussin lauseen mukaan on
Z
Z
∇ · K dV =
K · dA,
r · n dA = 0.
(iii) Vaipalla yksikkönormaali on
−4πG
=
=
V
r · n = r · k = z = h,
Z
Z
2
b) Lasketaan vuo pintaintegraalina.
(i) Yläpinnalla n = k ja
joten
Jos tilavuudessa V oleva kokonaismassa on M , niin
Z
K(r)er · er dA
Z
K(r) dA = K(r) · 4πr2
−4πGM.
Saamme siis tutun Newtonin gravitaatiolain
on kohtisuorassa vaippaa vastaan. Nyt
K(r) = −
x2 + y 2
a2
r·n=
=
= a,
a
a
joten
GM
,
r2
tai vektoriaalisesti
Z
vaippa
r · n dA = a
Z
dA = a · 2πah.
K(r) = −
GM
er .
r2
Laskemalla kaikki vuot yhteen saadaan
I = 3πa2 h.
Esim. Newtonin gravitaatiopotentiaali φ toteuttaa
yhtälön
∇2 φ = 4πGρ,
8.5 Stokesin lause
Roottorin fysikaalista tulkintaa etsiessämme saimme
tuloksen (7.18), jonka mukaan xy-tasossa pisteen (x, y)
ympäri kiertyvä virtaus oli
missä G on gravitaatiovakio ja ρ massatiheys.
Määritetään gravitaatiokenttävoimakkuus
pallosymmetrisessä tapauksessa
Merkitään
K = −∇φ,
dSz
=
=
69
µx (x, y − dy/2, z)dx + µy (x + dx/2, y, z)dy
−µx (x, y + dy/2, z)dx − µy (x − dx/2, y, z)dy
∂µy
∂µx
dx dy.
−
∂x
∂y
Summassa (8.16) yhteisiin reunoihin liittyvät termit
kumoutuvat, joten jäljelle jäävät vain alueen A reunoihin
rajoittuvien pinta-alkioiden ulkoreunat eli
X
X
(∇ × F) · dAi =
F · dr.
d x
y
3
4
2
d y
d A
i
1
x
Kuva 8.16 xy-tason pinta-alkio
Kuvan mukaisesti voimme kirjoittaa tämän muotoon
4
X
i=1
µ · dri = (∇ × µ)z dx dy,
missä vektoriaaliset differentiaalit ovat dr1 = dx i,
dr2 = dy j, dr3 = −dx i sekä dr4 = −dy j ja virtatiheys on
laskettava aina vastaavalla infinitesimaalisen suorakaiteen
sivulla. Yhtälön oikeakin puoli on lausuttavissa
kompaktimmin, kun otamme käyttöön vektoriaalisen
pinta-alkion dA = dx dy k. Näin päädymme relaatioon
4
X
i=1
µ · dr = (∇ × µ) · dA,
missä nyt sekä dr että µ on laskettava summausindeksiin
liittyvällä suorakaiteen sivulla. Tämä yhtälö on toki
voimassa mielivaltaisellekin (differentioituvalle)
vektorikentälle F ja miten tahansa orientoituneelle
pintaelementille dA:
4
X
i=1
F · dr = (∇ × F) · dA,
(8.15)
missä vasemmalla puolen kierretään dA vastapäivään.
Tarkastellaan nyt mielivaltaista pintaa A. Jaetaan A
infinitesimaalisiin palasiin dAi . Kussakin pinta-alkiossa on
voimassa
4
X
F · dr,
(∇ × F) · dAi =
A:n ulkoreuna
Yhtälön vasen puoli on suureen ∇ × F pintaintegraali yli
pinnan A ja oikea puoli viivaintegraali pintaa A
rajoittavan reunakäyrän C ympäri. Koska jokainen
pinta-elementti yhtälön (8.15) ja kuvan 8.16 mukaisesti
kierrettiin positiiviiseen kiertosuuntaan, samaan suuntaan
kierretään myös pinta A. Olemme näin päätyneet
Stokesin lauseena tunnettuun pinta- ja viivaintegraaleja
sitovaan relaatioon
I
Z
F · dr = (∇ × F) · dA.
(8.17)
C
A
Sanallisesti Stokesin lause on ilmaistavissa muodossa
Vektorikentän F viivaintegraali pinnan A reunakäyrän C
ympäri on sama kuin kentän F roottorin
normaalikomponentin pintaintegraali pinnan A yli.
Huom. Integraalin arvo ei muutu sellaisissa
integrointipinnan deformaatioissa, joissa reunakäyrä
säilyy muuttumattomana.
R
Esim. A ∇ × F · dA kun F = −yi + xj + zk ja A on
puolipallon x2 + y 2 + z 2 = a2 ; z ≥ 0 pinta
1) Suoraan pintaintegraalina. Katso edellä
(pintaintegraalit).
2) Viivaintegraalina Stokesin lausetta soveltaen. Nyt
F · dr
=
=
(−yi + xj + zk) · (dx i + dy j + dz k)
−y dx + x dy + z dz.
Puolipallon pinnan A reunakäyrä C on xy-tason ympyrä
x2 + y 2 = a2 ; z = 0.
Tällä käyrällä
x
y
z
j=1
missä vasemmalla puolen roottori lasketaan alueen dAi
keskipisteessä ja oikealla puolen seka F että differentiaalit
alueen dAi summausindeksistä j riippuvalla reunalla.
Summataan yli kaikkien palasten, jolloin
X
i
(∇ × F) · dAi =
4
XX
i
j=1
F · dr.
=
=
=
a cos θ
a sin θ
0,
kun θ on vektorin r = (x, y, 0) ja x-akselin välinen kulma.
Tällöin
dx
dy
dz
(8.16)
= −a sin θ dθ
= a cos θ dθ
= 0,
joten käyrällä C
Tarkastellaan kahta vierekkäistä pinta-alkiota, sanotaan
alkioita 1 ja 2. Näiden yhteisellä reunalla toisen
suorakaiteen dr on vastakkainen toisen suorakaiteen
vastaavalle differentiaalille kun taas kenttä F on sama.
F · dr
70
=
=
=
−y dx + x dy
a2 sin2 θ dθ + a2 cos2 θ dθ
a2 dθ.
Stokesin lauseen mukaan on
Z
I
Z
(∇ × F) · dA =
F · dr =
A
C
=
2π
a2 dθ
0
2πa2 .
3) Pintaintegraali on sama mille tahansa käyrän C
rajoittamalle pinnalle. Valitaan xy-tason ympyrä. Koska
∇ × F = 2k,
on
Z
x2 +y 2 ≤a2
(∇ × F) · dA
=
=
Z
2k · k dA
x2 +y 2 ≤a2
2
2A = 2πa .
Stokesin lauseen perusteella pyörteettömälle kentälle F on
voimassa
I
Z
F · dr = (∇ × F) · dA = 0,
C
A
olipa C mikä tahansa suljettu käyrä ja A sen sisäänsä
sulkema pinta. Tähän tulokseen päädyimme jo
viivaintegraalien yhteydessä konservatiivisia
vektorikenttiä tarkastellessamme (ks. kaava (8.4).
71
9. Lineaarikuvaukset, matriisit
9.1 Vektoriavaruudet
Aiemmin olemmme puhuneet tason (R2 ) ja kotiavaruuden
(R3 ) vektoreista. Nämä (kuten myös pelkkä R) ovat
esimerkkejä reaalisista vektoriavaruuksista.
Yleisesti vektoriavaruudet ovat joukkoja V joille on
määritelty
1. Yhteenlasku: x + y ∈ V , jos x ja y ∈ V .
2. Skalaarilla kertominen: ax ∈ V , jos x ∈ V ja a ∈ R.
Vektoriavaruus sisältää yksikäsitteisen nollavektorin:
 ∈ V siten, että x +  = x.
Lisäksi jokaisella alkiolla x ∈ V on vastavektori −x ∈ V :
x + (−x) = .
Erilaiset vektoriavaruudet ovat matematiikassa ja
fysiikassa hyvin yleisiä. Rn :n lisäksi usein puhutaan
funktionaalisista avaruuksista, esim. asteluvun n
polynomit muodostavat n P
+ 1-ulotteisen
n
vektoriavaruuden: p(x) = i=0 ai xi (polynomeja voidaan
laskea yhteen ja kertoa skalaarilla, ja tuloksena on edellen
polynomi).
Vektoriavaruuden V aliavaruus S on sellainen V :n
alijoukko S, että:
jos x, y ∈ S ja a ∈ R, niin
x + y ∈ S ja
ax ∈ S
Esim. R3 :n aliavaruuksia ovat esim. kaikki origon kautta
kulkevat suorat ja tasot. Myös {} ja R3 ovat R3 :n
aliavaruuksia. Sen sijaan esim. R3 :n yksikkövektorien
joukko (|x| = 1) ei ole aliavaruus.
Vektoriavaruuksissa Rn on määritelty muitakin
laskusääntöjä, esim. vektorien pistetulo x · y. Oletetaan
jatkossa että pistetulo on määritelty.
Lineaarinen riippumattomuus
Muistetaan, että vektorit v1 . . . vk ovat lineaarisesti
riippumattomia (eli vapaita), jos
k
X
Huom: ylläolevan kaltainen lineaarikombinaatio
vektoreista on niin yleinen, että siitä usein käytetään
oikeanpuoleista merkintätapaa: toistuvan indeksin yli
summataan automaattisesti (implisiittisesti). Einsteinin
summaussääntö.
Sanotaan että vektorit ei muodostavat V :n kannan, ja
ai :t ovat v:n komponentit tässä kannassa.
Kanta ei ole yksikäsitteinen. Yksinkertaisin kanta on
ortonormaali kanta:
ei · ej = δij =
1,
0,
jos i = j
jos i =
6 j
Tässä δij on nimeltään Kroneckerin delta. Siis
ortonormaalit vektorit ovat kohtisuorassa toisiaan vastaan
ja niiden pituus |~ei | = 1.
Ortonormaalissa kannassa kahden vektorin a, b pistetulo
on
n
n
n
X
X
X
a i bj
bj e j =
ai e i ·
a·b=
i=1
j=1
i=1
Tai lyhyemmin: a · b = ai bi .
Tutuin esimerkki ortonormaalista kannasta on R3 :n kanta
i, j, k.
Palaamme myöhemmin siihen miten ei-ortonormaalista
kannasta voidaan tehdä ortonormaali.
Huom: ortonormitetussa kannassa
X
X
ej · a =
ai ej · ei =
ai δij = aj
i
i
eli
ai = a · ei
Kertoimet ai siis ilmaisevat vektorin a projektion ei
suuntaan.
9.2 Lineaarikuvaus
ai v i = 0
i=1
vain jos kaikki a1 = a2 = . . . = ak = 0. Muussa
tapauksessa vektorit ovat lineaarisesti riippuvia, ja
ainakin yksi vektori voidaan lausua muiden
lineaarikombinaationa.
n-ulotteisessa vektoriavaruudessa voidaan valita enintään
n:n keskenään lineaarisesti riippumattoman vektorin
joukko. Kolmiulotteisessa avaruudessa on enintään 3
vektorin joukko keskenään lineaarisesti riippumaton.
Jos vektorit e1 , e2 . . . en ovat lineaarisesti riippumattomia
n-ulotteisen vektoriavaruuden V alkioita, sanotaan että
ne virittävät V :n: mikä tahansa v ∈ V voidaan esittää
niiden lineaarikombinaatioina:
n
X
ai ei ≡ ai ei
v=
i=1
Olkoon A kuvaus (funktio) vektoriavaruudesta V
vektoriavaruuteen U : jos nyt
A(x + y) = A(x) + A(y),
A(αx) = αA(x)
kaikilla x, y ∈ V ja α ∈ R, niin A on lineaarikuvaus.
Esim. Kuvaus A : R → R, A(x) = cx, c vakio, on
lineaarikuvaus:
A(x + y) = c(x + y) = cx + cy = A(x) + A(y)
A(αx) = cαx = αA(x)
Esim. Kuvaus B : R → R, B(x) = cx + d, d 6= 0, ei ole
lineaarinen (HT).
Lineaarikuvaukset ovat hyvin rajoitettu funktiojoukko, ja
pelkästään R:n kuvauksina ne ole kovinkaan
mielenkiintoisia (tavallisin sovellus: yleisen funktion f (x)
approksimaatio lineaarisesti). Useampiulotteisissa
avaruuksissa sen sijaan niillä on paljon käyttöä!
72
9.2.1 Tason kuvaus itselleen
Tarkastellaan tason vektorien lineaarikuvausta A, joka
muuttaa tason vektorin v = (x, y) toiseksi tason
vektoriksi v′ = (x′ , y ′ ): A(v) = v′ , tai
′
x = a11 x + a12 y
y ′ = a21 x + a22 y
Tässä aij ovat lukuja, jotka määrittelevät A:n. Kyseessä
on todellakin lineaarikuvaus (HT):
A(v1 + v2 ) = A(v1 ) + A(v2 )
A(αv) = αA(v)
On kätevää ottaa käyttöön pystyvektorit ja matriisit:
Merkitään nyt
′ x
x
v=
v′ =
y′
y
ja
A=
a11
a21
a12
a22
a12
·
x
y
=
0 0
···
1
eli Iij = δij . Se kuvaa vektorin itselleen: Ix = x
nollamatriisi:


0 ··· 0
 0 ··· 0 


0= .

 ..

0 ···
0
mikä kuvaa kaikki vektorit nollavektoreiksi: 0x = .
Tässä notaatiossa merkitään
′ a11 a12
x
x
a11 x + a12 y
=
=
a21 a22
y′
y
a21 x + a22 y
Siis esimerkiksi
′ a11
x
=
·′
·
Tässä siis A:n on oltava m vaakariviä ja n pystyriviä,
jotta lasku yllä voidaan tehdä! A on siis m × n -matriisi.
Jos m = n, on A neliömatriisi
Erikoisasemassa ovat yksikkömatriisi (neliömatriisi)


1 0 ··· 0
 0 1 ··· 0 


I= .

 ..

a11 x + a12 y
·
Siis: tulosvektorin rivi k lasketaan siten, että kerrotaan
matriisin rivin k alkiot elementti elementiltä alkuperäisen
vektorin elementeillä, ja lasketaan yhteen.
Vielä systemaattisemmin: merkitään
′ v1
v1
v=
v′ =
v2
v2′
Rotaatio tasossa
Tärkeä tason lineaarikuvaus on rotaatio: vektorien kierto
kulman θ verran origon suhteen positiiviseen suuntaan.
Matriiseina
′ cos θx − sin θy
x
cos θ − sin θ
x
=
=
sin θx + cos θy
y
sin θ
cos θ
y′
eli x′ = R(θ)x.
Rotaatio kääntää vektoria muuttamatta sen pituutta:
|x′ | = |x|, kuten helposti nähdään.
Vektorien väliset kulmat säilyvät rotaatioissa (pituuden
lisäksi): jos x ja y ovat kaksi vektoria, niin
(R(θ)x) · (R(θ)y) = x · y
kuten suoraviivaisesti nähdään laskemalla.
Standardikannan kuvautuminen
Nyt
v1′
v2′
=
a11
a21
a12
a22
v1
v2
tai lyhyesti ja ytimekkäästi
X
vi′ =
aij vj = aij vj
Rn :n standardikanta e1 . . . en on sellainen jossa


0
 .. 
 . 



k:s rivi
ek = 
 1 
 . 
.
 . 
0
j
Yleinen lineaarikuvaus Rn → Rm
Kuvaus A : Rn → Rm voidaan myös esittää
matriisimuodossa: jos y ∈ Rm ja x ∈ Rn , niin
y = Ax ⇔ yi =
eli eksplisiittisesti

 
a11
y1
 y2   a21

 
 ..  =  ..
 .   .
am1
ym
n
X
j=1
eli (ek )i = δki (vektorin ek elementti i).
Se kuvautuu lineaarikuvauksessa A seuraavasti:
X
X
(Aek )i =
aij (ek )j =
aij δkj = aik
aij xj , 1 ≤ j ≤ m
j
a12
a22
···
···
a1n
a2n
..
.
am2
···
amn





x1
x2
..
.
xn

eli




j



Aek = 

73
a1k
a2k
..
.
ank





Tuloksena on siis A:n pystyrivin k alkioista muodostuva
vektori.
Kääntäen, jos tunnemme kuinka standardikanta kuvautuu
lineaarikuvauksessa A, saamme A:n matriisiesityksen. Siis
jos tiedämme, että
Aek = fk ,
täytyy olla

(f1 )1
 (f1 )2

A=
..

.
(f1 )n
(f2 )1
(f2 )2
···
···
(fn )1
(fn )2
..
.
(f2 )n
···
(fn )n



 = (f1 , f2 , · · · , fn )

Eli: tulomatriisin elementti ij, (AB)ij , saadaan
kertomalla A:n i:s vaakarivi ja B:n j:s pystyrivi alkio
alkiolta keskenään ja laskemalla yhteen.
Tämä on helppo näyttää tutkimalla mielivaltaisen
vektorin v ∈ Rn kuvausta:
(ABv)i = (A(Bv))i = Aij (Bv)j = Aij Bjk vk
ja toisaalta (ABv)i = (AB)ik vk .
Huom: matriiseille ei yleensä päde AB = BA! Sanotaan
että matriisitulo ei kommutoi.
Huom: Jos B on m × 1-matriisi, matriisitulo AB palautuu
matriisin ja vektorin tuloksi. Siis vektori = matriisi, jossa
on vain yksi pystyrivi.
Esim. Olkoon lineaarikuvaukset A : R3 → R2 ja
B : R2 → R3 , ja niiden matriisiesitykset


1 1
0 1 0
A=
, B= 0 2 
1 0 1
1 0
missä viimeinen merkintätapa tarkoittaa että kyseessä on
vektoreista fi koottu matriisi.
Esim. Etsi R3 :n lineaarikuvauksen matriisi, joka vie
standardikannan i, j, k vektoreiksi


 
 
0
1
1
Ai =  1  ≡ f1 , Aj =  0  ≡ f2 , Ak =  0  ≡ f3
Nyt
1
1
0
Edellisen mukaan siis on oltava


1 1 0
A =  1 0 0  = (f1 , f2 , f3 )
0 1 1
9.3 Kuvausten yhdistäminen: matriisien
kertolasku
Kuten yhdistetyissä funktioissa yleensä, matriiseilla
voidaan myös tehdä yhdistetty kuvaus: olkoon
lineaarikuvaukset
A : Rs → Rm ja
B : Rn → Rs
Nyt yhdistetty kuvaus AB : Rn → Rm on lineaarikuvaus.
Kuvauksen AB matriisi on A:n m × s -matriisin ja B:n
s × n-matriisin matriisitulo. Sen saamme
(AB)ij =
s
X
Aik Bkj = Aik Bkj
k=1
Huom: B:ssä on oltava sama määrä vaakarivejä kuin
A:ssa on pystyrivejä (s), muuten matriisituloa ei ole
määritelty!
Siis


·
·
·
 · (AB)ij ·  =
·
·
·


· B1j ·


·
·
·
·
 · B2j · 

 Ai1 Ai2 · · · Ais  


..
 ·
.
· 
·
·
·
·
· Bsj ·
AB
=
=
=
0 1
1 0
0
1

1 1
 0 2 
1 0

0·1+1·0+0·1
1·1+0·0+1·1
0 2
2 1
0·1+1·2+0·0
1·1+0·2+1·0
on kuvaus R2 → R2 ja

1 1
BA =  2 0
0 1

1
2 
0
on kuvaus R3 → R3 .
Sen sijaan tulot AA tai BB eivät ole määriteltyjä,
johtuen siitä että A ja B eivät ole neliömatriiseja.
Esim. Rotaatioiden yhdistäminen
Rotaatiomatriisi tasossa oli
cos θ − sin θ
R(θ) =
sin θ
cos θ
Jos teemme peräkkäin kaksi rotaatiota, niin matriisituloa
ja sinin ja kosinin laskusääntöjä käyttäen saamme (HT)
R(θ2 )R(θ1 ) = R(θ1 + θ2 )
9.4 Matriisilaskentoa
Matriiseille (ja niiden määrittämille lineaarikuvauksille)
on määritelty
Yhteenlasku: (A + B)ij = Aij + Bij . Tässä A:n ja B:n
täytyy olla samankokoisia (m × n) matriiseja.
74
Skalaarilla kertominen: (λA)ij = λAij .
Matriisien kertolasku: (AB)ij = Aik Bkj , missä A on n × r
ja B on r × m matriisi. Jos m 6= n, tule BA ei ole
määritelty.
Diagonaalimatriisi: neliömatriisia A sanotaan
diagonaaliseksi, jos se on muotoa



A=

A11
0
..
.
0
A22
···
···
0
0
0
0
···
Ann





Jos kaikki A11 = A22 = . . . = λ, voidaan A kirjoittaa
muotoon A = λI missä I on yksikkömatriisi Iij = δij .
Jos A on neliömatriisi, niin AI = IA = A.
Transpoosi AT
Kaikille matriiseille A voidaan määritellä transpoosi AT .
Sen elementit ovat
T
(A )ij = Aji
(joskus merkitään AT = Ã). Siis vaakarivit käännetään
pystyriveiksi ja päinvastoin.
Esim.
A=
1 2
4 5
3
6


1 4
⇒ AT =  2 5 
3 6
Jos A on n × m-matriisi, on AT m × n -matriisi.
Transpoosille on voimassa seuraava tärkeä tulos:
T
T
(ilman lihavointia x, kompaktiuden vuoksi). Tämä on siis
n × 1 -matriisi. Transponoimalla saamme vaakavektorin
xT = (x1 x2 · · · xn )
(1 × n -matriisi!)
Jos nyt x ja y ovat Rn :n (pysty)vektoreita, niin


x1


y T x = (y1 · · · yn )  ...  = yi xi = y · x
xn
y T x antaa siis vektoreiden pistetulon.
Jos taas kerrotaan pystyvektorilla vaakavektori, saadaan
matriisi:




x 1 y1 · · · x 1 yn
x1



.. 
..
xy T =  ...  (y1 · · · yn ) = 
. 
.
Todistus: nyt
[(AB)T ]ij = (AB)ji = Ajk Bki
Toisaalta
(B T AT )ij = (B T )ik (AT )kj = Bki Ajk = Ajk Bki .
Huom: viimeisessä vaiheessa järjestys voidaan vaihtaa,
sillä Ajk , Bki ovat pelkkiä lukuja (matriisin elementtejä),
eivät matriiseja! Yleensä matriisien järjestystä ei voida
vaihtaa.
Olkoon A neliömatriisi. Silloin A on
symmetrinen, jos AT = A eli Aij = Aji . (samat elementit
symmetrisesti diagonaalin molemmin puolin!)
antisymmetrinen, jos AT = −A eli Aij = −Aji .
Antisymmetristen matriisien diagonaalielementit
häviävät, ts. Aii = −Aii = 0.
Useimmat matriisit eivät ole symmetrisiä eivätkä
antisymmetrisiä.
Ilmeisesti pätee:
x n y1
xn
···
x n yn
tai (xy T )ij = xi yj .
Esim. Tason rotaatioille pätee RT R = I, mikä nähdään
suoraan laskemalla. Sen saa myös siitä että rotaatiot
säilyttävät pistetulon:
y T x = (Ry)T (Rx) = y T RT Rx ⇒ RT R = I
T
(AB) = B A
(AT )T = A,
vektorit: Otetaan nyt käyttöön merkintätapa Rn :n
pystyvektoreille


x1
 x2 


x= . 
 .. 
xn
Tässä tapauksessa sanotaan että RT on R:n
käänteismatriisi.
Konjugaatti A∗
Yleistetään lineaarikuvaukset kompleksisiin avaruuksiin,
ts. olkoon A : C n → C m . Nyt A:ta voidaan kuvata
matriisilla jonka elementit ovat kompleksilukuja. Tälle
matriisille ovat voimassa kaikki samat tulokset kuin yllä
reaaliselle matriisillekin.
Matriisin A konjugaatti A∗ on matriisi jonka kaikki
elementit ovat A:n elementtien kompleksikonjugaatteja:
(A∗ )ij = A∗ij
Jos pätee A∗ = A, matriisi on reaalimatriisi.
Hermiittinen konjugaatti A†
Hermiittinen konjugointi on transpoosin ja konjugoinnin
yhdistelmä:
A† = (A∗ )T = (AT )∗ ,
(A + B)T = AT + B T
75
(A† )ij = (Aji )∗
A on hermiittinen, jos A† = A, ja antihermiittinen, jos
A† = −A.
Ominaisuuksia:
(A† )† = A,
(A + B)† = A† + B † ,
(AB)† = B † A†
Esim. Paulin spinmatriisit
σ1 =
0
1
1
0
, σ2 =
0
i
−i
0
, σ3 =
1
0
0
−1
σ1 ja σ3 ovat symmetrisiä: σ1T = σ1 , σ3T = σ3 .
σ2 on antisymmetrinen: σ2T = −σ2 .
σ1 ja σ3 ovat reaalimatriiseja: σ1∗ = σ1
Kaikki σi ovat hermiittisiä, esim. σ2† = σ2 .
Jos x, y ∈ C n eli ovat n-komponenttisia
kompleksivektoreita, niin niiden sisätulo (eli pistetulo)
voidaan esittää muodossa
x† y = x∗i yi ,
y † x = yi∗ xi = (x† y)∗
Käänteismatriisi A−1
Olkoot A ja B n × n -neliömatriiseja. Jos pätee
AB = BA = I
matriisia B kutsutaan A:n käänteismatriisiksi ja
merkitään A−1 . Siis
A−1 A = AA−1 = I
Huom. Kaikille neliömatriiseille ei löydy
käänteismatriisia.
Jos A−1 on olemassa, sanotaan että A on säännöllinen eli
kääntyvä
Jos A−1 ei ole olemassa, A on singulaarinen tai
ei-säännöllinen.
Käänteismatriisi on yksikäsitteinen: jos sekä B että C
ovat A:n käänteismatriiseja, niin välttämättä B = C.
Todistus: B(AC) = (BA)C ⇒ BI = IC ⇒ B = C.
76
Käänteismatriiseille pätee
Esim. Paulin spinmatriisit ovat kaikki unitaarisia: esim.
(AB)−1 = B −1 A−1
σ1† σ1 =
Todistus:
(B −1 A−1 )(AB) = B −1 B = I, ja
(AB)(B −1 A−1 ) = A−1 A = I.
Siis (AB)−1 = B −1 A−1 .
Jos käänteismatriisi on olemassa, niin pätee
(AT )−1 = (A−1 )T ,
−1 T
T
T
−1 T
Tod. (A ) A = (AA ) = I = I, eli (A ) on
AT :n käänteismatriisi.
Ei-singulaarisen matriisin käänteismatriisin löytäminen ei
ole aina kovin yksinkertaista. Myöhemmin palataan
konsteihin joilla käänteismatriisi voidaan löytää.
Suurten matriisien käänteismatriisien löytäminen
numeerisesti onkin oma tieteenalansa, ja yksi
tärkeimmistä numeeristen algoritmien luokasta.
Esim. Matriisi
1 1
A=
0 1
on säännöllinen, sen käänteismatriisi on
1 −1
−1
A =
0 1
AA−1 = A−1 A = I (tarkista!)
Matriisi
1
B=
1
0 1
1 0
=
1 0
0 1
9.5 Matriisin jälki Tr A ja determinantti
det A
Neliömatriisien jälki (engl. trace) ja sen determinantti
ovat tärkeimpiä matriiseja karakterisoivia lukuja. Ne ovat
määriteltyjä ainoastaan neliömatriiseille.
9.5.1 Jälki Tr A
Neliömatriisin jälki on sen diagonaalielementtien summa:
X
Tr A = A11 + A22 + . . . + Ann =
Aii
i
Jos A on n × m matriisi ja B on n × m-matriisi, niin AB
on n × n ja
Tr (AB) =
n
X
(AB)ii =
i=1
m
n X
X
Aij Bji
n
m X
X
Bji Aij
i=1 j=1
BA on taas m × m ja
Tr (BA) =
1
1
0 1
1 0
Samoin σ2† σ2 = I, σ3† σ3 = I.
σ1 ja σ3 ovat myös ortogonaalisia, mutta σ2 ei ole.
(A† )−1 = (A−1 )† .
−1 T
m
X
j=1
(BA)jj =
j=1 i=1
(Tai lyhyesti Tr (AB) = (AB)ii = Aij Bji jne.) Siis pätee
on puolestaan singulaarinen: jos C on mielivaltainen
Tr (AB) = Tr (BA)
2 × 2-matriisi,
mikä yleistyy muotoon
c11 c12
c11 + c21 c12 + c22
1 1
=
BC =
c21 c22
c11 + c21 c12 + c22
1 1
Tr (A1 A2 . . . Ak ) = Tr (Ak A1 . . . Ak−1 )
mikä selvästikään ei voi olla yksikkömatriisi millään cij :n
eli matriiseja voi permutoida syklisesti ilman että jälki
arvoilla.
muuttuu.
Neliömatriisi on ortogonaalinen, jos
Esim. Tr (ABC) = Tr (CAB) = Tr (BAC).
T
−1
Heti nähdään että myös
A =A .
Tr (A + B) = Tr A + Tr B
ja unitaarinen, jos
†
−1
A =A
Ortogonaaliset matriisit säilyttävät reaalivektorien
pistetulon:
(Ay)T (Ax) = y T AT Ax = y T A−1 Ax = y T x
ja unitaariset matriisit kompleksivektorien:
(Ay)† (Ax) = y † A† Ax = y † x
Huom: jos A on reaalimatriisi, AT = A† .
9.5.2 Determinantti det A
Tarkastellaan tason lineaarikuvausta
y1
1 1
x1
y = Ax ⇔
=
y2
x2
−1 2
Tämä kuvaa tason neliöt suunnikkaiksi (yleinen
lineaarikuvausten ominaisuus!). Esim. yksikköneliö
kuvautuu seuraavasti:
77
(0, 0) → (0, 0)
(1, 0) → (1, −1)
(0, 1) → (1, 2)
(1, 1) → (2, 1)
Nämä pisteet muodostavat todellakin suunnikkaan
(piirrä!). Yksikköneliön pinta-ala on 1, ja suunnikkaan
pinta-ala saadaan esim. ristitulosta
Determinantin määritelmästä voidaan suoraviivaisesti
nähdä
det(. . . , Ai , . . . , Aj , . . .) = − det(. . . , Aj , . . . , Ai , . . .)
eli determinantti vaihtaa etumerkkiä jos kaksi pystyriviä
(tai vaakariviä) vaihdetaan keskenään.
det(A1 , . . . , λAi , . . .) = λ det(A1 , . . . , Ai , . . .)
i
|(1, −1) × (1, 2)| = 1
1
j k −1 0 = |1 × 2 + 1 × 1| = 3
2 0 Huomataan myös että det A = 2 + 1 = 3.
Tämä tulos pätee täysin yleisesti: mielivaltainen 2 × 2
matriisi A kuvaa pinta-alan a pinta-alaksi a det(A).
Tämä yleistyy: n × n-matriisi A kuvaa n-ulotteisen
tilavuuselementin detA-kertaiseksi, missä detA on
matriisin determinantti.
Vertaa Jacobin determinanttiin! Se pohjautuu juuri tähän
tulokseen.
Katsotaan nyt kuinka determinantti lasketaan.
2 × 2 ja 3 × 3-matriisien determinantti tuli jo tutuksi
vektorien kolmitulon yhteydessä. Yleisesti n × n-matriisin
A determinantti on
det A =
n
X
ijk...=1
ǫijk... A1i A2j A3k . . .
missä λ on reaali- tai kompleksiluku. Tästä seuraa
det(λA) = λn det A
jos A on n × n matriisi.
Determinantin kehittäminen vaakarivin suhteen:
Determinantti voidaan kehittää mielivaltaisen vaakarivin
i suhteen seuraavasti:
det A =
n
X
Aij cofAij
j=1
missä kofaktori on
cofAij = (−1)i+j Dij
(9.1)
ja missä Dij on sen (n − 1) × (n − 1) matriisin
determinantti mikä saadaan poistamalla matriisista A
vaakarivi i ja pystyrivi j. Tätä sääntöä käytettiin
aiemmin 3 × 3 matriisien determinantteihin.
Tämä pätee myös mielivaltaisille pystyriville j:
missä indeksejä ijk . . . on n kappaletta. Tässä ǫijk... on
n
Levi-Civita symboli:
X

Aij cofAij
det A =
kun ijk . . . on 123 . . . parillinen permutaatio
 +1,
i=1
−1,
kun ijk . . . on 123 . . . pariton permutaatio
ǫijk... =

Determinantille pätee:
0,
kun mikä tahansa indeksi toistuu
det A = 0, jos A:ssa on kaksi samaa vaaka- tai pystyriviä
Siis: valitaan matriisin jokaiselta vaakariviltä yksi alkio
det A ei muutu, jos sen johonkin vaaka/pystyriviin
siten, että ne ovat aina eri pystyriveiltä ja kerrotaan
lisätään tai siitä vähennetään muiden vaaka/pystyrivien
keskenään. Jos rivit ovat 123. . . :n pariton permutaatio
mielivaltainen lineaarikombinaatio
kerrotaan -1:llä. Käydään läpi kaikki permutaatiot ja
Näitä sääntöjä voidaan käyttää determinanttien
summataan yhteen.
“sieventämiseen” ja oikomaan niiden laskemista.
Esim. 2 × 2-matriisin determinanttiNyt ǫ12 = −ǫ21 = 1,
Esim. Lasketaan
ǫ11 = ǫ22 = 0.
1 0 3 1 1 2 3 1 a11 a12
det A = det
0 1 1 1 a21 a22
−1 1 1 0 2
X
ǫij a1i a2j
=
lisäämällä ja vähentämällä lineaarikombinaatioita niin
ij=1
että 1. vaakarivi tulee nollaksi, paitsi 1. elementti.
= ǫ11 a11 a21 + ǫ12 a11 a22 + ǫ21 a12 a21 + ǫ22 a12 a22
Vähennetään 3×(pystyrivi 1) pystyrivistä 3, vähennetään
= a11 a22 − a12 a21
pystyrivi 1 pystyrivistä 4, ja kehitetään 1. vaakarivin
suhteen:
mikä on sama tulos kuin aiemmin. Samoin 3 × 3
1 0 0 0 -matriisin determinantti palautuu vanhaan tulokseen.
2 0 0 1 2 0 0 Kirjoitetaan mukavuuden vuoksi matriisi A pystyriviensä
= (−1)1+1 1 × 1 1 1 = Ai avulla:
0
1
1
1
1 4 1 −1 1 4 1 A = (A1 , A2 , . . . , An )
78
vaivattomin tapa laskea sitä (suurille matriiseille), vaan
käytetään esim. Gaussin eliminointimenetelmää
(myöhemmin).
Esim. 2 × 2 matriisin käänteismatriisi: Olkoon
a b
,
det A 6= 0
A=
c d
Kehitetään jälleen 1. rivin suhteen:
1+1 1 1 = 2(1 − 4) = −6
= (−1) 2 4 1 HUOM: kuten yllä, determinanttia merkitään usein
samalla merkinnällä kuin itseisarvoa: |A| = det A. Tällöin
determinantin itseisarvoa merkitään ||A||.
Matriisien tulon determinantille pätee tärkeä tulos
Nyt Dij on se determinantti mikä saadaan poistamalla
A:sta rivi i ja pystyrivi j. 2 × 2 matriiseille tämä on
yksinkertaisesti
d c
D=
b a
det(AB) = det A det B
Tämän näkee suoraviivaisella mutta hieman työläällä
pyörittämisellä, ja jätetään todistus tässä väliin.
Nyt siis
Käänteismatriisi ja determinantti
(A−1 )ij =
Determinantti ilmoittaa suoraan onko matriisi A
säännöllinen, ts. löytyykö A−1 :
det A 6= 0 ⇔ A säännöllinen ⇔ A−1 olemassa
Käänteismatriisin elementit ovat
eli
A−1 =
cof Aji
(−1)i+j Dji
=
det A
det A
(A−1 )ij =
X
Aik cof Aik
ja
Ajk cof Aik = δji det A
(A−1 )ij =
k
sillä jos j 6= i, niin kaavan vasen puoli vastaa sellaisen matriisin
determinanttia mikä saadaan A:sta korvaamalla rivi i rivillä j.
Koska nyt matriisissa on kaksi samaa vaakariviä, sen
determinantti = 0.
k
eli
Ajk
−b
a
=
1
ad − bc
1 2
2 3
d
−c
−b
a
1
(−1)i+j Dji =
det A
eli
A−1 =
Jakamalla det A:lla saadaan
X
d
−c
Nyt det A = −1 6= 0, siis A−1 on olemassa. Nyt
3 2
D=
2 1
k
Nyt huomataan että
A=
Näytetään tämä: muistetaan että
det A =
1
det A
Esim.
missä kofaktorit määriteltiin kaavassa (9.1). Huomaa
että kofaktorin indeksit tulevat “väärässä” järjestyksessä.
X
(−1)i+j Dji
det A
X
cof Aik
Ajk Bki = δji
=
det A
−3 2
2 −1
9.6 Lineaariset yhtälöryhmät
Monissa yhteyksissä tapaamme lineaarisen yhtälöryhmän,
esim.
k
AB = I
A11 x1 + A12 x2
A21 x1 + A22 x2
missä Bki = cof Aik / det A.
Tämä näytti että jos det A on olemassa, käänteismatriisin lauseke
saadaan sen ja kofaktorin avulla.
Näytetään vielä että jos matriisi A on säännöllinen (siis
A−1 on olemassa), siitä seuraa että det A 6= 0:
det I = 1 = det(A−1 A) = det A det A−1 ⇒ det A 6= 0.
Lisäksi nähdään
det A−1 = 1/ det A
HUOM: yllä esitetty tapa antaa käänteismatriisin
suljetussa muodossa. Se ei kuitenkaan ole tavallisesti
=
=
b1
b2
eli lyhyesti
Ax = b
Tässä siis A on joku tunnettu kerroinmatriisi, b annettu
vektori ja halutaan ratkaista x.
Kukin kahdesta yo. yhtälöstä määrää suoran
(x1 , x2 )-koordinaateissa. Kahden yhtälön yhtälöryhmällä
siis pyritään määräämään suorien leikkauspiste.
Milloin yo. yhtälöryhmällä on ratkaisu? Jos nyt
det A 6= 0, käänteismatriisi A−1 on olemassa ja
A−1 Ax = x = A−1 b
79
on yhtälön ainoa ratkaisu.
Entä jos det A = A11 A22 − A12 A21 = 0? Tällöin ei yleensä
ratkaisua ole, ellei sitten käy niin että yllä molemmat
yhtälöistä ovat vakiokerrointa vaille samat. Nimittäin
tällöin A:n ensimmäinen ja toinen rivi ovat kerrointa
vaille samat, ja det A = 0. Tässä tapauksessa yhtälöt
määräävät saman suoran, ja ratkaisuja on äärettömästi:
x2 =
1
(b1 − A11 x1 )
A12
Siis:
a) jos det A 6= 0, suorat eivät ole yhdensuuntaisia ja ∃
ratkaisu x = A−1 b.
b) jos det A = 0, suorat ovat yhdensuuntaiset. Nyt
riippuu vektorista b kuvaavatko yhtälöt kahta
yhdensuuntaista suoraa (ei ratkaisua) vai samaa suoraa
(äärettömästi ratkaisuja).
Tämä kaikki yleistyy luonnollisesti n × n-matriiseihin.
Siis, jos det A 6= 0, yhtälöryhmällä
Ax = b
on yksikäsitteinen ratkaisu x = A−1 b. Erityisesti yhtälöllä
Ax = 0
on vain ratkaisu x = 0, jos det A 6= 0. Kirjoittamalla tämä
muotoon
X
X
Aij xj = 0 ⇒
Âj xj = 0
j
j
vain jos xj = 0, ja missä Âi on A:n pystyrivistä i
koostuva pystyvektori, niin nähdään seuraava tulos:
det A 6= 0 ⇔ A:n pystyvektorit lineaarisesti
riippumattomia.
Sama pätee myös vaakavektoreille.
9.6.1 Yhtälöryhmän ratkaisu
eliminointimenetelmällä
Olkoon meillä yhtälö (det A 6= 0)
×1/2
5
2 1
−5
1
−2
1 1/2
5/2
väh. rivi 1
1 −2 −5
1 1/2
5/2
0 −5/2
−15/2
× − 2/5
1 1/2
5/2
väh. rivi 2 ×1/2
0
1
3
1 0
1
0 1
3
Yhtälön ratkaisu on siis x = (1 3)T , mikä voidaan heti
tarkistaa.
Päämäärä on siis lisätä ja vähentää rivejä sopivasti
kerrottuina niin että vasemmalle saadaan yksikkömatriisi.
Esim.

1
 1
1

 

−1 1
x
0
1 −1   y  =  1 
2 −3
z
−1
Eliminoidaan



1 −1 1
0
 1 1 −1   1 
1 2 −3
−1



1 −1 1
0
 0 2 −2   1 
0 3 −4
−1



1/2
1 0 0
 0 1 −1   1/2 
−5/2
0 0 −1



1 0 0
1/2
 0 1 0  3 
0 0 1
5/2
Siis ratkaisu on

Tässä tapauksessa käänteismatriisia ei useimmiten
kannata laskea, vaan ratkaista yhtälöryhmä
eliminointimenetelmällä:

1/2
x= 3 
5/2
9.6.2 Matriisin kääntäminen Gaussin
eliminointimenetelmällä
Eliminointimenetelmällä voidaan (lähes) samalla vaivalla
ratkaista usea muotoa
Ax = bi ,
Esim.
2 1
1 −2
x
y
=
2x + y
x − 2y
−rv.3
×−1
Huom: jos matriisin det = 0, eliminointimenetelmä kertoo
sen: ei voida konstruoida I-matriisia.
Ax = b ⇒ x = A−1 b
−rv.1
−rv.1
+(1/2)rv.2
×1/2
−(3/2)rv.2
=
5
−5
Nyt det A = −5 6= 0, joten yhtälö kääntyy. Pyrkimyksenä
on eliminoida jälkimmäisestä yhtälöstä x lisäämällä
ensimmäinen yhtälö sopivasti kerrottuna. Lisäksi
ensimmäisestä eliminoidaan y. Tämä voidaa
systematisoida seuraavasti:
i = 1...n
oleva yhtälö: kirjoitetaan vain rinnan
(A)(b1 )(b2 ) . . .
ja eliminoidaan rivejä niin että A:n tilalle tulee
yksikkömatriisi, ja tehdään sama eliminointi kaikille bi .
Lopputuloksena voimme lukea bi :n paikalta yhtälöryhmän
Ax = bi ratkaisun.
80
Tämä toimii myös jos bi = êi , standardikannan vektori.
Nyt lopputuloksena saadaan A:n käänteismatriisi.
Esim. Edellisen esimerkin matriisin


1 −1 1
 1 1 −1 
1 2 −3
käänteismatriisi:



1 −1 1
1 0 0
 1 1 −1   0 1 0  −rv.1
1 2 −3
0 0 1
−rv.1



1 −1 1
1 0 0
+(1/2)rv.2
 0 2 −2   −1 1 0 
×1/2
0 3 −4
−1 0 1
−(3/2)rv.2



1 0 0
1/2
1/2 0
 0 1 −1   −1/2 1/2 0  −rv.3
×−1
1/2 −3/2 1
 0 0 −1 
1 0 0
1/2 1/2 0
 0 1 0   −1
2 −1 
0 0 1
−1/2 3/2 −1
Siis käänteismatriisi on


1/2 1/2 0
 −1
2
−1 
−1/2 3/2 −1
mikä nähdään kokeilemalla.
HUOM: joskus diagonaalille uhkaa tulla 0. Tämä ei ole
ongelma, sillä tähän riviin voidaan lisätä/vähentää
sopivasti joku alla olevista riveistä niin että diagonaalille
tulee 1. Jos tämä ei millään onnistu, on det = 0.
Usein eliminointi on helpompaa tehdä niin että ei tule
murtolukuja.
Esim. Matriisin


2 3 5
A= 1 2 4 
3 1 0
käänteismatriisi.



1 0 0
2 3 5
 1 2 4   0 1 0  ×2 − (rv.1)
−3 × (rv.2)
0 0 1
3 1 0



2 3
5
1
0 0
−3 × (rv.2)
 0 1
3   −1 2 0 
0 −3 
1
+5 × (rv.2)
 0 −5 −12

2 0 −4
4 −6 0
×3 + 4 × (rv.3)
 0 1 3   −1 2 0  −(rv.3)
 0 0 3   −5 7 1 
6 0 0
−8 10
4
×1/6
 0 1 0   4 −5 −1 
0 0 3
−5 7
1
×1/3



1 0 0
−4/3 5/3 2/3
 0 1 0  4
−5 −1 
0 0 1
−5/3 7/3 1/3
Käänteismatriisi on siis

−4
1
A−1 =  12
3
−5
5
−15
7

2
−3 
1
9.7 Ominaisarvot ja -vektorit
Jos A on n × n-matriisi, ja jos löytyy vektori x 6= 0 siten
että
Ax = λx
missä λ on skalaari (yleisesti kompleksiluku), sanotaan
että
x on A:n ominaisvektori ja
λ on vektoriin x liittyvä ominaisarvo
Ominaisvektorit siis säilyttävät suuntansa
lineaarikuvauksissa. Ne ovat aina erityisasemassa, ja
vastaavat kuvausten “pääakseleita”.
Ominaisarvoille pätee: A on säännöllinen ↔ A:n kaikki
ominaisarvot 6= 0.
Tod. Jos λ = 0, niin vastaava ominaisvektori Ax = 0.
Koska x 6= 0, tämä toteutuu jos ja vain jos det A = 0, siis
A ei ole säännöllinen.
Ominaisvektorit eivät ole yksikäsitteisiä: ne voidaa kertoa
vakiolla ja ne ovat edelleen ominaisvektoreita. Samalla
ominaisarvolla voi myös olla useita lineaarisesti
riippumattomia ominaisvektoreita.
Esim. Yksikkömatriisi I toteuttaa Ix = x kaikilla x. Siis
kaikki vektorit ovat sen ominaisvektoreita ominaisarvolla
1.
Pätee: A:n ominaisarvot ovat yhtälön
det(A − λI) = 0
juuret.
Tod. Jos λ on ominaisarvo, on
Ax = λx = λIx ⇒ (A − λI)x = 0. Tällä on ratkaisu kun
x 6= 0 vain jos det(A − λI) = 0.
Jos A on n × n-matriisi, det(A − λI) on n:n asteen
polynomi λ:n suhteen:
A11 − λ
A12
···
A1n
A21
A
−
λ
·
·
·
A
22
2n
det(A−λI) = ≡ Pn (λ)
..
.
An1
···
Ann − λ (9.2)
Yhtälö
Pn (λ) = 0
on A:n karakteristinen yhtälö, ja sen ratkaisut ovat A:n
ominaisarvot. Näiden avulla Pn voidaan kirjoittaa
muotoon
Pn (λ) = (−1)n (λ − λ1 )(λ − λ2 ) . . . ≡ (−1)n
81
n
Y
i=1
(λ − λi )
(9.3)
(nähdään kaavasta (9.2) että λn :n kerroin on (−1)n ).
Tästä seuraa että
Pn (0) =
n
Y
= −(2 − λ)(1 + λ)(1 − λ) + 4(1 − λ) + 6 − 3(1 − λ)
= −λ3 + 2λ2 − 6λ + 5 = (1 − λ)(λ2 − λ + 5) = 0
Ominaisarvot ovat siis
λi = det A
λ1 = 1,
i=1
λ2,3 =
√
1
1 1√
1 − 20 = (1 ± i 19)
±
2 2
2
Kertalukuun λn−1 on otettava (9.2) diagonaalilta kaikki
λ:t paitsi vuorollaan yksi Aii . Samoin karakteristisen
polynomin ekspansiosta (9.3):
X
X
termi λn−1 :
Aii (−λ)n−1 = (−λ)n−1
λi
Ominaisarvoa λ vastaava ominaisvektori saadaan
yhtälöstä
Av = λv
Siis saamme tulokset:
niin sen ominaisarvot ovat
1−λ
det(A − λI) = 2
i
det A =
λ1 λ2 . . . =
n
Y
λi
λ1 + λ2 + . . . =
n
X
Esim. Matriisin
A=
2 1
0 1
ominaisarvot:
2−λ
det(A − λI) = 0
1 = (2 − λ)(1 − λ) = 0
1−λ minkä ratkaisut ovat λ = 2 ja λ = 1. Tässä tapauksessa
karakteristinen yhtälö oli yksinkertainen.
Esim. Yleinen 2 × 2-matriisi
a b
,
A=
c d
Karakteristinen yhtälö on
a−λ
b
det(A − λI) = c
d−λ
1 = λ2 − λ + 2 = 0
−λ 2. ominaisvektori:
x2
x2
1 1
= −1
y2
2 0
y2
x2 + y2 = −x2
⇒
⇒ y2 = −2x2
2x2 = −y2
= λ2 − (a + d)λ + (ad − bc)
Siis ominaisarvoa λ2 = −1 vastaava ominaisvektori
v2 = vakio
Huom: tämä pätee vain 2 × 2-matriiseille.

−2 3
−1 0 
1 1
2−λ
−2
3
−1 − λ
0
ominaisarvot: det(A − λI) = 2
−1
1
1 − λ
−1 − λ
2
0
0
− (−2) +
= (2 − λ) 1 1−λ
−1 1 − λ 2 −1 − λ 3 −1
1
1
−2
Ominaisvektorit on usein tapana normittaa: määrätään
vakio niin että |v| = 1. Edellä normitetut vektorit ovat siis
1
1
1
1
v2 = √
v1 = √
1
−2
2
5
Esim. Etsitään matriisin
2
A= 2
−1
1 1
2 0
minkä ratkaisu on x1 = y1 (molemmista sama ehto). Siis
ominaisarvoa λ1 = 2 vastaava ominaisvektori
1
v1 = vakio
1
λ2 − Tr Aλ + det A = 0

joten ominaisarvot λ1 = 2, λ2 = −1.
1. Ominaisvektori:
1 1
x1
x1
=2
y1
y1
2 0
x1 + y1 = 2x1
⇒
2x1 = 2y1
λi
i=1
=
A=
i
i=1
Tr A =
Esim. jos
Pystyvektorit ovat ortogonaalisia, jos niiden välinen
pistetulo (sisätulo) häviää:
x† y =
n
X
x∗i yi = 0
i=1
Olkoon matriisi A hermiittinen, ts. A† = A. Sille pätee
82
Hermiittisen matriisin ominaisarvot ovat reaaliset, ja eri
ominaisarvoja vastaavat ominaisvektorit ortogonaaliset
Tod. Olkoon Ax = λx. Nyt
x† Ax = λx† x
ja toisaalta
x† Ax = x† A† x = (Ax)† x = (λx)† x = λ∗ x† x
Siis λ∗ = λ.
Olkoon nyt λ1 , λ2 kaksi erisuurta ominaisarvoa, ja niiden
ominaisvektorit x1 , x2 . Nyt
x†2 Ax1 = λ1 x†2 x1 .
Toisaalta
x†2 A† x1 = (Ax2 )† x1 = λ2 x†2 x1
Koska λ2 6= λ1 , tämä voi pitää paikkansa vain jos
x†2 x1 = 0.
Liite A. Kreikkalaiset kirjaimet
Pienet kirjaimet
α alfa
β beta
γ gamma
δ delta
ǫ epsilon
ζ zeta
η eta
ψ psi
Isot kirjaimet
Γ Gamma
∆ Delta
Θ Theta
Ψ Psi
83
θ
ι
κ
λ
µ
ν
ξ
ω
theta
iota
kappa
lambda
my
ny
xi
omega
π
ρ
σ
τ
υ
φ
χ
Λ
Ξ
Π
Ω
Lambda
Xi
Pi
Omega
Σ
Υ
Φ
pi
ro
sigma
tau
ypsilon
fi
khi
Sigma
Ypsilon
Fi
Liite B. Joukko-oppia
Joukko koostuu alkioista (jäsenistä, elementeistä). Kun
halutaan ilmoittaa, että joukon A alkiot ovat a1 , a2 , . . .
käytetään usein merkintää
A = {a1 , a2 , . . .}.
Joukko voi olla tyhjä, ts. siinä ei ole yhtään jäsentä.
Tyhjästä joukosta käytetään merkintää ∅.
Jos joukon A jäsenet toteuttavat jonkun tietyn ehdon,
merkitään
A = {x|ehto x:lle}.
Esimerkiksi
I = {x|0 ≤ x ≤ 1}
on välillä 0 ja 1 olevien (reaali)lukujen joukko.
Merkintä a ∈ A ilmoittaa, että a on joukon A jäsen, a
kuuluu joukkoon A. Jos kaikki joukon A alkiot ovat myös
joukon B alkioita, merkitään A ⊂ B (B ⊃ A) ja
sanotaan, että A kuuluu joukkoon B tai että A on joukon
B osajoukko.
Joukkojen A ja B yhtäsuuruus tarkoittaa, että
molemmissa joukoissa on samat jäsenet, ts. A ⊂ B ja
B ⊂ A. Luonnollinen merkintä yhtäsuuruudelle on A = B.
Kahden joukon A ja B yhteisistä jäsenistä koostuvaa
joukkoa A ∩ B sanotaan leikkaukseksi. Ilmeisestikin on
voimassa A ∩ B = B ∩ A, A ∩ B ⊂ A ja A ∩ B ⊂ B.
Yhdiste A ∪ B on molempien joukkojen A ja B alkioista
koostuva joukko. Se toteuttaa mm. relaatiot
A ∪ B = B ∪ A, A ⊂ A ∪ B ja B ⊂ A ∪ B.
Liite C. Kvanttorit
Matematiikassa käytetään usein ilmauksia on olemassa
ja kaikilla. Esimerkkilauseita voisivat olla vaikkapa: on
olemassa sellainen reaaliluku x, että x2 = a kun a ≥ 0
tai
kaikilla reaaliluvuilla x on voimassa x2 ≥ 0.
Päästään hieman vähemmällä kirjoittamisella, kun
otetaan käyttöön formaalin logiikan kvanttorit ∃ ja ∀
ilmaisemaan olemassaoloa (eksistenssiä) ja
yleispätevyyttä (universaalisuutta). Kvanttoreiden avulla
esimerkkilauseet voitaisiin kirjoittaa vaikkapa muotoihin
∃x ∈ R siten, että x2 = a kun a ≥ 0
ja
x2 ≥ 0 ∀x ∈ R.
Symbolilla R on tässä merkitty reaalilukujen joukkoa.
84
Liite D. Intervalleja, jatkuvuuksia, . . .
Reaaliakselin yhtenäisistä osista intervalleista käytetään
usein merkintöjä
suljettu väli [a, b] tarkoittaa reaaliakselin väliä
a ≤ x ≤ b, ts. alku- ja loppupisteet kuuluvat mukaan.
avoin väli (a, b) tarkoittaa väliä a < x < b, ts. alku- ja
loppupisteet eivät kuulu väliin.
puoliavoimet välit (a, b] ja [a, b) tarkoittavat
vastaavasti välejä, joissa vain toinen päätepiste
kuuluu joukkoon.
Funktio f (x) on
rajoitettu jos tarkasteltavalla välillä on |f (x)| ≤ M ,
missä 0 ≤ M < ∞.
jatkuva jos se ei ”hyppää”pisteestä toiseen,
paloittain jatkuva funktio jos se on jatkuva muualla
paitsi mahdollisesti äärellisen monessa tarkasteltavan
välin pisteessä.
85