Download Report

1. Vektorit
Projektioita Ax , . . . sanotaan vektorin koordinaateiksi tai
komponenenteiksi. Puhutaan myös vektorin
komponenttiesityksestä.
Koska vektorin paikalla ei ole merkitystä, voisimme
siirtää kaikki vektorit valitsemamme koordinaatiston
origoon, jolloin vektoria kuvaisivat sen kärjen
koordinaatit. Kääntäen, mitä tahansa avaruuden pistettä
voidaan pitää origosta lähtevän vektorin kärkenä. Tällöin
puhutaan usein paikka- eli radiusvektorista.
1.1 Vektorin käsite
Fysikaalisten suureiden spesifioimiseksi ei useinkaan
pelkkä suureen koko ole riittävä. Esimerkiksi liikettä
kuvattaessa on yleensä tarpeen kertoa myös liikkeen
suunta kolmiulotteisessa avaruudessamme. Liikkeen
puolestaan aiheuttaa johonkin suuntaan vaikuttava jonkin
suuruinen voima. Tällaisia suureita kuvaamaan on luotu
vektorit.
Vektori on suure, jolla on suunta ja suuruus. Skalaari
puolestaan on suure, jolla on vain suuruus.
Graafisesti vektori esitetään nuolena, jonka kärki osoittaa
vektorin suunnan ja pituus vektorin suuruuden.
A
x
z
A
A
C
z
A = ( A x,A y,A z)
z
C
r = P ( x ,y ,z ) = ( x ,y ,z )
y
x
Kuva 1.2 Paikkavektori
y
C = ( C x,C y,C z)
z
C
Esimerkiksi massapisteen paikkaa avaruudessa voisi
kuvata paikkavektori
y
y
B = ( B x,B y,B z)
x
B
r = (x, y, z).
Jos piste on liikkeessä, niin sen koordinaatit x, y ja z ovat
ajan funktioita, joten paikkavektorin r kärkikin liikkuu
ajan myötä:
z
x
B
B
x
y
r = r(t) = (x(t), y(t), z(t)).
Kuva 1.1 Vektorin esitys
Määritelmän mukaan vektorin paikalla avaruudessa ei ole
merkitystä. Esimerkiksi kuvan 1.1 kaikki kolme vektoria
ovat samoja, ts.
A = B = C.
r (t0)
r (t1)
Merkintöjä
Tekstissä vektoreita merkitään tavallisesti (mm. tässä esityksessä)
lihavoitetuilla symboleilla (A, r,β, . . .). Käsin kirjoitettaessa
vektoreiden päälle piirretään useimmiten yläviiva, Ā, joskus nuoli,
~
A.
Valitussa koordinaatistossa vektori voidaan spesifioida
esim.
Kuva 1.3 Liikkuva piste
• antamalla kaksi suuntakulmaa, vaikkapa vektorin ja
z-akselin välinen kulma sekä vektorin xy-tasolla
olevan projektion ja x-akselin välinen kulma, ja
vektorin pituus.
Liikkuvan pisteen nopeus v määräytyy ilmeisestikin
.
. sen
.
koordinaattien muutosnopeuksista x(t), y (t) ja z(t), ts.
.
.
.
v(t) = (x(t), y (t), z(t)).
• antamalla vektorin koordinaattiakseleilla olevien
projektioiden pituudet (merkki huomioiden).
Jos vielä sovimme, että vektori derivoidaan derivoimalla
sen komponentit, voimme kirjoittaa ytimekkäästi
.
Käytämme aluksi lähes yksinomaan jälkimmäistä esitystä.
Vektorin A spesifioivat siis sen projektiot
koordinaattiakseleille: kolmiulotteisessa avaruudessa
reaalilukukolmikko (Ax , Ay , Az ),
v(t) = r(t).
Vektorin määritelmän perusteella vektorit a = (ax , ay , az )
ja b = (bx , by , bz ) ovat yhtäsuuria jos ja vain jos niiden
vastinkomponentit ovat yhtäsuuria, ts. jos ja vain jos
ax = bx , ay = by ja az = bz . Tällöin merkitään a = b.
A = (Ax , Ay , Az ).
1
Vektorin ajatellaan olevan jotakin absoluuttista; vektori on
olemassa ja pysyy samana käytettiinpä millaista koordinaatistoa
tahansa tai toimittiinpa ilman koordinaatistoa. Vektorin esitys
komponenttimuodossa sen sijaan riippuu valitusta
koordinaatistosta. Mittakaava ja koordinaattiakseleiden suunnat
vaikuttavat vektorin komponentteihin. Esimerkiksi vektoreiden
yhtäsuuruudesta päätettäessä on pidettävä huoli siitä, että ne
esitetään samassa koordinaatistossa.
A
A
B
Määritellään nollavektori  siten, että
 = (0, 0, 0).
A + B
B
A -B
A
(1.1)
B
2
(A
A
+ A
x
(A
y
+ A
z
)1
/2
Kuva 1.5 Vektorien yhteen- ja vähennyslasku
A
A
x
x
A
2
2
2
+ A
y
Graafisesti kahden vektorin A ja B summa siis
muodostetaan siirtämällä esim. vektori B siten, että sen
kanta yhtyy vektorin A kärkeen. Summa- eli
resultanttivektori A + B on silloin vektorin A kannasta
vektorin B kärkeen ulottuva vektori. Erotusvektori
voidaan puolestaan muodostaa siten, että siirretään
molempien vektorien kannat samaan kohtaan. Erotus
A − B on nyt vektorin B kärjestä vektorin A kärkeen
ulottuva vektori.
z
2 1
/2
)
y
Kuva 1.4 Vektorin pituus
Laskutoimitusten ominaisuuksia
Vektorin suuruus on sama kuin vektorin pituus. Kuten
kuvasta 1.4 nähdään, on vektorin A = (Ax , Ay , Az )
pituus |A| Pythagoraan lauseen mukaan
q
|A| = A2x + A2y + A2z .
(1.2)
Suoraan määritelmistä on helppo todeta, että
• Vektoreiden yhteenlasku on kommutatiivinen, ts.
A + B = B + A.
• Vektoreiden yhteenlasku on assosiatiivinen, ts.
Hyvin usein vektorista käytetty symboli ilman
vektorimerkintää tarkoittaa ko. vektorin pituutta, esim.
A = |A|.
Ilmeisestikin A =  jos ja vain jos |A| = 0. Tämän vuoksi
hyvin usein jätetään vektorimerkintä pois nollavektorista.
A + (B + C) = (A + B) + C.
Sulut voidaan siis tämän kaltaisissa lausekkeissa
jättää merkitsemättä.
1.2 Vektorialgebra
• Skalaarilla kertominen on distributiivinen, ts.
Skalaarilla kertominen
λ(A + B) = λA + λB.
Olkoon A = (Ax , Ay , Az ) jokin vektori ja λ jokin
reaalinen vakio. Silloin λA on vektori
Yksikkövektorit
λA = (λAx , λAy , λAz ).
(1.3)
Yksikkövektori on sellainen√vektori, jonka pituus on yksi.
Esim. Vektorin A = (5, 3, 2) suuntainen yksikkövektori
Vektorin A pituus A on
q
√ 2 √
A = |A| = 52 + 32 + 2 = 36 = 6.
Skalaarilla λ kerrottaessa vektori siis säilyttää suuntansa
jos λ > 0 tai kääntyy vastakkaiseen suuntaan jos λ < 0.
Vektorin pituus muuttuu vakiolla λ kerrottaessa kuten
|λA| = |λ||A|.
Tällöin vektori
Yhteen- ja vähennyslasku
a=
Vektorien A = (Ax , Ay , Az ) ja B = (Bx , By , Bz ) summan
määrittelee yhtälö
A + B = (Ax + Bx , Ay + By , Az + Bz ).
on vektorin A suuntainen. Se on ilmeisestikin myös
yksikön mittainen, sillä
1 1
1
|a| = A = |A| = A = 1.
A
A
A
(1.4)
ja erotuksen yhtälö
A−B
=
=
A + (−1)B
(Ax − Bx , Ay − By , Az − Bz ).
√
1
1
5 1 1
A = (5, 3, 2) = ( , , √ )
A
6
6 2 3 2
(1.5)
2
Esim. Cauchy-Schwartzin epäyhtälö
Olkoot A ja B nollasta poikkeavia vektoreita ja λ
mielivaltainen skalaari. Tarkastellaan vektoreiden λA ja
B resultanttia λA + B ja erikoisesti sen pituuden neliötä
Yksikkövektorit erotetaan usein kirjoittamalla ˆ-merkki vektorin
yläpuolelle, kuten esim. b̂. Jos samassa yhteydessä puhutaan
myös vektorista b, niin silloin b̂ tarkoittaa yleensä vektorin b
suuntaista yksikkövektoria.
Koordinaattiakseleiden suuntaisia yksikkövektoreita
sanotáan yksikkökoordinaattivektoreiksi tai lyhyesti
kantavektoreiksi. Niitä merkitään usein kuten
ex
ey
ez
=
=
=
(1, 0, 0)
(0, 1, 0)
(0, 0, 1).
q(λ) = |λA + B|2 .
Kuten näimme, vektorin pituuden neliö on vektorin
skalaaritulo itsensä kanssa, ts.
(1.6)
q(λ)
=
=
. Toinen hyvin paljon käytetty merkitsemistapa on
i = ex , j = ey ja k = ez .
(1.7)
=
Koska vektori voidaan kirjoittaa kuten
A
=
=
(Ax , Ay , Az )
(Ax , 0, 0) + (0, Ay , 0) + (0, 0, Az )
=
Ax (1, 0, 0) + Ay (0, 1, 0) + Az (0, 0, 1),
=
=
Ax ex + Ay ey + Az ez
Ax i + Ay j + Az k.
1.3.1 Pistetulo
Vektoreiden A = (Ax , Ay , Az ) ja B = (Bx , By , Bz )
Pistetulon eli skalaaritulon A · B määrittelee kaava
Tämän muodon ensimmäinen termi on neliönä aina
ei-negatiivinen, joten funktiolla q(λ) on minimi kun
neliötermi on minimissään. Valitsemalla λ = −A · B/|A|2
saadaan neliötermi häviämään joten funktion q(λ) minimi
qmin on sama kuin jälkimmäinen termi. Pituuden neliönä
q(λ) ei voi olla negatiivinen olipa λ mitä hyvänsä, joten
myös sen minimille täytyy olla voimassa qmin ≥ 0. Siis on
(1.8)
Merkintä A2 tarkoittaa vektorin A skalaarituloa itsensä
kanssa eli
A2
=
=
λ2 A · A + λA · B + λB · A + B · B
λ2 |A|2 + 2λA · B + |B|2
A·B
2
2
|A| λ + 2λ
+ |B|2 ,
|A|2
Hieman sieventäen ja ryhmittäen voimme kirjoittaa
edellisen lausekkeen muotoon
2
A·B
2
q(λ) = |A| λ +
|A|2
1
|A|2 |B|2 − (A · B)2
+
2
|A|
1.3 Vektoreiden tulot
A · B = Ax Bx + Ay By + Az Bz .
(λA + B) · (λA + B)
missä olemme käyttäneet hyväksi skalaaritulon
ominaisuksia (distributiivisuus, kommutatiivisuus jne.).
Täydennetään sulkujen sisällä oleva lauseke neliöksi ja
saadaan
A · B (A · B)2
2
2
q(λ) = |A| λ + 2λ
+
|A|2
|A|4
2
(A · B)
+ |B|2 .
−
|A|2
saadaan sille komponenttiesitykset
A
=
A · A = A2x + A2y + A2z
|A|2 .
|A|2 |B|2 − (A · B)2 ≥ 0.
Vektorin pituus on siis ilmaistavissa skalaaritulon avulla
kuten
√
√
|A| = A · A = A2 .
Tämä on kirjoitettavissa Cauchy-Schwartzin epäyhtälönä
tunnettuun muotoon
Suoraan määritelmästä nähdään, että pistetulo
|A · B| ≤ |A||B|.
• on kommutatiivinen, ts. A · B = B · A.
Oletimme, että A 6=  ja B 6= 0. Jos nyt jompi kumpi tai
molemmat ovat nollia, niin epäyhtälö on edelleenkin
voimassa (yhtäsuuruutena).
Esim. Kolmioepäyhtälö
Vektorit A, B ja A + B muodostavat kolmion, jonka
sivujen pituudet ovat |A|, |B| ja |A + B|. Kääntäen,
• on distributiivinen: A · (B + C) = A · B + A · C.
• skalaarilla kerrottaessa toteuttaa relaatiot
λ(A · B) = (λA) · B = A · (λB).
3
(1.9)
jokainen kolmio voidaan esittää kahtena vektorina ja
niiden resultanttina.
A + B
Edelleen Pythagoraan lausetta soveltaen saamme
|A − B|2
B
A
=
=
=
Kuva 1.6 Kolmioepäyhtälö
=
=
≤
≤
=
(A + B) · (A + B)
|A|2 + 2A · B + |B|2
• vektorin A projektion pituus vektorilla B kertaa
vektorin B pituus tai
• vektorin B projektion pituus vektorilla A kertaa
vektorin A pituus.
Vektoreiden välisen kulman θ kosini on lausuttavissa
pistetulon avulla kuten
(1.10)
joka kertoo sen tutun tosiasian, että kolmiossa kahden
sivun summa on aina suurempi tai yhtäsuuri kuin kolmas
sivu.
cos θ =
A·B
.
|A||B|
(1.12)
Ilmeisestikin vektorit A ja B ovat kohtisuorassa toisiaan
vastaan jos A · B = 0 ja yhdensuuntaisia jos
A · B = |A||B|. Erikoisesti kantavektoreille i, j ja k on
voimassa
i·j=i·k=j·k=0
Pistetulon geometrinen merkitys
Tarkastellaan nyt vektoreiden A, B ja A − B
muodostamaa kolmiota.
A -B
eli ne ovat toisiaan vastaan kohtisuorassa, ts.
ortogonaalisia. Koska vielä on
B
h
(1.11)
Kuviosta 1.7 on luettavissa myös tulkinnat: A · B on
missä viimeistä edellisessä muodossa olemme soveltaneet
Cauchy-Schwarzin epäyhtälöä. Päädymme siten
kolmioepäyhtälönä tunnettuun relaatioon
A
A2 + B 2 − 2AB cos θ.
A · B = AB cos θ.
|A|2 + 2|A · B| + |B|2
|A|2 + 2|A||B| + |B|2
(|A| + |B|)2 ,
|A + B| ≤ |A| + |B|,
A2 − A2 cos2 θ
+B 2 + A2 cos2 θ − 2AB cos θ
Vertaamalla tätä aikaisempaan suureen |A − B|2
lausekkeeseen näemme, että
Nyt on
|A + B|2
h2 + (B − A cos θ)2
B -A c o sq
i · i = j · j = k · k = 1,
q
sanotaan näiden kantavektoreiden olevan ortonormaalisia.
Kirjoitetaan vektori A komponenttimuodossa
A c o sq
Kuva 1.7 Pistetulon geometrinen merkitys
A = Ax i + Ay j + Az k.
Sivun A − B pituuden neliö on
|A − B|2
=
=
=
Kantavektoreiden ortonormaalisuuden perusteella on mm.
(A − B) · (A − B)
A · i = Ax i · i + Ay j · i + Az k · i = Ax
|A|2 + |B|2 − 2A · B
A2 + B 2 − 2A · B,
Vektorin komponentit voidaan siten lausua skalaarituloina
Ax = A · i, Ay = A · j ja Az = A · k.
missä A ja B tarkoittavat vektoreiden A ja B pituuksia.
Kuviosta 1.7 nähdään, että vektoreiden A, B ja A − B
muodostaman kolmion korkeuden h neliö on
Kantavektoreiden ortonormaalisuudesta seuraa samoin se,
että muodossa A = Ax i + Ay j + Az k ja
B = Bx i + By j + Bz k esitettyjen vektoreiden skalaaritulo
on
A · B = Ax Bx + Ay By + Az Bz
h2 = A2 − A2 cos2 θ,
missä θ on vektoreiden A ja B välinen kulma.
4
Esim. Voiman F = 2i − j − k tekemä työ sen siirtäessä
kappaletta vektorin r = 3i + 2j − 5k kannasta kärkeen
Määritelmän mukaan voiman tekemä työ on siirroksen
suuntainen voima kerrottuna siirron pituudella.
eli yhtäpitävä määritelmän (1.8) kanssa.
A
k
g
a
F
b
j
i
q
Kuva 1.8 Suuntakulmat
r
F c o sq
Vektorin ja yksikkövektorin i välisen kulman eli vektorin
ja x-akselin välisen kulman α kosini on
Kuva 1.9 Voiman tekemä työ
A·i
Ax
cos α =
=
,
|A||i|
A
Kuvan mukaisesti voiman F tekemä työ on
W = (F cos θ)r. Pistetulon avulla tämä saadaan
kirjoitettua muotoon
missä A = |A|. Vastaavat lausekkeet saadaan vektorin ja
y-akselin välisen kulman β sekä vektorin ja z-akselin
välisen kulman γ kosineille. Näemme siis, että vektori on
kirjoitettavissa suuntakulmiensa α, β ja γ avulla mm.
muodossa
A = A(cos α, cos β, cos γ).
W = F · r.
Tässä tapauksessa työ on siis
W
Olkoon nyt a vektori
a=
1
A.
A
(2i − j − k) · (3i + 2j − 5k)
(2)(3) + (−1)(2) + (−1)(−5)
6 − 2 + 5 = 9.
Esim. Vektoria A = 2i + 3j + 6k vastaan kohtisuorassa
Ensinnäkin on
olevan ja vektorin B = i + 5j + 3k kärjen kautta kulkevan
tason yhtälö
1
A2 = 1
A2
ja toiseksi vektorien a ja A väliselle kulmalle θaA on
voimassa
a·a=
cos θaA =
=
=
=
1
1
a·A
= A · A = 1,
|a||A|
A
A
A
joten a on vektorin A suuntainen yksikkövektori.
Vektorin B projektio p vektorin A suuntaan voidaan nyt
lausua yksikkövektorin a avulla kuten
r
1
p = A · B = a · B.
A
B = 4i − 4j + 7k
Vektorin B suuntainen yksikkövektori on
b
=
=
B
4i − 4j + 7k
=p
B
42 + (−4)2 + 72
4
4
7
i − j + k.
9
9
9
Kuva 1.10 Tason yhtälö
Olkoon r jokin tason piste. Tällöin vektori B − r on
jonkin vektoreitten r ja B kärkien kautta kulkevan tason
suuntainen. Koska tason piti olla kohtisuorassa vektoria A
vastaan, täytyy vektorin B − r olla kohtisuorassa vektoria
A vastaan osoittipa r mihin tahansa tason pisteeseen.
Saamme siis ehdon
Vektorin A projektio tähän suuntaan on
p
=
=
B
O
Esim. Vektorin A = i − 2j + k projektio vektorille
B -r
4
4
7
A · b = (i − 2j + k) · ( i − j + k)
9
9
9
4
7
19
4
.
(1)( ) + (−2)(− ) + (1)( ) =
9
9
9
9
(B − r) · A = 0
5
tason pisteille r. Sijoittamalla tähän r = xi + yj + zk
sekä vektoreiden A ja B eksplisiittiset lausekkeet saadaan
0 =
=
=
3. kuhunkin valitun rivin tai sarakkeen alkioon liittyy
2 × 2-alideterminantti, joka muodostetaan alkuperäisestä
determinantista pyyhkimällä siitä pois ko. alkion kautta
kulkeva vaaka- ja pystyrivi.
((1 − x)i + (5 − y)j + (3 − z)k)
4. käydään läpi kaikki valitun rivin tai sarakkeen alkiot kertoen
keskenään alkio varustettuna siihen liittyvällä merkillä ja
sen alideterminantti. Muodostettujen termien summa on
determinantin arvo.
·(2i + 3j + 6k)
−2x − 3y − 6z + (1)(2) + (5)(3) + (3)(6)
−2x − 3y − 6z + 35.
Esim. Determinantti
Kysytyn tason yhtälö on siis
D=
2x + 3y + 6z = 35.
+(−2) A × B = (Ay Bz − Az By , Az Bx − Ax Bz , Ax By − Ay Bx ).
(1.13)
Vektoritulon muodostamista auttanee muistisääntö:
Tulo A × B lasketaan siten, että kolmirivisen
determinantin ylimmäksi riviksi kirjoitetaan kantavektorit
i, j ja k (tässä järjestyksessä), keskimmäisen rivin
muodostavat vektorin A komponentit Ax , Ay ja Az (tässä
järjestyksessä) sekä alimman rivin vektorin B
komponentit Bx , By ja Bz (tässä järjestyksessä), ts.
i
j
k A × B = Ax Ay Az .
(1.14)
Bx By Bz a12
a22
.
.
.
an2
···
···
..
.
···
a1n
a2n
.
.
.
ann
a12
a22
mukaisesti.
+
−
+
2. valitaan jokin vaaka- tai pystyrivi.
= (−2)[(1)(−3) − (4)(−2)] = −10.
2
4
2
1
1
−3
1
−2
= −3[(2)(−3) − (1)(4)] = 30
= 4[(2)(−2) − (1)(1)] = −20.
D = (−10) + (30) + (−20) = 0.
Determinantteihin liittyy useita laskusääntöjä. Tässä vaiheessa
meille riittänee tieto siitä, että
• determinantin merkki vaihtuu vaihdettaessa kaksi vaakariviä
(tai kaksi pystyriviä) keskenään.
• determinantti on nolla, jos sen kaksi vaakariviä (tai kaksi
pystyriviä) ovat samoja.
Kehitetään determinantti (1.14) ylimmän rivin mukaan,
jolloin
i
j
k Ax Ay Az = i Ay Az − j Ax Az By Bz Bx Bz Bx By Bz Ax Ay +k Bx By =
(Ay Bz − Az By )i
−(Ax Bz − Az Bx )j
+(Ax By − Ay Bx )k.
Nähdään, että tämä todellakin yhtyy määritelmään
(1.13).
Determinanttiesityksestä nähdään mm. ominaisuus
i
i
j
k j
k
A × B = Ax Ay Az = − Bx By Bz
Bx By Bz Ax Ay Az
= −B × A.
1. kuhunkin determinantin alkioon liittyy merkki taulukon
−
+
−
Determinantin arvo D on näiden termien summa eli
ts. kaksirivisen determinantin arvo saadaan vähentämällä
lävistäjäalkioden tulosta sivulävistäjäalkioiden tulo.
Kolmirivinen determinantti lasketaan helpoimmin kehittämällä se
alideterminanttien avulla:
+
−
+
+(4) =a a −a a ,
11 22
12 21
−2
−3
ja alin alkio termin
Meidän tarkoituksiimme riittävät kaksi- ja kolmiriviset
determinantit. Kaksirivisen determinantin arvon määrittelee kaava
a11
a21
1
4
−(3) olevia taulukoita. Niissä siis sarakkeiden ja rivien lukumäärä on
sama. Puhutaan n × n-determinanteista tai n-rivisisistä
determinanteista. Determinanteilla on lukuarvo.
−2
3
4
Vastaavasti kehityssarakkeen toinen alkio antaa termin
Determinanteista
Determinantit ovat muotoa
a11
a21
.
.
.
an1
1
−2
−3
Kehitetään vaikkapa oikeanpuoleisimman sarakkeen mukaan.
Tämän ylimpään alkioon −2 liittyy merkki +. Vastaava
alideterminantti saadaan pyyhkimällä pois ylin rivi ja
oikeanpuoleisin sarake. Päädymme termiin
1.3.2 Ristitulo
Vektoreiden A = (Ax , Ay , Az ) ja B = (Bx , By , BZ )
ristitulon eli vektoritulon A × B määrittelee kaava
2
1
4
6
Siten ristitulon merkki vaihtuu vaihdettaessa tekijöiden
järjestystä:
(1.15)
A × B = −B × A.
Ristitulon geometrinen merkitys
Vektorin A × B pituuden neliö on
|A × B|2
Ristitulo ei siis ole kommutatiivinen. Ominaisuudesta
(1.15) seuraa mm.
|A × B|2
joten vektorin ristitulo itsensä kanssa on nolla,
(1.16)
=
=
(1.17)
|A × B|2 = A2 B 2 (1 − cos2 θ) = A2 B 2 sin2 θ.
Näemme siis, että ristitulovektorin A × B pituus on
(1.18)
|A × B| = AB| sin θ|.
Vektoreiden A × B ja A skalaaritulo on
A · (A × B)
(1, 0, 0) × (0, 1, 0) = (0 − 0, 0 − 0, 1 − 0)
(0, 0, 1) = k.
=
=
=
k
i
j
=
=
Samalla tavoin voimme todeta, että muutkin kaavoista
i×j
j×k
k×i
−(Ax Bx + Ay By + Az Bz )2 .
missä jälleen A ja B tarkoittavat vektoreiden A ja B
pituuksia. Kirjoitetaan pistetulo vektoreiden välisen
kulman θ avulla, jolloin
Katsotaan, millaisia ovat yksikkövektoreiden ristitulot
toistensa kanssa. Lasketaan esimerkkinä
i×j
(A2x + A2y + A2z )(Bx2 + By2 + Bz2 )
|A × B|2 = A2 B 2 − (A · B)2 ,
Skalaarilla kerrottaessa ristitulo noudattaa yhtälöä
λ(A × B) = (λA) × B = A × (λB).
=
Tämä taas on sama kuin
Suoraan määritelmästä nähdään vektoritulon
distributiivisuus
A × (B + C) = A × B + A × C.
(Ay Bz − Az By )2 + (Az Bx − Ax Bz )2
+(Ax By − Ay Bx )2 .
Suoraviivainen lasku osoittaa, että tämä voidaan
kirjoittaa muotoon
A × A = −A × A,
A × A = 0.
=
Ax (Ay Bz − Az By )
+Ay (Az Bx − Ax Bz )
+Az (Ax By − Ay Bx )
0.
Samoin nähdään, että B · (A × B) = 0. Vektori A × B on
siis kohtisuorassa molempia tekijöitään vastaan eli
kohtisuorassa tekijöiden muodostamaa tasoa vastaan.
Tulovektorin suunta on pääteltävissä yksikkövektoreitten
ristituloista (1.19):
Vektoreiden A ja B ristitulo on
(1.19)
pitävät paikkansa. Koordinaatistoa, jonka kantavektorit
toteuttavat relaatiot (1.19) sanotaan oikeakätiseksi.
z
A × B = (|A||B| sin θ)n,
(1.20)
missä θ on vektoreiden välinen kulma ja n vektoreiden
muodostamaa tasoa vastaan kohtisuorassa oleva sellainen
yksikkövektori että vektoreiden A, B ja n kolmikko (tässä
järjestyksessä) muodostaa oikeakätisen systeemin. Oikean
käden kolmisormisääntö lienee havainnollisempi: Jos A
osoittaa oikean käden peukalon suuntaan ja B etusormen
suuntaan niin A × B osoittaa keskisormen suuntaan (ja
on kohtisuorassa vektoreita A ja B vastaan).
y
x
Kuva 1.11 Oikeakätinen koordinatisto
A ´ B
Oikeakätisessä xyz-koordinaatistossa z-akselin suuntainen
oikeakätinen ruuvi postiiviseen kiertosuuntaan
kierrettäessä (kierretään lyhintä kautta positiiviselta
x-akselilta positiiviselle y-akselille) etenee positiivisen
z-akselin suuntaan. Sama asia voidaan ilmaista myös ns.
oikean käden kolmisormisääntönä:
oikean käden peukalon osoittaessa x-akselin suuntaan ja
etusormen y-akselin suuntaan osoittaa keskisormi
z-akselin suunnan.
B
q
|A ´ B |
A
Kuva 1.12 Ristitulon geometrinen merkitys
7
Kuvassa 1.12 vektoreiden A ja B muodostaman kolmion
korkeus on B sin θ jos kolmion kantana pidetään vektoria
A. Tämän kolmion pinta-ala on siten 21 AB sin θ, joten
ristitulo on suuruudeltaan tekijävektoreiden
muodostaman suunnikkaan pinta-ala.
Esim. A = 2i − 3j − k ja B = i + 4j − 2k, a) A × B, b)
B × A ja c) (A + B) × (A − B)
a)
i
j
k A × B = 2 −3 −1 1
4 −2 −3 −1 − j 2 −1 + k 2 −3 = i 4 −2
1 −2
1
4 = 10i + 3j + 11k.
Vääntömomentin suunnasta on sovittu, että voiman
kiertämä vaikutuspisteeseen asetettu vaikutustasoa
(vektoreiden r ja F muodostama taso) vastaan
kohtisuorassa oleva oikeakätinen ruuvi etenee
vääntömomentin suuntaan. Voimme siis kirjoittaa
M = r × F.
w
B×A
=
=
=
c)
(A + B) × (A − B)
=
=
=
=
=
r s in q
r
q
O
w
Kuva 1.14 Kulmanopeus ja lineaarinen nopeus
Esim. Lineaarinen nopeus pyörivässä
kappaleessa: Oletetaan, että kiinteä kappale pyörii origon
O kautta kulkevan akselin ω ympäri kulmanopeudella ω.
Vektori ω orientoidaan siten, että vektorin suuntaan
katsottuna kappale pyörii myötäpäivään. Tarkastellaan
kappaleen pistettä P . Kappaleen pyöriessä piste P seuraa
sellaisen ympyrän kehää, joka on kohtisuorassa
keskipisteensä kautta kulkevaa vektoria ω vastaan. Jos
nyt r on pisteen P paikka sekä θ vektorien r ja ω välinen
kulma, niin tämän ympyrän säde on r sin θ.
Ympyräliikkeen lineaarinen nopeus on suuruudeltaan
ympyrän säde kertaa kulmanopeus, ts. rω sin θ.
Lineaarisen nopeuden suunta taas on ympyrän tangentin
suuntainen eli nyt kohtisuorassa vektoreita ω ja r
vastaan. Oikean käden kolmisormisäännön perusteella
voimme siten kirjoittaa
4 −3 A × (A − B)
+B × (A − B)
A×A−A×B
+B × A − B × B
−A×B−A×B−
−2A × B
−20i − 6j − 22k.
v = ω × r.
M
P
v
P
b)
i
j
k 1
4 −2 2 −3 −1 1
1 −2 4 −2 + k − j
i
2
2 −1 −3 −1 −10i − 3j − 11k = −A × B.
r s in q
1.3.3 Kolmitulot
Skalaarikolmitulo
F
r
Tarkastellaan muotoa A · (B × C) olevia kolmen vektórin
tuloja. Vektoreiden A ja B × C pistetulona tämä on
skalaari. Siksi sitä nimitetäänkin skalaarikolmituloksi.
Skalaarikolmitulon geometrinen merkitys selvinnee alla
olevasta kuvasta.
q
Kuva 1.13 Vääntömomentti
Esim. Vääntömomentti: Määritelmän mukaan voiman
B × C
F vääntömomentti pisteen P suhteen on suuruudeltaan F
kertaa pisteen P kohtisuora etäisyys voiman
vaikutussuorasta. Olkoon nyt r pisteestä P voiman
vaikutuspisteeseen suunnattu vektori ja θ tämän vektorin
ja voiman välinen kulma. Kuvasta nähdään, että pisteen
P kohtisuora etäisyys vaikutussuorasta on r| sin θ|, joten
vääntömomentti on suuruudeltaan
A
h
C
B
M = F r| sin θ| = |r × F|.
Kuva 1.15 Skalaarikolmitulo
8
Vektoreiden A, B ja C muodostaman suuntaissärmiön
tilavuus on pohjasuunnikkaan pinta-ala |B × C| kertaa
särmiön korkeus h. Korkeus taas on vektorin A projektio
pohjatasoa vastaan kohtisuoralle suunnalle, esim.
vektorille B × C. Särmiön tilavuus V on siis
V = |A · (B × C)|.
Vektorikolmitulo
Vektorikolmitulolla tarkoitetaan kolmen vektorin
ristituloja A × (B × C) ja (A × B) × C. Nämä ovat
yleensä erisuuria, joten sulkumerkit ovat oleellisia.
Käsitellään edellistä muotoa olevia kolmituloja
(jälkimmäisen käsittely menee samalla tavoin). Koska
kyseessä on vektoreiden A ja B × C vektoritulo, on
tuloskin vektori. Lasketaan näytteeksi sen x-komponentti:
(1.21)
Komponenttimuodossa skalaarikolmitulo on
A · (B × C)
=
=
=
=
eli
(A × (B × C))x
= i · (A × (B × C))
1
0
A
A
x
y
= By Bz − Bx Bz Cx Cz Cy Cz (Ax i + Ay j + Az k) ·
i
j
k Bx By Bz Cx Cy Cz (Ax i + Ay j + Az k) ·
Bx Bz By Bz − j
i
Cx Cz Cy Cz B
By +k x
Cx Cy B Bz − Ay Bx Bz
Ax y
Cx Cz
Cy Cz
B
By +Az x
Cx Cy Ax Ay Az Bx By Bz Cx Cy Cz Ax
A · (B × C) = Bx
Cx
Ay
By
Cy
Az Bz .
Cz = Ay (Bx Cy − By Cx ) + Az (Bx Cz − Bz Cx )
= Bx (Ax Cx + Ay Cy + Az Cz )
−Cx (Ax Bx + Ay By + Az Bz )
= (A · C)(B · i) − (A · B)(C · i)
= i · [(A · C)B − (A · B)C] .
Samalla tavoin voisimme laskea niin tämän kolmitulon
muut komponentit kuin myös jälkimmäisen muodon
komponentit jolloin päätyisimme yhtälöihin
A × (B × C)
(A × B) × C
=
=
(A · C)B − (A · B)C
(A · C)B − (B · C)A.
(1.24)
Muistamista helpottanee molempiin tapauksiin soveltuva
sääntö:
vektorikolmitulo = (kauempi·ulko)lähempi
-(lähempi·ulko)kauempi,
missä ”ulko”tarkoitaa sulkujen ulkopuolista tekijää,
”lähempi”lähempänä ja ”kauempi”kauempana
”ulko”-tekijästä olevaa sulkujen sisäpuolista vektoria.
(1.22)
Koska vaihdettaessa kaksi riviä keskenään determinantti
vaihtaa merkkinsä, saamme
Ax Ay Az A · (B × C) = Bx By Bz Cx Cy Cz Cx Cy Cz = − Bx By Bz Ax Ay Az Cx Cy Cz = Ax Ay Az = C · (A × B).
Bx By Bz Koska skalaaritulo on kommutatiivinen, voimme
kirjoittaa tämän myös muotoon
A · (B × C) = (A × B) · C
0
Az
Bx By
Cx Cy
(1.23)
eli skalaarikolmitulossa pisteen ja ristin paikan voi vaihtaa
(sulkumerkkien paikat toki vaihtuvat tässä operaatiossa).
9
2. Raja-arvo ja derivaatta
Lineaarinen riippumattomuus
Vektorit v1 , v2 , . . . vn ovat lineaarisesti riippumattomia,
jos
n
X
ak vk = 0 vain jos a1 = . . . = an = 0
(1.25)
k=1
Muussa tapauksessa vektorit ovat lineaarisesti riippuvia.
Kolmiulotteisessa avaruudessa on enintään 3 vektorin
joukko keskenään lineaarisesti riippumaton.
Esim. kantavektorit i, j, k ovat lineaarisesti
riippumattomia:
2.1 Raja-arvon määritelmä
Funktiolla f (x) on raja-arvo f0 pisteessä x0 jos f (x)
lähestyy arvoa f0 kun x lähestyy arvoa x0 .
Merkitään
f (x) → f0 kun x → x0
(2.1)
tai
lim f (x) = f0 .
x→x0
(2.2)
Raja-arvo matemaattisemmin:
a1 i + a2 j + a3 k = 0
Intuitiivisesti raja-arvon käsite on varsin selvä. Matemaattisesti se
määritellään seuraavasti: funktiolla f (x) on raja-arvo f0 pisteessä
x0 , jos
vain jos a1 = a2 = a3 = 0.
Esim. v1 = i, v2 = j, v3 = i + j ovat lineaarisesti
riippuvia:
∀ǫ ∃δ > 0 siten että |f (x) − f0 | < ǫ
jos 0 < |x − x0 | < δ
Tässä merkintä “∀: kaikille”, “∃: on olemassa”.
v3 = v1 + v2 ⇒ v 1 + v2 − v3 = 0
Jos vektorit ovat lineaarisesti riippuvia, ainakin yksi
vektoreista voidaan kirjoittaa lineaarikombinaationa
muista.
Skalaarikolmitulon ja lineaarisen riippumattomuuden
välillä on seuraava yhteys:
Vektorit a, b ja c ovat lineaarisesti riippumattomia jos ja
vain jos a · (b × c) 6= 0.
Esim. i · (j × k) = 1, joten i, j, k ovat lineaarisesti
riippumattomia.
Esim. a = (1, 0, 1), b = (1, 2, 3), c = (3, 2, 5):
1 0 1 a · (b × c) = 1 2 3 3 2 5 2 3 1 3 1 2 = 1
− 0
+ 1
2 5 3 5 3 2 =
Eli: f on mielivaltaisen lähellä f0 :aa, jos x on riittävän lähellä
x0 :aa.
Raja-arvo on selkeä esim. tapauksissa
lim x2 + x = 2,
x→1
x→π/4
xa
= 0, a ∈ R
x→∞ ex
1
= 0,
x→∞ x
lim
lim
(Huom: eksponenttifunktio pesee minkä tahansa
potenssin!)
Kavalia ovat esim. tapaukset jotka lähenevät muotoa
∞
0
, 0 × ∞,
, ∞ − ∞, 00 , . . .
0
∞
Esim:
2x4
2x4 + x2 + 1
= lim
= −2
4
3
x→∞ −x4
x→∞ −x + x
lim
4−0−4=0
Vektorit eivät ole lineaarisesti riippumattomia. Helposti
nähdään että a = (c − b)/2.
Huom: jos meillä on kolme lineaarisesti riippumatonta
vektoria v1 , v2 , v3 , niin mielivaltainen vektori voidaan
esittää näiden lineaarikombinaationa:
a = a1 v1 + a2 v2 + a3 v3 . Sanotaan että vektorit vi
virittävät 3-ulotteisen avaruuden.
Tutuin esimerkki näistä on tietysti i, j, k.
√
lim sin x = sin π/4 = 1/ 2,
(2.3)
Suurin potenssi voittaa kun x → ∞. (vastaavasti pienin
jos x → 0).
Usein raja-arvojen laskemisessa auttavat seuraavat
approksimaatiot, kun |x| on pieni:
(1 + x)a
=
1
x − x3 + O(x5 )
6
1 2
1 − x + O(x4 )
2
1 + ax + O(x2 )
ln(1 + x)
ex
=
=
x + O(x2 )
1 + x + O(x2 )
sin x
=
cos x
=
(2.4)
(2.5)
(2.6)
(2.7)
(2.8)
Tässä merkintä O(xn ) tarkoittaa että kaikissa lopuissa
termeissä
√ x:n potenssi on vähintään n.
Esim. 1 + x = 1 + x/2 + O(x2 )
10
2.3 Derivaatan määritelmä
Esim.
sin x
lim
x→0 x
=
=
Funktion f (x) derivaatalla f ′ (x0 ) pisteessä x0
tarkoitetaan raja-arvoa
x − x3 /6 + O(x5 )
lim
x→0
x
lim (1 − x2 /6 + O(x4 )) = 1.
f ′ (x0 )
x→0
Määritellään vielä oikeanpuoleinen raja-arvo:
f0 = lim f (x)
Ilmeisesti limx→0+ θ(x) = 1, mutta limx→0− θ(x) = 0.
Huom: askelfunktiolla ei ole tavallista raja-arvoa pisteessä
x = 0!
Huom: merkitään myös ilmeiset raja-arvot
1
= ∞,
x
lim
x→0−
1
= −∞,
x
y = f(x )
a
Eli x lähestyy arvoa x0 vasemmalta (negatiiviselta)
puolelta.
Epäjatkuvalla funktiolla oikeanpuoleinen ja
vasemmanpuoleinen raja-arvo voivat olla erilaiset:
Esim. askelfunktio eli Heavisiden funktio:

x>0
 1,
1/2, x = 0
θ(x) =
(2.11)

0
x<0
lim
lim x = ∞
x→∞
2.2 Jatkuva funktio
Funktio f (x) jatkuva pisteessä x0 , jos f on määritelty
jossain pisteen x0 ympäristössä ja
x
=
lim [f (x)/g(x)]
=
x→x0
x→x0
3
f ′ (x0 ) =
df (x) .
dx x=x0
Kun kyseessä on derivointi ajan suhteen, käytetään fysiikassa
usein merkintää
.
d
f (t) = f (t).
dt
x→x0
x→x0
lim f (x)/ lim g(x)
x→x0
x
d
df (x)
f (x) =
= Dy = Df (x).
dx
dx
Monesti jätetään funtion f argumenttikin merkitsemättä. Kun
halutaan painottaa, että derivaattafunktio f ′ (x) halutaan laskea
nimenomaan pisteessä x0 , merkitään joskus
lim f (x) lim g(x)
x→x0
2
f ′ (x) = y ′ =
lim f (x) + lim g(x)
x→x0
x
Olkoon y = f (x) jokin derivoituva funktio. Derivaattaa f ′ (x)
merkitään usein myös
pisteessä x = 0, mutta on jatkuva kaikissa pisteissä x 6= 0.
Esim. Funktio f (x) = 1/x2 ei ole jatkuva pisteessä x = 0
(ei edes määritelty)
Raja-arvoille pätevät myös seuraavat ominaisuudet: jos
funktioilla f (x) ja g(x) on raja-arvot kun x → x0 , niin
lim [f (x)g(x)]
1
Merkintöjä
Fysiikassa funktiot ovat jatkuvia (melkein) kaikkialla.
x→x0
x
Määritelmässä (2.14) ei ole spesifioitu lähestymissuuntaa,
ts. voi olla joko x > x0 tai x < x0 . Molempien
lähestymistapojen täytyy johtaa samaan lopputulokseen.
Raja-arvo (2.14) ei välttämättä aina ole yksikäsitteinen
tai sitä ei ole olemassa. Tällaisessa tapauksessa
derivaattaa ei ole määritelty. Jos raja-arvo (2.14)on
(yksikäsitteisenä) olemassa, sanotaan, että funktio on
derivoituva pisteessä x0 .
Esim. funktio f (x) = |x| on jatkuva kaikilla x ∈ R. Jos
x > 0, on
f (y) − f (x)
= 1,
f ′ (x) = lim
y→x
y−x
ja vastaavasti jos x < 0 on f ′ (x) = −1. Pisteessä x = 0 ei
raja-arvoa ole olemassa (on vain vasemman- ja
oikeanpuoleiset raja-arvot), eikä |x| ole derivoituva
pisteessä x = 0.
Esim. Heavisiden askelfunktio (2.11) ei ole jatkuva
=
0
f '( x 0 ) = ta n a
Kuva 2.1 Derivaatan geometrinen tulkinta
(2.12)
lim f (x) = f (x0 )
x→x0
lim [f (x) + g(x)]
(2.14)
(2.10)
x→x0 −
x→0+
(2.13)
Geometrisesti derivaatta on funktion kuvaajan tangentin
kulmakerroin derivointipisteessä.
tai f (x) → f0 , kun x → x0 +. Merkintä tarkoittaa että x
lähestyy arvoa x0 oikealta (positiiviselta) puolelta.
Vastaavasti vasemmanpuoleinen:
f0 = lim f (x)
lim
x→x0
=
(2.9)
x→x0 +
f (x) − f (x0 )
x − x0
f (x0 + h) − f (x0 )
lim
h→0
h
=
Leibnitzin merkintätapa
x→x0
df
dx
on intuitiivisin:
funktion muutos
kun muutos → 0
muuttujan muutos
missä viimeisin edellyttää että limx→x0 g(x) 6= 0.
11
Huom:
f ′ (x) = 0: funktio vaakasuora pisteessä x
f ′ (x) = 1: funktion kulmakerroin = 1 (45◦ ) pisteessä x)
f ′ (x) → ∞: funktio lähestyy pystysuoraa
joten
cos ∆x − 1
lim
∆x→0
∆x
=
=
2.4 Derivaattojen lasku
=
Derivaatta suoraan määritelmästä
Lasketaan esimerkiksi potenssifunktion f (x) = xn
derivaatta. Määritelmän mukaan derivaatta f ′ (x) on
raja-arvo
f ′ (x)
=
=
f (y) − f (x)
y−x
f (x + ∆x) − f (x)
.
lim
∆x→0
∆x
− 21 (∆x)2 + O (∆x)4
lim
∆x→0
∆x
lim O (∆x)
∆x→0
0
ja
sin ∆x
lim
∆x→0 ∆x
∆x − O (∆x)3
lim
∆x→0
∆x
lim 1 − O (∆x)2
=
=
lim
y→x
∆x→0
=
1.
Derivaataksi saamme siis
d
sin x = cos x.
dx
Tässä tapauksessa on siis laskettava raja-arvo
(x + ∆x)n − xn
.
∆x→0
∆x
f ′ (x) = lim
Trigonometristen funktioiden yhteenlaskukaavoja
Sini- kosinifunktiot toteuttavat yhteenlaskukaavat
Käyttäen (1 + δ)a = 1 + aδ + O(δ 2 ) (2.6) saamme
sin(x + y)
cos(x + y)
∆x n
∆x
∆x 2
(x + ∆x)n = xn (1 +
) = xn [1 + n
+ O((
) )]
x
x
x
=
=
sin x cos y + cos x sin y
cos x cos y − sin x sin y.
Koska
sin x
,
cos x
voidaan tangentin yhteenlaskukaava kirjoittaa mm. muotoon
tan x =
joten
(x + ∆x)n − xn
∆x→0
∆x
lim
=
=
lim [nxn−1 + xn−1 O(
∆x→0
n−1
nx
∆x
)]
x
tan(x + y) =
.
tan x + tan y
sin x cos y + cos x sin y
=
.
cos x cos y − sin x sin y
1 − tan x tan y
Erikoistapauksena saadaan kaksinkertaisille kulmille kaavat
n
sin 2x
cos 2x
tan 2x
n−1
.
Siis saimme dx
dx = nx
Käsitellään toisena esimerkkinä funktion f (x) = sin x
derivaatan laskua. Nyt
=
=
=
2 sin x cos x
cos2 x − sin2 x
2 tan x
.
1−tan2 x
Pythagoraan lauseen perusteella on
sin(x + ∆x) = sin x cos ∆x + cos x sin ∆x,
sin2 x + cos2 y = 1.
Kaksinkertaisen kulman kosini voidaan siten kirjoittaa myös
muotoihin
joten derivaatan määritelmän mukaan on
f ′ (x)
=
=
=
sin(x + ∆x) − sin x
∆x
sin x cos ∆x + cos x sin ∆x − sin x
lim
∆x→0
∆x
sin ∆x
cos ∆x − 1
,
+ cos x
lim sin x
∆x→0
∆x
∆x
cos 2x = 2 cos2 x − 1 = 1 − 2 sin2 x.
lim
∆x→0
Muutamien tavallisimpien funktioiden derivaattoja on
esitetty taulukossa
f (x)
c (vakio)
xn
ex
ln x
sin x
cos x
tan x
missä olemme käyttäneet sinin ja kosinin
yhteenlaskukaavoja.
Pienillä argumentin arvoilla trigonometriset funktiot
käyttäytyvät kuten (2.4,2.5):
sin δ
=
cos δ
=
1
δ − δ3 + O δ5
6
1
1 − δ2 + O δ4 ,
2
12
Df (x)
0
nxn−1
ex
.
1/x
cos x
− sin x
1/cos2 x = 1 + tan2 x
(2.15)
d
d
sin ex = cos(ex ) ex = cos(ex )ex
dx
dx
Derivaatan laskusääntöjä
Olkoot f ja g derivoituvia funktioita ja a ja b vakioita.
Tällöin on voimassa
d
[af (x) + bg(y)] = af ′ (x) + bg ′ (x).
dx
d x
x
dx
(2.16)
=
=
Derivointi on lineaarinen operaatio. Funktioiden tulo
f (x)g(x) derivoidaan kuten
d x ln x
d
e
= ex ln x x ln x
dx
dx
1
xx (1 ln x + x ) = xx (1 + ln x)
x
Käänteisfunktion derivaatta
d
[f (x)g(x)] = f ′ (x)g(x) + f (x)g ′ (x)
dx
Olkoon meillä funktion y = f (x), käänteisfunktio
x = f −1 (y). Nyt käänteisfunktion derivaatta saadaan
funktion derivaatan avulla seuraavasti:
(2.17)
ja osamäärä f (x)/g(x) kuten
d f (x)
f ′ (x)g(x) − f (x)g ′ (x)
=
.
dx g(x)
g 2 (x)
Df −1 (y) =
(2.18)
1
f ′ (f −1 (y))
=
1
f ′ (x)
.
(2.20)
Leibnitzin notaatiolla tämä on yksinkertaisesti
Tulon derivointi
dx
1
= dy
dy
dx
Osoitetaan tulon derivoimissääntö. Suoraan derivaatan
määritelmästä nähdään
f (x + h) − f (x) = hf ′ (x) + O(h2 )
Nyt
d
(f (x)g(x))
dx
f (x + h)g(x + h) − f (x)g(x)
= lim
h
h→0
(f (x) + hf ′ (x))(g(x) + hg ′ (x)) − f (x)g(x) + O(h2 )
= lim
h→0
h
h(f ′ (x)g(x) + f (x)g ′ (x)) + O(h2 )
= lim
h
h→0
= f ′ (x)g(x) + f (x)g ′ (x)
(miten todistetaankin käänteisfunktion derivoimissääntö,
kun ajatellaan raja-arvoja ∆x, ∆y.)
Esim. Johdetaan logaritmin derivoimissääntö. Nyt
y = ex , x = ln y:
d ln y
dy
=
1
1
1
dx
1
= dy = dex = x =
dy
e
y
dx
dx
tai D ln y = 1/(Dex ) = 1/ex = 1/y.
Syklometriset funktiot
Trigonometrisillä funktioilla ei ole yksikäsitteistä
käänteisfunktiota. Esimerkiksi yhtälön
Yhdistetyn funktion f (g(x)) derivointiin soveltuu
ketjusääntö
d
f (g(x)) = f ′ (g(x))g ′ (x).
dx
(2.21)
sin x =
1
2
ratkaisee mikä tahansa äärettömän joukon
(2.19)
x=
Tämä tulee erityisen selväksi käyttäen Leibnitzin
notaatiota: jos merkitään y = f (z) ja z = g(x), saadaan
π
+ 2nπ
6
5π
+ 2nπ,
6
n kokonaisluku
π
π
≤x≤ ,
2
2
on yhtälöllä sin x = a yksikäsitteinen ratkaisu, jota nimitetään
arkussiniksi ja merkitään
π
π
x = arcsin a, − ≤ x ≤ .
2
2
luvuista. Kun rajoitetaan sinin argumentti välille −
dy
dy dz
d
f (g(x)) =
=
= f ′ (g(x))g ′ (x)
dx
dx
dz dx
Tämän avulla nähdään muun muassa että
Arkussini on siis se sinin käänteisfunktio, jonka arvoalue on
π
π
rajoitettu välille − ≤ x ≤ + . Kosinilla puolestaan on
2
2
yksikäsitteinen arkuskosiniksi sanottu käänteisfunktio, kun
rajoitetaan kosinin argumentti välille 0 ≤ x ≤ π. Tästä käytetään
merkintää
x = arccos z, 0 ≤ x ≤ π.
d
[f (x)]µ = µ[f (x)]µ−1 f ′ (x)
dx
d f (x)
e
= ef (x) f ′ (x)
dx
f ′ (x)
d
ln f (x) =
dx
f (x)
Tangentin käänteisfunktio on nimeltään arkustangentti. Sen
arvoalue on
π
π
y = arctan x, − ≤ y ≤ .
2
2
Koska sinin ja kosinin arvoalueet kattavat välin [−1, 1], voivat
arkussinin ja arkuskosinin argumenttit olla väillä [−1, 1].
Arkustangentin argumentti taas voi olla mikä tahansa reaaliluku,
sillä tangentin arvoalueena on koko reaaliakseli.
Esimerkkejä:
2 d
2
d x2
e = ex
x2 = ex 2x
dx
dx
13
Joskus halutaan määritellä trigonometristen funktioiden
käänteisfunktiot monikäsitteisiksi, esim. halutaan että
z = arcsin x antaa kaikki ne arvot z, joilla sin z = x. Tällöin
π
π
rajattua arkussiniä sanotaan ko.
arvoalueelle − ≤ arcsin x ≤
2
2
funktion päähaaraksi. Päähaarasta käytetään merkintää arcsin x.
Vastaavat nimitykset ja merkinnät ovat käytössä muillekin
trigonometrisille käänteisfunktioille.
Trigonometristen funktioiden käänteisfunktioita sanotaan
syklometrisiksi funktioiksi tai useimmiten niiden nimen mukaisesti
tuttavallisesti arkus-funktioiksi.
Lasketaan esimerkkinä funktion arcsin x derivaatta. Nyt
arcsin on sinifunktion käänteisfunktio, ts. jos x = sin y
niin y = arcsin x. Säännön (2.20) perusteella on
1
1
=
.
D arcsin x =
D sin y
cos y
Trigonometristen funktioiden ominaisuuksien perusteella
voidaan kirjoittaa
q
p
cos y = 1 − sin2 y = 1 − x2 ,
joten saamme
d
1
arcsin x = √
.
dx
1 − x2
(2.22)
2.6 Sovelluksia
Differentiaalilaskennan lukemattomista käyttökohteista
käsitellään muutamia fysiikan kannalta ehkä tärkeähköjä
sovelluksia.
Suureiden muodostus
Intuitiivisesti nopeudella ymmärretään aikayksikössä
kuljettua matkaa. Matemaattisen täsmälliseksi nopeuden
käsite saadaan määrittelemällä se rajarvona
∆t→0
v(t) =
=
=
2
dv(t)
d x(t)
dt =.. dt2
.v(t)
x(t).
=
(2.27)
Muista lukemattomista derivaattojen avulla määritellyistä
fysiikan käsitteistä mainittakoon vaikkapa sähkövirta
2.5 Korkeamman kertaluvun derivaatat
I=
′
Jos funktion f (x) derivaatta f (x) on myöskin
derivoituva, voimme laskea senkin derivaatan:
dQ
dt
sähkövarauksen Q muuttuessa ajan t funktiona tai teho
(2.24)
Sanomme, että funktio f (x) on kahdesti derivoituva ja
suure Df ′ (x) funktion f (x) toinen derivaatta. Jos vielä
tämä toinen derivaattakin on derivoituva, voisimme
edelleen määrätä sen derivaatan DDf ′ (x) jne. Vastaavasti
funktion sanotaan tällöin olevan kolmesti, . . ., n kertaa,
derivoituva ja puhutaan kolmansista, . . ., n:stä
derivaatoista.
P =
Olkoon funktio f (x) n-kertaisesti derivoituva. Sen n:ttä
derivaattaa merkitään mm. kuten
dn f (x)
f (n) (x) = Dn f (x) =
.
dxn
Alhaisen kertaluvun derivaatoista voidaan myös käyttää sellaisia
merkintöjä kuin
dW
,
dt
missä W on hetkeen t mennessä tehty työ tai, kolmantena
esimerkkinä kappaleen tilavuuden V muutoksesta
aiheutuvasta paineen P muutoksesta kertova
puristusmoduuli (kompressibiliteetti)
B=−
Merkintöjä
1 dP
.
V dV
Approksimaatio
Derivaatan määritelmästä (2.14)
f ′ (x) = lim
∆x→0
f (x + ∆x) − f (x)
∆x
voidaan ratkaista f (x + ∆x) likimääräisesti:
Jos kyseessä on derivointi ajan suhteen, merkitään usein
..
d2 f (t)
= f (t).
2
dt
(2.26)
(2.23)
Kaavat (2.22,2.23) ovat hyödyllisiä integraalien laskuissa.
f (2) (x) = f ′′ (x) = DDf (x).
dx(t)
.
= x(t).
dt
Kiihtyvyys puolestaan on nopeuden muutos aikayksikössä.
Derivaattojen avulla ilmaistuna on siis pitkin x-akselia
liikkuvan kappaleen kiihtyvyys a kirjoitettavissa kuten
Samoin voidaan osoittaa
f ′ (x + ∆x) − f ′ (x)
.
Df ′ (x) = lim
∆x→0
∆x
(2.25)
kun oletetaan tarkasteltavan objektin liikkuvan pitkin
x-akselia ja sen olevan paikassa x(t) hetkellä t.
Derivaatan määritelmästä (2.14) nähdään, että nopeus
v(t) hetkellä t on
a(t)
d
1
arctan x =
.
dx
1 + x2
x(t + ∆t) − x(t)
,
∆t
v(t) = lim
f (x + ∆x) ≈ f (x) + f ′ (x)∆x.
(2.28)
Tämä relaatio on sitä tarkempi mitä pienempi ∆x on.
14
Väliarvolause
Ääriarvot
Tarkasti ottaen on voimassa ns. väliarvolause:
Funktion maksimikohta on sellainen piste, että
poistuttaessa siitä mihin tahansa suuntaan funktion arvo
pienee. Vastaavasti minimikohdasta poistuttaessa
funktion arvo kasvaa. Maksimi (minimi) on paikallinen eli
lokaali, jos funktiolla on muita arvoltaan tätäkin
suurempia (pienempiä) maksimeja (minimejä). Jos
kyseessä on funktion suurin (pienin) arvo, puhutaan
globaalista tai absoluuttisesta maksimista (minimistä).
Esim. kuvassa 2.3 minimi kohdassa x0 ja maksimi
kohdassa x1 ovat paikallisia. Kohdan x2 minimi saattaisi
olla globaali.
Olkoon f derivoituva funktio. Tällöin pisteiden x ja x + ∆x
välissä on olemassa sellainen piste x0 että
f ′ (x0 ) =
f (x + ∆x) − f (x)
.
∆x
Lauseen mukaan on siis tarkasti voimassa
f (x + ∆x) = f (x) + f ′ (x0 )∆x,
missä x < x0 < x + ∆x (olettaen, että ∆x > 0).
Esim. sin x kun x on pieni
Kaavan (2.28) mukaan on
f(x )
sin x ≈ x sin′ 0 = x cos 0 = x.
Esim. Newton-Raphsonin menetelmä
Tehtävänä on etsiä funktion f (x) nollakohta, ts. ratkaista
yhtälö
f (x) = 0.
Oletetaan, että f (x) on derivoituva. Olkoon x0 jokin
likiarvo ratkaisulle (saatu esim. arvaamalla tai piirtämällä
funktion kuvaaja). Approksimoidaan funktiota pisteen x0
läheisyydessä (ks. kuva 2.2) lineaarisella kuvaajalla
f (x) ≈ f (x0 ) + f ′ (x0 )(x − x0 ).
Tämän suoran ja x-akselin leikkauspiste
x1 = x0 −
f (x0 )
f ′ (x0 )
x
x
1
x
2
x
3
x
Kuva 2.3 Funktion ääriarvot
Derivoituvan funktion f (x) ääriarvokohdissa, ts.
maksimeissa ja minimeissä funktion tangentti on
x-akselin suuntainen (ks. kuva 2.3) eli
Derivoituvan funktion derivaatta ääriarvopisteissä on
nolla.
Tarkasti ottaen derivaatta häviää sellaisissa ääriarvopisteissä,
jotka sijaitsevat funktion määrittelyalueen sisällä. Jos esim.
funktio f (x) on määritelty siten, että
on (yleensä) parempi nollakohdan likiarvo kuin
alkuperäinen x0 .
f (x) = x2 , kun − 1 ≤ x ≤ 1,
f(x )
x
0
maksimit (arvoltaan 1) sijaitsevat reunapisteissä x = ±1.
Pisteitä, joissa derivaatta häviää sanotaan kriittisiksi
pisteiksi. Derivaatan häviäminen on siis ääriarvon
välttämätön ehto. Se ei kuitenkaan ole riittävä. Esim.
kuvassa 2.3 kohdan x3 vasemmalla puolen funktio on
pienempi ja oikealla puolen suurempi kuin pisteessä x3 .
Jos funktio on kahdesti derivoituva, voimme toisesta
derivaatasta päätellä kriittisen pisteen luonteen:
2
x
1
x
0
x
Kuva 2.2 Newton-Raphsonin iteraatio
• Jos toinen derivaatta on negatiivinen, siirryttäessä
pisteen yli vasemmalta oikealle ensimmäinen
derivaatta pienenee positiivisesta negatiiviseksi, ts.
kyseessä on maksimi.
Toistetaan sama menettely käyttäen pistettä x1
lähtöarvona, jolloin saadaan taas (toivottavasti) parempi
likiarvo x2 . Jatketaan samalla tavoin iteroiden, ts.
lasketaan likiarvosta xn likiarvo
xn+1 = xn −
• Jos toinen derivaatta on positiivinen, siirryttäessä
pisteen yli vasemmalta oikealle ensimmäinen
derivaatta kasvaa negatiivisesta positiiviseksi, ts.
minimi.
f (xn )
,
f ′ (xn )
niin kauan kunnes f (xn ) on halutulla tarkkuudella nolla
tai kunnes xn+1 poikkeaa riittävän vähän edellisestä
arvosta xn .
• jos toinen derivaatta on nolla kriittisessä pisteessä,
täytyy tarkastella korkeampia derivaattoja: jos pienin
nollasta poikkeava derivaatta on:
15
A) parillista kertalukua (2,4,. . . ), kyseessä on
maksimi/minimi jos derivaatan etumerkki on -/+.
B) pariton (1,3,. . . ), kyseessä ei ole ääriarvo.
Esim. limx→0 sin2 2x/x2
l’Hospitalin sääntö on ilmeisestikin sovellettavissa ja
saamme
sin2 2x
x→0
x2
Esim. Funktion f (x) = 3x4 − 4x3 kriittiset pisteet
=
lim
Derivaatta on nyt
=
f ′ (x) = 12x3 − 12x2 = 12x2 (x − 1).
Kriittiset pisteet saadaan asettamalla f ′ (x) = 0, ts.
ratkaistaan yhtälö
12x2 (x − 1) = 0.
Kriittiset pisteet ovat siten 0 ja 1. Funktion toinen
derivaatta on
f ′′ (x) = 36x2 − 24x,
joten f ′′ (0) = 0 ja f ′′ (1) = 12. Piste 1 on siis minimi.
mutta piste 0 ei ole maksimi eikä minimi.
l’Hospitalin sääntö
Hyvin monesti raja-arvoja laskettaessa päädytään
muotoa 0/0, ∞/∞ tai 0 · ∞ oleviin lausekkeisiin. Jos
kyseessä ovat derivoituvat funktiot, voidaan useimmiten
soveltaa l’Hospitalin sääntöä
Jos
f ′ (x)
lim ′
=A
x→a g (x)
ja jos joko
Päädymme siten edelleen muotoa 0/0 olevaan
lausekkeeseen. Sovelletaan tähän uudelleen l’Hospitalin
sääntöä, jolloin saadaan
lim 2
x→0
lim x ln x = lim
x→0+
f (x)
= A.
x→a g(x)
Tarkastellaan esimerkkinä tapausta, missä a on äärellinen ja missä
sekä f (a) = 0 että g(a) = 0. Voimme siis kirjoittaa
lim
x→a
f (x)
g(x)
=
=
=
=
lim
x→a
f (x) − f (a)
.
g(x) − g(a)
[f (x) − f (a)]/(x − a)
.
[g(x) − g(a)]/(x − a)
limx→a [f (x) − f (a)]/(x − a)
.
limx→a [g(x) − g(a)]/(x − a)
lim
f ′ (x)
g ′ (x)
Esim. limx→0 sin x/x
Sekä osoittaja että nimittäjä lähestyvät nollaa
argumentin lähestyessä nollaa ja funktiot ovat
derivoituvia. Voimme siis soveltaa l’Hospitalin sääntöä:
lim
1
x
.
x→0+
= lim (−x) = 0.
x→0+
Implisiittinen derivointi
Joskus funktiota y(x) määritellään esim. ehdolla
F (x, y) = F (x, y(x)) = c,
(2.29)
missä c on vakio. Periaatteessa tästä yhtälöstä voitaisiin
(ehkä) ratkaista muuttuja y. Tämä ratkaisu riippuisi
tietenkin muuttujasta x. Voimme siis ajatella, että yhtälö
(2.29) määrää implisiittisesti funktion y(x).
Funktion y(x) derivaatta voidaan usein ratkaista suoraan
derivoimalla ehtoa F :
x→a
jos derivaatat ovat olemassa.
x→0
1
x
x→0+ − 12
x
lim x ln x = lim
lim
Perusteluja
ln x
x→0+
Nyt sekä osoittaja että nimittäjä lähestyvät ääretöntä ja
l’Hospitalin sääntö on jälleen käyttökelpoinen:
tai
niin
cos 2x
sin 2x
= lim 4
= 4.
x→0
x
1
Esim. limx→0+ x ln x
Tässä merkintä x → 0+ tarkoittaa, että x lähestyy nollaa
positiiviselta puolelta. Tämä rajoitus on asetettu, jotta
logaritmifunktio olisi määritelty. Nyt x → 0 ja
ln x → −∞, joten l’Hospitalin säännön soveltamiseksi
kirjoitetaan raja-arvo muotoon
f (x) → 0 ja g(x) → 0 kun x → a
g(x) → ±∞ kun x → a,
4 sin 2x cos 2x
2x
sin 2x
sin 2x
lim
2 cos 2x = lim 2
.
x→0
x→0
x
x
lim
x→0
sin x
cos x
1
= lim
= = 1.
x→0
x
1
1
d
F (x, y(x)) = 0
dx
ja ratkaisemalla y ′ (x).
Esim. Tason origokeskeinen ympyrä x2 + y 2 = a2
määrittelee implisiittisesti funktion y(x).Nyt
d 2
(x + y(x)2 ) = 2x + 2y(x)y ′ (x) = 0
dx
⇒ y ′ (x) = −x/y
mikä on ympyrän tangentin kulmakerroin.
16
(2.30)
d
F (x, y(x))
dx
=
=
=0
3. Potenssisarjoja
dy
dx
yhtälöstä
sin(xy) + y = x
Tässä tapauksessa siis F (x, y(x)) = sin(xy) + y − x = 0, ja
Esim. Muodosta implisiittisesti derivaatta
d
(sin(xy) + y − x)
dx
dy
dy
+
−1
cos(xy) y + x
dx
dx
3.1 Äärettömät sarjat
Olkoon {an } jokin lukujono. Summaa
S=
∞
X
n=0
an = a0 + a1 + a2 + · · · + an + · · ·
sanotaan äärettömäksi sarjaksi. Lukuja
Hieman ryhmittäen voidaan kirjoittaa
Sn =
dy
(1 + x cos(xy))
= 1 − y cos(xy),
dx
Alkaako sarja nollannesta, ensimmäisestä, toisesta tai jostakin
P∞
muusta termistä on vain numerointikysymys. Summat
a ,
k=1 k
P∞
P∞
P∞
a
,
.
.
.
tai
lyhyemmin
a
,
a
,
.
.
.
ovat
myöskin
k
k
k
k=2
1
2
(äärettömiä) sarjoja.
Parametrisesti annetun funktion derivaatta
Esim. x = cos t ja y = sin t määrittelee parametrisesti
funktion (yksikköympyrän kaari) y(x) (kun 0 ≤ t ≤ π).
Yleisemmin: olkoon annettu x = g(t) ja
y = f (t) = f (g −1 (x)). Nyt ketjusäännön mukaan
Katsotaan esimerkkinä geometrista sarjaa
Osasummat ovat
Sn
(2.31)
=
=
dy
=
dx
Ympyrälle siis
√
1 − x2
cos t
dy
=
=−
dx
− sin t
x
n
X
0
Tai yksinkertaisesti
dy
dt
dx
dt
ak
kutsutaan osasummiksi. Äärettömän sarjan, tai lyhyesti
vain sarjan, sanotaan suppenevan (konvergoituvan) jos
raja-arvo limn→∞ Sn on olemassa. Jos raja-arvoa ei ole,
sarja hajaantuu (divergoi).
1 − y cos(xy)
dy
=
.
dx
1 + x cos(xy)
d
1
y (t)
dy
= f ′ (t) g −1 x = f ′ (t) ′
= ′
dx
dx
g (t)
x (t)
n
X
k=0
josta saamme derivaataksi
′
(3.1)
(2.32)
=
P∞
0
xn .
xk = 1 + x + · · · + xn
1 − xn+1
1−x
xn+1
1
−
.
1−x 1−x
Tiedämme, että xn+1 → 0 kun |x| < 1. Tällöin siis
lim Sn =
1
.
1−x
Toisaalta sarja selvästikin hajaantuu kun |x| ≥ 1.
Olemme siis saaneet tuloksen
∞
X
xn =
0
1
, kun |x| < 1.
1−x
(3.2)
Se, että sarjan termit lähestyvät nollaa, ei takaa sarjan
suppenemista. Esimerksi harmoninen sarja
∞
X
n=1
hajaantuu.
1
1
1
= 1 + + ··· + + ···
n
2
n
On olemassa useita testejä, joilla sarjojen suppenemista
voi tutkia.
P Näistä ehkä käytetyin on suhdetesti:
Olkoon
an sellainen positiivisten termien sarja, että
raja-arvo
lim an+1 /an = q
n→∞
on olemassa. Silloin
17
• jos q < 1, niin sarja suppenee,
Sarja siis suppenee, jos muuttuja x toteuttaa ehdon
• jos q > 1, niin sarja hajaantuu ja
|x| <
an
• jos q = 1, niin sarja voi supeta tai hajaantua.
Vaikka suhdetesti käsitteleekin vain positiivitermisiä
sarjoja, sitä voidaanP
soveltaa yleisempiinkin tapauksiin.
Sanotaan
että
sarja
an suppenee itseisesti jos sarja
P
|an | suppenee. Voidaan osoittaa, että sarjan supetessa
itseisesti myös itse sarja suppenee. Jos siis suhdetestillä
todetaan sarjan suppenevan itseisesti niin voidaan
päätellä sarjan suppenevan sellaisenaankin.
P∞ (−1)n n
Esim. Osoita, että sarja
suppenee
1
2n
Kyseessä on ns. vuorotteleva sarja: joka toinen termi on
positiivinen ja joka toinen negatiivinen.
Osoitetaan, että
P∞ (−1)n n sarja suppenee itseisesti, ts. että 1 2n suppenee.
Nyt an = 2nn ja
1
(n + 1)2n
1
an+1
1+
=
=
an
n2n+1
2
n
1
→
< 1.
2
Suhdetestin mukaan sarja suppenee itseisesti ja niin ollen
suppenee sellaisenaankin.
3.2 PotenssisarjatP
Geometrinen sarja (3.2) 0 xn esittää funktiota
1/(1 − x). Itseasiassa hyvin monet funktiot voidaan
esittää tyyppiä
∞
X
an (x − x0 )n
joten suppenemissäde R on
Esim. Sarjan
Nyt
n
Potenssisarjan suppeneminen riippuu yleensä muuttujan
x arvosta. Voidaan osoittaa, että
On olemassa sellainen
P luku R ≥ 0 (mahdollisesti +∞,
että potenssisarja n an xn suppenee itseisesti, kun
−R < x < R ja hajaantuu kun |x| > R.
Lukua R sanotaan suppenemissäteeksi.
Tärkein suppenemissäteen määräämismenetelmä on
jälleen suhdetesti:
P
Olkoon sarja n an xn sellainen, että raja-arvo
lim |an+1 /an | = q on olemassa. Suppenemissäde on silloin
R = 1/q.
P
n
Suhdetestin mukaan sarja
a x suppenee itseisesti, jos
n n
termien suhteelle on voimassa
an+1 xn+1 = lim an+1 |x| < 1.
lim
n
an x
an
P
n
R = lim = lim an
an+1
an
an+1
,
.
xn /n! suppenemissäde
an+1 n!
1
an = (n + 1)! = n + 1 ,
joten suhdetestin q on 0. Suppenemissäde on niin ollen
ääretön eli sarjaPsuppenee kaikilla muuttujan x arvoilla.
∞ 10n n
Esim. Sarjan
1
n x suppenemissäde
Suhdetesti antaa
10n
an n
=
an+1 10n+1
n+1
=
n+1 1
1
1
·
→
= = R.
n
10
10
q
Kuten todettua potenssisarjoja voidaan pitää
argumenttinsa funktioina. Potenssisarjafunktioilla on mm.
ominaisuudet:
P
Suppenemissäteen sisällä sarjan
an xn esittämä funktio
• on jatkuva,
• voidaan integroida integroimalla sarja termeittäin,
• voidaan derivoida (mielivaltaisen monesti)
derivoimalla sarja termeittäin.
0
olevina potenssisarjoina. Jatkossa käsittelemme
enimmäkseen tapauksia, joissa x0 = 0, sillä vaihtamalla
muuttujaan x′ = x − x0 mikä tahansa potenssisarja
saadaan muotoon
∞
X
n
an x ′ .
a1 lim n+1 3.3 Taylorin sarjat
Olkoon funktio f (x) äärettömän monta kertaa
derivoituva pisteen x0 ympäristössä. Tällöin se voidaan
esittää Taylorin sarjana pisteen x0 suhteen kehitettynä
suppenemissäteen sisällä:
f (x) =
∞
X
f (n) (x0 )
(x − x0 )n
n!
n=0
(3.3)
Tässä siis f (n) (x0 ) on funktion n:s derivaatta pisteessä
x0 , ja f (0) (x0 ) = f (x0 ). Luku
n! ≡ n(n − 1)(n − 2) . . . 1,
0! ≡ 1
on n:n kertoma.
Jos x0 = 0, Taylorin sarja saadaan usein esiintyvään
muotoon
∞
X
f (n) (0) n
x
f (x) =
(3.4)
n!
n=0
18
Todistus: Olkoon meillä potenssisarja
f (x) =
∞
X
n=0
=
f (x) =
∞
X
0
Asettamalla tässä x = x0 nähdään a1 = f (x0 ) = f
Derivoimalla k kertaa saamme
=
=
y = x suhdetestille sopivaan muotoon
a y . Tämä sarja
n n
suppenee kun muuttuja y on itseisarvoltaan pienempi kuin testin
antama suppenemissäde R. Muuttujalle x = y 1/β
suppenemissäde on niin ollen R1/β .
∞
∞
X
n=0
∞
X
n=k
an
(1)
Kääntäen, jos tunnetaan funktion f (x) Taylorin sarja
f (x) =
(x0 ).
mistä jälleen seuraa f (k) (x0 ) = k!ak , mikä jo osoittaakin
tuloksen (3.3).
Esim. Kosinifunktion Taylorin sarja
Nyt
=
− sin x
=
− cos x
=
sin x
=
cos x
f (xβ ) =
d2n+1
cos x =
dx2n+1
..
.
(n − 1)!
dn
ln x = (−1)n−1
; (n > 0),
dxn
xn
divergoi kun x = 0, emme voi origon (x0 = 0)
ympäristössä Taylorin sarjaa muodostaa.
Kehittämällä sen sijaan Taylorin sarja (3.3) pisteen
x0 = 1 ympäristössä, saame sarjan
ln x
cos x =
=
=
f (2) (0) 2
x
2!
f (3) (0) 3 f (4) (0) 4
+
x +
x + ···
3!
4!
1
1
1 − x2 + x4 + · · ·
2
4!
(x − 1)2
2
(x − 1)3
(x − 1)4
+
−
+ ···
3
4
∞
X
(x − 1)n
(−1)n−1
.
n
n=1
ln 1 + (x − 1) −
mikä on tapana esittää muodossa (y = x − 1)
(−1)n+1 sin x
Nähdään, että tässä tapauksessa parittomat derivaatat
f (2n+1) (0) häviävät ja jäljelle jäävät ainoastaan parilliset
f (2n) (0) = (−1)n .
Funktion cos x Taylorin sarja on niin ollen
an xβn
Katsotaan nyt, miten muodostaisimme logaritmifunktion
Taylorin sarjan. Koska sen jokainen derivaatta,
=
(−1)n cos x
X
n
..
.
d2n
cos x =
dx2n
an xn
ja sen suppenemissäde R, niin funktion f (xβ ) Taylorin sarja on
yksinkertaisesti
ja sen suppenemissäde R1/β .
an n(n − 1) . . . (n − k + 1)(x − x0 )n−k
X
n
dk
(x − x0 )n
dxk
d
cos x
dx
d2
cos x
dx2
d3
cos x
dx3
d4
cos x
dx4
x2n
.
(2n)!
Suhdetestin avulla todetaan helposti, että tämän sarjan
suppenemissäde on ääretön.
P
Tarkasti ottaen suhdetestillä määrätään sarjan
a xn
n n
P
βn
suppenemissäde. Sarja
a x
saadaan muuttujan vaihdolla
n n
P
β
n
X
d
an n(x − x0 )n−1 .
an (x − x0 )n =
dx
1
′
f (k) (x)
(−1)n
n=0
an (x − x0 )n .
Asettamalla x = x0 vain ensimmäinen termi on nollasta
poikkeava, ja nähdään heti a0 = f (x0 ) = f (0) (x0 ).
Potenssisarjojen ominaisuuksien mukaan sarjaa voidaan
derivoida termeittäin. Silloin ensimmäinen derivaatta
suppenemissäteen sisällä on
′
∞
X
ln(1 + y) =
∞
X
(−1)n−1
n=1
yn
n
Näiden sarjojen suppenemissäde on 1 (suppenee jos
|y| = |x − 1| < 1)
Taylorin sarjat funktioiden approksimaatioina
Kirjoitetaan funktion f Taylorin sarja muotoon
f (0) + f (1) (0)x +
f (x) = f (0) + f (1) (0)x + · · · +
f (n) (0) n
x + R(x).
n!
Intuitiivisesti on ilmeistä (ja voidaan osoittaa), että mitä
pienempi on argumetti x ja mitä suurempi on n sitä
pienempi on jäännöstermi R(x). Tämän perusteella
19
voimme approksimoida funktioita katkaistuilla Taylorin
sarjoilla:
f (n) (0) n
(3.5)
x .
n!
Approksimaatio on siis sitä tarkempi mitä pienempi on x
tai mitä suurempi on n. Yleensä approksimoitaessa
tyydytään lineaarisiin tai neliöllisiin termeihin.
Katkaistaessa yleistetty Taylorin sarja (3.3) tarkkuus on
vastaavasti sitä parempi mitä lähempänä argumentti on
kehityspistettä. Jotta tarkkuus olisi sitä parempi mitä
pienempi argumentti on, useimmiten muutetaan
tarkasteltavaa funktiota sen sijaan että kehitettäisiin
origosta poikkeavassa pisteessä.
Esimerkiksi logaritmifunktion tapauksessa saadaan
approksimaatio
f (x) ≈ f (0) + f (1) (0)x + · · · +
ln(1 + x) = x −
Jos µ on positiivinen kokonaisluku, sarjassa on äärellinen
määrä termejä (n = 0 . . . µ). Muussa tapauksessa sarjan
suppenemissäde on |x| < 1.
x3
x2
+
+ O(x4)
2
3
tai sinille
x3
+ O(x5 ).
6
Alla olevaan taulukkoon on kerätty muutamia usein
tarvittavia Taylorin sarjoja.
P
f (x)
a xn
P nxn
x
e
P0 n! n x2n+1
(−1) (2n+1)!
sin x
P0
n x2n
cos x
0 (−1) (2n)!
P x2n+1
(3.6)
sinh x
0 (2n+1)!
P x2n
cosh x
P0 (2n)!n−1 xn
ln(1 + x)
1 (−1)
n , |x| < 1
x3
2 5
tan x
x + 3 + 15 x + · · · , |x| < π2
sin x = x −
Näistä saamme suoraan aiemmin esitetyt approksimaatiot
(2.4–2.8).
Eksponenttifunktion sarjasta
X xn
ex =
n!
0
seuraa
d x
dx e
= ex , jos sitä ei muuten tunnettaisi:
d X xn
dx n n!
=
=
X nxn−1
n
∞
X
n!
X xk
xn−1
=
(n − 1)!
k!
n=1
k
missä k = n − 1.
Toistuvasti derivoimalla saadaan myös sarja
(1 + x)µ
=
=
µ(µ − 1) 2
x + ...
2!
∞
X
µ(µ − 1) . . . (µ − n + 1) n
x
n!
n=0
1 + µx +
20
Z
4. Integraalilaskentaa
4.1 Integraalifunktio
Z
Funktio F on funktion f integraalifunktio (integraali), jos
F ′ (x) = f (x).
Z
(4.1)
Integraalifunktion laskeminen (integrointi) on siis
derivoinnin käänteisoperaatio. Integraalifunktiosta on
tapana käyttää merkintää
Z
F (x) = f (x) dx
(4.2)
Funktiota f sanotaan integroitavaksi.
Integraalifunktio ei ole yksikäsitteinen: Olkoon f
integroituva funktio, jonka eräs integraalifunktio on F .
Tällöin jokainen funktion f integraalifunktio on muotoa
F (x) + C.
Todistus:
1. (F (x) + C)′ = F ′ (x) = f (x), joten F (x) + C on
integraalifunktio.
2. Olkoon G(x) toinen f (x):n integraalifunktio. Nyt
(F (x) − G(x))′ = F ′ (x) − G′ (x) = f (x) − f (x) = 0, joten
F (x) − G(x) on vakio.
Yleisesti integrointi on huomattavasti vaikeampaa kuin
derivointi: alkeisfunktioiden derivaatat ovat
alkeisfunktioita, mutta alkeisfunktioiden integraalit eivät
yleisesti ottaen ole!
Koska derivointi on lineaarinen operaatio, myös
integrointi on lineaarinen, ts.
Z
Z
Z
[αf (x) + βg(x)] dx = α f (x) dx + β g(x) dx, (4.3)
missä α ja β ovat vakioita.
Etenkin fysiikassa käytetään usein merkintää missä dx
tulee välittömästi integraalimerkin jälkeen, siis
Z
Z
dxf (x) ≡ f (x) dx
4.1.1 Tavallisia integraaleja
Johto seuraaville: derivoimalla!
Z
xµ+1
+ C, µ 6= 1
xµ dx =
µ+1
Z
a dx = ax + C, a vakio
Z
1
dx = ln |x| + C = ln |Ax|, missä C = ln |A|.
x
Z
ex dx = ex + C
Z
ax
+C
ax dx =
ln a
Z
Z
sin x dx
= − cos x + C
cos x dx
= sin x + C
tan x dx
= − ln | cos x| + C
cosh x dx
= sinh x + C
sinh x dx
= cosh x + C
Usein esiintyvät myös
Z
1
dx
1+x
Z
1
dx
1 + x2
Z
1
dx
1 − x2
Z
1
√
dx
1 − x2
Z
1
√
dx
2
x ±1
=
ln |1 + x| + C
=
arctan x + C
1 1 + x ln +C
2
1 − x
=
=
arcsin x + C
=
ln |x +
p
x2 ± 1| + C
4.2 Integraalien lasku
Toisin kuin derivointi integrointi ei yleensä ole
suoraviivainen mekaaninen toimenpide. Läheskään kaikki
alkeisfunktioista muodostetut funktiot eivät ole
integroituvia alkeisfunktioiden avulla! Integraalifunktion
etsinnässä on käytössä lukuisia menetelmiä, joista
tärkeimmät ovat muuttujan vaihto ja osittaisintegrointi.
Polynomit ja sarjat
Koska integrointi on lineaarinen operaatio, voimme laskea
esim. minkä tahansa polynomin integraalin. Jos polynomi
on muotoa,
P (x) = a0 + a1 x + a2 x2 + · · · an xn ,
on sen integraali
Z
1
1
an xn+1 . (4.4)
P (x) dx = C + a0 x + a1 x2 + · · · +
2
n+1
Samoin P
jos tunnemme funktion Taylorin sarjan,
f (x) = n an xn , saamme välittömästi integraalifunktion
sarjan
Z
X an
(4.5)
xn+1
f (x) dx = C +
n
+
1
n
Tämä sarja ei välttämättä vastaa mitään alkeisfunktiota.
4.2.1 Ketjusäännön käyttö
Derivoinnin ketjusäännön (2.19)
d
g(f (x)) = g ′ (f (x))f ′ (x)
dx
21
mukaan on
Z
g ′ (f (x))f ′ (x) dx = g(f (x)).
Jos g(x) = x2 , saadaan usein esiintyvä
Z
1
f ′ (x)f (x) dx = f (x)2 + C
2
Tai jos g(x) = ln x,
Z ′
f (x)
dx = ln |f (x)| + C
f (x)
Yleisemmin
Z
f ′ (x)(f (x))n dx =
(4.6)
Sijoitetaan t = ln x, jolloin dt = 1/x dx eli
dx = xdt.
(4.7)
(4.8)
1
(f (x))n+1 +C, n 6= −1 (4.9)
n+1
Esimerkkejä:
Z
Z
1
sin x cos x dx = sin x(sin x)′ dx = sin2 x + C
2
Z
Z
sin x
−(cos x)′
dx =
dx = − ln | cos x| + C
cos x
cos x
4.2.2 Muuttujan vaihto
Ketjusääntöön perustuu myös muuttujanvaihto- eli
sijoitustekniikka. Olkoon F funktion f integraalifunktio,
joka siis toteuttaa relaation
d
F (x) = f (x).
dx
Oletetaan nyt että x on parametrin t funktio, x(t).
Ketjusäännön mukaan on
d
F (x(t)) = F ′ (x(t))x′ (t) = f (x(t))x′ (t).
dt
Integroimalla yhtälö puolittain saadaan siten
Z
F (x(t)) = f (x(t))x′ (t) dt,
jonka voimme myös kirjoittaa muotoon
Z
Z
f (x) dx = f (x(t))x′ (t) dt.
(4.10)
Lyhyesti, tämä vastaa sijoitusta
dx =
Valaistaan muuttujan vaihtoa esimerkillä: integroidaan
Z
ln x
dx.
x
dx
dt
dt
eli siis muuttuja x “ylennetään” muuttujan t funktioksi.
Muuttujan vaihdon jälkeen integraali voi olla helpompi
laskea. Tulos on t’n funktio, mutta saadaan x:n funktioksi
kääntämällä x = x(t).
Integraali on siten
Z
ln x
dx =
x
Z
t
x dt =
x
Z
t dt
1 2
t .
2
Sijoitetaan takaisin t = ln x, jolloin saadaan lopulta
Z
ln x
1
dx = ln2 x.
x
2
=
Integroinnin tulos kannattaa yleensä tarkistaa derivoimalla.
Äskeisessä esimerkissä derivointi antaa
h
i
1
1
ln x
d 1 2
ln x = 2 ln x =
dx 2
2
x
x
kuten pitääkin.
Ongelma: kuinka löytää sopiva sijoitus t(x)? Löytyy
lukuisia sääntöjä, mutta yleispätevää ei. Kannattaa
yrittää tunnistaa sopiva kokonaisuus integroitavasta
funktiosta.
tyypillisistä sijoituksista:
REsimerkkejä
(ax + b)µ dx:
kokeillaan t = ax + b, dt = adx, joten
Z
Z
dt
µ
(ax + b) dx = tµ
a
µ+1
(ax + b)µ+1
t
+C =
+C
=
a(µ + 1)
a(µ + 1)
R
Esim. (5x − 6)6 dx. Sijoitetaan t = 5x − 6,
dt = 5dx ⇒ dx = dt/5, ja
Z
Z
1
11 7
1
(5x − 6)6 dx = t6 dt =
t +C =
(5x − 6)7 + C
5
57
35
vaiheessa sijoitetaan x takaisin.
√
RViimeisessä
a2 − x2 dx:
kokeillaan x = a sin
p t, dx = a cos tdt. (Miksi tämä sijoitus?
√
Syy: a2 − x2 = a2 − a2 sin2 t = |a cos t|.)
Z
Z p
a2 − x2 dx = a cos t a cos tdt
Z
Z
a2
= a2 cos2 tdt =
(1 + cos 2t)dt
2
a2
1
= (t − sin 2t) + C
2 2
x 1
x
a2
arcsin − sin(2 arcsin ) + C
=
2
a 2
a
!
r
2
x2
a
x x
=
arcsin +
1− 2 +C
2
a
a
a
22
missä viimeisessä käytettiinpcos 2t = 2 cos2 t − 1 ja
2
Rsin√2t = 2 sin t cos t = 2 sin t 1 − sin t.
2
2
a + x dx:
p
Tässä toimii x = a sinh t, sillä 1 + sinh2 x = cosh x
(vertaa
edelliseen).
R
1
ex +e−x dx:
Kokeillaan y = ex , dy = ex dx ja
Z
Z
1
1
1
dx =
dy
ex + e−x
y + 1/y y
Z
1
dy = arctan y + C = arctan ex + C
=
1 + y2
R √
3x 1 − 2x2 dx:
Kokeillaan u = 1 − 2x2 , du = −4xdx ⇒ xdx = − 14 du
Z
Z
p
3 √
2
udu
3x 1 − 2x dx = −
4
32
1
= − u3/2 + C = − (1 − 2x2 )3/2 + C
43
2
Huom: sijoitukset eivät useinkaan ole√yksikäsitteisiä.
Esim. yllä voidaan kokeilla myös t = 1 − 2x2 ,
1
dt = −2x(1 − 2x2 )−1/2 dx = − 2x
t dx ⇒ xdx = − 2 tdt:
Z
Z
p
1
2
3x 1 − 2x dx = 3t(− t)dt
2
1
1 3
= − t + C = − (1 − 2x2 )3/2 + C
2
2
Vinkki: juurilausekkeen sisältävässä integraalissa
kannattaa kokeilla uudeksi muuttujaksi joko juuren
sisäpuolta
tai juurilauseketta kokonaisuudessaan
R dx
√
:
1+x
√
Kokeillaan s = 1 + x, ds = 12 (1 + x)−1/2 dx ja
Z
Z
√
dx
√
= 2ds = 2s + C = 2 1 + x + C
1+x
Usein juurilausekkeita sisältävät funktiot eivät ole
integroitavissa alkeisfunktioiden avulla.
Rkuitenkaan
√ x+2 dx:
x+1+1 √
sijoitus t = x + 1 ⇒ x = t2 − 1, dx = 2tdt:
Z
Z 2
x+2
t −1+2
√
2tdt
dx =
t+1
x+1+1
Z 3
t +t
=2
dt
t+1
Koska rationaalilausekkeen osoittaja on korkeampaa
kertalukua kuin nimittäjä, voimme “jakaa” lausekkeen
muotoon polynomi + jakojäännös. Tästä tarkemmin
rationaalifunktioiden integroinnin yhteydessä.
Tarkistamalla nähdään että integraali on
Z 2
2
t −t+2−
=2
dt
t+1
1
1
= 2( t3 − t2 + 2t − 2 ln(t + 1) + C
3
2
2
= (x + 1)3/2 − (x + 1) + 4(x + 1)1/2
3 √
−4 ln( x + 1 + 1) + C
4.2.3 Osittaisintegrointi
Integroimalla tulon derivointisäännön
d
[f (x)g(x)] = f ′ (x)g(x) + f (x)g ′ (x)
dx
saamme osittaisintegrointisäännön
Z
Z
′
f (x)g(x) dx = f (x)g(x) − f (x)g ′ (x) dx.
(4.11)
R
Sovelletaan osittaisintegrointia integraaliin x ln x dx.
Olkoon säännön (4.11) f ′ (x) = x ja g(x) = ln x. Silloin on
f (x) = 1/2 x2 ja g ′ (x) = 1/x ja saamme
Z
Z
1 2
1
1
x ln x dx =
x2 dx
x ln x −
2
2
x
Z
1
1 2
=
x ln x −
x dx
2
2
1
1 2
x ln x − x2 .
=
2
4
Kuten nähtiin, funktiot “f ” ja “g” täytyy valita
huolellisesti että osittaisintegrointi johtaisi helpommin
ratkeavaan integraaliin! Väärä valinta johtaa vain
huonompaan
lopputulokseen.
R
Esim.
arctan xdx. Valitaan nyt g(x) = arctan x ja
′
2
f ′ (x)
Z = 1! Tästä seuraa g (x) =Z1/(1 + x ) ja f (x) = x, ja
x
arctan xdx = x arctan x −
dx =
1 + x2
1
x arctan x − ln(1 + x2 ) + C
2
missä x/(1 + x2 ) on muotoa 12 u′ (x)/u(x). Tapaus f ′ = 1
on yleisesti
R käytetty osittaisintegroinnissa.
Esim.
ln xdx: valitaan jälleen f ′ = 1, g = ln x, jolloin
′
f=
Z x, g = 1/x, ja Z
1
ln xdx = x ln x − x dx = x ln x − x + C.
x
R
Esim.
x cos xdx: valitaan f ′ = cos x, g = x, jolloin
′
f=
eroon x:n potenssista. Siis
Z sin x, g = 1 ja pääsemme
Z
x cos xdx = x sin x − 1 sin xdx = x sin x + cos x + C.
Esimerkin vuoksi katsotaan mitä tapahtuisi jos valitaan
f ′ Z= x, g = cos x: nyt f = x2Z/2, g ′ = − sin x ja
1 2
1
x sin xdx
x cos xdx = x2 cos x +
2
2
Saatu integraali on pahempi kuin alkuperäinen! Funktiot
siis kannattaa valita huolella.
Osittaisintegrointia
voi joutua toistamaan:
R 2
Esim.
x sin xdx:kuten edellä, otetaan f ′ = sin x,
g = x2 , joten f = − cos x, g ′ = 2x ja
23
Z
x2 sin xdx = −x2 cos x +
Z
2x cos xdx =
−x2 cos x + 2x sin x + 2 cos x + C
missä saatu integraali laskettiin jo edellä.
Yleisesti:
MuotoaZ
Z
Z
xm sin xdx,
xm cos xdx,
xm ex dx
usein integroida standardisijoituksella
t = tan
(Tämän olisi nähnyt nopeamminkin käyttämällä
sin2 x = 21 (1 − cos 2x))
R
Yleisemmin: tyyppiä sinn xdx olevat integraalit voidaan
laskea palautuskaavan avulla: valitaan f ′ = sin x,
g = sinn−1 x, joten f = − cos x, g ′ = (n − 1) sinn−2 x cos x
Z
sinn xdx
Z
n−1
= − cos x sin
x + (n − 1) cos2 x sinn−2 xdx
Z
= − cos x sinn−1 x + (n − 1) (1 − sin2 x) sinn−2 xdx
Z
n−1
= − cos x sin
x + (n − 1) sinn−2 xdx
Z
−(n − 1) sinn xdx
Saimme siis jälleen alkuperäisen integraalin.
Ratkaisemalla
se saamme
Z
Z
1
n−1
sinn xdx = − cos x sinn−1 x +
sinn−2 xdx
n
n
Näin siis sinn x:n integraali saatiin palautettua sinn−2 x:n
integraaliksi. Toistamalla tätä päästään aina n = 1 tai 0,
ja sin1 x ja sin0 x integraalit tunnetaan.
Samalla menetelmällä saamme cosn x:n integraalille
palautuskaavan.
Näin
Z
Z esim.
3
1
3
4
sin2 xdx =
sin xdx = − cos x sin x +
4
4
Z
3 1
1
1
3
sin0 xdx) =
− cos x sin x + (− cos x sin x +
4
4 2
2
3
3
1
− cos x sin3 x − cos x sin x + x + C
4
8
8
(4.12)
Tällöin
olevat integraalit voidaan laskea osittaisintegroimalla m
kertaa R
Esim.
sin2 xdx: otetaan
f ′ Z= g = sin x ⇒ f = − cos x, Zg ′ = cos x ja
sin2 xdx = − cos x sin x + cos2 xdx = − cos x sin x +
Z
Z
(1 − sin2 x)dx = − cos x sin x + x − sin2 xdx
Saimme siis alkuperäisen integraalin, joka voidaan
ratkaista yhtälöstä:
Z
1
sin2 xdx = (− cos x sin x + x) + C
2
x
2
dt
=
cos x
=
=
sin x
=
=
x 1
2
) dx ⇒ dx =
dt,
2 2
1 + t2
x
x
x
cos 2 = cos2 − sin2
2
2
2
1
− tan2 x2
x
x
1 − t2
cos2 (1 − tan2 ) =
=
2
2
1 + t2
1 + tan2 x2
x
x
x
x
2 sin cos = 2 tan cos2
2
2
2
2
tan x2
2t
=
2
1 + t2
1 + tan2 x2
(1 + tan2
Tällä ratkeavat kaikki sin x, cos x rationaalifunktiot.
Esim:
Z
Z
Z
1 + t2 2
1
1
dx =
dt =
dt = ln |t| + C =
sin x
2t 1 + t2
t
x
ln | tan | + C
2
Helpompia sijoituksia usein kuitenkin ovat t = sin x,
t = cos x, t = tan x, joita voi myös kokeilla.
Monet trigonometrisia funktioita sisältävät integraalit
voidaan laskea helpommin kompleksilukujen ja Eulerin
kaavan avulla:
cos x
=
sin x
=
eix
=
1 ix
(e + e−ix )
2
1 ix
(e − e−ix )
2i
cos x + i sin x
(4.13)
(4.14)
(4.15)
Näiden käyttö nojautuu siihen että ex :n integraalit ovat
helppoja laskea. Imaginääriyksikö i on vakio, joka
toteuttaa i2 = −1. Tästä puhutaan tarkemmin
kompleksilukujen yhteydessä.
Esim.
Z
=
sin ax cos bxdx
Z =
1
4i
=
1
4i
=−
4.2.4 Trignonometristen funktioiden integrointi:
jos integroitava funktio sisältää sin x, cos x, se voidaan
24
Z
eiax − e−iax eibx + e−ibx
2i
2
dx
(ei(a+b)x + ei(a−b)x − e−i(a−b)x − e−i(a+b)x )dx
ei(a+b)x
ei(a−b)x
e−i(a−b)x
e−i(a+b)x
+
+
+
i(a + b)
i(a − b)
i(a − b)
i(a + b)
1 cos(a + b)
1 cos(a − b)
−
+C
2 a+b
2 a−b
+C
4.2.5 Rationaalifunktion integrointi
Viimeisenä menetelmänä tarkastelemme muotoa
R=
Pn
Qm
S
,
Qm
missä Tn−m on astetta n − m oleva osamääräpolynomi ja
S jakojäännöspolynomi. Polynomi Tn−m on helppo
integroida, joten jäljelle jää jälleen muotoa Pn /Qm oleva
murtofunktio, missä nyt on n < m.
Kaikki muotoa
Pn
R=
; (n < m)
Qm
olevat rationaalifunktiot voidaan integroida, mikäli
tunnetaan polynomin Qm nollakohdat. Tällöin
rationaalifunktio voidaan hajoittaa osamurtoihin.
Polynomien jakolasku
Kuinka polynomit jaetaan? Esim. jakokulmassa, kuten
numerotkin. Esim:
x2 + 5x − 3
P (x)
=
=?
Q(x)
x−1
x+6
x2 + 5x − 3
x2 − x
6x − 3
– 6x − 6
3
Jakolaskun tulos on siis
x−1
–
2
x + 5x − 3
3
=x+6+
x−1
x−1
mikä on helppo tarkistaa laventamalla.
Toinen esimerkki:
2x4 + 6x2 + 2
=?
x2 + x + 1
2
x2 + x + 1
–
? = 2x2 − 2x + 6 +
−4x − 4
x2 + x + 1
Polynomi in välittömästi integroitavissa. Entä
jakojäännöksenjä jäävä rationaalifunktio?
olevien murtolausekkeiden integrointia, kun Pn ja Qm
ovat asteen n ja m polynomeja (siis suurimmat niissä
esiintyvät potenssit ovat m ja n). Jos osoittaja on
asteluvultaan suurempi kuin nimittäja, voidaan tehdä
polynomien jakolasku ja päädytään lausekkeeseen
R = Tn−m +
Siis
2x − 2x + 6
2x4
+ 6x2
+2
2x4 + 2x3 + 2x2
−2x3 + 4x2
+2
–
−2x3 − 2x2 − 2x
6x2 + 2x + 2
– 6x2 + 6x + 6
−4x − 4
Jako osamurtoihin
1-kertaiset reaalijuuret: Oletetaan että yhtälöllä
Q(x) = 0 on vain 1-kertaisia reaalijuuria; olkoon nämä
juuret x1 , x2 , . . . xn (huom: Q:n asteluku on n, joten
löytyy n juurta.)
Tällöin voimme jakaa rationaalilausekkeen osamurtoihin
n
P (x) X Ai
=
Q(x)
x − xi
i=1
(4.16)
missä Ai ovat vakioita. Selvästi oikea puoli voidaan nyt
integroida.
Esim: jaetaan 4/(x2 − 1) osamurtoihin: nimittäjän
nollakohdat ovat x = ±1, mitkä ovat reaalisia ja
yksinkertaisia (x2 − 1 = (x − 1)(x + 1)). Siis
x2
4
a
b
=
+
−1
x−1 x+1
ja määräämme vakiot a ja b siten, että yhtälö on
voimassa kaikilla muuttujan x arvoilla. Kerrotaan yhtälö
(x + 1)(x − 1):llä, joten
4 =
a(x + 1) + b(x − 1) = (a + b)x + (a − b)
Jotta tämä olisi yhtäsuuri alkuperäisen lausekkeen kanssa,
täytyy olla a + b = 0 ja a − b = 4, joten a = 2 ja b = −2.
Osamurtojen avulla integraali
Z
4
dx.
2
x −1
on heti laskettavissa:
Z
4
dx =
2
x −1
=
=
=
Z
2
2
dx −
dx
x−1
x+1
2 ln |x − 1| − 2 ln |x + 1| + C
ln(x − 1)2 − ln(x + 1)2 + C
2
x−1
+ C.
ln
x+1
Z
Sovelletaan edellistä integraaliin
Z 3
x −2
F (x) =
dx
x2 − 1
Osoittaja on korkeampaa kertalukua, joten tehdään ensin
polynomien jakolasku. Nähdään että
x−2
x3 − 2
=x+ 2
2
x −1
x −1
25
Jäännöslausekkeen nimittäjän nollakohdat ovat x = ±1,
1-kertaisia. Siis voimme jakaa
x−2
x2 − 1
x−2
=
=
⇒
⇒
a
b
+
⇒
x−1 x+1
a(x + 1) + b(x − 1) = (a + b)x + (a − b)
=
=
=
a1
a2
a3
b
3x2 − 37x + 83
=
+
+
+
(x − 2)3 (x + 5)
x − 2 (x − 2)2
(x − 2)3
x+5
Lavennetaan nimittäjät pois:
3x2 − 37x + 83 = a1 (x − 2)2 (x + 5)
+a2 (x − 2)(x + 5) + a3 (x + 5) + b(x − 2)3
a + b = 1, a − b = −2
a = −1/2, b = 3/2
Siis
F (x)
Siis
Z −1/2
3/2
dx
+
x−1 x+1
1 2 1
3
x − ln |x − 1| + ln |x + 1| + C
2
2 2
1 2 1 (x + 1)3 +C
x + ln 2
2
x−1 x+
Moninkertainen juuri: Yleisemmässä tapauksessa
polynomilla voi olla moninkertaisia juuria (joiden edelleen
oletamme olevan reaalisia). Yleisesti polynomi Q(x)
voidaan kirjoittaa muotoon
Q(x) = A(x − x1 )n1 (x − x2 )n2 . . .
missä xi ovat polynomin nollakohtia, ni nollakohdan xi
kertaluku ja A vakio. Tässä tapauksessa
osamurtolausekkeella on yleinen muoto
n
n
k=1
k=1
2
1
X
P (x) X
bk
ak
+
+ ...
=
Q(x)
(x − x1 )k
(x − x2 )k
missä ak , bk . . . ovat vakioita.
Esim.
1
b
a1
a2
+
=
+
2
2
(x − 1) (x + 2)
x − 1 (x − 1)
x+2
x = 1 on 2-kertainen nollakohta, ja x = −2 1-kertainen.
Määrätään vakiot kertomalla (x − 1)2 (x − 2):lla:
1 = a1 (x − 1)(x + 2) + a2 (x + 2) + b(x − 1)2
Tästä voidaan ratkaista vakiot vaatimalla että yhtälön
kaikkien x:n potenssien kertoimet ovat samat molemmin
puolin (x0 , x1 , x2 ). Kuitenkin usein nopeampi menetelmä
on sijoittaa x 7→ xi :
x = 1 ⇒ 1 = a2 (1 + 2) ⇒ a2 = 31
x = −2 ⇒ 1 = b(−2 − 1)2 = b9 ⇒ b = 91
a1 saadaan esim. x2 :n kertoimista: 0 = a1 + b ⇒ a1 = − 91 .
Esimerkki: integroidaan
Z
3x2 − 37x + 83
F (x) =
(x − 2)3 (x + 5)
Osoittaja (2) on alempaa astetta kuin nimittäjä (4), joten
voidaan jakaa suoraan osamurtoihin. Nimittäjän
nollakohdat ovat
x1
x2
=
=
2,
−5,
3-kertainen
1-kertainen
Tästä tulee 4 yhtälöä 4 vakiolle (x:n potenssit x0 . . . x3 ),
jotka ovat suoraan ratkaistavissa.
Määrätään kuitenkin vakiot jälleen käyttämällä
“pikamenetelmää” ja sijoitetaan nollakohdat:
x = 2: 3 · 4 − 37 · 2 + 83 = a3 7 ⇒ a3 = 3
x = −5: 3 · 25 + 37 · 5 + 83 = −b73 ⇒ b = −1
Muut vakiot vaativat muita ehtoja, helpoin lienee x:n
korkeimman potenssin kerroin, mikä voidaan lukea
suoraan:
x3 : 0x3 = a1 x3 + bx3 ⇒ a1 = −b = 1
Jäljelle jää a2 . Tämän saa esim x2 :n kertoimesta tai
sijoittamalla esim.
x = 0: 83 = a1 4 · 5 − a2 2 · 5 + a3 5 − b8 ⇒ a2 = −4
Siis saimme a1 = 1, a2 = −4, a3 = 3, b = 1, ja
Z 1
−4
3
−1
F (x) =
dx
+
+
+
x − 2 (x − 2)2
(x − 2)3
x+5
3
= ln |x − 2| + 4(x − 2)−1 − (x − 2)−2
2
− ln |x + 5| + C
x − 2
4
1
3
+C
=
−
+ ln x − 2 2 (x − 2)2
x + 5
Kompleksijuuret: Yleisimmässä tapauksessa polynomin
Q(x) juuret ovat kompleksisia. Esim.
x2 + 1 = 0 ⇒ x = ±i
Kompleksijuurisen rationaalifunktion integraalin voi
laskea yllä olevia sääntöjä noudattaen, ottaen vain
huomioon että joistain kertoimista tulee kompleksilukuja.
Näitä varten voidaan myös johtaa omat
integrointisäännöt. Tätä ei käsitellä MAPU I:llä
tarkemmin.
4.3 Määrätty integraali
Tarkastellaan suljetulla välillä [a, b] määriteltyä
paloittain jatkuvaa rajoitettua funktiota f (x). Jaetaan
väli [a, b] n yhtäsuureen h-mittaiseen osaan,
h=
b−a
n
(4.17)
ja merkitään
xk = a + kh,
(4.18)
ts.
x0 = a, x1 = a + h, x2 = a + 2h, . . . , xn = b.
26
(4.19)
f(x )
Integrointirajojen vaihto
Määrittelimme (4.21) integraalin ”vasemmalta oikealle”eli
integroimisvälissä [a, b] oli a ≤ b. Tällöin jakoväli
h = (b − a)/n on positiivinen. Voimme myös ajatella
integrointia ”oikelta vasemmalle”, jolloin jakovälistä
(4.17) tulee negatiivinen. Tämän huomioonottaen
määrittelemme
Z a
Z b
f (x) dx.
f (x) dx = −
(4.23)
f(x 4)
A
x
1
x
2
h
{
x 0= a
b = x
4
x
6
x
7
Jakoon (4.19) liittyvä porrassumma on
Sn = h
n−1
X
f (xk ).
Additiivisuus
(4.20)
k=0
Jos c on integroimisvälin [a, b] sisäpiste, nähdään
määritelmästä (4.21) että voimme koostaa integraalin
paloista, kuten
Geometrisesti summan jokainen termi
Z
Ak = hf (xk )
esittää suorakaiteen, leveydeltään h ja korkeudeltaan
f (xk ), pinta-alaa. Koska jakovälin pituus h on
positiivinen, pinta-ala Ak on positiivinen jos f (xk ) on
positiivinen ja negatiivinen jos f (xk ) on negatiivinen.
Summa Sn (4.20) approksimoi siten välillä [a, b] käyrän
y = f (x) ja x-akselin väliin jäävää pinta-alaa siten, että
x-akselin yläpuolinen osa lasketaan positiivisena ja
alapuolinen osa negatiivisena. Tämä approksimaatio on
ilmeisestikin sitä tarkempi mitä tiheämpi jako on, ts. mitä
pienempi on h tai mitä suurempi on n.
Voidaan osoittaa, että jaon (4.19) tihentyessä summa
(4.20) lähestyy äärellistä raja-arvoa, ts. raja-arvo
S = lim Sn
n→∞
on olemassa ja äärellinen. Tätä raja-arvoa sanotaan
funktion f (x) määrätyksi integraaliksi välillä [a, b]. Sitä
merkitään kuten
Z b
n−1
X
f (xk ).
f (x) dx = lim h
(4.21)
n→∞
a
b
a
Kuva 4.1 Porrassumma
b
f (x) dx =
a
Z
c
f (x) dx +
a
Z
b
f (x) dx.
(4.24)
c
Ottaen huomioon rajojen vaihto-ominaisuuden (4.23)
näemme, että additiivisuus (4.24) on voimassa olivatpa a,
b ja c mitä tahansa funktion määrittelyalueen pisteitä.
Lineaarisuus
Integraalin määritelmästä (4.21) nähdään, että integrointi
on lineaarinen operaatio, ts.
Z
b
[αf (x) + βg(x)]dx = α
a
Z
b
f (x) dx + β
a
Z
b
g(x) dx.
a
(4.25)
Integroimismuuttujan vaihto
Rb
Integraalin a f (x) dx arvo (käyrän ja x-akselin välinen
pinta-ala) ei ilmeisestikään riipu muuttujasta x. On siis
aivan samantekevää, millä symbolilla funktion
argumenttia merkitään, ts.
Z
b
f (x) dx =
a
Z
b
f (s) ds.
(4.26)
a
k=0
Geometrisesti määrätty integraali on ilmeisestikin käyrän
y = f (x) ja x-akselin väliin jäävä pinta-ala.
4.3.1 Määrätyn integraalin ominaisuuksia
Tyhjä integroimisväli
Olkoon integrointiväli [a, a], ts. se sisältää vain yhden
pisteen. Tällöin on
Z a
(4.22)
f (x) dx = 0,
a
sillä integraalin määritelmässä (4.21) jakoväli
h = (a − a)/n on aina nolla riippumatta jakopisteiden
lukumäärästä.
4.3.2 Kertymäfunktio
Funktion f kertymäfunktio K on
Z x
f (t) dt.
K(x) =
(4.27)
a
Ilmeisestikin pisteessä a kertymäfunktio on nolla, sillä
Z a
f (t) dt = 0.
K(a) =
a
Kertymäfunktio (4.27) ilmoittaa käyrän ja x-akselin
välisen pinta-alan kohdasta a kohtaan x. Annetaan
kertymäfunktion argumentille (pieni) lisäys ∆x.
27
Vastaava kertymäfunktion muutos
Esim.
Z
∆K = K(x + ∆x) − K(x)
on silloin suuruudeltaan likimain kuvan 4.2 varjostetun
alueen pinta-ala ∆A = ∆xf (x), ts.
K(x + ∆x) − K(x) ≈ ∆xf (x).
b
ex dx = / ex = eb − ea
a
a
Esim.
Z
2π
2π
sin xdx = − / cos x = − cos 2π + cos 0 = 0
0
0
Rx
d
f (t)dt = f (x), on ketjusäännön
Huom: koska dx
a
mukaan
Z g(x)
Z g
d
dg d
f (t)dt =
f (t)dt = f (g(x))g ′ (x)
dx a
dx dg a
f(x )
D A
K (x )
b
Esim.
a
x
d
dx
x + D x
Kuva 4.2 Kertymäfunktion derivaatta
K(x + ∆x) − K(x)
= f (x)
∆x→0
∆x
d
K (x) =
dx
Z
0
(4.28)
L→∞
Esim.
Z
a
Täten siis kertymäfunktio K(x) on f (x):n
integraalifunktio, katso (4.1), riippumatta määrätyn
integraalin alarajasta a. Kertymäfunktiokin on siis
muotoa
Z x
f (t) dt = F (x) + C.
K(x) =
b
a
Z
Z
a
Integroimisvakio C määräytyy nyt alkuehdosta
Z
eli
C = −F (a),
∞
1
∞
(4.29)
Tämä ominaisuus on ilmeisestikin voimassa olipa F mikä
hyvänsä funktion f integraalifunktio.
Määrättyjä integraaleja laskettaessa käytetään usein
sijoitusmerkintää:
Z b
b
f (t) dt = / F (t) = F (b) − F (a).
(4.30)
a
b
−1
1 1
= −
x
a b
a
∞
1
1
dx =
x2
∞
−1
=1
x
1
∞
1
dx = / ln x hajaantuu
x
1
1
Z
b
a
1
dx =
x2
∞
√
√
dx
√ = 2 x = lim (2 L − 2) hajaantuu
L→∞
x
1
joten saamme yhteyden määrätyn integraalin
(kertymäfunktion) ja integraalifunktion välille:
f (x) dx = F (b) − F (a).
a
Esim.
K(a) = F (a) + C = 0
Z
d2x
= 2 sin 2x
dx
Jos raja-arvo on olemassa, sanotaan että integraali
suppenee, muuten hajaantuu.
x
f (t) dt = f (x).
sin xdx = sin(2x)
a
lim
′
2x
Epäoleellinen integraali on määrätty integraali jossa
ainakin toinen raja = ∞:
Z L
Z ∞
f (x)dx
(4.31)
f (x)dx ≡ lim
Tämä relaatio on ilmeisestikin sitä tarkempi mitä
pienempi ∆x on, joten saamme
eli
Z
1
0
1 √
dx
√ = 2 x=2
x
0
Huom: kuten edellä, määrätty integraali voi olla olemassa
vaikka integroitava → ∞ jossain pisteessä!
Esim. Seuraava kaunis tulos pätee (ei näytetä tässä)
Z ∞
√
2
e−x = π
−∞
Esim. Oletetaan p 6= −1:
Z
a
28
∞
1
p
x dx =
∞
1
xp+1
1
=
( lim Lp+1 − 1)
p+1
p + 1 L→∞
=
Z
1
xp dx =
0
∞
1/(p + 1)
1
jos p > −1
jos p < −1
Esim. I =
′
=
1
xp+1
=
(1 − lim ap+1 )
a→0
p+1
p+1
ln xdx:
0
a→0
jos p > −1
jos p < −1
1/(p + 1)
∞
1
valitaan f = 1 ja g = ln x, joten f = x ja g ′ = 1/x:
Z 1
1
1
1
x dx = (0 − 0) − / x = 1
I = / x ln x −
x
0
0
0
Huomaa että tässä on käytetty “0 ln 0 = 0”, sillä
lim a ln a = 0.
0
Z
Derivointi parametrin suhteen
4.3.3 Muuttujan vaihto määrätyssä integraalissa
Integrointimenetelmät määrätylle integraalille ovat samat
kuin integraalifunktiollekin, mutta lisäksi tulee ottaa
huomioon kuinka integroimisalueen rajat käyttäytyvät!
Integraalissa
Z b
f (x)dx
I=
Usein näppärä keino integraalien sieventämisessä on
derivoida integroitavaa jonkun parametrin suhteen: jos
f (x, t) on kahden muuttujan funktio, voimme määritellä
Z b
f (x, t)dt
I(x) =
a
jolloin
I ′ (x) =
a
sijoitetaan x = g(t), jolloin dx = g ′ (t)dt ja kun x = a tai
b, on
a
b
g(ta ) ⇒ ta = g −1 (a)
g(tb ) ⇒ tb = g −1 (b)
=
=
b
a
∂f (x, t)
dt
∂x
Tässä osittaisderivaatta ∂f (x, t)/∂x tarkoittaa että f
derivoidaan muuttujan x suhteen pitäen t vakiona.
Esim. halutaan integroida
Z ∞
t2 e−at dt
0
Siis
I=
Z
g −1 (b)
′
f (g(t))g (t)dt =
g −1 (a)
Z
tb
′
f (g(t))g (t)dt
(4.32)
0
0
π/2
0
1
(cos 2t + 1)dt =
2
π/2
π
1 1
( sin 2t + t) =
2 2
4
b
a
b
f ′ (x)g(x)dx = / f (x)g(x) −
a
Esim. I =
Z
∞
Z
(4.33)
I (a)
=
Z
=
e−at dt =
0
∞
−
1
e−at
=
a
a
0
∞
Z0 ∞
(−te−at )dt = −
t2 e−at dt =
0
1
a2
1
a3
Derivointi parametrin suhteen korvaa usein
osittaisintegrointia, mutta voi olla huomattavasti
nopeampi.
Funktio y = f (x) määrittelee (x, y) -tason käyrän kun
x ∈ [a, b]. Kun x muuttuu dx:n verran, y muuttuu
dy
= f ′ (x)dx:n verran.
dy = dx
ds
dy
Kuva 4.3
a
xe−x dx:
0
′′
≡
∞
dx
f (x)g ′ (x)dx
olkoon f ′ = e , g =Z x, joten f = −e−x , g ′ = 1:
∞
∞
∞
(−e−x )dx = (0 − 0) − e−x =
I = x(−e−x ) −
0
I ′ (a)
b
0
−x
−(0 − 1) = 1
I(a)
Z
Käyrän pituus
0
4.3.4 Määrätyn integraalin osittaisintegrointi
Kuten arvata saattaa, on osittaisintegrointisääntö
määrätylle integraalille
Z
Tämän voisi integroida osittain, mutta vaihtoehtoisesti
voimme määritellä
ta
Rajojen vaihto on helppo muistaa seuraavasti: jos x:n
rajat ovat a, b, niin korvataan ne vain niitä vastaavilla t:n
arvoilla.
R1√
Esim. I = 0 1 − x2 dx:
sopiva sijoitus on x = sin t, ja dx = cos tdt. Nyt kun
x = 0, on t = 0, ja kun x = 1 on t = π/2. Siis
Z π/2
Z π/2 p
2
1 − sin t cos tdt =
cos2 tdt =
I=
Z
Z
0
Tästä saadaan käyrän pituuden differentiaali
p
p
ds = (dx)2 + (dy)2 = 1 + [f ′ (x)]2 dx
ja siis koko käyrän (funktion kuvaajan) pituus
Z bp
L=
1 + [f ′ (x)]2 dx
a
29
√
Esimerkki: olkoon y = 1 − x2 , kun 0 ≤ x ≤ 1 (ympyrän
neljännes). Mikä on kaaren pituus?
Z 1p
1 + y ′ (x)2 dx
L =
0
Z 1s
−x 2
1+ √
=
dx
1 − x2
0
Z 1r
x2
1+
dx
=
1 − x2
0
Z 1
dx
√
=
1 − x2
0
1
π
= / arcsin(x) =
2
0
ja tilavuus
V
=
−R
π
R
Z
i2
hp
R2 − x2 dx = π
R
−R
(R2 − x2 )dx
1
4
(R2 x − x3 ) = πR3
3
3
Toinen mahdollisuus on käyttää symboliseen laskentaan tehtyjä
tietokoneohjelmia. Näistä tunnetuimpia ovat Maple ja
Mathematica. Nämä osaavat huomattavasti enemmän
integrointitemppuja kuin MAPUlla on kuvattu.
Jos näitä ei ole saatavilla, löytyy Mathematicaan pohjautuva
ilmaiseksi käytettävä “laskin” www-sivulta
www.wolframalpha.com (ainakin v. 2010). Tämäkin tuntee
kaikki integointitemput mitkä Mathematicakin, ja sen avulla
kannattaa muun muassa tarkistaa MAPUn kotitehtävät.
r
x
Oletetaan että käyrä r = f (x) > 0 pyörähtää x-akselin
ympäri. Kun rajoitutaan a ≤ x ≤ b, käyrä rajaa
pyörähdyskappaleen pinnan, päädyissä x = a, x = b
olevien ympyröiden kanssa. Nyt käyrän pyyhkäisemän
pinnan alan differentiaali on
p
dA = 2πrds = 2πf (x) 1 + [f ′ (x)]2 dx
joten alaksi saadaan
Z b
p
2πf (x) 1 + f ′ (x)2 dx + πf (a)2 + πf (b)2
A=
a
Samoin pyörähdyskappaleen tilavuuden differentiaali on
(ympyräkiekon tilavuus)
dV = πr2 dx = πf (x)2 dx
ja tilavuudeksi tulee
b
π[f (x)]2 dx
a
√
R2 − x2 , −R ≤ x ≤ R,
pyörähtää x-akselin ympäri määritellen
pyörähdyskappaleen (mikä on tässä tapauksessa tietysti
pallo). Sen pinta-ala on
s
Z R
2
p
−x
dx
2π R2 − x2 1 + √
A =
R 2 − x2
−R
Z R
R
2πRdx = 2πR / x = 4πR2
=
Esim. Ympyrän kaari r =
−R
π
Kun omat neuvot eivät riitä, voi turvautua apuvälineisiin.
Integraaleja on taulukoitu lukuisiin kirjoihin, joista paras ja
tunnetuin lienee Gradshteyn and Ryzhik: Table of Integrals,
Series, and Products.
y
Z
R
Integroinnin apuvälineet
Pyörähdyskappaleen pinta-ala ja tilavuus
V =
Z
−R
mikä on tietysti tunnettu tulos.
z
=
−R
30
4.3.5 Numeerinen integrointi
puolisuunnikassäännöllä
Usein integraalifunktiota ei osata (tai voida) laskea, vaan
joudutaan turvautumaan integraalin numeeriseen
laskemiseen. Lasku perustuu määrätyn integraalin
tulkintaan pinta-alana, lasketaan siis porrassumman
kaltainen summa äärellisellä askelvälillä. Porrassumma
(4.20) ei kuitenkaan ole käytännössä suositeltava tapa
laskea integraalia, sillä se on hyvin tehoton.
Yksinkertaisin suositeltava tapa on käyttää ns.
puolisuunnikassääntöä: Olkoon laskettavana integraali
Z
tässä x1 = xi , x2 = xi+1 ):
Z x2
h
f (x)dx − [f (x1 ) + f (x2 )]
V (h) =
2
x1
Z x1 +h
[f (x1 ) + f ′ (x1 )(x − x1 )
=
x1
b
f (x)dx
a
=
• Jaetaan integroimisväli (a, b) N :ään tasaväliin
x0 , x1 , . . . xN (tässä x0 = a ja xN = b). Yhden välin
pituus on siis h = (b − a)/N .
y
f(x)
=
1
+ f ′′ (x1 )(x − x1 )2 + . . .
2
h
− [f (x1 ) + [f (x1 ) + f ′ (x1 )h
2
1 ′′
2
+ f (x1 )h + . . .]
2
1
1
1
f (x1 )h + f ′ (x1 ) h2 + f ′′ (x1 ) h3
2
2
3
1
h
− [2f (x1 ) + f ′ (x1 )h + f ′′ (x1 )h2 ] + O(h4 )
2
2
1
− h3 f ′′ (x0 ) + O(h4 )
12
Siis virhe yhden välin pinta-alassa on O(h3 ). Koko
summassa virhe tulee siis olemaan
V = N O(h3 ) = O(N h3 ) = O(
x0
x1
x2
xN x
Kuva 4.4
• Approksimoidaan integraalia summaamalla kunkin
välin ala puolisuunnikkaan pinta-alan avulla:
Z xi+1
1
f (x)dx ≈ h [f (xi ) + f (xi+1 )]
2
xi
f( xi+1)
f( xi)
xi
xi+1
Kuva 4.5 Puolisuunnikkaan ala
sillä h = (b − a)/N = O(1/N ).
Siis: jos lisäämme jakopisteiden määrää tekijällä 2
(N → 2N ), virhe pienenee tekijällä 4.
Harjoitustehtävä: mikä virhe tulee jos arvoidaan
integraalia summalla suorakaiteita, eli
Z xi+1
f (x)dx = hf (xi ) ?
xi
Hiven tarkempi tulos integroinnissa saadaan jos
käytetään puolisuunnikassäännön sijasta Simpsonin
sääntöä: siinä arvoidaan funktiota sovittamalla siihen
parabeli (toisen asteen käyrä). Tässä tapauksessa virhe
koko integraalissa on vain O(1/N 4 ).
Vielä hienostuneemmat menetelmät eivät jaa
integroimisaluetta tasaväleihin, vaan tihentävät jakoa
niissä kohdissa missä funktio muuttuu nopeimmin.
Lisätietoja numeerisesta integroinnista saa erinomaisesta
kirjasta N umerical Recipes (Cambridge University
Press), ja sen verkkosivulta www.nr.com. Tämä kirja on
jokaisen numeriikkaa harrastavan perusteos!
• Näin siis koko integraaliksi tulee
Z
b
a
f (x)dx ≈
1
)
N2
N
−1
X
h
h
f (xk ) + f (xN )
f (x0 ) + h
2
2
k=1
Kuinka suuri virhe tehdään? Tätä voidaan estimoida
kehittämällä yhden välin virhe Taylorin sarjaksi (olkoon
31
5. Kompleksiluvut
5.1 Lukualueen laajennus
Luonnolliset luvut N : 1, 2, 3, . . .
Luonnollisille luvuille on määritelty
Reaalilukujen joukosta löytyy myös vastaus kysymykseen
paljonko on x, kun x · x = a ja a ≥ 0.
Kysymykseen, onko olemassa sellainen x ∈ R, että
x · x = a kun a < 0, vastaus on edelleenkin kielteinen.
Laajennetaan lukualuetta kompleksilukuihin C lisäämällä
imaginääriluvut.
• yhteenlasku: a + b ∈ N , kun a, b ∈ N .
• kertolasku: a · b ∈ N , kun a, b ∈ N .
Kysymys: Löydetäänkö aina sellainen x ∈ N , että
a + x = b kun a, b ∈ N ?
Vastaus: ei aina (esim. a = 5, b = 2).
Laajennetaan lukualuetta lisäämällä 0 ja negatiiviset
luvut.
Kokonaisluvut Z : . . . , −2, −1, 0, 1, 2, . . .
5.2 Kompleksilukujen esitys ja algebra
5.2.1 Imaginääriyksikkö
Määritellään imaginääriyksikkö i siten, että
i2 = −1.
Jos nyt a ∈ R on jokin reaaliluku, niin ia on
imaginääriluku, joka toteuttaa relaation
Kokonaisluvuille on määritelty
• yhteenlasku: a + b ∈ Z, kun a, b ∈ Z.
• vähennyslasku: a − b = a + (−b) ∈ Z, kun a, b ∈ Z.
(ia)2 = i2 a2 = −1 · a2 = −a2 .
Kompleksiluku z ∈ C voidaan esittää mm. reaaliluvun ja
imaginääriluvun summana
z = a + ib,
• kertolasku: a · b ∈ Z, kun a, b ∈ Z.
Vähennyslasku a − b vastaa kysymykseen: paljonko on x,
jos x + b = a.
Kysymys: Onko olemassa sellainen x ∈ Z, että a · x = b,
kun a, b ∈ Z?
Vastaus: ei aina (esim. a = 3, b = 2).
Laajennetaan lukualuetta lisäämällä murtoluvut.
Rationaaliluvut Q :
a
; a, b
b
∈ Z, b 6= 0
Rationaaliluvuille on määritelty
• yhteenlasku: a + b ∈ Q, kun a, b ∈ Q.
• vähennyslasku: a − b ∈ Q, kun a, b ∈ Q.
• kertolasku: a · b ∈ Q, kun a, b ∈ Q.
• jakolasku:
a
b
Re z
Im z
• vähennyslasku: a − b ∈ R, kun a, b ∈ R.
• kertolasku: a · b ∈ R, kun a, b ∈ R.
• jakolasku:
a
b
∈ R, kun a, b ∈ R ja b 6= 0.
a
b,
(5.3)
ax2 + bx + c = 0
ratkaisut ovat
x=
p
1
(−b ± b2 − 4ac)
2a
Jos b2 ≥ 4ac, ratkaisut ovat reaalisia.
√
Jos b2 < 4ac, niin ( )2 < 0 ja
x=
p
p
1
1
(−b ± −(4ac − b2 )) =
(−b ± i 4ac − b2 )
2a
2a
z 2 − 2z + 5 = 0
Reaaliluvuille on määritelty
• yhteenlasku: a + b ∈ R, kun a, b ∈ R.
=
=
kun z = a + ib.
Tutustuimme kompleksilukuun 2. asteen yhtälön
ratkaisuissa: yhtälön
Esim.
Reaaliluvut R
(5.2)
missä a, b ∈ R. Sanotaan, että a on luvun z reaaliosa ja b
sen imaginääriosa. Kompleksiluvun reaaliosaa ja
imaginäärisosaa merkitään kuten
∈ Q, kun a, b ∈ Q ja b 6= 0.
Jakolasku ab vastaa kysymykseen: paljonko on x, kun
x · b = a?
Kysymys: Onko olemassa sellainen x ∈ Q, että x · x = a,
kun a ∈ Q ja a > 0?
Vastaus: ei aina (esim. a = 2).
Laajennetaan lukualuetta lisäämällä irrationaaliluvut.
(5.1)
ratkaisut ovat
√
√
z = 12 (2 ± 4 − 20) = 12 (2 ± −16) = 1 ± 2i.
Kompleksiluku z on (puhtaasti) reaalinen, jos Im z = 0 ja
(puhtaasti) imaginäärinen, jos Re z = 0.
Kompleksiluvut ovat yhtäsuuria, jos niiden reaali- ja
imaginääriosat ovat yhtäsuuria, ts. u = v tarkoittaa, että
Re u = Re v ja Im u = Im v. Kompleksiluku on nolla jos ja
32
vain jos sen reaali- ja imaginääriosat ovat nollia, ts. z = 0
on sama kuin Re z = Im z = 0.
Kompleksiluvun z = a + ib liittoluku eli
kompleksikonjugaatti z ∗ on
z ∗ = a − ib,
(5.4)
Jakolasku
Jakolasku on hieman monimutkaisempi. Lavennetaan
ensin murtolauseke u/v nimittäjän
kompleksikonjugaatilla, jolloin päädytään reaaliseen (ja
positiiviseen) nimittäjään:
ts. konjugoitaessa vaihdetaan imaginääriosan merkki.
Kompleksiluvun z normi |z|2 on
|z|2 = zz ∗ = (Re z)2 + (Im z)2 .
a + ib
(a + ib)(c − id)
u
=
=
.
v
c + id
(c + id)(c − id)
(5.5)
Normin laskusäännön (5.5) mukaan nimittäjä on nyt
Normi on siis aina ei-negatiivinen ja nolla vain jos luku
itse on nolla.
z ∗ on fyysikoiden käyttämä merkintä. Matemaatikot piirtävät
kompleksikonjugoidun suureen päälle viivan, z̄.
Normiksi kutsutaan silloin tällöin myös suuretta
siitä käytetään merkintää |z|.
p
|z|2 ,
|v|2 = vv ∗ = (c + id)(c − id) = c2 + d2 ∈ R
ja osoittaja
jolloin
Insinöörit puolestaan merkitsevät imaginääriyksikköä symbolilla j.
5.2.2 Algebra
Kompleksilukujen algebra saadaan soveltamalla
reaalilukujen algebraa summiin z = a + ib muistaen
kuitenkin, että i2 = −1. Tarkastellaan kompleksilukuja
u = a + ib ja v = c + id.
(a + ib)(c − id) = ac + bd + i(bc − ad).
Tämän jälkeen jakolasku on helppoa, jaetaan vain
osoittajan reaali- ja imaginääriosat reaalisella
nimittäjällä, ts.
u
v
u
Im
v
Re
=
=
Yhteenlasku
Vastaavasti kompleksiluvun z käänteisluku z −1 =
saadaan seuraavasti: jos z = x + iy, niin
Summa u + v voidaan muodostaa kuten
u + v = a + ib + c + id = (a + c) + i(b + d),
z −1
eli
Re (u + v) =
Im (u + v) =
Re u + Re v
Im u + Im v.
(5.6)
=
Vastaavasti vähennyslasku antaa
z −1 =
u − v = a + ib − c − id = (a − c) + i(b − d)
Re (u − v) =
Im (u − v) =
Re u − Re v
Im u − Im v.
(5.7)
1
x − iy
=
x + iy
(x + iy)(x − iy)
x
y
x − iy
= 2 −i 2
2
2
x +y
|z|
|z|
=
=
(a + ib)(c + id)
ac + (ib)(id) + (ib)c + a(id)
=
=
ac + i2 bd + i(bc + ad)
(ac − bd) + i(ad + bc)
=
=
3 − i2 + (−1 + i) = 3 − 1 + i(−2 + 1)
2−i
u−v
=
3 − i2 − (−1 + i) = 3 + 1 + i(−2 − 1)
ja
(Re u)(Re v) − (Im u)(Im v)
(Re u)(Im v) + (Re v)(Im u).
=
4 − 3i,
Kertolasku taas antaa
tai
=
=
1
1 − 2i
1
2
=
= −i
1 + 2i
(1 + 2i)(1 − 2i)
5
5
u+v
Kahden kompleksiluvun tulo puolestaan on
Re (uv)
Im (uv)
1
z
Esim. Olkoot u = 3 − i2 ja v = −1 + i. Laske u + v,
u − v, uv ja u/v
Yhteen- ja vähennyslasku antavat
Kertolasku
u·v
=
(5.9)
Esim. Luvun z = 1 + 2i käänteisluku on
Vähennyslasku
eli
(Re u)(Re v) + (Im u)(Im v)
|v|2
(Im u)(Re v) − (Re u)(Im v)
.
|v|2
uv
(5.8)
33
=
=
(3 − i2)(−1 + i) = −3 + 3i + 2i − 2ii
−1 + 5i
myös napakoordinaatteja, ns. polaariesitystä:
ja jakolasku
5.2.3 Kompleksitaso
Kompleksiluku voidaan esittää myös x, y-tason pisteinä
(vektoreina): z = x + iy 7→ (x, y) = (Re z, Im z). Tässä siis
y-akselin yksikkönä on i.
Tasoa, jossa kompleksilukuja esitetään sanotaan
kompleksitasoksi. Tason akseleita kutsutaan yleensä
reaali- ja imaginääriakseleiksi. Kääntäen, jokaista
(kompleksi)tason pistettä vastaa kompleksiluku.
z = ( x ,y )
{
r
f
R e z
Kuva 5.1 Kompleksitaso
x = r c o s f
Kuva 5.2 Polaariesitys
Polaariesityksessä (r, φ)
• r on kompleksiluvun itseisarvo |z| = modz,
• φ on luvun z vaihekulma eli argumentti.
Kuvassa 5.1 r on pisteen etäisyys origosta. Pythagoraan
teoreeman mukaan on
x
y
=
=
r cos φ
r sin φ,
(5.12)
ts.
r2 = x2 + y 2 = |z|2
z = x + iy = r cos φ + ir sin φ = reiφ
(5.13)
missä viimeisessä kohdassa käytettiin Eulerin kaavaa
ja
r = |z| =
Suure
R e z
Jotta reaali- ja imaginääriosien merkit saataisiin oikein,
on tällä kertaa arkustangenttia pidettävä
monikäsitteisenä funktiona. Kaikista mahdollisista
kulman φ = arctan xy arvoista on valittava se, jolla sekä
cos φ ja x keskenään että sin φ ja y keskenään ovat saman
merkkisiä. Kääntäen napakoordinaateista (r, φ) päästään
luvun z = x + iy karteesisiin koordinaatteihin kaavoilla
r
x
z = ( r c o s f ,r s in f )
Polaariesityksessa kompleksiluvun z = x + iy koordinaatit
ovat
p
r = |z| = x2 + y 2
(5.11)
φ = arctan xy .
z
y
z
{
=
=
Im
Im
3 − 2i
3 − 2i −1 − i
−3 − 3i + 2i − 2
=
·
=
−1 + i
−1 + i −1 − i
1+i−i+1
5 1
−5 − i
= − − i.
2
2 2
y = r s in f
u
v
p
(Re z)2 + (Im z)2 =
|z| =
√
zz ∗ .
eiφ = cos φ + i sin φ.
(5.10)
p
√
zz ∗ = |z|2
on kompleksiluvun z itseisarvo, luvun suuruus. Joskus
puhutaan myös modulista ja käytetään merkintää
|z| = modz.
Kun z on puhtaasti reaalinen, on
Tämä osoitetaan myöhemmin.
√
Esim. Luku 2 + 2 3i polaariesityksessä
Nyt moduli on
√
√
r = |2 + 2 3i| = 4 + 12 = 4.
Vaihekulma on
φ = arctan
√
√
2 3
π
= arctan 3 = .
2
3
Nyt siis
|z| =
p
(Re z)2 = |Re z|
eli itseisarvon määritelmä yhtyy tässä tapauksessa
reaaliluvun itseisarvon määritelmään.
Huom: kompleksikonjugointi z → z ∗ vastaa heijastusta
x-akselin suhteen: iy → −iy.
Kompleksitason pisteiden esityksessä voidaan käyttää
√
π
π
2 + 2 3i = 4eiπ/3 = 4 cos + 4i sin .
3
3
√
Esim. Luku −2 + 2 3i polaariesityksessä
Kuten edellä, moduli on r = 4. Vaihekulma on nyt
√
√
2 3
φ = arctan
= arctan(− 3).
−2
34
(5.14)
Tangetille on voimassa
tan(φ + nπ) = tan φ.
Jos siis φ = arctan x, niin on myös φ + nπ = arctan x.
Vaihekulmaa määrättäessä on näistä mahdollisista
arvoista valittava sellainen, että reaali- ja
imaginäärisosien merkit tulevat oikein. Nyt vaihekulma on
√
Esimerkiksi w = f (z) = z 2 on yksiarvoinen. Funktio
w = f (z) = z 1/2 on puolestaan moniarvoinen
(kaksiarvoinen), mm. piste z = 1 kuvautuu pisteiksi
w = ±1.
Ellei toisin mainita, funktio tarkoittaa jatkossa
yksiarvoista funktiota.
Tulkinta
Olkoon w = f (z) jokin kompleksifunktio. Kirjoitetaan
π
φ = arctan(− 3) + nπ = − + nπ.
3
Reaaliosa on negatiivinen ja imaginääriosa positiivinen,
joten vaihekulma on välillä π/2 ≤ φ ≤ π, ts. on valittava
n = 1 eli
2π
.
φ=
3
Polaariesitys on siis
w = u + iv, u, v ∈ R
ja
z = x + iy, x, y ∈ R.
Nyt
w = u + iv = f (z) = f (x + iy),
ts. funktion reaali- ja imaginääriosat,
√
2π
2π
−2 + 2 3i = 4ei2π/3 = 4 cos
+ 4 sin
i.
3
3
Huom: polaariesitys helpottaa kompleksilukujen kerto- ja
jakolaskuja:
Olkoon z1 = r1 eiθ1 ja z2 = r2 eiθ2 . Nyt
z1 z2 = r1 r2 ei(θ1 +θ2 )
normaalien eksponenttifunktioiden laskusääntöjen
mukaan. Samoin
r1
z1
= ei(θ1 −θ2 )
z2
r2
u = u(x, y) ja v = v(x, y),
ovat muuttujien x ja y funktioita. Voidaan siis ajatella,
että kompleksifunktio kuvaa kompleksitason (z-tason)
pisteen (x, y) toisen kompleksitason (w-tason) pisteeksi
(u, v).
Funktion reaali- ja imaginääriosat
Tehtävänä on nyt jakaa funktio f (z) reaali- ja
imaginääriosiinsa. Polynomien ja polynomien
murtolausekkeiden tapauksessa kompleksilukujen algebra
määrää jaon. Esimerkiksi w = z 2 jakautuu reaali- ja
imaginääriosiinsa kuten
Myös potenssit ovat helppoja:
z n = (reiθ )n = rn einθ
Sen sijaan yhteen- ja vähennyslasku on hankala suorittaa
polaariesityksessä.
Huom: jos z = reiθ , niin z ∗ = re−iθ .
z ∗ z = re−iθ reiθ = r2 = |z|2 .
5.3 Kompleksifunktiot
Tarkastellaan funktiota f (z), joka kuvaa kompleksiluvun
z kompleksiluvuksi w, ts.
w = f (z).
Sanotaan, että f (z) on
• yksiarvoinen funktio, jos ja vain jos jokainen z
kuvautuu täsmälleen yhdeksi luvuksi w.
• moniarvoinen funktio, jos ja vain jos jotkin
muuttujan z arvot kuvautuvat useammaksi kuin
yhdeksi luvuksi w.
w = u + iv = (x + iy)2 = x2 − y 2 + 2ixy,
joten
u =
v =
x2 − y 2
2xy.
Usein halutaan jatkaa (analyyttisesti) reaalimuuttujan
reaaliarvoinen funktio kompleksitasoon siten, että
alkuperäinen ja jatkettu funktio yhtyvät reaaliakselilla.
Jos reaalifunktio f (x) voidaan esittää Taylorin sarjana
(3.3), korvataan sarjassa reaalimuuttuja x
kompleksimuuttujalla.
Koska kompleksiluvut noudattavat samoja laskusääntöjä
kuin reaaliluvut, säilyttää analyttinen jatkaminen
funktionaaliset ominaisuudet. Esimerkiksi jatkettu
eksponenttifunktio toteuttaa edelleenkin relaation
ez1 +z2 = ez1 ez2 , z1 , z2 ∈ C.
Samoin trigonometristen funktioiden yhteenlaskukaavat
ovat voimassa jatketuillekin funktioille.
35
Eulerin kaava
Tarkastellaan eksponenttifunktiota w = ez . Koska
jatkaminen säilyttää funktionaaliset ominaisuudet, on
missä siis r = |z| ja φ = arctan Im z/Re z. Kuten edellä
mainittiin, polaariesityksen avulla kompleksilukujen
kerto- ja jakolaskut ovat suoraviivaisia:
w = ex+iy = ex eiy .
z1 z2
Tässä ex on vanha tuttu reaalinen eksponenttifunktio.
Selvitetään siis, mitä on eix , kun x ∈ R.
Eksponenttifunktion Taylorin sarja (3.6) on
z3
z4
z5
z2
+
+
+
+ ···.
e =1+z+
2!
3!
4!
5!
z
=
r1 r2 ei(φ1 +φ2 )
=
r1 r2 (cos(φ1 + φ2 ) + i sin(φ1 + φ2))
ja
z1
z2
(5.15)
=
=
Sijoitetaan tähän z = ix. Imaginääriluvun ix potenssit
ovat
r1 i(φ1 −φ2 )
e
r2
r1
(cos(φ1 − φ2 ) + i sin(φ1 − φ2)) .
r2
Potenssifunktiot
(ix)2
(ix)3
=
=
i2 x2 = −x2
ix(ix)2 = −ix3
(ix)4
(ix)5
=
=
..
.
ix(ix)3 = −i2 x4 = x4
ix(ix)4 = ix5
(ix)2n
(ix)2n+1
=
=
..
.
(−1)n x2n
i(−1)n x2n+1
Kertolaskun erikoistapauksena saadaan
potenssiinkorotukselle De Moivren kaavana tunnettu
lauseke
zn
=
=
x2
x3
x4
x5
−i +
+ i + ···
2!
3!
4!
5!
x2
x4
1−
+
+ ···
4!
2!
x3
x5
+i x −
+
+ ··· .
3!
5!
ei(φ+n2π)
1 + ix −
x
e = e (cos y + i sin y),
=
=
eiφ ei2nπ
eiφ (cos 2nπ + i sin 2nπ)
=
=
eiφ (1 + i0)
eiφ .
z = reiφ+i2nπ , n = 0, ±1, ±2, . . . .
(5.16)
Luvun z n:s juuri w = z 1/n on se luku mikä toteuttaa
wn = z. Käyttäen polaariesitystä
w = ρeiφ ,
z = reiθ
nähdään että on oltava voimassa
Yleisesti kompleksinen eksponenttifunktio on siten
z
(5.19)
Kompleksiluku z voidaan siis esittää kuten
Vertaamalla reaali- ja imaginääriosia Taylorin sarjoihin
(3.6) todetaan niiden esittävän kosini- ja sinifunktioita.
Päädymme Eulerin kaavaan
eix = cos x + i sin x.
rn (cos φ + i sin φ)n = rn eniφ
rn (cos nφ + i sin nφ).
Polaariesityksen napakulma ei ole yksikäsitteinen. Jos
nimittäin φ on luvun z napakulma, niin on myös mikä
tahansa muotoa φ + n2π, n = 0, ±1, ±2, . . . , oleva kulma,
sillä Eulerin kaavan mukaan on
Sijoitetaan nämä potenssit Taylorin kehitelmään (5.15),
jolloin saadaan
eix
=
=
ρn = r ⇒ ρ =
(5.17)
√
n
r
ja
kun z = x + iy.
Muistetaan, että polaariesityksessa (5.13) kompleksiluku
z voitiin kirjoittaa muotoon
z = r cos φ + ir sin φ.
koska ei k 2π = 1. Siis saamme
√
z 1/n = n rei(θ/n+k 2π/n) , k ∈ N
(5.20)
Helposti nähdään, että vain luvut k = 0, 1, . . . (n − 1)
tuottavat erisuuruisen tuloksen:
josta, Eulerin kaavaa (5.16) soveltaen saamme
standardimuodon polaariesitykselle:
z = reiφ ,
einφ = eiθ ⇒ nφ = θ + k 2π, k ∈ N
e0 , ei2π/n , ei4π/n , . . . , ei2(n−1)π/n
(5.18)
36
(5.21)
Toisaalta positiivinen kokonaisluku k voidaan aina
kirjoittaa muodossa k = qn + r, missä q on jakolaskun
k/n osamäärä ja r, 0 ≤ r < n, sen jakojäännös. On siis
voimassa
ei2kπ/n = ei2rπ/n ei2qπ = ei2rπ/n ,
joten jokainen muotoa exp(i2kπ/n), k ≥ 0, oleva
kompleksiluku on joukossa (5.21). Samalla tavoin voidaan
todeta, että myös luvut exp(i2kπ/n) kokonaisluvun k
ollessa negatiivinen ovat nekin joukossa (5.21). Siis,
kompleksiluvulla z = reiφ , r 6= 0, on täsmälleen n
erilaista n:ttä juurta:
z 1/n
=
r1/n eiφ/n , r1/n ei(φ+2π)/n ,
r1/n ei(φ+4π)/n , . . . ,
r1/n ei(φ+2(n−1)π)/n .
(5.22)
Hyperboliset kosini- ja sinifunktiot määritellään kaavoilla
cosh x
sinh x
2 = 2e
= 2e
= 2e
4πi
= 2e
6πi
(ex + e−x )
(ex − e−x ) .
(5.24)
Analogisesti hyperbolinen tangentti määritellään kuten
tanh x =
sinh x
ex − e−x
= x
.
cosh x
e + e−x
(5.26)
Trigonometristen ja hyperbolisten funktioiden välillä
vallitsee yhteys
cosh iφ
sinh iφ
tanh iφ
Kirjoitetaan Eulerin kaavaa käyttäen
2πi
1
2
1
2
Myös tangenttifunktio voidaan kirjoittaa eksponenttien
avulla:
sin φ
eiφ − e−iφ
tan φ =
(5.25)
=
.
cos φ
i(eiφ + e−iφ )
Esim. Luvun 2 neljännet juuret
0i
=
=
.
Näemme, että neljännet juuret ovat
21/4 , 21/4 eπi/2 , 21/4 eπi ja 21/4 e3πi/2 .
Eulerin kaavan mukaan on mm.
1
1
eπi/2 = cos π + i sin π = i
2
2
Samoin voimme
todeta, että exp(πi) = −1 ja
exp 23 πi = −i. Kysytyt juuret ovat niin ollen
21/4 , 21/4 i, −21/4 ja − 21/4 i.
Huomattakoon, että jonossa seuraava termi,
2 = 2 exp(8πi), antaisi neljänneksi juureksi
21/4 exp(2πi) = 21/4 . Tämä esiintyy jo juurilistassamme.
Trigonometriset funktiot
Eulerin kaavan (5.16)
eiφ = cos φ + i sin φ
mukaan on
e−iφ = cos(−φ) + i sin(−φ) = cos φ − i sin φ.
Ratkaistaan näistä yhtälöistä sini- ja kosinifunktiot:
cos φ = 12 eiφ + e−iφ (5.23)
1
sin φ = 2i
eiφ − e−iφ .
Voimme itse asiassa tästä lähtien pitää näitä lausekkeita
sini- ja kosinifunktioiden määritelminä. Nämä
määritelmät ovat voimassa siinäkin tapauksessa, että
argumenttikulma φ on kompleksinen.
37
=
=
=
cos φ
i sin φ
i tan φ.
(5.27)
6. Differentiaaliyhtälöistä
Kompleksiluvun logaritmi:
ln z = w ⇔ z = ew
Jos nyt z = reiθ = reiθ ein2π , missä n ∈ Z, niin saadaan
w = ln z = ln r + iθ + in2π,
n∈Z
Logaritmi on siis äärettömän moniarvoinen funktio.
Helposti nähdään että ew = z kaikilla n.
Logaritmin päähaaraksi sanotaan valintaa n = 0 ja
0 ≤ θ < 2π:
lnz = ln r + iθ,
Newtonin toisen lain mukaan kappaleeseen vaikuttava
voima on yhtäsuuri kuin kappaleen massa kerrottuna sen
kiihtyvyydellä. Korkeudella h putoamisliikkeessä olevan
2
kappaleen kiihtyvyys on ddt2h ja siihen vaikuttava
gravitaatiovoima −mg, kun kappaleen massa on m.
Newtonin lain mukaan on siis
m
tai
0 ≤ θ < 2π
Jos nyt z ∈ R, ja z on positiivinen (> 0):
lnz = ln r
Jos taas z on negatiivinen reaaliluku,
lnz = ln r + iπ
Esim. (päähaara-arvot):
ln(−1) = ln eiπ ) = iπ
ln i = ln eiπ/2 = i π2
√
ln(1 + i) = ln( 12 + 12 eiπ/4 ) = 21 ln 2 + i π4
d2 h
= −mg
dt2
d2 h
= −g.
dt2
Tämä on korkeutta h hallitseva differentiaaliyhtälö, ts.
siinä esiintyy tuntemattoman funktion derivaattoja.
Differentiaaliyhtälön ratkaisemisella tarkoitetaan yhtälön
toteuttavan funktion etsimistä.
Putoamisliikkeen tapauksessa ratkaisu on helppo löytää.
Integroidaan differentiaaliyhtälön
d2 h
= −g
dt2
molemmat puolet, jolloin saadaan
dh
= −gt + c1 .
dt
Tämä on edelleenkin differentiaaliyhtälö ja edelleenkin
voimme integroida sen puolittain. Päädymme ratkaisuun
1
h = − gt2 + c1 t + c2 .
2
Terminologiaa
Putoamisliikkeen ratkaisussa on kummastakin
integroinnista aiheutuneet integrointivakiot otettu
mukaan. Vakioiden arvot määräytyvät alkuehdoista.
Tässä tapauksessa tieto kappaleen korkeudesta ja
nopeudesta alkuhetkellä t = 0 riittää.
Kun yhtälössä on jonkin muuttujan derivaattoja jonkin
toisen muuttujan suhteen, sanotaan edellistä muuttujaa
riippuvaksi ja jälkimmäistä riippumattomaksi (vapaaksi).
Riippuva muuttuja on siis sama kuin funktio mikä
halutaan ratkaista.
Jos differentiaaliyhtälössä esiintyy derivaattoja vain
yhden riippumattoman muuttujan suhteen, puhutaan
tavallisesta differentiaaliyhtälöstä. Jos yhtälössä on
osittaisderivaattoja useamman kuin yhden vapaan
muuttujan suhteen, kyseessä on
osittaisdifferentiaaliyhtälö.
Esimerkiksi differentiaaliyhtälö
dx
d2 x
2 + a dt + kx = 0
dt
38
on tavallinen. Sen riippuva muuttuja on x ja riippumaton
t. Yhtälö
∂u ∂u
+
= x − 3y
∂x ∂y
on puolestaan osittaisdifferentiaaliyhtälö, jonka
riippumattomat muuttujat ovat x ja y. u on tämän
yhtälön riippuva muuttuja.
Yhtälön kertaluku on korkein siinä esiintyvien
derivaattojen kertaluvuista. Esimerkiksi yhtälön
2
d h
= −g
dt2
kertaluku on 2.
Differentiaaliyhtälö on lineaarinen, jos riippuva muuttuja
(y) ja sen derivaatat esiintyvät yhtälön kaikissa termeissä
joko ensimmäisessä potenssissa tai ei ollenkaan. Jos
differentiaaliyhtälö ei ole lineaarinen, sen sanotaan olevan
epälineaarinen. Esimerkiksi yhtälö
d2 y
+ y = x4
dx2
on lineaarinen mutta yhtälöt
d2 y
+ sin y = 0,
dx2
y ′ + 2yy ′ = 0 ja y ′ =
Esim. φ(x) = c1 e−x + c2 e2x on yhtälön y ′′ − y ′ − 2y = 0
ratkaisu
Nyt φ′ (x) = −c1 e−x + 2c2 e2x ja φ′′ (x) = c1 e−x + 4c2 e2x .
Sijoitetaan nämä yhtälöön, jolloin
(c1 e−x + 4c2 e2x ) − (−c1 e−x + 2c2 e2x )
−2(c1 e−x + c2 e2x )
= (c1 + c1 − 2c1 )e−x + (4c2 − 2c2 − 2c2 )e2x = 0.
Tämä on ilmeisestikin voimassa koko reaaliakselilla, joten
φ(x) = c1 e−x + c2 e2x on yhtälön ratkaisu välillä (−∞, ∞)
olivatpa c1 ja c2 mitä tahansa vakioita.
dy
+ 1 + yexy = 0 ratkaisu
Esim. Yhtälön (1 + xexy ) dx
määräytyy yhtälöstä x + y + exy = 0
Suoraviivainen menettely olisi ratkaista y yhtälöstä
x + y + exy = 0 ja sijoittaa tämä differentiaaliyhtälöön.
Valitettavasti vain emme osaa tätä ratkaisua muodostaa.
Derivoidaan sen sijaan yhtälö x + y + exy = 0
implisiittisesti, jolloin
dy
dy
= 0.
+ exy y + x
1+
dx
dx
Uudestaan ryhmittäen voidaan kirjoittaa
x
y
ovat epälineaarisia.
Mikä tahansa kertaluvun n tavallinen differentiaaliyhtälö
on kirjoitettavissa muotoon
dn y
dy
, . . . , n = 0.
F x, y,
dx
dx
Olkoon I jokin lukuväli ((a, b), [a, b], . . .).
Jos sijoitettaessa y = f (x) yhtälöön
dn y
dy
,..., n = 0
F x, y,
dx
dx
se toteutuu kaikilla x ∈ I, sanotaan että f (x) on ko.
yhtälön ratkaisu välillä I.
Esim. Yhtälön y ′′ − x22 y = 0 ratkaisu on f (x) = x2 − x−1
Nyt derivaatat f ′ (x) = 2x + x−2 ja f ′′ (x) = 2 − 2x−3 ovat
määriteltyjä aina kun x 6= 0. Sijoitetaan f yhtälöön,
jolloin saadaan
(1 + xexy )
joten yhtälö x + y + exy = 0 todellakin määrää
implisiittisesti ko. differentiaaliyhtälön ratkaisun.
Osoittautuu, että kertalukua n olevien
differentiaaliyhtälöiden ratkaisuihin liittyy aina n
mielivaltaista vakiota. Useimmissa tapauksissa vakiot
ovat määrättävissä, jos tunnetaan funktio ja sen n − 1
ensimmäisen derivaatan arvot jossakin ratkaisuvälin I
pisteessä.
Differentiaaliyhtälöön
dy
dn y
F x, y,
,..., n = 0
dx
dx
liittyvä alkuarvoprobleema kuuluu: Etsi välillä I se
differentiaaliyhtälön ratkaisu, joka pisteessä x0 ∈ I
toteuttaa n ehtoa
y(x0 )
dy
(x0 )
dx
=
y0
=
y1
..
.
2 2
(x − x−1 )
x2
(2 − 2x−3 ) − (2 − 2x−3 )
0.
(2 − 2x−3 ) −
=
=
dy
+ 1 + yexy = 0,
dx
dn−1 y
(x0 )
dxn−1
=
yn−1 ,
missä suureet y0 , y1 , . . . , yn−1 ovat vakioita.
Yhtälö siis toteutuu kun x 6= 0 eli f (x) = x2 − x−1 on
yhtälön ratkaisu alueissa (−∞, 0) ja (0, ∞).
Nimitys alkuarvo on peräisin mekaniikasta, missä y(x0 ) = y0
tarkoittaa usein kappaleen paikkaa alkuhetkellä x0 ja y ′ (x0 ) = y1
sen nopeutta samalla hetkellä.
39
Esim. Määrää se yhtälön y ′′ − y ′ − 2y = 0 ratkaisu, joka
toteuttaa alkuehdot y(0) = 2 ja y ′ (0) = −3
Aiemmin näimme, että φ(x) = c1 e−x + c2 e2x on ko.
yhtälön ratkaisu olivatpa vakiot c1 ja c2 mitä tahansa.
Määrätään nämä kertoimet siten, että alkuehdot
toteutuvat:
φ(0)
′
φ (0)
=
c 1 e0 + c 2 e0 = 2
=
−c1 e0 + 2c2 e0 = −3,
eli
c1 + c2
=
2
−c1 + 2c2
=
−3.
Vastaavanlaisia lauseita on olemassa myös korkeamman
kertaluvun differentiaaliyhtälöille.
Lause siis kertoo, milloin ratkaisu on löydettävissä ja että
ratkaisun löydyttyä ei tarvitse etsiä muita ratkaisuja
koska niitä ei ole olemassa. Graafisesti olemassaolo
tarkoittaa, että lauseen suorakaiteen jokaisen pisteen
kautta kulkee jokin ratkaisu ja yksikäsitteisyys sitä, että
kunkin pisteen (x0 , y0 ) kautta kulkee täsmälleen yksi
ratkaisu. Tästä johtuen ratkaisujen kuvaajat eivät
koskaan leikkaa toisiaan. Valitettavasti lause kertoo vain
että ratkaisu on olemassa pisteen x = x0 ympäristössä,
mutta ei kerro tämän ympäristön suuruutta.
Fysiikan mallintamisessa alkuarvotehtävän ratkaisun olemassaolo
ja yksikäsitteisyys ovat ensiarvoisen tärkeitä. Ensinnäkin
todellisessa maailmassa ”jotakin tapahtuu”joten mallinnettaessa
maailmaa aluarvoprobleemoina olisi ratkaisujen syytä olla
olemassa. Toiseksi, jos saman kokeen toisto samoilla ehdoilla
johtaa aina samaan tulokseen, täytyy kokeeseen liittyvän
mallinkin olla yksikäsitteinen. Mekaniikka on hyvä esimerkki
deterministisestä mallista: tulevaisuus määräytyy tarkasti jos
alkutila tunnetaan tarkasti.
Yhtälöryhmän ratkaisuna saadaan c1 = 7/3 ja c2 = −1/3.
Alkuarvot toteuttava ratkaisu on siis
φ(x) =
7 −x 1 2x
e − e .
3
3
tavallisimmat differentiaaliyhtälöt:
Seuraavat differentiaaliyhtälöt esiintyvät usein fysiikassa
ja muissa sovelluksissa:
d2 y
dx2
6.1.1 Separoituvat yhtälöt
Jos differentiaaliyhtälö voidaan kirjoittaa muodossa
dy
= ay, a ∈ R ⇒ y = Ceax
dx
dy
= q(x)p(y)
dx
d2 y
= a2 y, ⇒ y = C1 eax + C2 e−ax
dx2
ts. oikea puoli on kirjoitettavissa kahden funktion tulona,
joista toinen riippuu vain muuttujasta x ja toinen vain
muuttujasta y, sanotaan että yhtälö on separoituva tai
että yhtälön muuttujat ovat erotettavissa.
Luonnollisesti myös muotoa
=
−a2 y, ⇒ y = C1 cos(ax) + C2 sin(ax)
=
D1 eiax + D2 e−iax
Viimeinen yhtälö on esim. harmonisen värähtelijän
yhtälö: jos kappale liikkuu x-akselia pitkin voiman
F = −kx vaikutuksessa, Newtonin lain mukaan (F = ma)
d2 x
F = −kx = 2
dt
6.1 Ensimmäisen kertaluvun yhtälöt
Ensimmäisen kertaluvun differentiaaliyhtälöille voidaan
todistaa olemassaolo- ja yksikäsitteisyyslause:
Olkoot funktio f (x, y) ja sen osittaisderivaatta ∂f
∂x (x, y)
jatkuvia pisteen (x0 , y0 ) sisältävässä suorakaiteessa
R = {(x, y)|a < x < b, c < y < d}.
Silloin alkuarvoprobleemalla
dy
= f (x, y),
dx
q(x)
dy
p(y)
dy
=
tai
=
dx
p(y)
dx
q(x)
(6.1)
(6.2)
ovat separoituvia.
Separoituva yhtälö
q(x)
dy
=
dx
p(y)
ratkeaa muuttujien separoinnilla:
kerrotaan molemmat puolet funktiolla p(y) ja
differentiaalilla dx, jolloin
p(y) dy = q(x) dx,
ja integroimalla näin saatu yhtälö,
Z
Z
p(y) dy = q(x) dx.
(6.3)
Jos integraalit osataan laskea, voidaan ratkaista y = f (x).
y(x0 ) = y0
on yksikäsitteinen ratkaisu φ(x) jollakin välillä
x0 − h < x < x0 + h, missä h > 0.
Näytetään että (6.3) antaa oikean ratkaisun: Olkoot P (y)
ja Q(x) funktioiden p(y) ja q(x) integraalifunktioita, ts.
P ′ (y) = p(y),
40
Q′ (x) = q(x)
Tälloin yhtälö (6.3) on ekvivalentti yhtälön
P (y) = Q(x) + C
kanssa. Kirjoittamalla y = y(x) ja derivoimalla x:n
suhteen saamme
d
d
P (y(x)) = P ′ (y(x))y ′ (x) =
Q(x) ⇒
dx
dx
p(y)y ′ = q(x)
mikä oli alkuperäinen differentiaaliyhtälö.
dy
= x−5
Esim. Ratkaise dx
y2
Kerrotaan yhtälö puolittain tekijällä y 2 dx, jolloin saadaan
y 2 dy = (x − 5) dx.
1 1
y = − − x.
2 2
6.1.2 Lineaariset yhtälöt
Ensimmäisen kertaluvun lineaarinen yhtälö on muotoa
a1 (x)
x2 sin x − (cos x)y = (sin x)
x2
y3
=
− 5x + C.
3
2
y=
3x2
− 15x + 3C
2
y
1/3
.
Koska vakio C voi olla mielivaltainen reaaliluku niin
sellainen on myös 3C. Voimme siis aivan hyvin korvata
sen vaikkapa symbolilla K:
y=
3x2
− 15x + K
2
dy
dx
(6.4)
dy
dx
on selvästikin lineaarinen. Yhtälö
Ratkaistaan y:
dy
+ a0 (x)y = b(x),
dx
missä kertoimet a1 (x), a0 (x) ja oikea puoli b(x) voivat
riippua vain vapaasta muuttujasta x mutta eivät
riippuvasta muuttujasta y.
Esimerkiksi yhtälö
Integrointi molemmin puolin antaa
Z
Z
2
y dy = (x − 5) dx
eli
Merkitään vakiota ±K jälleen symbolilla C, joka voi nyt
siis olla mielivaltainen reaaliluku. Saamme silloin
differentiaaliyhtälön ratkaisuksi y = 1 + C(x + 3).
Alkuehto oli y(−1) = 1 + C(−1 + 3) = 0 eli C = −1/2.
Alkuarvotehtävän siis ratkaisee funktio
1/3
sen sijaan ei ole lineaarinen, sillä sen lisäksi että
derivaatan kertoimena on riippuva muuttuja y esiintyy
yhtälössä muuttujan y kuutiollinen termi.
Olettaen, että kerroin a1 (x) yhtälössä (6.4) on
tarkasteltavalla välillä nollasta poikkeava, ensimmäisen
kertaluvun yhtälö on kirjoitettavissa standardimuotoon
dy
+ p(x)y = q(x).
dx
.
y−1
x+3
=
Esim. Ratkaise alkuarvotehtävä
Muuttujien erottaminen johtaa yhtälöön
dy
+ (sin x)y 3 = ex + 1
dx
kun y(−1) = 0
dx
dy
=
.
y−1
x+3
Tämän integrointi antaa
Jos asetetaan q(x) = 0 yhtälöä sanotaan homogeeniseksi,
alkuperäistä täydelliseksi. Homogeenisen yhtälön kaikissa
termeissä esiintyy siis ainoastaan y:n tai y ′ ensimmäistä
potenssia.
Ratkaisussa kannattaa lähteä liikkeelle homogeenisen
yhtälön ratkaisusta:
I) Homogeeninen yhtälö (HY):
dy
+ p(x)y = 0
dx
ln |y − 1| = ln |x + 3| + C.
Eksponentioidaan yhtälön molemmat puolet ja saadaan
Ratkeaa separoimalla:
eln |y−1| = eln |x+3|+C
eli
⇒
|y − 1| = eC |x + 3| = K|x + 3|,
missä olemme merkinneet K = eC > 0. Riippuen
muuttujien y ja x arvoista on |y − 1| = ±(y − 1) ja
|x + 3| = ±(x + 3). Voimme siis kirjoittaa
y − 1 = ±K(x + 3) tai y = 1 + (±K)(x + 3).
(6.5)
⇒
dy
= −p(x)dx
y
Z
ln |y| = − p(x)dx + A
Z
y = C exp − p(x)dx
missä C = ±eA on integroimisvakio. Tämä on HY:n
yleinen ratkaisu.
41
II) Täydellinen yhtälö (TY):
Nyt riittää löytää joku ratkaisu TY:lle, olkoon se y0 (x).
Tällöin TY:n yleinen ratkaisu on HY:n ja TY:n
ratkaisujen summa,
yTY (x) = yHY (x) + y0 (x)
missä yHY on yllä lasketty HY:n yleinen ratkaisu.
Todistus:
1. yTY (x) on selvästi TY:n ratkaisu
2. Olkoon y1 (x) TY:n mielivaltainen ratkaisu. Tällöin
y1 (x) − y0 (x) on selvästi HY:n joku ratkaisu, joten
y1 (x) = yHY (x) + y0 (x).
Kuinka TY:n ratkaisu löydetään?
Arvaus: toimii usein, mutta pitää keksiä!
Esim. y ′ + xy = x: selvästi yksi TY:n ratkaisu on y = 1.
Vakion variointi: Etsitään ratkaisua niin että HY:n
ratkaisun vakio “ylennetään” x:n funktioksi:
R
y = C(x)e− p(x)dx
R
R
y ′ = C ′ e− pdx − Cpe− pdx
R
= C ′ e− pdx − py
Sijoitetaan tämä TY:hyn:
R
C ′ e−
⇒
⇒
pdx
R
− py + py = q
C ′ = qe pdx
Z
R
C = qe pdx dx
Siis TY:n yleinen ratkaisu saadaan muotoon
Z
R
R
pdx
− pdx
C + qe
dx
y(x) = e
Siis TY:n yleinen ratkaisu on siis näiden kahden ratkaisun
summa:
y = (C + sin x)x2
Vakio C määräytyy nyt alkuehdosta.
Esim. Etsi yhtälön y ′ − 2y = 2 yleinen ratkaisu
Yhtälö on lineaarinen:
HY:
⇒
⇒
TY: Täydellisen yhtälön ratkaisu voidaan etsiä vakion
varioinnilla, mutta tässä tapauksessa nähdään helposti
että y = −1 toteuttaa TY:n. Siis yleinen ratkaisu on
y = Ce2x − 1 .
Esim. Putoava kappale:kappale jonka massa on m putoaa
ilmassa maan vetovoiman vaikutuksesta. Hetkellä t = 0
kappale on levossa. Mikä on kappaleen nopeus ajan
funktiona?
Kappaleeseen vaikuttavat voimat:
maan vetovoima: mg
ilmanvastus: −kv (pitää paikkansa jos nopeus v on pieni).
Newtonin liikelaki
F = ma ⇒ m
(6.6)
Tässä C -termi on HY:n yleinen ratkaisu. Tätä muotoa ei
kannata muistaa, menetelmä kyllä!
dy
− x2y2 = x cos x yleinen ratkaisu
Esim. Etsi yhtälön x1 dx
Yhtälö on lineaarinen, joten kirjoitetaan se ensin
standardimuotoon kertomalla se tekijällä x:
dy
2
− y = x2 cos x.
dx x
Nyt homogeeninen yhtälö on siis y ′ − x2 y = 0, joka
ratkeaa separoimalla:
2
dy
= dx ⇒ ln |y| = 2 ln |x| + A ⇒ y = Cx2
y
x
Täydellinen yhtälö ratkeaa vakion varioinnilla:
y = Cx2 ⇒ y ′ = C ′ x2 + C2x
dv
= mg − kv
dt
Kyseessä on lineaarinen 1. kertaluvun differentiaaliyhtälö.
HY on
mv ′ = −kv ⇒
⇒
ln |v| = −
1
k
dv = − dt
v
m
k
t + A ⇒ v = Ce−kt/m
m
TY:n yksittäisratkaisu saadan vakion varioinnilla, tai
jälleen arvaamalla: selvästi v = mg/k toteuttaa TY:n,
joten yleinen ratkaisu on
v(t) = Ce−kt/m + mg/k
Hetkellä t = 0 nopeus v(0) = 0 ⇒ C = −mg/k, joten
alkuehdon toteuttava ratkaisu on
v(t) =
mg
(1 − e−kt/m )
k
Kun t on pieni (t ≪ m/k), kappaleen nopeus v ≈ gt,
mutta kun t → ∞, nopeus lähestyy raja-arvoa mg/k.
ja TY:
C ′ x2 + C2x −
dy
− 2y = 0
dx
dy
= 2dx
y
ln |y| = 2x + A ⇒ y = Ce2x
2
Cx2 = x2 cos x ⇒ C ′ = cos x ⇒ C = sin x
x
42
6.2 Lineaariset toisen kertaluvun yhtälöt
Toisen kertaluvun differentiaaliyhtälöt ovat tuntuvasti
hankalampia ratkaista kuin ensimmäinen.
Käsittelemmekin tässä vain tärkeintä erikoistapausta,
toisen kertaluvun lineaarista ja vakiokertoimista
differentiaaliyhtälöä.
Toisen kertaluvun lineaarinen differentiaaliyhtälö on
muotoa
lineaarisesti riippumatonta HY:n ratkaisua. Tässä
tapauksessa lineaarinen riippumattomuus tarkoittaa että
a1 y1 (x) + a2 y2 (x) = 0 vain jos a1 = a2 = 0
kaikilla x ∈ I.
Helposti nähdään että jos y1 ja y2 ovat HY:n ratkaisuja
niin yHY on myös ratkaisu.
Normaalisti ratkaisujen lineaarinen riippumattomuus on selvää.
Tarkemmin se voidaan laskea Wronskin determinantista:
dy
d2 y
+ a0 (x)y = b(x),
a2 (x) 2 + a1 (x)
dx
dx
W [y1 , y2 ](x)
=
ts. se sisältää enintään y:n toista derivaattaa (toinen
kertaluku) ja sen termit ovat verrannollisia ainoastaan y 1
tai y 0 (lineaarinen differentiaaliyhtälö). (siinä ei siis
esiinny termejä y 2 , y ′ y, ey jne.)
Jos kertoimet a0 , a1 ja a2 ovat vakioita, sanotaan yhtälön
olevan vakiokertoimisen.
Lineaarisen toisen kertaluvun yhtälön standardimuoto on
dy
d2 y
2 + p(x) dx + q(x)y = g(x),
dx
dy
d2 y
2 + p(x) dx + q(x)y = 0.
dx
(6.8)
Jos standardimuotoisessa yhtälössä (6.7) g(x) 6= 0,
sanotaan yhtälön olevan ei-homogeeninen tai täydellinen.
2. kertaluvun lineaarisen dy:n ratkaisujen
ominaisuuksia
y1 (x) y2 (x) y1′ (x) y2′ (x) y1 (x)y2′ (x) − y2 (x)y1′ (x)
(6.10)
Käytännössä lineaarista riippuvuutta ei useinkaan testatata
Wronskin determinantilla, ei ainakaan silloin kun on kyse tutuista
funktioista. On helppo nähdä, että esimerkiksi kaikki eri
potenssifunktiot (xr , potenssit r erisuuria) ovat toisistaan
lineaarisesti riippumattomia. Tästä seuraa se, että kaikki eri
eksponenttifunktiotkin (erx , eri kertoimet r) ovat toisistaan
riippumattomia sen lisäksi, että ne ovat riippumattomia myös
potenssifunktioista. Samoin sini- ja kosinifunktiot ovat toisistaan
rippumattomia. Sen sijaan esim. kosinifunktio riippuu lineaarisesti
(kompleksisista) eksponenttifunktioista (Eulerin kaava:
cos x = 21 (eix + e−ix )). Tästä voidaan toisaalta päätellä, että
funktiot cos rx (kertoimet r itseisarvoltaan erisuuria) ovat
riippumattomia sekä toisistaan että funktioista sin rx.
Esim. Funktiot y1 (x) = e2x cos 3x ja y2 (x) = e2x sin 3x
ratkaisevat homogeenisen yhtälön y ′′ − 4y ′ + 13y = 0. Etsi
ratkaisu, joka toteuttaa alkuehdot y(0) = 2 ja y ′ (0) = −5
y1 ja y2 ovat lineaarisesti riippumattomia. Yleinen
ratkaisu on siis
y(x) = c1 e2x cos 3x + c2 e2x sin 3x
Tämän derivaatta on
y ′ (x)
Toisen kertaluvun lineaarisen differentiaaliyhtälön
ratkaisu etenee samaan tapaan kuin ensimmäisen
kertaluvun:
=
c1 (2e2x cos 3x − 3e2x sin 3x)
+c2 (2e2x sin 3x + 3e2x cos 3x).
Asetetaan y(0) = 2 ja y ′ (0) = −5, jolloin saadaan yhtälöt
1. Etsitään homogeenisen yhtälön yleinen ratkaisu,
yHY (x).
2. Etsitään täydellisen yhtälön joku ratkaisu y0 (x). Nyt
täydellisen yhtälön yleinen ratkaisu on muotoa
yTY (x) = yHY (x) + y0 (x).
Tämä ominaisuus seuraa samalla perusteella kuten 1. kl:n
yhtälölläkin.
Voidaan osoittaa, että homogeenisen yhtälön (HY) (6.8)
yleinen ratkaisu (jossain joukossa x ∈ I) voidaan
kirjoittaa muodossa
yHY (x) = C1 y1 (x) + C2 y2 (x)
on = 0 jos ja vain jos y1 ja y2 ovat lineaarisesti riippuvia
ratkaisuja.
(6.7)
missä p(x) = a1 (x)/a2 (x), q(x) = a0 (x)/a2 (x) ja
g(x) = b(x)/a2 (x) (olettaen, että a2 (x) 6= 0
tarkasteltavalla välillä).
Standardimuotoon (6.7) liittyvä homogeeninen yhtälö on
=
(6.9)
missä C1 , C2 ovat vakioita jotka voidaan kiinnittää
alkuehdoista ja y1 (x) ja y2 (x) ovat kaksi mielivaltaista
c1
=
2
2c1 + 3c2
=
−5.
Ratkaisut ovat c1 = 2 ja c2 = −3. Alkuehdot toteuttava
differentiaaliyhtälön ratkaisu on siten
y(x) = 2e2x cos 3x − 3e2x sin 3x.
6.2.1 Vakiokertoimiset toisen kertaluvun
homogeeniset lineaariset yhtälöt
MAPUlla rajoitumme ratkaisemaan vakiokertoimisia 2.
kertaluvun differentiaaliyhtälöitä. Nämä ratkaistaan
ratkaisemalla ensin homogeeninen yhtälö (HY), mikä on
muotoa
ay ′′ + by ′ + cy = 0,
(6.11)
43
missä a, b ja c ovat vakiota ja a 6= 0. Yhtälön mukaan siis
vakioilla kerrotun funktion ja sen derivaattojen summan
pitäisi olla identtisesti nolla. Ratkaisua kannattaisi
varmaankin etsiä sellaisten funktioiden joukosta, joiden
derivaatat ovat keskenään ja itse funktion kanssa samaa
muotoa, mahdollisesti vakiotekijöillä kerrottuna. Ratkaisu
saattaisi siten löytyä funktioiden erx joukosta (r vakio).
Sijoitetaan tämä yrite yhtälöön (6.11), jolloin saadaan
ar2 erx + brerx + cerx = 0.
Koska eksponenttifunktio erx on aina nollasta poikkeava,
voimme jakaa yhtälön sillä ja päädytään ns.
karakteristiseen yhtälöön
ar2 + br + c = 0.
Alkuehdot johtavat yhtälöihin
y(0) = c1 e0 + c2 e0 = c1 + c2
√
√
−1 = y ′ (0) = (−1 + 2)c1 e0 + (−1 − 2)c2 e0
√
√
= (−1 + 2)c1 + (−1 − 2)c2 ,
√
√
joiden ratkaisuina ovat c1 = − 2/4 ja c2 = 2/4.
Alkuarvoprobleeman siis toteuttaa funktio
√
√
2 (−1+√2)x
2 (−1−√2)x
y(x) = −
+
.
e
e
4
4
0 =
Tapaus 2: b2 < 4ac
Nyt karakteristisen yhtälön
(6.12)
Toisen asteen yhtälönä karakteristinen yhtälö on helppo
ratkaista:
√
−b + b2 − 4ac
r1 =
√2a
−b − b2 − 4ac
r2 =
.
2a
Funktiot y1 = er1 x ja y2 er2 x ratkaisevat siten
differentiaaliyhtälön (6.11).
ar2 + br + c = 0
juuret ovat kompleksiset:
p
1
(−b ± i |b2 − 4ac|) ≡ α ± iβ
2a
√
missä α = −b/(2a) ja β = 4ac − b2 /(2a) ovat reaalisia.
Juuret ovat siis toistensa liittolukuja, r1 = r2∗ . Nyt siis
differentiaaliyhtälön yleinen ratkaisu saadaan edelleen
eksponenttifunktioiden summasta
r1,2 =
y
2
Tapaus 1: b > 4ac:
Tässä tapauksessa karakteristisen yhtälön ratkaisut r1 ja
r2 ovat reaalisia, ja r1 6= r2 . Tällöin er1 x ja er2 x ovat
lineaarisesti riippumattomia. (Nähdään myös Wronskin
determinantista). Yleinen ratkaisu y on näiden
superpositio
y(x) = c1 er1 x + c2 er2 x .
Esim. Yhtälön y ′′ + 5y ′ − 6y = 0 yleinen ratkaisu
Karakteristinen yhtälö on nyt
r2 + 5r − 6 = 0
−5 ±
√
25 + 24
1
=
−6.
2
Yleinen ratkaisu on siten
y(x) = c1 ex + c2 e−6x .
Esim. Alkuarvotehtävä y ′′ + 2y ′ − y = 0, kun y(0) = 0 ja
y ′ (0) = −1
2
Karakteristisen
√ yhtälön r +√2r − 1 = 0 ratkaisut ovat
r1 = −1 + 2 ja r2 = −1 − 2. Yleinen ratkaisu on niin
ollen
√
√
y(x) = c1 e(−1+ 2)x + c2 e(−1− 2)x .
C 1 er1 x + C 2 er 2 x
=
=
eαx (C1 eiβx + C2 e−iβx )
eαx (A cos βx + B sin βx)
missä nyt A = C1 + C2 ja B = iC1 − iC2 . Yllä viimeisin
muoto antaa reaalisen ratkaisun (y(x) ∈ R), jos A, B ∈ R.
Esim. Yhtälön y ′′ + 2y ′ + 4y = 0 yleinen ratkaisu
Karakteristisen yhtälön r2 + 2r + 4 = 0 ratkaisut ovat
√
√
−2 ± 4 − 16
= −1 ± i 3.
r=
2
Silloin funktiot
y1 (x) = e−x cos
ja sen ratkaisut
r1,2 =
=
√
3x ja y2 (x) = e−x sin
√
3x
ovat yhtälön lineaarisesti riippumattomia ratkaisuja.
Yleinen ratkaisu on siten
√
√
y(x) = c1 e−x cos 3x + c2 e−x sin 3x.
Esim. Vaimennettu harmoninen värähtelijä
Olkoon meillä kappale (massa m) joka liikkuu x -akselia
pitkin ja joka on kiinnitetty jousella kiintopisteeseen.
Olkoon kappaleen paikka x(t). Jousi aiheuttaa
kappaleeseen harmonisen voiman Fjousi = −kx (k > 0),
missä x = 0 on piste missä kappale on levossa. Lisäksi
kappaleeseen vaikuttaa nopeuteen verrannollinen
kitkavoima γv = −γx′ (t).
44
Newtonin lain mukaan F = ma = mx′′ ⇒
Sijoitetaan tähän r0 = −b/2a ja nähdään että
−kx − γx′ = mx′′
Tämä on 2. kertaluvun lineaarinen homogeeninen
vakiokertoiminen differentiaaliyhtälö. Karakteristinen
yhtälö on
2ar0 + b = −2a
ja
ar02 + br0 + c
p
1
(−γ ± γ 2 − 4mk)
−k − γr = mr2 ⇒ r =
2m
x(t) = Aer1 t + Ber2 t
missä
r1,2 =
ovat reaalisia.
p
1
(−γ ± γ 2 − 4mk) < 0
2m
ratkaisu on v(x) = C1 x + C2 . Tästä nähdään että
y(x) = xer0 x on niin ollen eräs alkuperäisen yhtälömme
ratkaisu, ja on helppo nähdä, että tämä on lineaarisesti
riippumaton ratkaisusta er0 x .
Olemme saaneet aikaan reseptin:
Jos yhtälöön
ay ′′ + by ′ + cy = 0
liittyvän karakteristisen yhtälön
ar2 + br + c = 0
Karakteristisen yhtälön
ar2 + br + c = 0
juuret ovat yhtäsuuret, jos b2 − 4ac = 0. Ainoa juuri on
tällöin reaalinen ja suuruudeltaan
b
r0 = −
2a
ja er0 x on siten ainoa muotoa erx oleva ratkaisu.
Tiedämme toisaalta, että toisen kertaluvun yhtälöllä on
aina kaksi lineaarisesti riippumatonta ratkaisua.
Etsitään toinen ratkaisu vakion varioinnilla: yrite
molemmat juuret ovat yhtäsuuret, r0 , niin yleinen
ratkaisu on
y(x) = C1 er0 x + C2 xer0 x .
Esim. Yhtälön y ′′ + 4y ′ + 4y = 0 yleinen ratkaisu
Karakteristinen yhtälö on
r2 + 4r + 4 = (r + 2)2 = 0,
jonka molemmat juuret ovat −2. Yleinen ratkaisu on
silloin
y(x) = c1 e−2x + c2 xe−2x .
y(x) = v(x)er0 x
Vakion variointi soveltuu yleisemminkin tilanteisiin, missä
tunnetaan jokin erikoisratkaisu ja pitäisi etsiä toinen tästä
lineaarisesti riippumaton ratkaisu.
vie differentiaaliyhtälömme
Olkoon g jokin yhtälön
ay ′′ + by ′ + cy = 0.
y ′′ + py ′ + qy = 0
Sijoitamme tähän yritteemme ja derivaatat
y
y ′′
=
=
b
b2
b2
−b +c=− +c
2
4a
2a
4a
b2 − 4ac
−
= 0,
4a
a
koska diskriminantti oli b2 − 4ac = 0. Päädymme siten
yhtälöön
av ′′ = 0
Tapaus 3: b2 = 4ac
′
=
=
Jos γ 2 < 4km (pieni vaimennus), ratkaisu on
x(t) = e−γt/(2m) (A cos ωt + B sin ωt)
p
missä ω = 4mk − γ 2 /(2m). Kappale siis värähtelee
vaimenevasti taajuudella ω. Jos γ = 0, värähtely ei
vaimene.
Jos taas γ 2 > 4km (voimakas vaimennus), ratkaisu on
b
+b=0
2a
′ r0 x
ratkaisu. Sijoittamalla tähän y(x) = g(x)v(x) päädytään yhtälöön
r0 x
gv ′′ + 2g ′ v ′ + g ′′ v + pg ′ v + pgv ′ + qgv = 0.
v e + r0 ve
v ′′ er0 x + 2r0 v ′ er0 x + r02 ver0 x .
Uudelleen ryhmittäen voidaan kirjoittaa
gv ′′ + (2g ′ + pg)v ′ + (g ′′ + pg ′ + qg)v = 0.
Hieman ryhmittäen saadaan
Koska g toteutti alkuperäisen yhtälön, g ′′ + pg ′ + qg = 0, saamme
av ′′ + (2ar0 + b)v ′ + (ar02 + br0 + c)v er0 x = 0.
gv ′′ + (2g ′ + pg)v ′ = 0.
Funktion v täytyy siis toteuttaa yhtälö
Tämä on funktiolle v ′ = u ensimmäisen kertaluvun yhtälö
av ′′ + (2ar0 + b)v ′ + (ar02 + br0 + c)v = 0.
g(x)
45
du
+ [2g ′ (x) + p(x)g(x)]u = 0.
dx
2
Tämä separoitavissa yhtälöksi
Z
du
=−
u
jolloin saadaan
Z
ln |u| = ln
2g ′ (x) + p(x)g(x)
dx,
g(x)
1
−
[g(x)]2
Eksponenttiointi antaa
v ′ (x) = u(x) =
Z
d
d
, D2 ≡ dx
missä D ≡ dx
2 on merkintätapa.
HY:n karakteristinen yhtälö on r2 + ar + b = 0, jonka
ratkaisut ovat r1 , r2 . Näiden juurien avulla voimme
kirjoittaa karakteristisen polynomin muotoon
r2 + ar + b = (r − r1 )(r − r2 )
p(x) dx.
1
−
e
[g(x)]2
Täten differentiaaliyhtälökin voidaan kirjoittaa
R
p(x) dx
(D2 + aD + b)y(x) = (D − λ1 )(D − λ2 )y(x) = f (x)
,
josta vielä kerran integroimalla saadaan v.
Määritellään nyt u ≡ (D − λ2 )y, jolloin saamme dy:n:
6.2.2 Epähomogeeninen vakiokertoiminen
lineaarinen toisen kertaluvun differentiaaliyhtälö
Nyt differentiaaliyhtälö (täydellinen yhtälö, TY) on
muotoa
ay ′′ + by ′ + cy = f (x)
(6.13)
Helposti nähdään että jos y1 on TY:n joku ratkaisu ja y0
on homogeenisen yhtälön (HY, f (x) = 0) joku ratkaisu
niin y = y0 + y1 on myös TY:n ratkaisu. Koska 2.
kertaluvun lineaarisen yhtälön täydellinen ratkaisu
riippuu kahdesta vakiosta, saadaan
TY:n täydellinen ratkaisu = HY:n täydellinen ratkaisu +
TY:n joku yksittäisratkaisu.
Kuinka siis löytää TY:n yksittäisratkaisu?
1. Arvaus/yrite:
toimii hyvin etenkin jos f (x) on polynomi. Tällöin
kannattaa yrittää y(x) polynomi, jonka asteluku = f :n
asteluku.
Esim. y ′′ + ay ′ + by = c: yritetään y = α, vakio. Siis
by = bα = c ⇒ α = c/b.
Arvaus toimii myös usein jos f (x) = eαx , sillä f :n kaikki
derivaatat ovat verrannollisia eαx :ään:
(D − λ1 )u = f (x)
Tämä on lineaarinen 1. kl:n vakiokertoiminen dy, mikä
ratkeaa edellä kuvatulla menetelmällä. Nyt voimme sitten
ratkaista y:n yhtälöstä
(D − λ2 )y = u(x)
mikä siis antaa alkuperäisen TY:n ratkaisun.
Esim. y ′′ + y ′ − 2y = ex HY:n karakteristinen yhtälö on
r2 + r − 2 = 0 ⇒ r =
Täten voimme kirjoittaa
y ′′ + y ′ − 2y = (D − 1)(D + 2)y = ex
1.vaihe: olkoon nyt u(x) = (D + 2)y, jolloin u:n
differentiaaliyhtälö on
(D − 1)u(x) = u′ (x) − u(x) = ex
tämän HY:
y ′′ + ay ′ + by = eαx
u′ − u = 0 ⇒
Yrite: y = Aeαx , sijoitus yhtälöön antaa
A(α2 + aα + b)eαx = eαx ⇒ A = (α2 + aα + b)−1
Tämä toimii jollei eαx satu olemaan HY:n ratkaisu
(jolloin α2 + aα + b = 0). Tällöin kannattaa kokeilla
yritettä Axeαx , ellei sekin satu olemaan HY:n ratkaisu
(tällöin α on HY:n karakterisen polynomin
kaksinkertainen juuri). Siinä tapauksessa yrite on Ax2 eαx .
2. Integrointi kahdessa vaiheessa:
Tämä on yleisempi menetelmä täydellisen yhtälön
ratkaisuun. Tässä menetelmässä yhtälöä ryhmitellään
muotoon jossa sitä voidaan integroidan suoraan, ja
homogeenista yhtälöä ei tarvitse ratkaista erikseen.
Kirjoitetaan yhtälö ensin muotoon (jaetaan y ′′ :n
kertoimella, jos tarpeen)
y ′′ + ay ′ + by = (D2 + aD + b)y = f (x)
√
1
1 3
(−1 ± 1 + 8) = − ± = 1, −2
2
2 2
Z
du
=
u
Z
dx ⇒ u(x) = Cex
TY:n ratkaisu saadaan vakion varioinnilla:
u(x) = C(x)ex ⇒ u′ (x) = C ′ ex + Cex , joten sijoitus
(C ′ + C)ex − Cex = ex ⇒ C ′ = 1 ⇒ C = x + A
Siis TY:n täydellinen ratkaisu on
u(x) = Cex + xex
2.vaihe: ratkaistaan y yhtälöstä
(D + 2)y = y ′ + 2y = u(x) = (C + x)ex
HY: y ′ = −2y ⇒ y = Be−2x
TY: jälleen vakion varioinnilla B → B(x):
y ′ = B ′ e−2x − 2Bex .
46
Sijoitus differentiaaliyhtälöön antaa
⇒
⇒
(B ′ − 2B)e−2x + 2Be−2x = (C + x)ex
B ′ = (C + x)e3x
Z
Z
C
x
1 3x
B = (C + x)e3x dx = e3x + e3x −
e
3
3
3
C
1
x
= ( − )e3x + e3x + D
3
9
3
x 3x
3x
= Ee + e + D
3
missä viimeisessä vaiheessa otettiin käyttöön uusi vakio
E = C/3 − 1/9.
Siis TY:n ratkaisu on
x
x
y = (Ee3x + e3x + D)e−2x = De−2x + (E + )ex
3
3
Nyt ei2x ei ole HY:n ratkaisu, joten TY:n
yksittäisratkaisu löytyy yrittellä z = Aei2x :
⇒
Siis TY:n yleinen ratkaisu on
z = C1 ex + C2 e−2x +
y = Im z = A1 ex + A2 e−2x −
missä A1 = Im C1 , A2 = Im C2 .
y ′′ + y ′ − 2y = ex
voi myös soveltaa arvausmenetelmää. HY:n
karakteristinen yhtälö on r2 + r − 2 = 0, minkä juuret
ovat r = 1, −2. Koska nyt siis ex on HY:n ratkaisu, TY:n
yksittäisratkaisu voidaan löytää yritteellä
y = Axex :
y ′ = A(ex + xex ), y ′′ = A(2ex + xex )
Nyt dy tulee muotoon
A(2 + x)ex + A(1 + x)ex − 2Axex = ex ⇒ 3A = 1
Siis TY:n yksittäisratkaisu on y = x3 ex , ja TY:n
täydellinen ratkaisu on HY:n täydellisen ratkaisun ja
TY:n yksittäisratkaisun summa:
x x
e
3
Eksponenttifunktioyritteestä on usein myös hyötyä jos
f (x) ∼ sin x, cos x (esim. värähtelevä pakkovoima
harmonisella oskillaattorilla).
Esim: y ′′ + y ′ − 2y = 4 sin 2x
Tämän voi toki ratkaista integroinnilla kahdessa
vaiheessa, mutta kirjoitammekin yhtälön muotoon
z ′′ + z ′ − 2z = 4ei2x .
Tällöin ottamalla imaginaariosa yhtälöstä saadaan
alkuperäinen yhtälö, ja y = Im z.
HY:n karakteristinen yhtälö on
r2 + r − 2 = 0 ⇒ r =
−3 − i i2x
e
5
ja
mikä onkin myös TY:n yleinen ratkaisu. Vakion variointi
antaakin yleisesti koko ratkaisun kaupan päälle
yksittäisratkaisun lisäksi, vakioista riippuvat osat ovat
HY:n yleinen ratkaisu.
Edellisen esimerkin yhtälöön
y = Aex + Be−2x +
A[(2i)2 + 2i − 2]ei2x = 4ei2x
4
2(−3 − i)
−3 − i
A=
=
=
−6 + 2i
(−3 + i)(−3 − i)
5
√
1
(−1 ± 1 + 8) = 1, −2
2
joten HY:n ratkaisu on
zHY = C1 ex + C2 e−2x
47
1
3
cos 2x − sin 2x
5
5
7. Vektorit ja differentiaalilaskenta
Esim. Nopeus v, v, kiihtyvyys a ja a kun paikka on
r = sin t i + cos t j + k
Nopeus on nyt
7.1 Yhden muuttujan vektorifunktiot
Liikkuvan kappaleen paikka avaruudessa muuttuu ajan
kuluessa. Matemaattisesti voimme ilmaista tämän
sanomalla, että kappaleen paikkaa kuvaava radiusvektori
r on ajan t funktio r(t), ts. vektorin
v
=
=
dr
dy(t)
dz(t)
. dx(t)
=r=
i+
j+
k
dt
dt
dt
dt
cos t i − sin t j.
Vauhti puolestaan on
r(t) = x(t)i + y(t)j + z(t)k
komponentit x, y ja z riippuvat yhdestä muuttujasta t.
Samoin yhden muuttujan, ajan, vektorifunktioita ovat
myös kyseisen kappaleen nopeus ja kiihtyvyys. Usein
puhutaan lyhyesti vain vektorifunktioista kun
tarkoitetaan yhden muuttujan vektoriarvoisia funktioita.
7.1.1 Vektorifunktion derivaatta
Olkoon A(u) jokin yhden muuttujan u vektorifunktio
v = |v| =
p
cos2 t + sin2 t = 1.
Kiihtyvyys saadaan derivoimalla nopeus,
a
=
dv
. ..
= v = r = − sin t i − cos tj,
dt
ja sen itseisarvo on
a = |a| =
A(u) = Ax (u)i + Ay (u)j + Az (u)k.
p
sin2 t + cos2 t = 1.
Derivaatan ominaisuuksia
A (u )
Olkoot A(u) ja B(u) muuttujan u vektorifunktioita.
Lasketaan pistetulon A · B derivaatta:
A (u + D u )-A (u )
dA · B
du
A (u + D u )
=
=
=
Kuva 7.1 Vektorin derivaatta
Vektorifunktion derivaatta määritellään analogisesti
skalaarifunktion derivaatan kanssa eli
dA(u)
A(u + ∆u) − A(u)
= lim
.
∆u→0
du
∆u
(7.1)
=
Kirjoitetaan määritelmä (7.1) komponenteittain,
dA(u)
du
=
=
Ax (u + ∆u) − Ax (u)
lim
i
∆u→0
∆u
Ay (u + ∆u) − Ay (u)
+
j
∆u
Az (u + ∆u) − Az (u)
k
+
∆u
dAy (u)
dAz (u)
dAx (u)
i+
j+
k,
du
du
du
d
(Ax Bx + Ay By + Az Bz )
du
dBx
dAx
Bx + Ax
du
du
dBy
dAy
By + Ay
+
du
du
dBz
dAz
Bz + Az
+
du
du
dAx
dAy
dAz
i+
j+
k ·
du
du
du
(Bx i + By j + Bz k)
+(Ax i + Ay j + Az k) ·
dBx
dBy
dBz
i+
j+
k
du
du
du
dA
dB
·B+A·
.
du
du
Näemme, että pistetulon derivointiin soveltuu
skalaarifunktioista tuttu derivointisääntö (2.17) kunhan
vain korvataan tavallinen tulo pistetulolla.
Yleensäkin on helppo todeta, että luonnollisella tavalla
modifioidut tutut säännöt ovat voimassa myös vektoreille:
d
(αA + βB)
du
d(φA)
du
d(A · B)
du
d(A × B)
du
jolloin nähdään, että vektorifunktio derivoidaan
derivoimalla sen komponentit.
48
=
=
=
=
dA
dB
α
+β
du
du
dφ
dA
A+φ
du
du
dA
dB
·B+A·
du
du
dA
dB
×B+A×
.
du
du
(7.2)
Tässä α ja β ovat mielivaltaisia skalaarivakioita ja φ(u)
mielivaltainen derivoituva muuttujan u skalaarifunktio.
Analogisesti skalaarifunktion differentiaalin kanssa
määrittelemme vektorifunktion differentiaalin:
dA = i dAx + j dAy + k dAz .
Koska vektorin komponentit Ai ovat nyt vain yhden
muuttujan u funktioita, ovat niiden differentiaalit muotoa
dAi
du du ja vektorin A(u) differentiaali niin ollen
dA = du
dAy
dAz
dAx
i+
j+
k
du
du
du
=
dA
du.
du
on käyrän tangentin suuntainen. Tämän vektorin pituus
on
dr p
= (2t)2 + 16 + (4t − 6)2 ,
dt joten yksikkötangentti on
2ti + 4j + (4t − 6)k
dr dr =p
.
T=
dt dt (2t)2 + 16 + (4t − 6)2
Erikoisesti pisteessä, missä t = 2, yksikkötangentti on
2
1
2
4i + 4j + 2k
= i + j + k.
T= √
2
2
2
3
3
3
4 +4 +2
(7.3)
dr
Koska derivaatta du
on yksikkötangentin suuntainen, niin
toki silloin myös differentiaali
7.1.2 Avaruuskäyrät
Tangentti
dr = du
Olkoon
r(u) = x(u)i + y(u)j + z(u)k
muuttujasta u riippuva paikkavektori. Muuttujan u
käydessä läpi arvoalueensa vektorin r kärki piirtää
dr
käyrän kolmiulotteisessa avaruudessamme. Derivaatta du
on konstruktionsa perusteella (kuva 7.1) ilmeisestikin
tämän käyrän pisteeseen r(u) piirretyn tangentin
suuntainen. Käyrän tangentin suuntainen yksikkövektori
T on niin ollen
dr dr
/| |.
T=
(7.4)
du du
d r
on yksikkötangentin suuntainen. Voimme siis kirjoittaa
dr = T ds
missä olemme symbolilla ds merkinneet differentiaalin dr
pituutta
p
ds = |dr| = dx2 + dy 2 + dz 2 .
Voimme siis kirjoittaa yksikkötangentin myös muodossa
Differentiaali ds oli infinitesimaalisen muutoksen dr
suuruus. Koska muutos dr oli käyrän tangentin
suuntainen, on ds siten käyrän kaaren pituuden s
infinitesimaalinen muutos.
s
Esim. Käyrän x = t2 + 1, y = 4t − 3, z = 2t2 − 6t
yksikkötangentti kun t = 2
Käyrän piirtää vektorin
=
=
xi + yj + zk
(t2 + 1)i + (4t − 3)j + (2t2 − 6t)k
kärki kun t käy läpi kaikki arvonsa (kun muuta ei ole
sanottu, arvoalueena on yleensä koko reaalilukualue).
Paikkavektorin derivaatta
dr
dt
=
=
d 2
d
d
(t + 1) + j (4t − 3) + k (2t2 − 6t)
dt
dt
dt
2ti + 4j + (4t − 6)k
i
(7.5)
Kaaren pituus
Kuva 7.2 Käyrän tangentti
r
dr
.
ds
T=
T
r(u )
dr
du
0
s s+ d s
d r
C
Kuva 7.3 Käyrän kaaren pituus
Käyrän C kaaren pituus s saadaan summaamalla pitkin
käyrää laskettuja differentiaalisia kaaren pituuksia.
Formaalisti voimme ilmaista tämän, kuten
Z
s=
ds.
(7.6)
C
49
Käyrän ulottuessa äärettömyyteen on yleensä on myös
spesifioitava integroinnin alkukohta eli kaaren pituuden
nollakohta. Kuvassamme tämä voisi olla vaikkapa piste s0 .
Laskettaessa kaaren pituutta kaavalla (7.6) integroinnin
suunnaksi otetaan differentiaalin dr suunta eli tangentin
suunta. Pituus s siis kasvaa kun edetään käyrällä
tangentin osoittamaan suuntaan. Jos nyt käyrän yhtälö
on annettu muodossa
Vektori T on sekin kaaren pituuden s funktio, joten
voimme laskea derivaatan
dT
d2 r
= 2.
ds
ds
Olkoon nyt N vektorin
dT
ds
suuntainen yksikkövektori
N=
r = r(u),
missä on merkitty
niin tangentti osoittaa vektorin
dr
du = r(u + du) − r(u)
dr =
du
suuntaan eli suuntaan johon u kasvaa. Pituus s on siten
ds
muuttujan u kasvava funtio ja derivaatta du
silloin
positiivinen. Differentiaali ds oli määritelty itseisarvona
|dr|, joten on
dr ds = |dr| = du,
du
ds
kun du > 0. Toisaalta derivaatta du
oli positiivinen, joten
voimme kirjoittaa
dr = ds .
(7.7)
du du
Jos ratkaisemme relaatiosta s = s(u) muuttujan u
pituuden s funktiona, u = u(s), niin voimme pitää käyrää
piirtävää vektoriakin kaaren pituuden funktiona: r = r(s).
Esim. Käyrän x = sin t, y = cos t, z = 0 kaaren pituus
lähtien pisteestä, missä t = 0
Käyrän piirtää vektori
Voimme siis kirjoittaa
Suuretta κ sanotaan käyrän kaarevuudeksi ja sen
käänteisarvoa
1
1
ρ = = dT
κ
ds (7.8)
(7.9)
(7.10)
käyrän kaarevuussäteeksi. Yksikkötangentti T on nimensä
mukaisesti yksikön mittainen, joten on
T2 = T · T = |T|2 = 1.
Derivoidaan relaatio T · T = 1 kaaren pituuden suhteen,
jolloin saadaan
d
(T · T)
ds
=
=
dT
dT
dT
·T+T·
= 2T ·
ds
ds
ds
2κT · N = 0,
kun on sijoitettu lauseke (7.9). Päädymme yhtälöön
Differentiaali dr on
dr
dt = (i cos t − j sin t) dt
dt
ja differentiaali ds siten
p
√
ds = |dr| = cos2 t + sin2 t dt = 1 dt = dt,
kun etenemme muuttujan t kasvavaan suuntaan (dt > 0).
Kaaren pituus on siis
s(t) =
dT κ = .
ds
dT
= κN.
ds
r = i sin t + j cos t + 0k = i sin t + j cos t.
dr =
1 dT
,
κ ds
Z
ds =
C
Z
t
dt = t.
0
T · N = 0,
eli vektori N on kohtisuorassa tangenttia T vastaan ja
siten myös kohtisuorassa ko. avaruuskäyrää vastaan.
Tämän vuoksi vektoria N sanotaan käyrän
päänormaaliksi.
Esim. Käyrän x = 3 cos t, y = 3 sin t, z = 4t
yksikkötangentti, päänormaali, kaarevuus ja
kaarevuussäde
Käyrän
r = i3 cos t + j3 sin t + k4t
eräs tangentti on
Kaarevuussäde
dr
= −i3 sin t + j3 cos t + k4.
dt
Avaruuskäyrän r = r(s), s kaaren pituus,
yksikkötangentti on kaavan (7.5) mukaisesti
T=
dr
.
ds
(7.11)
Normitetaan tämä, ts. muodostetaan yksikön mittainen
saman suuntainen vektori jakamalla vektori pituudellaan.
50
Tangentin pituus on
p
dr =
(−3 sin t)2 + (3 cos t)2 + 42
dt q
=
9(sin2 t + cos2 t) + 16
√
9 + 16 = 5.
=
ja kaarevuussäde
ρ=
−i3 sin t + j3 cos t + k4
dr Ajan t funktiona massapisteen paikkavektori olkoon
r = r(t). Nopeus on tällöin
dt
=
3
4
3
−i sin t + j cos t + k .
5
5
5
Yksikkötangentiksi saatiin siis
3
3
4
T = −i sin t + j cos t + k .
5
5
5
Derivoidaan tämä muuttujan t suhteen:
3
3
dT
= −i cos t − j sin t.
dt
5
5
Toisaalta, koska kaaren pituus s on jokin muuttujan t
funktio, voimme ketjusäännön perusteella kirjoittaa
v=
r · r = R2 .
Tämän derivointi antaa
.
2r · r = 2v · r = 0.
Nopeus on kohtisuorassa radiusvektoria r vastaan (eli
kohtisuorassa ympyrän sädettä vastaan, ympyrän
tangentin suuntainen).
Tarkastellaan erikoisesti sellaista xy-tason liikettä, missä
r = iR cos ωt + jR sin ωt
joten
dT
dT
=
ds
dt
ds
dt
Aikaisemmin (kaava (7.7)) totesimme, että kaaren
pituuden derivaatta käyrää parametrisoivan muuttujan
suhteen noudattaa kaavaa
ds dr = dt
dt
dT
dT
=
ds
dt
dr dt Määritelmän (7.9) mukaan on siis
dT dr dT
=
κN =
ds
dt dt =
−i 53
=
−i
cos t −
5
j 35
dr
.
= r.
dt
Kun piste kulkee pitkin origokeskeisen R säteisen
ympyrän kehää, on vektorin r pituus vakio R: |r| = R tai
dT
dT ds
=
,
dt
ds dt
eli
1
25
=
.
κ
3
Esim. Ympyräliike
Yksikkötangentti on siten
T =
Kaarevuus on silloin
s 2
3
3
(sin2 t + cos2 t) =
κ=
25
25
sin t
3
3
cos t − j sin t.
25
25
Koska N on yksikön mittainen, on voimassa
dT = |κ||N| = κ, κ ≥ 0.
ds kun ω on vakio. Nyt
q
|r| = R2 (cos2 ωt + sin2 ωt) = R,
joten kyseessä on ympyräliike.
Nopeus on
.
v = r = −iRω sin ωt + jRω cos ωt.
Kuten todettiin, tämä on kohtisuorassa paikkavektoria r
vastaan. Vauhti on nyt
q
|v| = (ωR)2 (cos2 ωt + sin2 ωt) = ωR,
joten liikkeen vauhtikin on vakio. Kiihtyvyys taas on
.
a = v = −iRω 2 cos ωt − jRω 2 sin ωt.
Vauhdin vakioisuudesta (v · v = ω 2 R2 = vakio) seuraa
että kiihtyvyys on kohtisuorassa nopeutta vastaan (ja
siten joko radiusvektorin suuntainen tai sille
vastakkaissuuntainen). Itseasiassa näemme, että
a = −ω 2 r.
Kiihtyvyyden suuruus on sekin vakio, sillä
|a| = | − ω 2 r| = ω 2 R.
51
7.2 Gradientti, divergenssi, roottori
jyrkimmin. |∇φ|:n pituus on korkeuden kulmakerroin
∇φ:n suuntaan.
Osittaisderivaatta ja kentät
φ=vakio
Olkoon f koordinaattipisteen r = (x, y, z) funktio,
f (r) = f (x, y, z). funktion osittaisderivaattaa esim.
muuttujan x suhteen merkitään
φ=vakio
∆
ja se lasketaan derivoimalla x:n suhteen pitämällä muut
muuttujat vakiona.
Esim. Olkoon f (x, y, z) = xyz + x2 y. Nyt
∂f
= yz + 2xy,
∂x
∂f
= xz + x2 ,
∂y
∂f
= xy
∂z
Kuva 7.4 Gradientti ∇φ
Avaruudessa (x, y, z) ∈ R3 tai sen osajoukossa
määriteltyä funktiota kutsutaan usein kentäksi.
Jos f on reaaliluku, f (r) ∈ R, kyseessä on skalaarifunktio
eli skalaarikenttä, jos taas funktio on vektori,
~v (r) = ivx (r) + jvy (r) + kvz (r) ∈ R3 , kyseessä on
vektorifunktio eli v ektorikenttä.
Esim. skalaarikenttiä (-funktioita) ovat ilman paikallinen
lämpötila T (r), paine p(r), sähkövarauksen tiheys ρ(r).
Vektorikenttiä ovat esim. kaasun (nesteen) virtausnopeus
v(r), sähkökenttä E(r), sähkövirran tiheys J(r). . .
Nabla
Määritellään “derivaattavektori” nabla:
∇≡i
X
∂
∂
∂
∂
+j
+k
=
êi
∂x
∂y
∂z
∂x
i
i
(7.12)
Nabla ∇ on siis yhtä aikaa derivaatta ja vektori. Sillä
voidaan operoida skalaari- tai vektorifunktioihin:
∇f (r) gradientti (vektori)
∇ · v(r) divergenssi (skalaari)
∇ × v(r) roottori (vektori)
7.2.1 Gradientti
Olkoon φ(r) skalaarifunktio. Funktion gradientti on
vektorifunktio
∇φ =
X ∂φ
∂φ
∂φ
∂φ
i+
j+
k=
êi
∂x
∂y
∂z
∂ri
i
φ
tangenttitaso
∂f (r)
∂f (x, y, z)
=
= ∂x f (r)
∂x
∂x
(7.13)
Graafisesti: gradientti ∇f (r) on vektori, joka on
kohtisuorassa pintaa f (r) = vakio vastaan, ja |∇f | kertoo
kuinka nopeasti funktio muuttuu ko. suuntaan.
Vielä havainnollisemmin: kartta ja korkeuskäyrät
(kahdessa ulottuvuudessa): olkoon φ(x, y) maaston
korkeus koordinaattipisteessä (x, y). Nyt yhtälö
φ(x, y) = vakio määrittelee korkeuskäyrän, jossa korkeus
on vakio, ja ∇φ osoittaa suuntaan mihin φ kasvaa
Todistus: tehdään pieni muutos r → r + ∆r. Nyt
f (r + ∆r)
=
=
=
f (x + ∆x, y + ∆y, z + ∆z)
∂f
∂f
∂f
f (r) +
∆x +
∆y +
∆z + O(∆2 )
∂x
∂y
∂z
f (r) + (∇f ) · (∆r)
Pistetulosta näkee, että funktion muutos
∆f = f (r + ∆r) − f (r)
on suurin, kun ∆r k ∇f
on = 0, kun ∆r ⊥ ∇f
Siis:
– pinnan f = vakio yksikkönormaali on ∇f /|∇f |
– pinnan f = vakio tangenttitaso on vektoria ∇f
kohtisuoraan
– funktion f kasvunopeus suuntaan n̂ on n̂ · ∇f (n̂
yksikkövektori)
Näistä viimeisimmän näkee valitsemalla yllä ∆r k n̂.
Esim. Funktion φ(x, y, z) = 3x2 y − y 3 z 2 gradientti ∇φ
pisteessä (1, −2, −1)
Gradientti mielivaltaisessa pisteessä (x, y, z) on
∂
∂
∂
∇φ =
i
(3x2 y − y 3 z 2 )
+j
+k
∂x
∂y
∂z
∂
∂
= i (3x2 y − y 3 z 2 ) + j (3x2 y − y 3 z 2 )
∂x
∂y
∂
+k (3x2 y − y 3 z 2 )
∂z
= 6xyi + (3x2 − 3y 2 z 2 )j − 2y 3 zk,
joten pisteessä (1, −2, −1) se on
∇φ
=
=
6(1)(−2)i + (3(1)2 − 3(−2)2 (−1)2 )j
−2(−2)3 (−1)k
−12i − 9j − 16k.
Suunnattu derivaatta
Edellisestä esimerkistä yleistäen voimme todeta, että
skalaarikentän φ muutos pituusyksikköä kohti suunnassa
52
n, |n| = 1, on ∇φ · n. Sanomme, että suure
n · ∇φ = (∇φ) · n, |n| = 1
Katsotaan esimerkkinä nesteen virtausta tarkemmin. Jokaisessa
avaruuden pisteessä (ajattelemme nestettä jatkuvasti
jakautuneena aineena unohtaen sen atomaarisen rakenteen)
r = (x, y, z) neste virtaa paikasta riippuvalla nopeudella
(7.14)
on funktion φ suunnattu derivaatta (suuntaan n). Kuten
olemme nähneet, suunnattu derivaatta on suurimmillaan
gradientin suunnassa.
Huom: voimme kirjoittaa derivaattaoperaattorin
suuntaan n
X
∂
n·∇=
ni
∂r
i
i
v = v(r) = vx (x, y, z)i + vy (x, y, z)j + vz (x, y, z)k.
µ
Jos nesteen massatiheys on ρ (kg/m3 ), massavirtatiheys
((kg/m3 )(m/s)=kg/(m2 s)) pisteessä r on
µ = ρv .
m
Jos esim. n k i, saamme tavallisen osittaisderivaatan x:n
suuntaan.
Esim. Funktion φ = x2 yz + 4xz 2 derivaatta pisteessä
(1, −2, −1) suuntaan 2i − j − 2k
Gradientti pisteessä (1, −2, −1) on
∇φ
=
=
=
=
A
=
A
2
i−
3
=
=
=
Katsotaan, mitä massavirralle tapahtuu pisteen r
infinitesimaalisessa ympäristössä. Kuvitellaan tätä tarkoitusta
varten ko. piste sijoitetuksi sellaisen suorakulmaisen särmiön
keskelle, jonka särmien pituudet ovat dx, dy ja dz. Virta µ tuo
särmiön pohjan kautta materiaa virtatiheydellä µz (x, y, z − dz/2),
joten kaiken kaikkiaan pohjan läpi virtaa aikayksikössä särmiöön
materiaa määrä µz (x, y, z − dz/2)dx dy (kg/s). Vastaavasti
kannen läpi poistuu aikayksikössä materiamäärä
µz (x, y, z + dz/2)dx dy. Näiden virtausten seurauksena särmiön
nestemäärän vähenemä aikayksikössä on
2i − j − 2k
√
22 + 12 + 22
1
2
j − k.
3
3
∇φ · a
dmz
1
2
2
(8i − j − 10k) · ( i − j − k)
3
3
3
37
16 1 20
+ +
=
.
3
3
3
3
=
=
=
µz (x, y, z + dz/2)dx dy
−µz (x, y, z − dz/2)dx dy
∂µz (x, y, z) dz
dx dy
∂z
2
i
h
dz
∂µz (x, y, z)
− µz (x, y, z) +
−
dx dy
∂z
2
∂µz
=
dx dy dz.
∂z
Differentiaalien tulo dx dy dz on infinitesimaalisen särmiömme
(infinitesimaalinen) tilavuus
=
7.2.2 Divergenssi
Olkoon nyt v(r) = (vx (r), vy (r), vz (r)) vektorikenttä.
Vektorikentän divergenssi on
∇ · v)
d z
d y
Kuva 7.5 Divergenssin tulkinta
Tähän suuntaan laskettu derivaatta on
∇a φ
y
d x
2
Vektorin A = 2i − j − 2k suuntainen yksikkövektori on
=
m
x
( x ,y ,z )
m ( x ,y ,z - d z /2 )
+(1) (−1)j + ((1) (−2) + 8(1)(−1))k
8i − j − 10k.
a
z
m
(2xyz + 4z 2 )i + x2 zj + (x2 y + 8xz)k
(2(1)(−2)(−1) + 4(−1)2 )i
2
m ( x ,y ,z + d z /2 )
m
∂
∂
∂
+j
+ k ) · (ivx + jvy + kvx )
∂x
∂y
∂z
∂vx
∂vy
∂vz
+
+
∂x
∂y
∂z
h
µz (x, y, z) +
i
dV = dx dy dz.
(i
Pohjan ja pinnan läpi suuntautuvien virtausten aiheuttama
massan nettomuutos (nettopoistuma) aikayksikössä tilavuudessa
dV on siten
∂µz
dV.
dmz =
∂z
Vastaava lasku osoittaa, että xz- ja yz-suuntaisten pintojen läpi
kulkevat virrat aiheuttavat aikayksikössä nettopoistumat
Graafisesti: vektorikentän divergenssi on
(yksikkötilavuudessa) syntyvän vuon (vesi!) määrä:
∂µy
dV
∂y
∂µx
dV.
dmx =
∂x
Massan kokonaismuutos aikayksikössä tilavuusalkiossa dV on
siten
dmy
∇ · v > 0, lähde (source))
∇ · v < 0, nielu (sink)
Jos ∇ · v = 0 koko määrittelyjoukossa, sanotaan että
vektorikenttä v on lähteetön
dm
=
=
53
=
dmx + dmy + dmz
∂µy
∂µz
∂µx
dV.
+
+
∂x
∂y
∂z
Vektorimerkintää käyttäen voimme kirjoittaa tämän muotoon
dm =
∂
∂
∂
i +j +k
∂x
∂y
∂z
· (µx i + µy j + µz k)dV.
Kun huomaamme, että skalaaritulon ensimmäinen tekijä on
operaattori ∇, saamme tämän kompaktimpaan muotoon
∇ × v = i(∂y z − ∂z y) − j(∂x z − ∂z x) + k(∂x y − ∂y x) = 0
Kyseessä on pyörteetön kenttä
Esim. v = −yi + xj
dm = ∇ · µ dV.
∇ · v = 0 lähteetön
∇ × v = 2k 6= , pyörre
Esim. Maxwellin yhtälöt:kuvaavat sähködynamiikkaa
Massatieyden muutos dm/dV pisteessä (x, y, z)
dm/dV = ∇ · µ
voi aiheutua mm. siitä, että
• neste puristuu kokoon tai laajenee, jolloin
∂ρ
∂t
6= 0,
∇·E=
• ko. pisteeseen ruiskutetaan lisää nestettä eli pisteessä on
lähde tai ko. pisteestä poistetaan nestettä eli pisteessä on
nielu.
Massatiheyden muutos (pienennys) voidaan siten ilmaista kahden
termin summana
∂ρ
+ ψ,
dm/dV = −
∂t
missä jälkimmäinen termi ψ kuvaa nielujen ja lähteiden
vaikutusta. Näin olemme johtaneet nesteiden (ja kaasujen)
virtausta hallitsevan kontinuiteettiyhtälön
∂ρ
= ψ,
∂t
muistaen, että massavirtatiheys oli µ = ρv.
∇ · (ρv) +
∇·B=0
=
∇·B
=
(7.15)
1
ρ
ǫ0
0
Tässä E on sähkökenttä, B magneettikenttä, ρ
sähkövaraustiheys (lähde sähkökentälle!). Magneettisia
varauksia ei ole olemassa (magneettinen monopoli), joten
magneettikentän lähdetermi = 0, ja magneettikenttä on
lähteetön.
7.2.3 Roottori
Vektorikentän v(r) roottori ∇ × v lasketaan seuraavasti:
i
j k (7.16)
∇ × v = ∂x ∂y ∂z vx vy vz =
+
i
∇ × r = ∂x
x
j
∂y
y
k
∂z
z
=0
Esim. Gradientti ∇f (r) on pyörteetön:
∇ × (∇f ) = (∇ × ∇)f = 0
(näin voidaan tehdä, sillä ∇:n vektorikomponentit
menevät tavallisen ristitulon tapaan, ja derivaatat kaikki
vaikuttavat f :ään.)
Huom: usein käytetään derivaattaoperaattoreita v · ∇ ja
v × ∇. Näissä ei derivoida v:tä, derivaatta ei ole vielä
operoinut!PSiis esim.
v · ∇ = i vi ∂i
v × ∇ = i(vy ∂z − vz ∂y ) + j . . .
Laplacen operaattori
Määritellään
i(∂y vz − ∂z vy ) − j(∂x vz − ∂z vx )
k(∂x vy − ∂y vx )
(7.17)
Tämä on siis tavallinen ristitulo vektoreille, mutta
derivaatta vaikuttaa aina eteenpäin, “alariville”:
∂x ∂y vx vy = ∂x vy − ∂y vx
1 ∂E
= µ0 j
c2 ∂t
∂B
=0
∇×E+
∂t
∇×B−
E sähkö, B magneettikenttä, ρ sähkövaraustiheys, j
sähkövirrantiheys, c valon nopeus, ǫ0 tyhjiön
permittiivisyys ja µ0 permeabiliteetti (vakioita).
Vektorikenttä v on pyörteetön, jos ∇ × v = 0.
Esim. r on pyörteetön:
Sähkömagnetismi, Maxwellin yhtälöt:
∇·E
1
ρ
ǫ0
∇ · ∇ ≡ ∇2 = ∂x2 + ∂y2 + ∂z2 =
X ∂2
∂ri2
i
Tämä on skalaaridifferentiaalioperaattori, jota käytetään
usein fysiikassa.
Roottori mikroskooppisesti
Roottori kuvaa vektorikentän pyörteisyyttä:
Tarkastellaan jälleen ρ-tiheyksisen nesteen virtausta. Kun
virtausnopeus pisteessä r = (x, y, z) on v(r), on µ = ρv
massavirtatiheys tässä pisteessä. Tutkitaan tällä kertaa, miten
pyörteellistä virtaus on. Katsotaan esimerkkinä pisteen (x, y, z)
ympäri kiertyvää virtausta. Lasketaan erikseen nettokiertymät
kunkin koordinaattitason suuntaisissa virtauksissa, esimerkkinä
Esim. v = xi + yj + zk
∇ · v = 3 lähde (kaikilla r!)
54
Siis
xy-tason suuntainen taso.
( x ,y )
Laskusääntöjä
m y( x + d x /2 ,y )
m y( x - d x /2 ,y )
m x( x ,y + d y /2 )
m x( x ,y - d y /2 )
Kuva 7.6 Virtauksen kiertymä
Kuvitellaaan piste (x, y, z) (kuvassa z-koordinaattia ei ole
merkitty) sijoitetuksi tässä tasossa dx dy-sivuisen suorakaiteen
keskelle. Suorakaiteen alalaidalla kokonaisvirtaus positiiviseen
kiertosuuntaan on µx (x, y − dy/2, z)dx, oikeanpuoleista laidalla
µy (x + dx/2, y, z)dy, ylälaidalla −µx (x, y + dy/2, z)dx ja
vasemmanpuoleisella laidalla −µy (x − dx/2, y, z)dy. z-akselin
ympäri kiertyvä kokonaisvirtaus dSz (kg/(ms)) on näiden neljän
termin summa
dSz
=
µx (x, y − dy/2, z)dx + µy (x + dx/2, y, z)dy
=
[µy (x + dx/2, y, z) − µy (x − dx/2, y, z)] dy
−µx (x, y + dy/2, z)dx − µy (x − dx/2, y, z)dy
− [µx (x, y + dy/2, z) − µx (x, y − dy/2, z)] dx
∂µx
∂µy
dx dy −
dy dx
=
∂x
∂y
i
h
∂µx
∂µy
dx dy.
(7.18)
−
=
∂x
∂y
Jakamalla tämä suorakaiteen pinta-alalla dx dy saamme z-akselin
ympäri aikayksikössä kiertyväksi massatiheydeksi
∂µy
∂µx
dSz
=
−
.
sz =
dx dy
∂x
∂y
Menettelemme samoin kuin kulmanopeuden tapauksessa ja
muodostamme pyörteisyydeksi sanotun vektorisuureen sz , jonka
pituus ilmoittaa aikayksikössä kiertyvän massatiheyden määrän ja
suunta kiertoakselin, ts.
h
i
∂µy
∂µx
s z = sz k =
k.
−
∂x
∂y
Vastaavasti x- ja y-akseleiden suuntaiset pyörteisyydet ovat
i
h
∂µy
∂µz
i
−
sx =
∂y
∂z
h
i
∂µx
∂µz
sy =
j.
−
∂z
∂x
Vektoreiden sx , sy ja sz resultantin s pituus kertoo silloin
pisteeseen (x, y, z) asetetun resultanttivektorin ympäri
aikayksikössä kiertyvän massatiheyden kokonaismäärän.
Virtauskentän pyörteisyys on siis
i
h
i
h
∂µy
∂µx
∂µz
∂µz
i+
j
−
−
s =
∂y
∂z
∂z
∂x
h
i
∂µy
∂µx
+
k.
−
∂x
∂y
Nähdään helposti että
muotoon
s = s on µ:n roottori.
s voidaan kirjoittaa determinantin avulla
i
j
k ∂
∂
∂ ∂x
∂y
∂z = ∇ × µ
µx µ y µ z Nablalle on helppo näyttää mm. seuraavat laskusäännöt:
∇(a + b) = ∇a + ∇b
∇(ab) = (∇a)b + a(∇b)
∇ · (u + v) = ∇ · u + ∇ · v
∇ · (au) = (∇a) · u + a∇ · ~u
∇ × (u + v) = ∇ × u + ∇ × v
∇ × (au) = (∇a) × u + a∇ × u
∇ × (∇a) = ∇ × ∇a = 0 eli ∇a on pyörteetön
∇ · (∇ × v) = (∇ × ∇) · v = 0 eli ∇ × v on lähteetön
(tässä käytettiin skalaarikolmituloa,
a · (b × c) = (a × b) · c
Joskus esiintyy myös
∇ × (∇ × u) = ∇(∇ · u) − (∇ · ∇)u
missä käytettiin vektorikolmitulon laskusääntöä.
Siis sääntö: derivaattaosa - käytä derivoimissääntöjä,
vektoriosa - vektoreiden laskusääntöjä.
Huom: jos kehität ∇-lausekkeita skalaari- tai kolmitulon
avulla, muista järjestys:
Esim: u × (∇ × v) = ∇(uc · v) − (u · ∇)v
missä siis uc pidetään vakiona derivoinnissa.
Samoin esim.
∇·(u×v) = ∇·(u×vc )+∇·(uc ×v) = v·(∇×u)+u·(∇×v).
Esim. Olkoon u = xyi + yzj + zxk.Nyt
∇×(∇×u) = ∇(∇·u)−∇2 u = ∇(y +z +x)−0 = i+j+k
Tai suoraan
ja
i
∇ × u = ∂x
xy
j
∂y
yz
i
∇ × (∇ × u) = ∂x
−y
k
∂z
zk
= −iy − jz − kx
j
∂y
−z
k
∂z
−x
Esim. ∇ × A pisteessä (1 − 1, 1), kun
=i+j+k
A = xz 3 i − 2x2 yzj + 2yz 4 k
Nyt
∂
∂
∂
i+
j+
k ×
∇×A =
∂x
∂y
∂z
=
=
55
(xz 3 i − 2x2 yzj + 2yz 4 k)
i
j
k ∂
∂
∂
∂y
∂z
∂x
xz 3 −2x2 yz 2yz 4 ∂
∂
4
2
(2yz ) −
(−2x yz) i
∂y
∂z
∂
∂
4
3
−
(2yz ) −
(xz ) j
∂x
∂z
∂
∂
2
3
+
(−2x yz) −
(xz ) k
∂x
∂y
=
=
=
(2z 4 + 2x2 y)i + 3xz 2 j − 4xyzk
4
2
ja
2
(2(1) + 2(1) (−1))i + 3(1)(1) j
−4(1)(−1)(1)k
∇2
3j + 4k.
Jos pätee ∇2 f = 0, funktio f (r) on harmoninen.
Samoin edelleen
Esim. ∇ × (∇ × A), kun A = x2 yi − 2xzj + 2yzk
Nyt
∇ × (∇ × A)
=
=
=
=
i
∂
∇ × ∂x
x2 y
j
∂
∂y
−2xz
∇2 f (r)
k ∂
∂z 2yz =
(2x + 2)j.
7.2.4 Paikkavektorin derivaatat
Paikkavektori on
p
r = xi + yj + zk, r = x2 + y 2 + z 2 = |r|
i
∇×r
=
∇r
=
(7.19)
i
0 (ks. aiemmin)
(7.20)
r
= r̂ r:n suuntainen 1-vektori (7.21)
r
Viimeisin tulee siitä, että
∂x r = 21 (x2 + y 2 + z 2 )−1/2 2x = x/r, joten
X
X ri
r
∇r =
êi ∂i r =
êi =
r
r
i
i
Jos nyt f (r) on r:n funktio, niin ketjusääntö saa muodon
∇f (r) = f ′ (r)∇r = f ′ (r)
r
r
Tämä tulee suoraan tavallisesta ketjusäännöstä:
i∂x f (r) = if ′ (r)∂x r = if ′ (r)r/r.
Näin esim
∇ · (rf (r))
=
=
=
∂x (xf (r)) + ∂y (yf (r)) + ∂z (zf (r))
x
y
z
3f (r) + xf ′ (r) + yf ′ (r) + zf ′ (r)
r
r
r
3f (r) + rf ′ (r)
tai suoraan:
∇ · (rf (r)) = f (r)∇ · r + r · ∇f (r) = 3f (r) + rf ′ (r)
Usein tavataan
1
d
∇ =
r
dr
=
=
∇ × [(2x + 2z)i − (x2 + 2z)k]
i
j
k
∂
∂
∂
∂x
∂y
∂z
2x + 2z 0 −x2 − 2z Nyt saamme heti tulokset
X
X
∇·r =
∂i ri =
1=3
3
r r
1
r
1
= ∇ · (∇ ) = ∇ · ( 3 ) = 3 − 3 4 · = 0
r
r
r
r
r r
1 r
1
r
∇r = − 2 = − 3
r
r r
r
56
r
∇ · ∇f (r) = ∇ · (f ′ (r) )
r
r
3
r r
r
f ′′ (r) ) · + f ′ (r) − f ′ (r) 2 ·
r r
r
r r
2
f ′′ (r) + f ′ (r)
r
8. Viiva-, pinta- ja
tilavuusintegrointi
8.1 Viivaintegraali
Luvussa 7.1.2 käsiteltiin viivan pituuden integrointia.
Tässä luvussa yleistetään integrointi avaruuskäyrää,
viivaa pitkin. Olkoon meillä käyrä C, jonka piirtää
paikkavektori
Integrointitiellä on määrätty suunta: kussakin käyrän
pisteessä etenemissuunta on sama kuin käyrällä lasketun
differentiaalin suunta. Kun siis tien C kuvaaja on
r = r(u), niin integrointi etenee parametrin u kasvavaan
suuntaan. Jos nyt −C on muuten sama käyrä kuin C
mutta suunnaltaan päinvastainen, niin näemme että
Z
Z
F · dr = −
F · dr,
(8.2)
−C
r = r(u) = x(u)i + y(u)j + z(u)k.
Oletamme edelleen, että pistettä A vastaa paikkavektori
r(a) ja pistettä B paikkavektori r(b). Käyrällä C laskettu
differentiaali dr on
dr
du
dr = idx + jdy + kdz =
du
ja osoittaa, kuten aiemmin olemme nähneet (ks. (7.4)),
käyrän tangentin suuntaan.
Käyrää C pitkin voidaan muodostaa useita viiva- eli
polkuintegraaleja:
Jos f (r) on skalaarifunktio, saamme f :n integraalin
viivan pituuden suhteen
Z
Z b
ds
f (r) du
f (r)ds =
du
a
C
missä
r
dr drx 2
ds
dry 2
drz 2
= =
+
+
du du du
du
du
Jos f (r) = 1, integraali antaa käyrän C pituuden.
Jos nyt F(r) on vektorifunktio, saamme erittäin yleisen
viivaintegraalin
sillä käyrällä C laskettu differentiaali on
vastakkaisuuntainen käyrällä −C lasketulle
differentiaalille.
C :
r(u r (b )= r (a + b -a )
)
-C
: r
B
(a +
A
b -u
)
r(a )= r(a + b -b )
Kuva 8.2 Suunnan vaihto
Kuvassa integroinnin alku- ja loppupisteitä yhdistävä tie
on C : r(u). Kuvan mukaisesti pistettä A vastaa
paikkavektori r(a) ja pistettä B paikkavektori r(b). Jos
nyt a > b, niin käyrän ja siis integroinnin suunta on
pisteestä A pisteeseen B. Integroinnin suunnan kääntö
voidaan toteuttaa helposti esimerkiksi vaihtamalla
parametri u käyrän C kuvaajassa parametriksi a + b − u,
ts. käännettyä integrointisuuntaa vastaava tie on
−C : p(u) = r(a + b − u).
Vielä selvemmäksi geometrinen merkitys käy, kun
kirjoitamme differentiaalin dr muotoon
F
dr = T(r) ds.
A
B
C
r(a )
Tässä T on käyrän yksikkötangentti ja s käyrän kaaren
pituus (mitattuna jostakin pisteestä). Viivaintegraalissa
esiintyvä skalaaritulo on tällöin
r(b )
d r
r(u )
F(r) · dr = |F(r)||T(r)| cos θ ds = F (r) cos θ ds,
missä θ on vektorin F ja integrointitien tangentin välinen
kulma. Viivaintegraali saadaan nyt muotoon
Z
Z
F(r) · dr =
F (r) cos θ ds.
O
Kuva 8.1 Viivaintegraali
Z
F(r) · dr
C
Z
=
(Fx dx + Fy dy + Fz dz)
C
Z b
C
(8.1)
dy(u)
dz(u)
dx(u)
du.
+ Fy
+ Fz
du
du
du
a
R
Geometrisesti viivaintegraali C F · dr tarkoittaa vektorin
F käyrän C tangentin suuntaisten projektioiden summaa.
=
C
Fx
C
Tästä muodosta nähdään esimerkiksi, että vektorin F
ollessa massapisteeseen vaikuttava voima tarkoittaa
viivaintegraali tehtyä työtä siirrettäessä massapistettä
pitkin käyrää C. R
Esim. Integraali C F · dr pitkin xy-tason käyrää y = 2x2
pisteestä (0, 0) pisteeseen (1, 2), kun F = 3xyi − y 2 j
Parametrisoidaan käyrä C siten, että x = t ja y = 2t2 .
Tällöin alkupisteessä t = 0 ja loppupisteessä t = 1.
57
Differentiaali dr on
Tehty työ on
dr
=
dx i + dy j
dx
dy
dt
i
+j
dt
dt
(i + 4tj)dt.
=
=
W =
=
C
Z 1
0
=
=
Z
(6t3 − 16t5 )dt =
1 6 4 16 6
t − t
4
6
dy =
1
dx.
2
0
B
3 8
7
− [0] = − .
−
2 3
6
y = x /2
A
Kuva 8.3 Integrointitie a)
Tehty työ on nyt
y = y(x).
Wa
F · dr pitkin xy-tason käyrää y = 2x2
C
pisteestä (0, 0) pisteeseen (1, 2), kun F = 3xyi − y 2 j
Otetaan käyrää C parametrisoivaksi muuttujaksi x,
jolloin y = 2x2 . Alkupisteessä x = 0 ja loppupisteessä
x = 1. Differentiaali dr on
R
dr
=
dx i + dy j
dy
dx
dx i + j
dx
(i + 4xj)dx.
=
=
=
Z
(xy dx − y 2 dy)
"
#
2
1
1
1
x x dx −
x
dx
2
2
2
0
=
C
Z 2
=
Z
2
0
3 2
x dx =
8
=
C
Z 1
0
=
=
Z
x3
= 1.
8
b) Integroidaan ensin pitkin y-akselia pisteestä (0, 0)
pisteeseen (0, 1) ja sitten x-akselin suuntaisesti pisteestä
(0, 1) pisteeseen (2, 1).
B
(3x(2x2 )i − (2x2 )2 j) · (i + 4xj)dx
1
3
0
2
0
Viivaintegraali on siis
Z
Z
(3xyi − y 2 j) · (dx i + dy j)
F · dr =
C
C
(xy dx − y 2 dy).
1
x,
2
jolloin
Käyrää parametrisoivaksi muuttujaksi voidaan usein
ottaa jokin muuttujista x, y tai z. Esimerkiksi xy-tason
käyrät esitetään monesti muodossa
Esim. Integraali
Z
y=
(3(t)(2t2 )i − (2t2 )2 j) · (i + 4tj)dt
1
0
C
F · dr =
a) Otetaan integrointitieksi suora
Viivaintegraali on siis
Z
Z
F · dr =
(3xyi − y 2 j) · (dx i + dy j)
C
Z
5
(6x − 16x )dx =
1 6 4 16 6
x − x
4
6
0
7
3 8
− [0] = − .
−
2 3
6
Esim. Tehty työ siirrettäessä kappale xy-tasossa pisteestä
A = (0, 0) pisteeseen B = (2, 1), kun kappaleeseen
vaikuttava voima on F = xyi − y 2 j
Nyt
A
Kuva 8.4 Integrointitie b)
Reitillä (0, 0) → (0, 1) on x = 0 ja dx = 0. Reitillä
(0, 1) → (2, 1) taas on y = 1 ja dy = 0. Työ on siten
Z 1
((0)y(0) − y 2 dy)
Wb =
y=0
Z 2
+
F · dr = (xyi − y 2 j) · (dx i + dy j) = xy dx − y 2 dy.
x=0
58
(x(1)dx − (1)(0))
=
1 y3
−
3
0
+
2
1
5
x2
=− +2= .
2
3
3
Näemme siis, että kenttä φ toteuttaa ehdon
∇φ ·
0
du
du
=F·
dt
dt
tai
Konservatiiviset kentät
Edellisen esimerkin tapauksessa tehty työ riippui
siirtoreitistä. Toisaalta hyvin monissa kiinnostavissa
fysikaalisissa syteemeissä työ riippuu ainoastaan
siirroksen alku- ja loppupisteistä mutta ei lainkaan näitä
pisteitä yhdistävästä reitistä. Tällöin siis pisteitä P1 ja P2
yhdistävää käyrää myöten laskettu voiman F
viivaintegraali
Z P2
F · dr
W =
P1
on tiestä riippumaton ja voimakentän F sanotaan olevan
konservatiivinen.
Oletetaan nyt, että kenttä F on konservatiivinen. Silloin
pisteitä P1 = (x1 , y1 , z1 ) ja P = (x, y, z) yhdistävää tietä
myöten laskettu viivaintegraali
φ(x, y, z) =
Z
Konservatiivinen kenttä on siis esitettävissä jonkin
skalaarikentän gradienttina.
Oletetaan nyt, että vektorikenttä F on skalaarikentän φ
gradientti, ts.
F = ∇φ.
Lasketaan pisteestä P1 pisteeseen P2 pitkin käyrää C
viivaintegraalia
Z P2
Z P2
∇φ · dr.
F · dr =
W =
P1
P1
(x,y,z)
(x1 ,y1 ,z1 )
du
= 0.
dt
Koska u(t) oli mielivaltainen pisteitä P1 ja P yhdistävä
käyrä, täytyy olla
F = ∇φ.
(∇φ − F) ·
F · dr
määrittelee yksikäsitteisesti integrointitiestä
riippumattoman ja vain integroinnin loppupisteestä
(pidetään alkupistettä kiinnitettynä) riippuvan
skalaarikentän φ. Olkoon
r = u(t)
jokin sellainen pisteitä P1 ja P yhdistävä käyrä, että
(x1 , y1 , z1 ) = u(t1 ) ja (x, y, z) = u(t).
Skalaarifunktion φ differentiaali on
dφ(x, y, z) = ∇φ · dr,
joten työ W on kirjoitettavissa muotoon
Z P2
dφ.
W =
P1
Olkoon nyt
r = r(t)
sellainen käyrän C parametriesitys, että
Tällä käyrällä on
du
dt,
dr =
dt
joten tätä käyrää myöten laskettuna kentän φ arvoksi
saadaan
Z t
du
F·
φ(x, y, z) =
dt.
dt
t1
(x1 , y1 , z1 ) = r(t1 ) ja (x2 , y2 , z2 ) = r(t2 ).
Tällä käyrällä kenttä φ saa arvot φ(x(t), y(t), z(t)) eli
voimme pitää käyrällä kenttää yhden muuttujan t
funktiona
ψ(t) = φ(x(t), y(t), z(t)).
Käyrällä laskettu differentiaali on
Kentän φ argumentteja voidaan näin pitää
integrointimuuttujan t funktioina. Tällöin ensinnäkin
integraalifunktion määritelmän (4.1) mukaan on
du
dφ
=F·
.
dt
dt
Toiseksi, koska kentän φ differentiaali käyrällä r = u(t) on
dφ = dψ(t) =
eli pitkin käyrää C tehty työ on nyt
Z t2
Z P2
dψ(t)
dφ =
dt
W =
dt
t1
P1
t2
=
dφ = ∇φ · du,
derivaatta parametrin t suhteen on kirjoitettavissa myös
muotoon
dφ
du
= ∇φ ·
.
dt
dt
dψ(t)
dt,
dt
/ ψ(t) = ψ(t2 ) − ψ(t1 )
t1
=
φ(x2 , y2 , z2 ) − φ(x1 , y1 , z1 ).
Integraalin arvo riippuu näin ollen ainoastaan
päätepisteistä eikä lainkaan valitusta integrointitiestä.
59
Olemme johtaneet lauseen
RP
Integraali P12 F · dr on riippumaton integrointitiestä (ts.
F on konservatiivinen) jos ja vain jos kenttä F on
esitettävissä jonkin skalaarifunktion φ gradienttina
F = ∇φ.
Eräs operaattoriin ∇ liittyvä ominaisuus oli
Muuttujan y suhteen osittaisderivaatta on
Z z
∂φ
∂Fz (x, y, z)
= Fy (x, y, z1 ) +
dz
∂y
∂y
z1
Z z
∂Fy (x, y, z)
dz
= Fy (x, y, z1 ) +
∂z
z1
z
∇ × (∇φ) = 0
=
olipa φ mikä tahansa skalaarikenttä. Jos siis kenttä F on
konservatiivinen ja siten ilmaistavissa jonkin
skalaarikentän gradienttina, sen roottori häviää:
=
=
∇ × F = 0.
Oletetaan nyt että kentän F roottori on nolla, ts.
i
j
k ∂
∂
∂ ∇ × F = ∂x ∂y
∂z Fx Fy Fz ∂Fz
∂Fx
∂Fy
∂Fz
=
i+
j
−
−
∂y
∂z
∂z
∂x
∂Fy
∂Fx
k
+
−
∂x
∂y
= 0.
z1
y
z
=
Fx (x, y1 , z1 ) + / Fx (x, y, z1 ) + / Fx (x, y, z)
=
Fx (x, y1 , z1 ) + Fx (x, y, z1 ) − Fx (x, y1 , z1 )
z1
y1
∂Fy ∂Fx
∂Fz
∂Fy
∂Fx
∂Fz
=
,
=
ja
=
.
∂y
∂z
∂z
∂x
∂x
∂y
C
Fy (x, y, z1 ) + Fy (x, y, z) − Fy (x, y, z1 )
Fy (x, y, z),
missä olemme käyttäneet hyväksi roottorin häviämisestä
seuranneita ehtoja.
Funktion φ osittaisderivaatta muuttujan x suhteen on
Z y
∂φ
∂Fy (x, y, z1 )
= Fx (x, y1 , z1 ) +
dy
∂x
∂x
y1
Z z
∂Fz (x, y, z)
+
dz
∂x
z1
Z y
∂Fx (x, y, z1 )
dy
= Fx (x, y1 , z1 ) +
∂y
y1
Z z
∂Fx (x, y, z)
+
dz
∂z
z1
Kentän komponenttien osittaisderivaatat toteuttavat siis
ehdot
Lasketaan viivaintegraali
Z
Z
F · dr =
(Fx dx + Fy dy + Fz dz)
Fy (x, y, z1 ) + / Fy (x, y, z)
=
+Fx (x, y, z) − F (x, y, z1 )
Fx (x, y, z),
missä jälleen olemme käyttäneet osittaisderivaattojen
välisiä ehtoja.
Kenttä F voidaan siis kirjoittaa muodossa
C
pisteestä P1 = (x1 , y1 , z1 ) pisteeseen P = (x, y, z) pitkin
käyrää C. Valitaan erikoisesti täksi käyräksi
koordinaattiakselien suuntaiset viivasegmentit pisteestä
(x1 , y1 , z1 ) pisteeseen (x, y1 , y2 ), siitä pisteeseen (x, y, z1 )
ja tästä lopuksi pisteeseen (x, y, z). Olkoon φ(x, y, z) tätä
käyrää myöten laskettu viivaintegraalin arvo, ts.
Z x
Fx (x, y1 , z1 )dx
φ(x, y, z) =
x1
Z y
Fy (x, y, z1 )dy
+
+
Z
y1
z
Fz (x, y, z)dz.
F=
Skalaarikentän gradienttina kenttä F on siten edellisen
lauseemme mukaisesti konservatiivinen.
Olemme saaneet kentän konservatiivisuudelle kätevän
kriteerin:
Vektorikenttä on konservatiivinen (ts. esitettävissä
skalaarifunktion gradienttina) jos ja vain jos sen roottori
häviää.
Lausetta
johtaessamme muodostimme sellaisia derivaattoja kuin
R
∂
∂y
φ(x, y)dx siirtämällä derivoinnin integraalin sisälle, ts.
∂
∂y
z1
Z
φ(x, y)dx =
Z
∂φ(x, y)
dx.
∂y
Tämä on sallittua silloin kun integraalit ovat kyllin
”siistejä”(tasaisesti suppenevia). Fysikaalisissa systeemeissä
voidaan useimmiten näin olettaa.
Tästä esityksestä funktion φ osittaisderivaataksi
muuttujan z suhteen saadaan
∂φ
= Fz (x, y, z).
∂z
∂φ
∂φ
∂φ
i+
j+
k = ∇φ.
∂x
∂y
∂z
Konservatiivista kenttää vastaavaa skalaarifunktiota
sanotaan kentän potentiaaliksi.
60
Jos integrointitie C on suljettu, ts. integrointitien
alkupiste yhtyy loppupisteeseen, on viivaintegraalista
tapana käyttää merkintää
I
Z
F · dr =
F · dr.
(8.3)
C
C
F · dr = 0.
(8.4)
Tämä on voimassa myös toisin päin. Oletetaan siis, että
mitä tahansa suljettua käyrää myöten laskettu
viivaintegraali häviää. Olkoot Pa ja Pb kaksi avaruuden
pistettä ja C1 jokin pisteestä Pa pisteeseen Pb kulkeva
käyrä. Jos C2 on jokin toinen käyrä välillä Pa −→ Pb , niin
I
Z
Z
F · dr
F · dr =
F · dr −
C
C2
C1
=
0,
Pa −→ Pb −→ Pa .
C1
=
2xy + z 3
=
x2
=
3xz 2 .
Integroimalla nämä lausekkeet saamme
 2
 x y + xz 3 + f (y, z)
x2 y
+ g(x, z)
φ=

xz 3 + h(x, y)
Tulokset ovat yhtäpitäviä, kun valitsemme f (y, z) = 0,
g(x, z) = xz 3 ja h(x, y) = x2 y. Haettu skalaaripotentiaali
on siis
φ = x2 y + xz 3 ,
mihin voidaan vielä lisätä mielivaltainen vakio.
Esim. Tehty työ siirrettäessä massapistettä pisteestä
P1 = (1, −2, 1) pisteeseen P2 = (3, 1, 4), kun vaikuttava
voima on F = (2xy + z 3 )j + x2 j + 3xz 2 k
Konservatiivista kenttää F vastaava skalaaripotentiaali on
edellisen esimerkin perusteella
kun C on yhdistetty suljettu käyrä
Pa
∂φ
∂x
∂φ
∂y
∂φ
∂z
C
Jos kenttä on konservatiivinen, niin pitkin mitä tahansa
suljettua käyrää C myöten laskettu viivaintegraali on
nolla,
I
Viivaintegraali
Z Pb
On siis etsittävä sellainen φ, että
−C2
φ = x2 y + xz 3 .
F · dr =
Z
C1
F · dr =
Z
C2
F · dr
ei siis riipu lainkaan integrointitiestä, joten kenttä F on
konservatiivinen.
Esim. Onko kenttä F = (2xy + z 3 )j + x2 j + 3xz 2 k
konservatiivinen?
Lasketaan kentän roottori
i
j
k ∂
∂
∂
∇ × F = ∂x
∂y
∂z
2xy + z 3 x2 3xz2 ∂(3xz 2 ) ∂(x2 )
=
i
−
∂y
∂z
∂(2xy + z 3 ) ∂(3xz 2 )
j
−
+
∂z
∂x
∂(x2 ) ∂(2xy + z 3 )
k
−
+
∂x
∂y
= 0,
joten kenttä F on konservatiivinen.
Esim. Kenttää F = (2xy + z 3 )j + x2 j + 3xz 2 k vastaava
skalaaripotentiaali
Edellisen esimerkin perusteella F on konservatiivinen,
joten on olemassa sellainen potentiaali φ, että
F = ∇φ.
Voiman konservatiivisuudesta johtuen tehty työ on
W
Z
=
P2
P1
F · dr = φ(3, 1, 4) − φ(1, −2, 1)
201 − (−1) = 202.
=
Muita viivaintegraaleja
R
R
Edellä käsittelimme integraaleja C f ds C F · dr.
Muunkinnäköisiä yhdistelmiä esiintyy:
Z
Z
Z
f dr,
Fds,
F × dr
C
C
C
Nämä kaikki muunnetaan tavallisiksi integraaleiksi
käyräparametrin u yli: r(u) = (x(u), y(u), z(u)). Näistä
esim
Z
Z b
Z b i
j
k dr
Fx Fy Fz du =
F×
F × dr =
du =
du
a
C
a x′
y′ z′ Z
b
a
[i(Fy z ′ − Fz y ′ ) + j . . .]
Esim. (x, y)-tason käyrän C rajoittaman alueen
ala:Olkoon r käyrän C koordinaattivektori, ja dr
differentiaali C:n suuntaisesti. Näiden vektoreiden
61
virittämän kolmion ala on 21 |r × dr|. Koko alueen ala
saadaan integroimalla (piirrä kuva!)
I
I
1
1
(r × dr)z =
(xdy − ydx)
2 C
2 C
Tämä toimii riippumatta siitä onko origo käyrän C sisällä
vai ei.
8.2 Pintaintegraali tasoalueen yli
Olkoon meillä funktio f (x, y) jonka haluamme integroida
yli tason alueen A:
y (x)
2
y-akselin (vakio x) suuntaiset suorat enintään 2 kertaa.
Jos näin ei ole, alue täytyy joko jakaa kahteen tai
useampaan säännölliseen osaan tai vaihtaa
integroimismuuttujia. Usein riittä että vaihdetaan vain x,
y-integrointijärjestystä.
8.2.1 Muuttujien vaihto pintaintegraalissa
Usein kannattaa vaihtaa koordinaatistosysteemi johonkin
muuhun kuin karteesiseen (x, y)-koordinaatistoon,
integroimisalueen tai funktion mukaan. (esim. integraali
riippuu vain vektorin r pituudesta, ei suunnasta).
1-ulotteisessa tapauksessa muuttujan vaihto x → u
tapahtui muuttamalla differentiaalia: du = du
dx dx. Tämä
yleistyy myös tasolle (tai useampaankin ulottuvuuteen:
jos vaihdetaan muuttujat (x, y) ↔ (u, v), niin
v
y
y (x)
1
x
x1
2
Kuva 8.5 Pintaintegraali
I
Z
=
f (x, y)da =
A
Z x2
=
u
dx
x1
Z
y2 (x)
Z Z
x
f (x, y)dxdy
Kuva 8.6 Koordinaattien vaihto
dyf (x, y)
y1 (x)
Tämä palautuu siis kahdeksi sisäkkäiseksi integraaliksi.
Tässä da = dxdy on infintesimaalinen pinta-alaelementti.
Huom: joskus pintaintegraaleja
kahdella, joskus yhdellä
R
R merkitään
R
integraalimerkillä: f dxdy =
f dxdy. Kaksi integraalimerkkiä
on tarpeen jos merkitään eksplisiittisesti muuttujien rajat. Näissä
muistiinpanoissa käytetään pääsääntöisesti vain yhtä
integraalimerkkiä.
tai kääntäen,
0
=
=
Z
1
dx
0
x
0
1 1 3
1
x =
2 0
2
Z
1
0
∂x
∂u
∂y
∂u
∂x
∂v
∂y
∂v
dudv
dudv = ∂u
∂x
∂v
∂x
∂u
∂y
∂v
∂y
dudv
Jos u → u + du, v vakio, r:n muutos on
∆u r = ∂u rdu = (∂u xi + ∂u y j)du.
Samoin jos v → v + dv, r:n muutos on
∆v r = ∂v rdv = (∂v xi + ∂v y j)dv.
Vektorien ∆u r ja ∆v r virittämän suunnikkaan pinta-ala on
1
dx(x2 + x2 )
2
R
R y (x)
R
Huom: jako A da = dx y12(x) dy toimii vain jos alue on
riittävän säännöllinen, ts. että suljettu käyrä C leikkaa
dxdy = Osoitetaan tämä: tutkitaan kuinka kuvautuu pinta-alan
differentiaali dudv xy-tasolle. Olkoon r = x(u, v)i + y(u, v)j
tason koordinaattivektori.
0
1
(xy + y 2 ) =
2
x = x(u, v)
y = y(u, v)
(||J||, determinantin itseisarvo). Determinanttia
kutsutaan Jacobin determinantiksi.
R
Esim: Alueen A pinta-ala on A dxdy
Esim: Olkoon A pisteiden (0,0), (1,0), (1,1) määräämä
kolmio, ja f (x, y) = x + y. Nyt
Z
Z 1 Z x
dy(x + y)
dx
f dxdy =
A
tai kääntäen
Differentiaaleille pätee
R
On syytä huomata että . . . dxdy ei spesifioi integrointien
suoritusjärjestystä eikä myöskään kerro eksplisiittisesti
integrointirajoja. Nämä valitaan tilanteen mukaan, useista
vaihtoehdoista tietenkin helpoimmin laskettava. Usein
R käytetään
R
myös sellaisia samaa tarkoittavia merkintöjä kuin dx dy . . ..
Vastaavia merkintöjä käytetään myös kolmi- ja useampiulotteisille
integroinneille.
u = u(x, y)
v = v(x, y)
|∆u r×∆v r| = | i
j
∂u x
∂v x
∂u y
∂u y
k 0 |dudv = | 0 ∂u x
∂v x
∂u y
∂u y
|dudv
Siis: jos vaihdetaan muuttujia (x, y) → (u, v), eli
sijoitetaan x = x(u, v), y = y(u, v),
Z
Z
∂(x, y) |dudv
f (x(u, v), y(u, v))| f (x, y)dxdy =
∂(u, v) A′
A
62
√
π.
missä A′ on sama alue mutta ilmaistu u, v-koordinaateilla.
Siis saamme I =
8.2.2 Napakoordinaatisto
Kaksiulotteisen tason rφ-napakoordinaatiston
määrittelevät yhtälöt
8.2.3 Tilavuusintegraalit
Tilavuusintegraali yleistyy suoraan tasointegraalista:
x
y
y
e
e
f
r
=
=
r cos φ
r sin φ.
(8.5)
f (x, y, z)dV =
V
x
Z
r = v a k io
dV
=
V
Tämän muunnoksen Jacobin determinantti on
∂r x ∂φ x cos φ −r sin φ =
∂r y ∂φ y sin φ r cos φ = r
Siis saamme tuloksen dxdy = rdrdθ, ja
Z
Z
f (x, y)dxdy =
f rdrdφ
A′
Esim. Integroidaan f = r =
p
x2 + y 2 1-ympyrän alan
yli:
1. karteesisissa (x, y)-koordinaateissa:
Z 1 Z √1−x2 p
ei yksinkertainen!
dy x2 + y 2 = . . .
dx √
− 1−x2
0
2. napakoordinaatistossa:
Z 2π Z
dφ
0
1
0
=
=
Z
−∞
dθdrre
R2
2π
∞
0
−r 2
=
Z
2
1
− e−r = π
2
z2
2π
dθ
0
Z
Z
dz
z1
=
=
Z
1
dz
0
1
dz
0
1
0
Z
Z
1−z
dy
0
y2 (z)
dy
y1 (z)
Z
x2 (y,z)
dxf (x, y, z)
x1 (y,z)
drre−r
1−y−z
dx
0
dy(1 − y − z) =
0
Z
1
dz
0
1−z
1
(1 − z)y − y 2
2
0
1
1
dz[(1 − z)2 − (1 − z)2 ] =
2
6
Muuttujan vaihto: tapahtuu jälleen Jacobin
determinantin avulla, (x, y, z) → (u, v, t):
∂ u x ∂ v x ∂ t x
∂r dxdydz = | |dudvdt = ∂u y ∂v y ∂t y
∂u
∂ u z ∂ v z ∂ t z
dudvdt
Kaksi tärkeää erikoistapausta: sylinterikoordinaatisto ja
pallokoordinaatisto
8.2.4 Sylinterikoordinaatisto
Sylinterikoordinaatiston ρφz määrittelevät yhtälöt
x
y
z
R2
∞
Z
1−z
2π
drrr =
3
Helppoa! Kannattaa valita siis koordinaatisto ongelman
mukaan!
R∞
2
Esim. Mikä on I = −∞ e−x dx?Käytetään tässä
seuraava temppua ja muutetaan integraali
tasointegraaliksi:
Z
Z ∞
Z ∞
2
2
2
2
dye−y =
dxe−x
dxdye−(x +y )
I2 =
−∞
Z
Z
Kuva 8.7 Napakoordinaatisto
A
Z
(tai joku muu x, y, z-järjestys!). Jos f = 1, integraali
antaa suoraan alueen V tilavuuden. Tässä tilavuuden
differentiaali dV = dxdydz.
Esim. Määritellään tilavuus niin että x, y, z > 0, ja
x + y + z < 1 (tetraedri). Lasketaan tämän tilavuus. Nyt
kiinteällä z, 0 < z < 1, pätee 0 < y < 1 − z. Samoin
kiinteällä y, z 0 < x < 1 − y − z. Siis
f = v a k io
( x ,y )
f
Z
z
z
f
e
r = v a k io
z = v a k io
r
f
0
r
ρ cos φ
ρ sin φ
z.
r = v a k io
f = v a k io
e
z
z
2
=
=
=
e
r
f
f = v a k io
z = v a k io
r
y
x
Kuva 8.8 Sylinterikoordinaatisto
63
(8.6)
Kuten kuvasta nähdään, on ρ pisteen xy-tasolla olevan
projektion etäisyys origosta, φ tämän projektion
napakulma ja z pisteen korkeus xy-tasosta mitattuna.
Koordinaattikäyrät ovat
olevan projektion ja x-akselin välisenä atsimuuttikulmana
φ.
z
• ρ-käyrät: z-akselia vastaan kohtisuorat (= xy-tason
suuntaiset) ja sitä leikkaavat suorat.
r si
n q
yksikkövektorit nähdään suoraan
(8.7)
Kuvasta nähdään, että pallokoordinaateista rθφ
siirrytään karteesisiin koordinaatteihin kaavoilla
x
y
z
f
Siis: dV = ρdρdφdz.
Tämän näkee myös tutkimalla suoraan
tilavuuselementtiä:
r v a k io
f v a k io
Kuva 8.11 Pallokoordinaatiston
koordinaattikäyrät
Pallokoordinaatiston koordinaattikäyrät ovat
• r-käyrät: origon kautta kulkevat suorat.
Kuvasta nähdään, että sylinterikoordinaattien
differentiaalisia muutoksia dρ, dφ ja dz vastaa
tilavuuselementti
dV = ρ dρ dφ dz.
R
Esim. laske V f dV , kun V on sylinteri 0 ≤ z ≤ 1,
x2 + y 2 = ρ2 ≤ 1, ja f = ρ2 :
2π
dφ
0
r
q
x
tossa
V
r
q v a k io
f v a k io
f
Kuva 8.9 Tilavuuselementti sylinterikoordinaatis-
ρ2 dV =
(8.8)
y
r d f
Z
r sin θ cos φ
r sin θ sin φ
r cos θ.
d z
d V
Z
=
=
=
z
r v a k io
q v a k io
q
d f d r
r
rs
in
Kuva 8.10 Pallokoordinaatit
i cos φ + j sin φ
−i sin φ + j cos φ
k.
Sylinterikoordinaatistossa tilavuuden differentiaali antaa
Jacobin determinantin
cos φ −ρ sin φ 0 dV = dxdydz = | sin φ ρ cos φ 0 |dρdφdz = ρdρdφdz
0
0
1 z
q
r s in q s in f
x
y
f
co
s
f
• z-käyrät: z-akselin suuntaiset suorat.
r c o sq
• φ-käyrät: z-akselikeskeiset ja sitä vastaan kohtisuorat
ympyrät.
Sylinterikoordinaatiston
kuvasta:
eρ =
eφ =
ez =
r
q
Z
1
dz
0
Z
1
dρρρ2 =
0
• θ-käyrät: origokeskiset ympyrät, joiden halkaisijana
on z-akselin suuntaiset origokeskiset janat (= joiden
taso on kohtisuorassa xy-tasoa vastaan).
• φ-käyrät: z-akselikeskeiset ja sitä vastaan
kohtisuorassa olevat (= xy-tason suuntaiset)
ympyrät.
π
2
8.2.5 Pallokoordinaatisto
Pallokoordinaatistossa pisteen paikka ilmoitetaan
etäisyytenä r origosta, paikkavektorin ja z-akselin
välisenä korkeuskulmana θ sekä paikkavektorin xy-tasolla
Pallokoordinaatistossa Jacobin determinantti on
∂(x, y, z) 2
∂(r, θ, φ) = r sin θ
Siis nyt dV = r2 sin θdrdθdφ = r2 drd(cos θ)dφ.
64
R
Esim. Laske integraali V f dV , kun tilavuus V on
pallonkuori 1 ≤ r ≤ 2 ja f = 1/r2 :
Z 1
Z 2π Z π
Z
1
1
drr2 2 = 4π
dθ
sin
θ
dφ
dV
=
2
r
r
0
0
0
V
• Kantavektorit
Tässä siis
R
4π
dω =
= −i sin φ + j cos φ.
eφ
Usein merkitään kulmaosia yhdessä avaruuskulmalla Ω:
Z
Z
Z
dV =
dΩ drr2
V
= i sin θ cos φ + j sin θ sin φ + k cos θ
= i cos θ cos φ + j cos θ sin φ − k sin θ
er
eθ
• Gradientti
∇ψ = er
4π
R 2π
0
dφ
Rπ
eφ ∂ψ
∂ψ eθ ∂ψ
+
+
.
∂r
r ∂θ
r sin θ ∂φ
dθ sin θ
0
• Divergenssi
8.2.6 Nabla sylinteri- ja pallokoordinaatistoissa:
Samoin kuin integaaleja voidaan sylinteri- ja
pallokoordinaateissa, joskus on edullista laskea myös
differentiaaleja ko. koordinaateissa. Näiden osoittaminen
on varsin suoraviivaista mutta työlästä, joten annetaan
tässä vain tulokset:
∇·A
• Muunnoskaavat
=
=
ρ cos φ
ρ sin φ
z
=
z.
1 ∂
∂
1
r2 Ar +
(Aθ sin θ)
r2 ∂r
r sin θ ∂θ
1 ∂Aφ
.
+
r sin θ ∂φ
• Laplacen operaattori
∂
1 ∂
1
2 ∂ψ
2
2 ∂ψ
∇ ψ =
r
+ 2 2
sin θ
r2 ∂r
∂r
∂θ
r sin θ ∂θ
2
1
∂ ψ
.
+ 2 2
r sin θ ∂φ2
Sylinterikoordinaatisto
x
y
=
8.3 Pintaintegraali yli käyrän pinnan
• Kantavektorit
eρ
= i cos φ + j sin φ
eφ
ez
= −i sin φ + j cos φ
= k.
• Gradientti
∇ψ = eρ
∂ψ
1 ∂ψ
∂ψ
+ eφ
+ ez
.
∂ρ
ρ ∂φ
∂z
• Divergenssi
∇·A=
8.3.1 Skalaarifunktion integraalit
Olkoon φ(x, y, z) on jokin skalaarifunktio, A jokin
kolmiulotteisen avaruuden pinta ja dA tämän pinnan
infinitesimaalinen pinta-alkio. Tehtävänä on nyt laskea
pintaintegraali
Z
I=
Samalla tavoin kuin tavallisen yhden muuttujan
integraalinkin tapauksessa tämä tarkoittaa sitä, että
1. jaetaan pinta A pieniin ∆A suuruisiin palasiin,
1 ∂Aφ
∂Az
1 ∂
(ρAρ ) +
+
.
ρ ∂ρ
ρ ∂φ
∂z
2. lasketaan kussakin palasessa funktion φ(x, y, z) arvo
ja kerrotaan tämä palasen pinta-alalla ∆A,
• Laplacen operaattori
1 ∂
∂ψ
1 ∂2ψ ∂2ψ
2
+
.
∇ ψ=
ρ
+ 2
ρ ∂ρ
∂ρ
ρ ∂φ2
∂z 2
Pallokoordinaatisto
• Muunnoskaavat
x
=
r sin θ cos φ
y
z
=
=
r sin θ sin φ
r cos θ.
φ(x, y, z)dA.
A
3. summataan yhteen kaikki termit φ(x, y, z)∆A ja
4. annetaan palasten pinta-alan lähestyä nollaa.
Pintaintegraali on usein helpompi laskea palauttamalla se
koordinaattien yli suoritettaviksi integroinneiksi. Jos
esimerkiksi pinta A voidaan esittää muodossa z = f (x, y),
kannattaa yleensä integroida muuttujien x ja y yli, ts.
viedä integraali muotoon
Z y1 Z x1
φ(x, y, f (x, y))h(x, y)dx dy.
I=
y0
65
x0
Tässä h(x, y) on skaalaustekijä, jolla xy-tason pinta-alkio
dA0 = dx dy on kerrottava, jotta saataisiin pinnan alkio
dA. Integrointien rajat riippuvat pinnasta. Se,
kannattaako ensin integroida muuttujan x (kuten yo.
lausekkeessa) vai muuttujan y yli riippuu paitsi pinnasta
niin myös funktiosta φ.
k
z
g
n
d A
y
x
0
d y
g = 0.
Tällöin kaavassa (8.10) tarvittavat osittaisderivaatat ovat
∂f ∂g
∂f
∂g
∂g
=
,
=
ja
=1
∂x
∂x ∂y
∂y
∂z
ja pintaelementin skaalaustekijä vastaavasti
s 2
2
∂f
∂f
1
+
+ 1.
= |∇g| =
cos γ
∂x
∂y
A
d A
pinnan yhtälö on
d x
Kuva 8.12 Pintaintegraali
Kuten kuvasta nähdään, xy-tason pinta-alkiota dA0 ja
sitä pinnalla A vastaavaa alkiota sitoo toisiinsa relaatio
dA0 = dx dy = dA cos γ,
(8.9)
missä γ on pinnan normaalin n ja z-akselin välinen
kulma. Tässä tapauksessa pintaintegraali on siis
kirjoitettavissa muotoon
Z
Z
dx dy
I=
φ dA = φ(x, y, z)
.
cos γ
A
Pinta-integraali I on nyt
s 2
Z
2
∂f
∂f
I = φ(x, y, f (x, y))
+
+ 1dx dy.
∂x
∂y
(8.11)
Esim. Funktion φ = z integraali puolipallon
x2 + y 2 + z 2 = R2 , z ≥ 0 pinnan yli
Nyt
p
z = R2 − x2 − y 2 = f (x, y),
jolloin
Oletetaan nyt, että pinnan A yhtälö on annettu muodossa
Kyseessä on siis skalaarikentän g eräs tasa-arvopinta.
Kuten gradientin yhteydessä näimme, on skalaarin
gradientti kohtisuorassa tasa-arvopintaa vastaan. Eräs
pinnan A normaali on niin ollen ∇g ja normaalin
suuntainen yksikkövektori silloin
∇g
.
|∇g|
∂f
∂y
=
1
cos2 γ
−p
−p
x
R2
− x2 − y 2
y
R 2 − x2 − y 2
2 2
∂f
∂f
+
∂x
∂y
2
2
x +y
= 1+ 2
R − x2 − y 2
R2
.
=
2
R − x2 − y 2
= 1+
Integrointialueena xy-tasossa on puolipallon pinnan
projektio eli kehän
Tämän projektio z-akselille on
n · k = cos γ =
=
ja
g(x, y, z) = C.
n=
∂f
∂x
∂g
∂z
|∇g|
x2 + y 2 = R 2 ; z = 0
.
Pintaintegraalimme on nyt kirjoitettavissa muotoon
Z
|∇g|
I = φ(x, y, z) ∂g dx dy.
(8.10)
rajoittama ympyrä. xy-tason integraali kannattaa tehdä
nyt napakoordinaatteja käyttäen: ρ2 = x2 + y 2 :
I
=
∂z
Jos pinta A on annettu muodossa
=
z = f (x, y),
=
niin asettamalla
g = z − f (x, y)
66
2π
R
1
dρρz
cos
γ
0
0
A
s
Z R
p
R2
dρρ R2 − ρ2
2π
2
R − ρ2
0
Z
φdA =
Z
dφ
R
1
2π / R ρ2 = πR3
2
0
Z
8.3.2 Vuointegraalit: vektoreiden pintaintegraalit
Tavallisin tapaus pintaintegraaleista on laskea
vektorikentän vuo pinnan läpi: Tarkastellaan pintaa A ja
sillä pisteessä P (x, y, z) olevaa pinta-alkiota dA.
Määritellään vektoriaalinen pinta-alkio dA siten, että
dA = n dA,
eli radiusvektorin suuntainen yksikkövektori.
Edelleen
∇ × F · dA = 2k · n dA = 2 cos θ dA,
missä θ on radiusvektorin ja z-akselin välinen kulma.
z
missä n on pisteessä P laskettu pinnan normaalin
suuntainen yksikkövektori. Olkoon F(x, y, z) jokin
(integroituva) vektorikenttä. Eräs vektorikentän F
pintaintegraali on
Z
Z
F · dA =
F · n dA.
(8.12)
A
r s in q
d f
r
q
A
Tämä integraali kuvaa vektorin F vuota pinnan A läpi.
Huom: jos kyseessä on suljettu pinta, integraalia
merkitään
I
A
F · dA.
Jos pinta ei ole suljettu, sillä on luonnollisesti reunaviiva.
Esim. Nesteen virtaus
Jos ρ on nesteen tiheys ja v sen nopeus, niin
r d q
d A
r s in q d f
d q
Kuva 8.13 Pintaelementti pallolla
Kuvassa φ radiusvektorin xy-tasolla olevan projektion ja
x-akselin välinen kulma. Kuten kuvasta nähdään, pallon
pinnalla pallokoordinaattien θ ja φ differentiaalisia
muutoksia dθ ja dφ vastaava pintaelementti dA on
dA = r2 sin θ dθ dφ.
(8.13)
ρv · dA = ρv · n dA
on pintaelementin dA läpi aikayksikössä kulkevan
nesteen
R
määrä. Vektorin µ = ρv vuo pinnan A läpi, A µ · dA, on
aikayksikössä pinnan A läpi kulkevan nesteen määrä.
Muunlaisia pintaintegraaleja ovat esim.
Z
Z
Z
Z
F × dA =
F × n dA;
φ dA;
φ dA.
A
A
A
A
Esim. Radiaalikenttä pallokuoren yli:
Olkoon v = rf (r), ja pallonkuori |r|2 = r2 = R2 . Nyt
n = r/r, ja
I
I
I
dA = 4πR3 f (R)
f (R)r·r/RdA = f (R)R
v·dA =
A
Puolipallon pinnalla kulmat θ ja φ saavat arvot
=
=
2
missä käytettiin
tietoa pallon ala = 4πR .
R
Esim. I = A (∇ × F) · dA, kun F = −yi + xj + zk, ja A
on puolipallon x2 + y 2 + z 2 = R2 ; z ≥ 0 pinta
Nyt
i
j
k ∂
∂
∂ ∇ × F = ∂x ∂y
∂z = 2k.
−y x
z Pinnan A yhtälö on
g = x2 + y 2 + z 2 = R 2 ,
joten
∇g = 2xi + 2yj + 2zk = 2r.
Pallopinnan A yksikkönormaali n on siis
∇g
r
xi + yj + zk
n=
= =
,
|∇g|
r
r
θ
0≤
φ
π
2
≤ 2π.
≤
Integraali I on siis
Z
I =
∇ × F · n dA
A
A
0≤
=
Z
A
π/2
dθ
0
4πR2
4πR2
Z
Z
2π
dφ 2 cos θ R2 sin θ
0
π/2
0
π/2
cos θ sin θ dθ
sin2 θ
= 2πR2 .
2
0
8.4 Gaussin lause
Edellä laskettiin vektorikentän v = rf (r) vuo R-säteisen
pallon pinnan läpi, tuloksella
I
v · dA = 4πR3 f (R)
A
Lasketaan nyt ∇ · v integroituna pallon tilavuuden yli: nyt
∇·v = ∇·(rf (r)) = f (r)∇·r +r·f ′ (r)∇r = 3f (r)+rf ′ (r)
67
Siis
Z
Z
Z
∇·vdV = dΩ
V
R
drr2 (3f (r)+rf ′ (r)) = 4π
0
Z
R
alapinnalla:
dr∂r (r3 f (r)) = 4πR3 f (R)
joten
Z
(8.14)
V
missä A on alueen V pinta. Tämä tulos pätee yleisesti,
kaikille vektorikentille ja tilavuuksille, ja sitä sanotaan
Gaussin laiksi: vektorin v normaalikomponentin integraali
yli suljetun pinnan on sama kuin sen divergenssin
integraali pinnan sulkeman tilavuuden yli.
Toisin: kentän v vuo suljetun pinnan läpi = kentän v
lähteet pinnan sisällä!
Gaussin laki on 3-ulotteinen yleistys 1-ulotteisia
integraaleja koskevalle totuudelle
Z
b
a
[Fz (x, y, f2 ) − Fz (x, y, f1 )] dxdy
R
=
=
Z
Z
Fz k · n2 dA2 +
A2
Fz k · n dA.
∂Fz
dV =
∂z
V
ZZZ
Z ZV Z
∂Fy
dV
∂y
=
∂Fx
dV
∂x
=
Z
Z
Fy j · n dA
A
Fx i · n dA,
A
joten kaiken kaikkiaan on
ZZZ
ZZZ ∂Fz
dV.
∂z
∂Fx
∂Fy
∂Fz
+
+
∂x
∂y
∂z
V
V
=
2
eli
2
ZZZ
Z
dV
Fx i + Fy j + Fz k · n dA,
A
∇ · F dV =
V
Z
F · n dA =
A
Z
F · dA.
A
1
Esim. Vektorin r vuo a-säteisen ja h-korkuisen sylinterin
pinnan läpi
Olkoon A sylinteriä rajoittava pinta (mukaan lukien
pohjat) ja V sylinterin tilavuus.
z
1
d y
Fz k · n dA.
A
V
ja tarkastellaan integraalia
A
Z
Vastaavasti voidaan osoittaa, että
F = Fx i + Fy j + Fz k,
n
Fz k · n1 dA1
A1
A
ZZZ
df
dx = f (b) − f (a)
dx
A
Z
Saamme siis
Gaussin lauseen tarkempi todistus
Kirjoitetaan vektori F komponenteittain:
n
dxdy = −k · n1 dA1
dxdy = k · n2 dA2
dxdy = k · n dA,
yläpinnalla:
pinnalla:
0
Saimme siis tuloksen
I
Z
v · dA =
∇ · vdV
A
Olkoon n pinnan A yksikkönormaali, n1 alapinnan A1
yksikkönormaali ja n2 yläpinnan A2 yksikkönormaali. Nyt
d x R
Kuva 8.14 Gaussin lauseen todistus
Olkoot A1 ja A2 tilavuutta V ympäröivän suljetun pinnan A alaja yläpinta, joita esittävät yhtälöt
A1
:
z = f1 (x, y)
A2
:
z = f2 (x, y).
a
Olkoon R pinnan A (tai A1 tai A2 ) projektio xy-tasolla.
Tällöin
ZZZ
∂Fz
dV
∂z
=
ZZZ
∂Fz
dzdxdy
∂z
f2 (x,y)
=
Z Z
R
=
Z
R
y
x
Kuva 8.15 Sylinteri
V
V
h
f1 (x,y)
∂Fz
dz
∂z
dxdy
[Fz (x, y, f2 ) − Fz (x, y, f1 )] dxdy
a) Divergenssilauseen perusteella vuo I on
Z
Z
I=
r · dA =
∇ · r dV.
A
68
V
Koska
jolloin
r = xi + yj + zk,
on
∂x ∂y ∂z
+
+
= 3,
∂x ∂y ∂z
∇·r=
joten
I=3
Z
∇ · K = −∇2 φ = −4πGρ.
dV = 3V = 3πa h.
yläpinta
r · n dA =
Z
h dA = πa2 h.
(ii) Pohjalla n = −k ja
r · n = −z = 0,
joten
Z
V
∇ · K dV
pohja
n=
xi + yj
,
a
ρ dV
V
−4πGM.
V
A
kun A on tilavuutta V rajoittava pinta.
Oletetaan, että M -massainen kappale on
pallosymmetrinen ja otetaan tilavuudeksi V ko. kappaleen
sisäänsä sulkeva r-säteinen kappalekeskinen pallo. Tällöin
ilmeisestikin |K| on vakio pallon pinnalla ja K on
radiusvektorin suuntainen (tai vastakkaissuuntainen), ts.
voidaan kirjoittaa
K = K(r)er ,
missä er on radiusvektorin suuntainen yksikkövektori.
Vektori er on tietystikin myös yksikkönormaali ko. pallon
pinnalla, joten
Z
sillä vaipan yhtälö on
f = x 2 + y 2 = a2 ,
r-säteinen pallo
K · dA
=
=
ja niin ollen vektori
=
∇f = 2xi + 2yj
Z
Toisaalta Gaussin lauseen mukaan on
Z
Z
∇ · K dV =
K · dA,
r · n dA = 0.
(iii) Vaipalla yksikkönormaali on
−4πG
=
=
V
r · n = r · k = z = h,
Z
Z
2
b) Lasketaan vuo pintaintegraalina.
(i) Yläpinnalla n = k ja
joten
Jos tilavuudessa V oleva kokonaismassa on M , niin
Z
K(r)er · er dA
Z
K(r) dA = K(r) · 4πr2
−4πGM.
Saamme siis tutun Newtonin gravitaatiolain
on kohtisuorassa vaippaa vastaan. Nyt
K(r) = −
x2 + y 2
a2
r·n=
=
= a,
a
a
joten
GM
,
r2
tai vektoriaalisesti
Z
vaippa
r · n dA = a
Z
dA = a · 2πah.
K(r) = −
GM
er .
r2
Laskemalla kaikki vuot yhteen saadaan
I = 3πa2 h.
Esim. Newtonin gravitaatiopotentiaali φ toteuttaa
yhtälön
∇2 φ = 4πGρ,
8.5 Stokesin lause
Roottorin fysikaalista tulkintaa etsiessämme saimme
tuloksen (7.18), jonka mukaan xy-tasossa pisteen (x, y)
ympäri kiertyvä virtaus oli
missä G on gravitaatiovakio ja ρ massatiheys.
Määritetään gravitaatiokenttävoimakkuus
pallosymmetrisessä tapauksessa
Merkitään
K = −∇φ,
dSz
=
=
69
µx (x, y − dy/2, z)dx + µy (x + dx/2, y, z)dy
−µx (x, y + dy/2, z)dx − µy (x − dx/2, y, z)dy
∂µy
∂µx
dx dy.
−
∂x
∂y
Summassa (8.16) yhteisiin reunoihin liittyvät termit
kumoutuvat, joten jäljelle jäävät vain alueen A reunoihin
rajoittuvien pinta-alkioiden ulkoreunat eli
X
X
(∇ × F) · dAi =
F · dr.
d x
y
3
4
2
d y
d A
i
1
x
Kuva 8.16 xy-tason pinta-alkio
Kuvan mukaisesti voimme kirjoittaa tämän muotoon
4
X
i=1
µ · dri = (∇ × µ)z dx dy,
missä vektoriaaliset differentiaalit ovat dr1 = dx i,
dr2 = dy j, dr3 = −dx i sekä dr4 = −dy j ja virtatiheys on
laskettava aina vastaavalla infinitesimaalisen suorakaiteen
sivulla. Yhtälön oikeakin puoli on lausuttavissa
kompaktimmin, kun otamme käyttöön vektoriaalisen
pinta-alkion dA = dx dy k. Näin päädymme relaatioon
4
X
i=1
µ · dr = (∇ × µ) · dA,
missä nyt sekä dr että µ on laskettava summausindeksiin
liittyvällä suorakaiteen sivulla. Tämä yhtälö on toki
voimassa mielivaltaisellekin (differentioituvalle)
vektorikentälle F ja miten tahansa orientoituneelle
pintaelementille dA:
4
X
i=1
F · dr = (∇ × F) · dA,
(8.15)
missä vasemmalla puolen kierretään dA vastapäivään.
Tarkastellaan nyt mielivaltaista pintaa A. Jaetaan A
infinitesimaalisiin palasiin dAi . Kussakin pinta-alkiossa on
voimassa
4
X
F · dr,
(∇ × F) · dAi =
A:n ulkoreuna
Yhtälön vasen puoli on suureen ∇ × F pintaintegraali yli
pinnan A ja oikea puoli viivaintegraali pintaa A
rajoittavan reunakäyrän C ympäri. Koska jokainen
pinta-elementti yhtälön (8.15) ja kuvan 8.16 mukaisesti
kierrettiin positiiviiseen kiertosuuntaan, samaan suuntaan
kierretään myös pinta A. Olemme näin päätyneet
Stokesin lauseena tunnettuun pinta- ja viivaintegraaleja
sitovaan relaatioon
I
Z
F · dr = (∇ × F) · dA.
(8.17)
C
A
Sanallisesti Stokesin lause on ilmaistavissa muodossa
Vektorikentän F viivaintegraali pinnan A reunakäyrän C
ympäri on sama kuin kentän F roottorin
normaalikomponentin pintaintegraali pinnan A yli.
Huom. Integraalin arvo ei muutu sellaisissa
integrointipinnan deformaatioissa, joissa reunakäyrä
säilyy muuttumattomana.
R
Esim. A ∇ × F · dA kun F = −yi + xj + zk ja A on
puolipallon x2 + y 2 + z 2 = a2 ; z ≥ 0 pinta
1) Suoraan pintaintegraalina. Katso edellä
(pintaintegraalit).
2) Viivaintegraalina Stokesin lausetta soveltaen. Nyt
F · dr
=
=
(−yi + xj + zk) · (dx i + dy j + dz k)
−y dx + x dy + z dz.
Puolipallon pinnan A reunakäyrä C on xy-tason ympyrä
x2 + y 2 = a2 ; z = 0.
Tällä käyrällä
x
y
z
j=1
missä vasemmalla puolen roottori lasketaan alueen dAi
keskipisteessä ja oikealla puolen seka F että differentiaalit
alueen dAi summausindeksistä j riippuvalla reunalla.
Summataan yli kaikkien palasten, jolloin
X
i
(∇ × F) · dAi =
4
XX
i
j=1
F · dr.
=
=
=
a cos θ
a sin θ
0,
kun θ on vektorin r = (x, y, 0) ja x-akselin välinen kulma.
Tällöin
dx
dy
dz
(8.16)
= −a sin θ dθ
= a cos θ dθ
= 0,
joten käyrällä C
Tarkastellaan kahta vierekkäistä pinta-alkiota, sanotaan
alkioita 1 ja 2. Näiden yhteisellä reunalla toisen
suorakaiteen dr on vastakkainen toisen suorakaiteen
vastaavalle differentiaalille kun taas kenttä F on sama.
F · dr
70
=
=
=
−y dx + x dy
a2 sin2 θ dθ + a2 cos2 θ dθ
a2 dθ.
Stokesin lauseen mukaan on
Z
I
Z
(∇ × F) · dA =
F · dr =
A
C
=
2π
a2 dθ
0
2πa2 .
3) Pintaintegraali on sama mille tahansa käyrän C
rajoittamalle pinnalle. Valitaan xy-tason ympyrä. Koska
∇ × F = 2k,
on
Z
x2 +y 2 ≤a2
(∇ × F) · dA
=
=
Z
2k · k dA
x2 +y 2 ≤a2
2
2A = 2πa .
Stokesin lauseen perusteella pyörteettömälle kentälle F on
voimassa
I
Z
F · dr = (∇ × F) · dA = 0,
C
A
olipa C mikä tahansa suljettu käyrä ja A sen sisäänsä
sulkema pinta. Tähän tulokseen päädyimme jo
viivaintegraalien yhteydessä konservatiivisia
vektorikenttiä tarkastellessamme (ks. kaava (8.4).
71
9. Lineaarikuvaukset, matriisit
9.1 Vektoriavaruudet
Aiemmin olemmme puhuneet tason (R2 ) ja kotiavaruuden
(R3 ) vektoreista. Nämä (kuten myös pelkkä R) ovat
esimerkkejä reaalisista vektoriavaruuksista.
Yleisesti vektoriavaruudet ovat joukkoja V joille on
määritelty
1. Yhteenlasku: x + y ∈ V , jos x ja y ∈ V .
2. Skalaarilla kertominen: ax ∈ V , jos x ∈ V ja a ∈ R.
Vektoriavaruus sisältää yksikäsitteisen nollavektorin:
 ∈ V siten, että x +  = x.
Lisäksi jokaisella alkiolla x ∈ V on vastavektori −x ∈ V :
x + (−x) = .
Erilaiset vektoriavaruudet ovat matematiikassa ja
fysiikassa hyvin yleisiä. Rn :n lisäksi usein puhutaan
funktionaalisista avaruuksista, esim. asteluvun n
polynomit muodostavat n P
+ 1-ulotteisen
n
vektoriavaruuden: p(x) = i=0 ai xi (polynomeja voidaan
laskea yhteen ja kertoa skalaarilla, ja tuloksena on edellen
polynomi).
Vektoriavaruuden V aliavaruus S on sellainen V :n
alijoukko S, että:
jos x, y ∈ S ja a ∈ R, niin
x + y ∈ S ja
ax ∈ S
Esim. R3 :n aliavaruuksia ovat esim. kaikki origon kautta
kulkevat suorat ja tasot. Myös {} ja R3 ovat R3 :n
aliavaruuksia. Sen sijaan esim. R3 :n yksikkövektorien
joukko (|x| = 1) ei ole aliavaruus.
Vektoriavaruuksissa Rn on määritelty muitakin
laskusääntöjä, esim. vektorien pistetulo x · y. Oletetaan
jatkossa että pistetulo on määritelty.
Lineaarinen riippumattomuus
Muistetaan, että vektorit v1 . . . vk ovat lineaarisesti
riippumattomia (eli vapaita), jos
k
X
Huom: ylläolevan kaltainen lineaarikombinaatio
vektoreista on niin yleinen, että siitä usein käytetään
oikeanpuoleista merkintätapaa: toistuvan indeksin yli
summataan automaattisesti (implisiittisesti). Einsteinin
summaussääntö.
Sanotaan että vektorit ei muodostavat V :n kannan, ja
ai :t ovat v:n komponentit tässä kannassa.
Kanta ei ole yksikäsitteinen. Yksinkertaisin kanta on
ortonormaali kanta:
ei · ej = δij =
1,
0,
jos i = j
jos i =
6 j
Tässä δij on nimeltään Kroneckerin delta. Siis
ortonormaalit vektorit ovat kohtisuorassa toisiaan vastaan
ja niiden pituus |~ei | = 1.
Ortonormaalissa kannassa kahden vektorin a, b pistetulo
on
n
n
n
X
X
X
a i bj
bj e j =
ai e i ·
a·b=
i=1
j=1
i=1
Tai lyhyemmin: a · b = ai bi .
Tutuin esimerkki ortonormaalista kannasta on R3 :n kanta
i, j, k.
Palaamme myöhemmin siihen miten ei-ortonormaalista
kannasta voidaan tehdä ortonormaali.
Huom: ortonormitetussa kannassa
X
X
ej · a =
ai ej · ei =
ai δij = aj
i
i
eli
ai = a · ei
Kertoimet ai siis ilmaisevat vektorin a projektion ei
suuntaan.
9.2 Lineaarikuvaus
ai v i = 0
i=1
vain jos kaikki a1 = a2 = . . . = ak = 0. Muussa
tapauksessa vektorit ovat lineaarisesti riippuvia, ja
ainakin yksi vektori voidaan lausua muiden
lineaarikombinaationa.
n-ulotteisessa vektoriavaruudessa voidaan valita enintään
n:n keskenään lineaarisesti riippumattoman vektorin
joukko. Kolmiulotteisessa avaruudessa on enintään 3
vektorin joukko keskenään lineaarisesti riippumaton.
Jos vektorit e1 , e2 . . . en ovat lineaarisesti riippumattomia
n-ulotteisen vektoriavaruuden V alkioita, sanotaan että
ne virittävät V :n: mikä tahansa v ∈ V voidaan esittää
niiden lineaarikombinaatioina:
n
X
ai ei ≡ ai ei
v=
i=1
Olkoon A kuvaus (funktio) vektoriavaruudesta V
vektoriavaruuteen U : jos nyt
A(x + y) = A(x) + A(y),
A(αx) = αA(x)
kaikilla x, y ∈ V ja α ∈ R, niin A on lineaarikuvaus.
Esim. Kuvaus A : R → R, A(x) = cx, c vakio, on
lineaarikuvaus:
A(x + y) = c(x + y) = cx + cy = A(x) + A(y)
A(αx) = cαx = αA(x)
Esim. Kuvaus B : R → R, B(x) = cx + d, d 6= 0, ei ole
lineaarinen (HT).
Lineaarikuvaukset ovat hyvin rajoitettu funktiojoukko, ja
pelkästään R:n kuvauksina ne ole kovinkaan
mielenkiintoisia (tavallisin sovellus: yleisen funktion f (x)
approksimaatio lineaarisesti). Useampiulotteisissa
avaruuksissa sen sijaan niillä on paljon käyttöä!
72
9.2.1 Tason kuvaus itselleen
Tarkastellaan tason vektorien lineaarikuvausta A, joka
muuttaa tason vektorin v = (x, y) toiseksi tason
vektoriksi v′ = (x′ , y ′ ): A(v) = v′ , tai
′
x = a11 x + a12 y
y ′ = a21 x + a22 y
Tässä aij ovat lukuja, jotka määrittelevät A:n. Kyseessä
on todellakin lineaarikuvaus (HT):
A(v1 + v2 ) = A(v1 ) + A(v2 )
A(αv) = αA(v)
On kätevää ottaa käyttöön pystyvektorit ja matriisit:
Merkitään nyt
′ x
x
v=
v′ =
y′
y
ja
A=
a11
a21
a12
a22
a12
·
x
y
=
0 0
···
1
eli Iij = δij . Se kuvaa vektorin itselleen: Ix = x
nollamatriisi:


0 ··· 0
 0 ··· 0 


0= .

 ..

0 ···
0
mikä kuvaa kaikki vektorit nollavektoreiksi: 0x = .
Tässä notaatiossa merkitään
′ a11 a12
x
x
a11 x + a12 y
=
=
a21 a22
y′
y
a21 x + a22 y
Siis esimerkiksi
′ a11
x
=
·′
·
Tässä siis A:n on oltava m vaakariviä ja n pystyriviä,
jotta lasku yllä voidaan tehdä! A on siis m × n -matriisi.
Jos m = n, on A neliömatriisi
Erikoisasemassa ovat yksikkömatriisi (neliömatriisi)


1 0 ··· 0
 0 1 ··· 0 


I= .

 ..

a11 x + a12 y
·
Siis: tulosvektorin rivi k lasketaan siten, että kerrotaan
matriisin rivin k alkiot elementti elementiltä alkuperäisen
vektorin elementeillä, ja lasketaan yhteen.
Vielä systemaattisemmin: merkitään
′ v1
v1
v=
v′ =
v2
v2′
Rotaatio tasossa
Tärkeä tason lineaarikuvaus on rotaatio: vektorien kierto
kulman θ verran origon suhteen positiiviseen suuntaan.
Matriiseina
′ cos θx − sin θy
x
cos θ − sin θ
x
=
=
sin θx + cos θy
y
sin θ
cos θ
y′
eli x′ = R(θ)x.
Rotaatio kääntää vektoria muuttamatta sen pituutta:
|x′ | = |x|, kuten helposti nähdään.
Vektorien väliset kulmat säilyvät rotaatioissa (pituuden
lisäksi): jos x ja y ovat kaksi vektoria, niin
(R(θ)x) · (R(θ)y) = x · y
kuten suoraviivaisesti nähdään laskemalla.
Standardikannan kuvautuminen
Nyt
v1′
v2′
=
a11
a21
a12
a22
v1
v2
tai lyhyesti ja ytimekkäästi
X
vi′ =
aij vj = aij vj
Rn :n standardikanta e1 . . . en on sellainen jossa


0
 .. 
 . 



k:s rivi
ek = 
 1 
 . 
.
 . 
0
j
Yleinen lineaarikuvaus Rn → Rm
Kuvaus A : Rn → Rm voidaan myös esittää
matriisimuodossa: jos y ∈ Rm ja x ∈ Rn , niin
y = Ax ⇔ yi =
eli eksplisiittisesti

 
a11
y1
 y2   a21

 
 ..  =  ..
 .   .
am1
ym
n
X
j=1
eli (ek )i = δki (vektorin ek elementti i).
Se kuvautuu lineaarikuvauksessa A seuraavasti:
X
X
(Aek )i =
aij (ek )j =
aij δkj = aik
aij xj , 1 ≤ j ≤ m
j
a12
a22
···
···
a1n
a2n
..
.
am2
···
amn





x1
x2
..
.
xn

eli




j



Aek = 

73
a1k
a2k
..
.
ank





Tuloksena on siis A:n pystyrivin k alkioista muodostuva
vektori.
Kääntäen, jos tunnemme kuinka standardikanta kuvautuu
lineaarikuvauksessa A, saamme A:n matriisiesityksen. Siis
jos tiedämme, että
Aek = fk ,
täytyy olla

(f1 )1
 (f1 )2

A=
..

.
(f1 )n
(f2 )1
(f2 )2
···
···
(fn )1
(fn )2
..
.
(f2 )n
···
(fn )n



 = (f1 , f2 , · · · , fn )

Eli: tulomatriisin elementti ij, (AB)ij , saadaan
kertomalla A:n i:s vaakarivi ja B:n j:s pystyrivi alkio
alkiolta keskenään ja laskemalla yhteen.
Tämä on helppo näyttää tutkimalla mielivaltaisen
vektorin v ∈ Rn kuvausta:
(ABv)i = (A(Bv))i = Aij (Bv)j = Aij Bjk vk
ja toisaalta (ABv)i = (AB)ik vk .
Huom: matriiseille ei yleensä päde AB = BA! Sanotaan
että matriisitulo ei kommutoi.
Huom: Jos B on m × 1-matriisi, matriisitulo AB palautuu
matriisin ja vektorin tuloksi. Siis vektori = matriisi, jossa
on vain yksi pystyrivi.
Esim. Olkoon lineaarikuvaukset A : R3 → R2 ja
B : R2 → R3 , ja niiden matriisiesitykset


1 1
0 1 0
A=
, B= 0 2 
1 0 1
1 0
missä viimeinen merkintätapa tarkoittaa että kyseessä on
vektoreista fi koottu matriisi.
Esim. Etsi R3 :n lineaarikuvauksen matriisi, joka vie
standardikannan i, j, k vektoreiksi


 
 
0
1
1
Ai =  1  ≡ f1 , Aj =  0  ≡ f2 , Ak =  0  ≡ f3
Nyt
1
1
0
Edellisen mukaan siis on oltava


1 1 0
A =  1 0 0  = (f1 , f2 , f3 )
0 1 1
9.3 Kuvausten yhdistäminen: matriisien
kertolasku
Kuten yhdistetyissä funktioissa yleensä, matriiseilla
voidaan myös tehdä yhdistetty kuvaus: olkoon
lineaarikuvaukset
A : Rs → Rm ja
B : Rn → Rs
Nyt yhdistetty kuvaus AB : Rn → Rm on lineaarikuvaus.
Kuvauksen AB matriisi on A:n m × s -matriisin ja B:n
s × n-matriisin matriisitulo. Sen saamme
(AB)ij =
s
X
Aik Bkj = Aik Bkj
k=1
Huom: B:ssä on oltava sama määrä vaakarivejä kuin
A:ssa on pystyrivejä (s), muuten matriisituloa ei ole
määritelty!
Siis


·
·
·
 · (AB)ij ·  =
·
·
·


· B1j ·


·
·
·
·
 · B2j · 

 Ai1 Ai2 · · · Ais  


..
 ·
.
· 
·
·
·
·
· Bsj ·
AB
=
=
=
0 1
1 0
0
1

1 1
 0 2 
1 0

0·1+1·0+0·1
1·1+0·0+1·1
0 2
2 1
0·1+1·2+0·0
1·1+0·2+1·0
on kuvaus R2 → R2 ja

1 1
BA =  2 0
0 1

1
2 
0
on kuvaus R3 → R3 .
Sen sijaan tulot AA tai BB eivät ole määriteltyjä,
johtuen siitä että A ja B eivät ole neliömatriiseja.
Esim. Rotaatioiden yhdistäminen
Rotaatiomatriisi tasossa oli
cos θ − sin θ
R(θ) =
sin θ
cos θ
Jos teemme peräkkäin kaksi rotaatiota, niin matriisituloa
ja sinin ja kosinin laskusääntöjä käyttäen saamme (HT)
R(θ2 )R(θ1 ) = R(θ1 + θ2 )
9.4 Matriisilaskentoa
Matriiseille (ja niiden määrittämille lineaarikuvauksille)
on määritelty
Yhteenlasku: (A + B)ij = Aij + Bij . Tässä A:n ja B:n
täytyy olla samankokoisia (m × n) matriiseja.
74
Skalaarilla kertominen: (λA)ij = λAij .
Matriisien kertolasku: (AB)ij = Aik Bkj , missä A on n × r
ja B on r × m matriisi. Jos m 6= n, tule BA ei ole
määritelty.
Diagonaalimatriisi: neliömatriisia A sanotaan
diagonaaliseksi, jos se on muotoa



A=

A11
0
..
.
0
A22
···
···
0
0
0
0
···
Ann





Jos kaikki A11 = A22 = . . . = λ, voidaan A kirjoittaa
muotoon A = λI missä I on yksikkömatriisi Iij = δij .
Jos A on neliömatriisi, niin AI = IA = A.
Transpoosi AT
Kaikille matriiseille A voidaan määritellä transpoosi AT .
Sen elementit ovat
T
(A )ij = Aji
(joskus merkitään AT = Ã). Siis vaakarivit käännetään
pystyriveiksi ja päinvastoin.
Esim.
A=
1 2
4 5
3
6


1 4
⇒ AT =  2 5 
3 6
Jos A on n × m-matriisi, on AT m × n -matriisi.
Transpoosille on voimassa seuraava tärkeä tulos:
T
T
(ilman lihavointia x, kompaktiuden vuoksi). Tämä on siis
n × 1 -matriisi. Transponoimalla saamme vaakavektorin
xT = (x1 x2 · · · xn )
(1 × n -matriisi!)
Jos nyt x ja y ovat Rn :n (pysty)vektoreita, niin


x1


y T x = (y1 · · · yn )  ...  = yi xi = y · x
xn
y T x antaa siis vektoreiden pistetulon.
Jos taas kerrotaan pystyvektorilla vaakavektori, saadaan
matriisi:




x 1 y1 · · · x 1 yn
x1



.. 
..
xy T =  ...  (y1 · · · yn ) = 
. 
.
Todistus: nyt
[(AB)T ]ij = (AB)ji = Ajk Bki
Toisaalta
(B T AT )ij = (B T )ik (AT )kj = Bki Ajk = Ajk Bki .
Huom: viimeisessä vaiheessa järjestys voidaan vaihtaa,
sillä Ajk , Bki ovat pelkkiä lukuja (matriisin elementtejä),
eivät matriiseja! Yleensä matriisien järjestystä ei voida
vaihtaa.
Olkoon A neliömatriisi. Silloin A on
symmetrinen, jos AT = A eli Aij = Aji . (samat elementit
symmetrisesti diagonaalin molemmin puolin!)
antisymmetrinen, jos AT = −A eli Aij = −Aji .
Antisymmetristen matriisien diagonaalielementit
häviävät, ts. Aii = −Aii = 0.
Useimmat matriisit eivät ole symmetrisiä eivätkä
antisymmetrisiä.
Ilmeisesti pätee:
x n y1
xn
···
x n yn
tai (xy T )ij = xi yj .
Esim. Tason rotaatioille pätee RT R = I, mikä nähdään
suoraan laskemalla. Sen saa myös siitä että rotaatiot
säilyttävät pistetulon:
y T x = (Ry)T (Rx) = y T RT Rx ⇒ RT R = I
T
(AB) = B A
(AT )T = A,
vektorit: Otetaan nyt käyttöön merkintätapa Rn :n
pystyvektoreille


x1
 x2 


x= . 
 .. 
xn
Tässä tapauksessa sanotaan että RT on R:n
käänteismatriisi.
Konjugaatti A∗
Yleistetään lineaarikuvaukset kompleksisiin avaruuksiin,
ts. olkoon A : C n → C m . Nyt A:ta voidaan kuvata
matriisilla jonka elementit ovat kompleksilukuja. Tälle
matriisille ovat voimassa kaikki samat tulokset kuin yllä
reaaliselle matriisillekin.
Matriisin A konjugaatti A∗ on matriisi jonka kaikki
elementit ovat A:n elementtien kompleksikonjugaatteja:
(A∗ )ij = A∗ij
Jos pätee A∗ = A, matriisi on reaalimatriisi.
Hermiittinen konjugaatti A†
Hermiittinen konjugointi on transpoosin ja konjugoinnin
yhdistelmä:
A† = (A∗ )T = (AT )∗ ,
(A + B)T = AT + B T
75
(A† )ij = (Aji )∗
A on hermiittinen, jos A† = A, ja antihermiittinen, jos
A† = −A.
Ominaisuuksia:
(A† )† = A,
(A + B)† = A† + B † ,
(AB)† = B † A†
Esim. Paulin spinmatriisit
σ1 =
0
1
1
0
, σ2 =
0
i
−i
0
, σ3 =
1
0
0
−1
σ1 ja σ3 ovat symmetrisiä: σ1T = σ1 , σ3T = σ3 .
σ2 on antisymmetrinen: σ2T = −σ2 .
σ1 ja σ3 ovat reaalimatriiseja: σ1∗ = σ1
Kaikki σi ovat hermiittisiä, esim. σ2† = σ2 .
Jos x, y ∈ C n eli ovat n-komponenttisia
kompleksivektoreita, niin niiden sisätulo (eli pistetulo)
voidaan esittää muodossa
x† y = x∗i yi ,
y † x = yi∗ xi = (x† y)∗
Käänteismatriisi A−1
Olkoot A ja B n × n -neliömatriiseja. Jos pätee
AB = BA = I
matriisia B kutsutaan A:n käänteismatriisiksi ja
merkitään A−1 . Siis
A−1 A = AA−1 = I
Huom. Kaikille neliömatriiseille ei löydy
käänteismatriisia.
Jos A−1 on olemassa, sanotaan että A on säännöllinen eli
kääntyvä
Jos A−1 ei ole olemassa, A on singulaarinen tai
ei-säännöllinen.
Käänteismatriisi on yksikäsitteinen: jos sekä B että C
ovat A:n käänteismatriiseja, niin välttämättä B = C.
Todistus: B(AC) = (BA)C ⇒ BI = IC ⇒ B = C.
76
Käänteismatriiseille pätee
Esim. Paulin spinmatriisit ovat kaikki unitaarisia: esim.
(AB)−1 = B −1 A−1
σ1† σ1 =
Todistus:
(B −1 A−1 )(AB) = B −1 B = I, ja
(AB)(B −1 A−1 ) = A−1 A = I.
Siis (AB)−1 = B −1 A−1 .
Jos käänteismatriisi on olemassa, niin pätee
(AT )−1 = (A−1 )T ,
−1 T
T
T
−1 T
Tod. (A ) A = (AA ) = I = I, eli (A ) on
AT :n käänteismatriisi.
Ei-singulaarisen matriisin käänteismatriisin löytäminen ei
ole aina kovin yksinkertaista. Myöhemmin palataan
konsteihin joilla käänteismatriisi voidaan löytää.
Suurten matriisien käänteismatriisien löytäminen
numeerisesti onkin oma tieteenalansa, ja yksi
tärkeimmistä numeeristen algoritmien luokasta.
Esim. Matriisi
1 1
A=
0 1
on säännöllinen, sen käänteismatriisi on
1 −1
−1
A =
0 1
AA−1 = A−1 A = I (tarkista!)
Matriisi
1
B=
1
0 1
1 0
=
1 0
0 1
9.5 Matriisin jälki Tr A ja determinantti
det A
Neliömatriisien jälki (engl. trace) ja sen determinantti
ovat tärkeimpiä matriiseja karakterisoivia lukuja. Ne ovat
määriteltyjä ainoastaan neliömatriiseille.
9.5.1 Jälki Tr A
Neliömatriisin jälki on sen diagonaalielementtien summa:
X
Tr A = A11 + A22 + . . . + Ann =
Aii
i
Jos A on n × m matriisi ja B on n × m-matriisi, niin AB
on n × n ja
Tr (AB) =
n
X
(AB)ii =
i=1
m
n X
X
Aij Bji
n
m X
X
Bji Aij
i=1 j=1
BA on taas m × m ja
Tr (BA) =
1
1
0 1
1 0
Samoin σ2† σ2 = I, σ3† σ3 = I.
σ1 ja σ3 ovat myös ortogonaalisia, mutta σ2 ei ole.
(A† )−1 = (A−1 )† .
−1 T
m
X
j=1
(BA)jj =
j=1 i=1
(Tai lyhyesti Tr (AB) = (AB)ii = Aij Bji jne.) Siis pätee
on puolestaan singulaarinen: jos C on mielivaltainen
Tr (AB) = Tr (BA)
2 × 2-matriisi,
mikä yleistyy muotoon
c11 c12
c11 + c21 c12 + c22
1 1
=
BC =
c21 c22
c11 + c21 c12 + c22
1 1
Tr (A1 A2 . . . Ak ) = Tr (Ak A1 . . . Ak−1 )
mikä selvästikään ei voi olla yksikkömatriisi millään cij :n
eli matriiseja voi permutoida syklisesti ilman että jälki
arvoilla.
muuttuu.
Neliömatriisi on ortogonaalinen, jos
Esim. Tr (ABC) = Tr (CAB) = Tr (BAC).
T
−1
Heti nähdään että myös
A =A .
Tr (A + B) = Tr A + Tr B
ja unitaarinen, jos
†
−1
A =A
Ortogonaaliset matriisit säilyttävät reaalivektorien
pistetulon:
(Ay)T (Ax) = y T AT Ax = y T A−1 Ax = y T x
ja unitaariset matriisit kompleksivektorien:
(Ay)† (Ax) = y † A† Ax = y † x
Huom: jos A on reaalimatriisi, AT = A† .
9.5.2 Determinantti det A
Tarkastellaan tason lineaarikuvausta
y1
1 1
x1
y = Ax ⇔
=
y2
x2
−1 2
Tämä kuvaa tason neliöt suunnikkaiksi (yleinen
lineaarikuvausten ominaisuus!). Esim. yksikköneliö
kuvautuu seuraavasti:
77
(0, 0) → (0, 0)
(1, 0) → (1, −1)
(0, 1) → (1, 2)
(1, 1) → (2, 1)
Nämä pisteet muodostavat todellakin suunnikkaan
(piirrä!). Yksikköneliön pinta-ala on 1, ja suunnikkaan
pinta-ala saadaan esim. ristitulosta
Determinantin määritelmästä voidaan suoraviivaisesti
nähdä
det(. . . , Ai , . . . , Aj , . . .) = − det(. . . , Aj , . . . , Ai , . . .)
eli determinantti vaihtaa etumerkkiä jos kaksi pystyriviä
(tai vaakariviä) vaihdetaan keskenään.
det(A1 , . . . , λAi , . . .) = λ det(A1 , . . . , Ai , . . .)
i
|(1, −1) × (1, 2)| = 1
1
j k −1 0 = |1 × 2 + 1 × 1| = 3
2 0 Huomataan myös että det A = 2 + 1 = 3.
Tämä tulos pätee täysin yleisesti: mielivaltainen 2 × 2
matriisi A kuvaa pinta-alan a pinta-alaksi a det(A).
Tämä yleistyy: n × n-matriisi A kuvaa n-ulotteisen
tilavuuselementin detA-kertaiseksi, missä detA on
matriisin determinantti.
Vertaa Jacobin determinanttiin! Se pohjautuu juuri tähän
tulokseen.
Katsotaan nyt kuinka determinantti lasketaan.
2 × 2 ja 3 × 3-matriisien determinantti tuli jo tutuksi
vektorien kolmitulon yhteydessä. Yleisesti n × n-matriisin
A determinantti on
det A =
n
X
ijk...=1
ǫijk... A1i A2j A3k . . .
missä λ on reaali- tai kompleksiluku. Tästä seuraa
det(λA) = λn det A
jos A on n × n matriisi.
Determinantin kehittäminen vaakarivin suhteen:
Determinantti voidaan kehittää mielivaltaisen vaakarivin
i suhteen seuraavasti:
det A =
n
X
Aij cofAij
j=1
missä kofaktori on
cofAij = (−1)i+j Dij
(9.1)
ja missä Dij on sen (n − 1) × (n − 1) matriisin
determinantti mikä saadaan poistamalla matriisista A
vaakarivi i ja pystyrivi j. Tätä sääntöä käytettiin
aiemmin 3 × 3 matriisien determinantteihin.
Tämä pätee myös mielivaltaisille pystyriville j:
missä indeksejä ijk . . . on n kappaletta. Tässä ǫijk... on
n
Levi-Civita symboli:
X

Aij cofAij
det A =
kun ijk . . . on 123 . . . parillinen permutaatio
 +1,
i=1
−1,
kun ijk . . . on 123 . . . pariton permutaatio
ǫijk... =

Determinantille pätee:
0,
kun mikä tahansa indeksi toistuu
det A = 0, jos A:ssa on kaksi samaa vaaka- tai pystyriviä
Siis: valitaan matriisin jokaiselta vaakariviltä yksi alkio
det A ei muutu, jos sen johonkin vaaka/pystyriviin
siten, että ne ovat aina eri pystyriveiltä ja kerrotaan
lisätään tai siitä vähennetään muiden vaaka/pystyrivien
keskenään. Jos rivit ovat 123. . . :n pariton permutaatio
mielivaltainen lineaarikombinaatio
kerrotaan -1:llä. Käydään läpi kaikki permutaatiot ja
Näitä sääntöjä voidaan käyttää determinanttien
summataan yhteen.
“sieventämiseen” ja oikomaan niiden laskemista.
Esim. 2 × 2-matriisin determinanttiNyt ǫ12 = −ǫ21 = 1,
Esim. Lasketaan
ǫ11 = ǫ22 = 0.
1 0 3 1 1 2 3 1 a11 a12
det A = det
0 1 1 1 a21 a22
−1 1 1 0 2
X
ǫij a1i a2j
=
lisäämällä ja vähentämällä lineaarikombinaatioita niin
ij=1
että 1. vaakarivi tulee nollaksi, paitsi 1. elementti.
= ǫ11 a11 a21 + ǫ12 a11 a22 + ǫ21 a12 a21 + ǫ22 a12 a22
Vähennetään 3×(pystyrivi 1) pystyrivistä 3, vähennetään
= a11 a22 − a12 a21
pystyrivi 1 pystyrivistä 4, ja kehitetään 1. vaakarivin
suhteen:
mikä on sama tulos kuin aiemmin. Samoin 3 × 3
1 0 0 0 -matriisin determinantti palautuu vanhaan tulokseen.
2 0 0 1 2 0 0 Kirjoitetaan mukavuuden vuoksi matriisi A pystyriviensä
= (−1)1+1 1 × 1 1 1 = Ai avulla:
0
1
1
1
1 4 1 −1 1 4 1 A = (A1 , A2 , . . . , An )
78
vaivattomin tapa laskea sitä (suurille matriiseille), vaan
käytetään esim. Gaussin eliminointimenetelmää
(myöhemmin).
Esim. 2 × 2 matriisin käänteismatriisi: Olkoon
a b
,
det A 6= 0
A=
c d
Kehitetään jälleen 1. rivin suhteen:
1+1 1 1 = 2(1 − 4) = −6
= (−1) 2 4 1 HUOM: kuten yllä, determinanttia merkitään usein
samalla merkinnällä kuin itseisarvoa: |A| = det A. Tällöin
determinantin itseisarvoa merkitään ||A||.
Matriisien tulon determinantille pätee tärkeä tulos
Nyt Dij on se determinantti mikä saadaan poistamalla
A:sta rivi i ja pystyrivi j. 2 × 2 matriiseille tämä on
yksinkertaisesti
d c
D=
b a
det(AB) = det A det B
Tämän näkee suoraviivaisella mutta hieman työläällä
pyörittämisellä, ja jätetään todistus tässä väliin.
Nyt siis
Käänteismatriisi ja determinantti
(A−1 )ij =
Determinantti ilmoittaa suoraan onko matriisi A
säännöllinen, ts. löytyykö A−1 :
det A 6= 0 ⇔ A säännöllinen ⇔ A−1 olemassa
Käänteismatriisin elementit ovat
eli
A−1 =
cof Aji
(−1)i+j Dji
=
det A
det A
(A−1 )ij =
X
Aik cof Aik
ja
Ajk cof Aik = δji det A
(A−1 )ij =
k
sillä jos j 6= i, niin kaavan vasen puoli vastaa sellaisen matriisin
determinanttia mikä saadaan A:sta korvaamalla rivi i rivillä j.
Koska nyt matriisissa on kaksi samaa vaakariviä, sen
determinantti = 0.
k
eli
Ajk
−b
a
=
1
ad − bc
1 2
2 3
d
−c
−b
a
1
(−1)i+j Dji =
det A
eli
A−1 =
Jakamalla det A:lla saadaan
X
d
−c
Nyt det A = −1 6= 0, siis A−1 on olemassa. Nyt
3 2
D=
2 1
k
Nyt huomataan että
A=
Näytetään tämä: muistetaan että
det A =
1
det A
Esim.
missä kofaktorit määriteltiin kaavassa (9.1). Huomaa
että kofaktorin indeksit tulevat “väärässä” järjestyksessä.
X
(−1)i+j Dji
det A
X
cof Aik
Ajk Bki = δji
=
det A
−3 2
2 −1
9.6 Lineaariset yhtälöryhmät
Monissa yhteyksissä tapaamme lineaarisen yhtälöryhmän,
esim.
k
AB = I
A11 x1 + A12 x2
A21 x1 + A22 x2
missä Bki = cof Aik / det A.
Tämä näytti että jos det A on olemassa, käänteismatriisin lauseke
saadaan sen ja kofaktorin avulla.
Näytetään vielä että jos matriisi A on säännöllinen (siis
A−1 on olemassa), siitä seuraa että det A 6= 0:
det I = 1 = det(A−1 A) = det A det A−1 ⇒ det A 6= 0.
Lisäksi nähdään
det A−1 = 1/ det A
HUOM: yllä esitetty tapa antaa käänteismatriisin
suljetussa muodossa. Se ei kuitenkaan ole tavallisesti
=
=
b1
b2
eli lyhyesti
Ax = b
Tässä siis A on joku tunnettu kerroinmatriisi, b annettu
vektori ja halutaan ratkaista x.
Kukin kahdesta yo. yhtälöstä määrää suoran
(x1 , x2 )-koordinaateissa. Kahden yhtälön yhtälöryhmällä
siis pyritään määräämään suorien leikkauspiste.
Milloin yo. yhtälöryhmällä on ratkaisu? Jos nyt
det A 6= 0, käänteismatriisi A−1 on olemassa ja
A−1 Ax = x = A−1 b
79
on yhtälön ainoa ratkaisu.
Entä jos det A = A11 A22 − A12 A21 = 0? Tällöin ei yleensä
ratkaisua ole, ellei sitten käy niin että yllä molemmat
yhtälöistä ovat vakiokerrointa vaille samat. Nimittäin
tällöin A:n ensimmäinen ja toinen rivi ovat kerrointa
vaille samat, ja det A = 0. Tässä tapauksessa yhtälöt
määräävät saman suoran, ja ratkaisuja on äärettömästi:
x2 =
1
(b1 − A11 x1 )
A12
Siis:
a) jos det A 6= 0, suorat eivät ole yhdensuuntaisia ja ∃
ratkaisu x = A−1 b.
b) jos det A = 0, suorat ovat yhdensuuntaiset. Nyt
riippuu vektorista b kuvaavatko yhtälöt kahta
yhdensuuntaista suoraa (ei ratkaisua) vai samaa suoraa
(äärettömästi ratkaisuja).
Tämä kaikki yleistyy luonnollisesti n × n-matriiseihin.
Siis, jos det A 6= 0, yhtälöryhmällä
Ax = b
on yksikäsitteinen ratkaisu x = A−1 b. Erityisesti yhtälöllä
Ax = 0
on vain ratkaisu x = 0, jos det A 6= 0. Kirjoittamalla tämä
muotoon
X
X
Aij xj = 0 ⇒
Âj xj = 0
j
j
vain jos xj = 0, ja missä Âi on A:n pystyrivistä i
koostuva pystyvektori, niin nähdään seuraava tulos:
det A 6= 0 ⇔ A:n pystyvektorit lineaarisesti
riippumattomia.
Sama pätee myös vaakavektoreille.
9.6.1 Yhtälöryhmän ratkaisu
eliminointimenetelmällä
Olkoon meillä yhtälö (det A 6= 0)
×1/2
5
2 1
−5
1
−2
1 1/2
5/2
väh. rivi 1
1 −2 −5
1 1/2
5/2
0 −5/2
−15/2
× − 2/5
1 1/2
5/2
väh. rivi 2 ×1/2
0
1
3
1 0
1
0 1
3
Yhtälön ratkaisu on siis x = (1 3)T , mikä voidaan heti
tarkistaa.
Päämäärä on siis lisätä ja vähentää rivejä sopivasti
kerrottuina niin että vasemmalle saadaan yksikkömatriisi.
Esim.

1
 1
1

 

−1 1
x
0
1 −1   y  =  1 
2 −3
z
−1
Eliminoidaan



1 −1 1
0
 1 1 −1   1 
1 2 −3
−1



1 −1 1
0
 0 2 −2   1 
0 3 −4
−1



1/2
1 0 0
 0 1 −1   1/2 
−5/2
0 0 −1



1 0 0
1/2
 0 1 0  3 
0 0 1
5/2
Siis ratkaisu on

Tässä tapauksessa käänteismatriisia ei useimmiten
kannata laskea, vaan ratkaista yhtälöryhmä
eliminointimenetelmällä:

1/2
x= 3 
5/2
9.6.2 Matriisin kääntäminen Gaussin
eliminointimenetelmällä
Eliminointimenetelmällä voidaan (lähes) samalla vaivalla
ratkaista usea muotoa
Ax = bi ,
Esim.
2 1
1 −2
x
y
=
2x + y
x − 2y
−rv.3
×−1
Huom: jos matriisin det = 0, eliminointimenetelmä kertoo
sen: ei voida konstruoida I-matriisia.
Ax = b ⇒ x = A−1 b
−rv.1
−rv.1
+(1/2)rv.2
×1/2
−(3/2)rv.2
=
5
−5
Nyt det A = −5 6= 0, joten yhtälö kääntyy. Pyrkimyksenä
on eliminoida jälkimmäisestä yhtälöstä x lisäämällä
ensimmäinen yhtälö sopivasti kerrottuna. Lisäksi
ensimmäisestä eliminoidaan y. Tämä voidaa
systematisoida seuraavasti:
i = 1...n
oleva yhtälö: kirjoitetaan vain rinnan
(A)(b1 )(b2 ) . . .
ja eliminoidaan rivejä niin että A:n tilalle tulee
yksikkömatriisi, ja tehdään sama eliminointi kaikille bi .
Lopputuloksena voimme lukea bi :n paikalta yhtälöryhmän
Ax = bi ratkaisun.
80
Tämä toimii myös jos bi = êi , standardikannan vektori.
Nyt lopputuloksena saadaan A:n käänteismatriisi.
Esim. Edellisen esimerkin matriisin


1 −1 1
 1 1 −1 
1 2 −3
käänteismatriisi:



1 −1 1
1 0 0
 1 1 −1   0 1 0  −rv.1
1 2 −3
0 0 1
−rv.1



1 −1 1
1 0 0
+(1/2)rv.2
 0 2 −2   −1 1 0 
×1/2
0 3 −4
−1 0 1
−(3/2)rv.2



1 0 0
1/2
1/2 0
 0 1 −1   −1/2 1/2 0  −rv.3
×−1
1/2 −3/2 1
 0 0 −1 
1 0 0
1/2 1/2 0
 0 1 0   −1
2 −1 
0 0 1
−1/2 3/2 −1
Siis käänteismatriisi on


1/2 1/2 0
 −1
2
−1 
−1/2 3/2 −1
mikä nähdään kokeilemalla.
HUOM: joskus diagonaalille uhkaa tulla 0. Tämä ei ole
ongelma, sillä tähän riviin voidaan lisätä/vähentää
sopivasti joku alla olevista riveistä niin että diagonaalille
tulee 1. Jos tämä ei millään onnistu, on det = 0.
Usein eliminointi on helpompaa tehdä niin että ei tule
murtolukuja.
Esim. Matriisin


2 3 5
A= 1 2 4 
3 1 0
käänteismatriisi.



1 0 0
2 3 5
 1 2 4   0 1 0  ×2 − (rv.1)
−3 × (rv.2)
0 0 1
3 1 0



2 3
5
1
0 0
−3 × (rv.2)
 0 1
3   −1 2 0 
0 −3 
1
+5 × (rv.2)
 0 −5 −12

2 0 −4
4 −6 0
×3 + 4 × (rv.3)
 0 1 3   −1 2 0  −(rv.3)
 0 0 3   −5 7 1 
6 0 0
−8 10
4
×1/6
 0 1 0   4 −5 −1 
0 0 3
−5 7
1
×1/3



1 0 0
−4/3 5/3 2/3
 0 1 0  4
−5 −1 
0 0 1
−5/3 7/3 1/3
Käänteismatriisi on siis

−4
1
A−1 =  12
3
−5
5
−15
7

2
−3 
1
9.7 Ominaisarvot ja -vektorit
Jos A on n × n-matriisi, ja jos löytyy vektori x 6= 0 siten
että
Ax = λx
missä λ on skalaari (yleisesti kompleksiluku), sanotaan
että
x on A:n ominaisvektori ja
λ on vektoriin x liittyvä ominaisarvo
Ominaisvektorit siis säilyttävät suuntansa
lineaarikuvauksissa. Ne ovat aina erityisasemassa, ja
vastaavat kuvausten “pääakseleita”.
Ominaisarvoille pätee: A on säännöllinen ↔ A:n kaikki
ominaisarvot 6= 0.
Tod. Jos λ = 0, niin vastaava ominaisvektori Ax = 0.
Koska x 6= 0, tämä toteutuu jos ja vain jos det A = 0, siis
A ei ole säännöllinen.
Ominaisvektorit eivät ole yksikäsitteisiä: ne voidaa kertoa
vakiolla ja ne ovat edelleen ominaisvektoreita. Samalla
ominaisarvolla voi myös olla useita lineaarisesti
riippumattomia ominaisvektoreita.
Esim. Yksikkömatriisi I toteuttaa Ix = x kaikilla x. Siis
kaikki vektorit ovat sen ominaisvektoreita ominaisarvolla
1.
Pätee: A:n ominaisarvot ovat yhtälön
det(A − λI) = 0
juuret.
Tod. Jos λ on ominaisarvo, on
Ax = λx = λIx ⇒ (A − λI)x = 0. Tällä on ratkaisu kun
x 6= 0 vain jos det(A − λI) = 0.
Jos A on n × n-matriisi, det(A − λI) on n:n asteen
polynomi λ:n suhteen:
A11 − λ
A12
···
A1n
A21
A
−
λ
·
·
·
A
22
2n
det(A−λI) = ≡ Pn (λ)
..
.
An1
···
Ann − λ (9.2)
Yhtälö
Pn (λ) = 0
on A:n karakteristinen yhtälö, ja sen ratkaisut ovat A:n
ominaisarvot. Näiden avulla Pn voidaan kirjoittaa
muotoon
Pn (λ) = (−1)n (λ − λ1 )(λ − λ2 ) . . . ≡ (−1)n
81
n
Y
i=1
(λ − λi )
(9.3)
(nähdään kaavasta (9.2) että λn :n kerroin on (−1)n ).
Tästä seuraa että
Pn (0) =
n
Y
= −(2 − λ)(1 + λ)(1 − λ) + 4(1 − λ) + 6 − 3(1 − λ)
= −λ3 + 2λ2 − 6λ + 5 = (1 − λ)(λ2 − λ + 5) = 0
Ominaisarvot ovat siis
λi = det A
λ1 = 1,
i=1
λ2,3 =
√
1
1 1√
1 − 20 = (1 ± i 19)
±
2 2
2
Kertalukuun λn−1 on otettava (9.2) diagonaalilta kaikki
λ:t paitsi vuorollaan yksi Aii . Samoin karakteristisen
polynomin ekspansiosta (9.3):
X
X
termi λn−1 :
Aii (−λ)n−1 = (−λ)n−1
λi
Ominaisarvoa λ vastaava ominaisvektori saadaan
yhtälöstä
Av = λv
Siis saamme tulokset:
niin sen ominaisarvot ovat
1−λ
det(A − λI) = 2
i
det A =
λ1 λ2 . . . =
n
Y
λi
λ1 + λ2 + . . . =
n
X
Esim. Matriisin
A=
2 1
0 1
ominaisarvot:
2−λ
det(A − λI) = 0
1 = (2 − λ)(1 − λ) = 0
1−λ minkä ratkaisut ovat λ = 2 ja λ = 1. Tässä tapauksessa
karakteristinen yhtälö oli yksinkertainen.
Esim. Yleinen 2 × 2-matriisi
a b
,
A=
c d
Karakteristinen yhtälö on
a−λ
b
det(A − λI) = c
d−λ
1 = λ2 − λ + 2 = 0
−λ 2. ominaisvektori:
x2
x2
1 1
= −1
y2
2 0
y2
x2 + y2 = −x2
⇒
⇒ y2 = −2x2
2x2 = −y2
= λ2 − (a + d)λ + (ad − bc)
Siis ominaisarvoa λ2 = −1 vastaava ominaisvektori
v2 = vakio
Huom: tämä pätee vain 2 × 2-matriiseille.

−2 3
−1 0 
1 1
2−λ
−2
3
−1 − λ
0
ominaisarvot: det(A − λI) = 2
−1
1
1 − λ
−1 − λ
2
0
0
− (−2) +
= (2 − λ) 1 1−λ
−1 1 − λ 2 −1 − λ 3 −1
1
1
−2
Ominaisvektorit on usein tapana normittaa: määrätään
vakio niin että |v| = 1. Edellä normitetut vektorit ovat siis
1
1
1
1
v2 = √
v1 = √
1
−2
2
5
Esim. Etsitään matriisin
2
A= 2
−1
1 1
2 0
minkä ratkaisu on x1 = y1 (molemmista sama ehto). Siis
ominaisarvoa λ1 = 2 vastaava ominaisvektori
1
v1 = vakio
1
λ2 − Tr Aλ + det A = 0

joten ominaisarvot λ1 = 2, λ2 = −1.
1. Ominaisvektori:
1 1
x1
x1
=2
y1
y1
2 0
x1 + y1 = 2x1
⇒
2x1 = 2y1
λi
i=1
=
A=
i
i=1
Tr A =
Esim. jos
Pystyvektorit ovat ortogonaalisia, jos niiden välinen
pistetulo (sisätulo) häviää:
x† y =
n
X
x∗i yi = 0
i=1
Olkoon matriisi A hermiittinen, ts. A† = A. Sille pätee
82
Hermiittisen matriisin ominaisarvot ovat reaaliset, ja eri
ominaisarvoja vastaavat ominaisvektorit ortogonaaliset
Tod. Olkoon Ax = λx. Nyt
x† Ax = λx† x
ja toisaalta
x† Ax = x† A† x = (Ax)† x = (λx)† x = λ∗ x† x
Siis λ∗ = λ.
Olkoon nyt λ1 , λ2 kaksi erisuurta ominaisarvoa, ja niiden
ominaisvektorit x1 , x2 . Nyt
x†2 Ax1 = λ1 x†2 x1 .
Toisaalta
x†2 A† x1 = (Ax2 )† x1 = λ2 x†2 x1
Koska λ2 6= λ1 , tämä voi pitää paikkansa vain jos
x†2 x1 = 0.
Liite A. Kreikkalaiset kirjaimet
Pienet kirjaimet
α alfa
β beta
γ gamma
δ delta
ǫ epsilon
ζ zeta
η eta
ψ psi
Isot kirjaimet
Γ Gamma
∆ Delta
Θ Theta
Ψ Psi
83
θ
ι
κ
λ
µ
ν
ξ
ω
theta
iota
kappa
lambda
my
ny
xi
omega
π
ρ
σ
τ
υ
φ
χ
Λ
Ξ
Π
Ω
Lambda
Xi
Pi
Omega
Σ
Υ
Φ
pi
ro
sigma
tau
ypsilon
fi
khi
Sigma
Ypsilon
Fi
Liite B. Joukko-oppia
Joukko koostuu alkioista (jäsenistä, elementeistä). Kun
halutaan ilmoittaa, että joukon A alkiot ovat a1 , a2 , . . .
käytetään usein merkintää
A = {a1 , a2 , . . .}.
Joukko voi olla tyhjä, ts. siinä ei ole yhtään jäsentä.
Tyhjästä joukosta käytetään merkintää ∅.
Jos joukon A jäsenet toteuttavat jonkun tietyn ehdon,
merkitään
A = {x|ehto x:lle}.
Esimerkiksi
I = {x|0 ≤ x ≤ 1}
on välillä 0 ja 1 olevien (reaali)lukujen joukko.
Merkintä a ∈ A ilmoittaa, että a on joukon A jäsen, a
kuuluu joukkoon A. Jos kaikki joukon A alkiot ovat myös
joukon B alkioita, merkitään A ⊂ B (B ⊃ A) ja
sanotaan, että A kuuluu joukkoon B tai että A on joukon
B osajoukko.
Joukkojen A ja B yhtäsuuruus tarkoittaa, että
molemmissa joukoissa on samat jäsenet, ts. A ⊂ B ja
B ⊂ A. Luonnollinen merkintä yhtäsuuruudelle on A = B.
Kahden joukon A ja B yhteisistä jäsenistä koostuvaa
joukkoa A ∩ B sanotaan leikkaukseksi. Ilmeisestikin on
voimassa A ∩ B = B ∩ A, A ∩ B ⊂ A ja A ∩ B ⊂ B.
Yhdiste A ∪ B on molempien joukkojen A ja B alkioista
koostuva joukko. Se toteuttaa mm. relaatiot
A ∪ B = B ∪ A, A ⊂ A ∪ B ja B ⊂ A ∪ B.
Liite C. Kvanttorit
Matematiikassa käytetään usein ilmauksia on olemassa
ja kaikilla. Esimerkkilauseita voisivat olla vaikkapa: on
olemassa sellainen reaaliluku x, että x2 = a kun a ≥ 0
tai
kaikilla reaaliluvuilla x on voimassa x2 ≥ 0.
Päästään hieman vähemmällä kirjoittamisella, kun
otetaan käyttöön formaalin logiikan kvanttorit ∃ ja ∀
ilmaisemaan olemassaoloa (eksistenssiä) ja
yleispätevyyttä (universaalisuutta). Kvanttoreiden avulla
esimerkkilauseet voitaisiin kirjoittaa vaikkapa muotoihin
∃x ∈ R siten, että x2 = a kun a ≥ 0
ja
x2 ≥ 0 ∀x ∈ R.
Symbolilla R on tässä merkitty reaalilukujen joukkoa.
84
Liite D. Intervalleja, jatkuvuuksia, . . .
Reaaliakselin yhtenäisistä osista intervalleista käytetään
usein merkintöjä
suljettu väli [a, b] tarkoittaa reaaliakselin väliä
a ≤ x ≤ b, ts. alku- ja loppupisteet kuuluvat mukaan.
avoin väli (a, b) tarkoittaa väliä a < x < b, ts. alku- ja
loppupisteet eivät kuulu väliin.
puoliavoimet välit (a, b] ja [a, b) tarkoittavat
vastaavasti välejä, joissa vain toinen päätepiste
kuuluu joukkoon.
Funktio f (x) on
rajoitettu jos tarkasteltavalla välillä on |f (x)| ≤ M ,
missä 0 ≤ M < ∞.
jatkuva jos se ei ”hyppää”pisteestä toiseen,
paloittain jatkuva funktio jos se on jatkuva muualla
paitsi mahdollisesti äärellisen monessa tarkasteltavan
välin pisteessä.
85