1. Vektorit Projektioita Ax , . . . sanotaan vektorin koordinaateiksi tai komponenenteiksi. Puhutaan myös vektorin komponenttiesityksestä. Koska vektorin paikalla ei ole merkitystä, voisimme siirtää kaikki vektorit valitsemamme koordinaatiston origoon, jolloin vektoria kuvaisivat sen kärjen koordinaatit. Kääntäen, mitä tahansa avaruuden pistettä voidaan pitää origosta lähtevän vektorin kärkenä. Tällöin puhutaan usein paikka- eli radiusvektorista. 1.1 Vektorin käsite Fysikaalisten suureiden spesifioimiseksi ei useinkaan pelkkä suureen koko ole riittävä. Esimerkiksi liikettä kuvattaessa on yleensä tarpeen kertoa myös liikkeen suunta kolmiulotteisessa avaruudessamme. Liikkeen puolestaan aiheuttaa johonkin suuntaan vaikuttava jonkin suuruinen voima. Tällaisia suureita kuvaamaan on luotu vektorit. Vektori on suure, jolla on suunta ja suuruus. Skalaari puolestaan on suure, jolla on vain suuruus. Graafisesti vektori esitetään nuolena, jonka kärki osoittaa vektorin suunnan ja pituus vektorin suuruuden. A x z A A C z A = ( A x,A y,A z) z C r = P ( x ,y ,z ) = ( x ,y ,z ) y x Kuva 1.2 Paikkavektori y C = ( C x,C y,C z) z C Esimerkiksi massapisteen paikkaa avaruudessa voisi kuvata paikkavektori y y B = ( B x,B y,B z) x B r = (x, y, z). Jos piste on liikkeessä, niin sen koordinaatit x, y ja z ovat ajan funktioita, joten paikkavektorin r kärkikin liikkuu ajan myötä: z x B B x y r = r(t) = (x(t), y(t), z(t)). Kuva 1.1 Vektorin esitys Määritelmän mukaan vektorin paikalla avaruudessa ei ole merkitystä. Esimerkiksi kuvan 1.1 kaikki kolme vektoria ovat samoja, ts. A = B = C. r (t0) r (t1) Merkintöjä Tekstissä vektoreita merkitään tavallisesti (mm. tässä esityksessä) lihavoitetuilla symboleilla (A, r,β, . . .). Käsin kirjoitettaessa vektoreiden päälle piirretään useimmiten yläviiva, Ā, joskus nuoli, ~ A. Valitussa koordinaatistossa vektori voidaan spesifioida esim. Kuva 1.3 Liikkuva piste • antamalla kaksi suuntakulmaa, vaikkapa vektorin ja z-akselin välinen kulma sekä vektorin xy-tasolla olevan projektion ja x-akselin välinen kulma, ja vektorin pituus. Liikkuvan pisteen nopeus v määräytyy ilmeisestikin . . sen . koordinaattien muutosnopeuksista x(t), y (t) ja z(t), ts. . . . v(t) = (x(t), y (t), z(t)). • antamalla vektorin koordinaattiakseleilla olevien projektioiden pituudet (merkki huomioiden). Jos vielä sovimme, että vektori derivoidaan derivoimalla sen komponentit, voimme kirjoittaa ytimekkäästi . Käytämme aluksi lähes yksinomaan jälkimmäistä esitystä. Vektorin A spesifioivat siis sen projektiot koordinaattiakseleille: kolmiulotteisessa avaruudessa reaalilukukolmikko (Ax , Ay , Az ), v(t) = r(t). Vektorin määritelmän perusteella vektorit a = (ax , ay , az ) ja b = (bx , by , bz ) ovat yhtäsuuria jos ja vain jos niiden vastinkomponentit ovat yhtäsuuria, ts. jos ja vain jos ax = bx , ay = by ja az = bz . Tällöin merkitään a = b. A = (Ax , Ay , Az ). 1 Vektorin ajatellaan olevan jotakin absoluuttista; vektori on olemassa ja pysyy samana käytettiinpä millaista koordinaatistoa tahansa tai toimittiinpa ilman koordinaatistoa. Vektorin esitys komponenttimuodossa sen sijaan riippuu valitusta koordinaatistosta. Mittakaava ja koordinaattiakseleiden suunnat vaikuttavat vektorin komponentteihin. Esimerkiksi vektoreiden yhtäsuuruudesta päätettäessä on pidettävä huoli siitä, että ne esitetään samassa koordinaatistossa. A A B Määritellään nollavektori siten, että = (0, 0, 0). A + B B A -B A (1.1) B 2 (A A + A x (A y + A z )1 /2 Kuva 1.5 Vektorien yhteen- ja vähennyslasku A A x x A 2 2 2 + A y Graafisesti kahden vektorin A ja B summa siis muodostetaan siirtämällä esim. vektori B siten, että sen kanta yhtyy vektorin A kärkeen. Summa- eli resultanttivektori A + B on silloin vektorin A kannasta vektorin B kärkeen ulottuva vektori. Erotusvektori voidaan puolestaan muodostaa siten, että siirretään molempien vektorien kannat samaan kohtaan. Erotus A − B on nyt vektorin B kärjestä vektorin A kärkeen ulottuva vektori. z 2 1 /2 ) y Kuva 1.4 Vektorin pituus Laskutoimitusten ominaisuuksia Vektorin suuruus on sama kuin vektorin pituus. Kuten kuvasta 1.4 nähdään, on vektorin A = (Ax , Ay , Az ) pituus |A| Pythagoraan lauseen mukaan q |A| = A2x + A2y + A2z . (1.2) Suoraan määritelmistä on helppo todeta, että • Vektoreiden yhteenlasku on kommutatiivinen, ts. A + B = B + A. • Vektoreiden yhteenlasku on assosiatiivinen, ts. Hyvin usein vektorista käytetty symboli ilman vektorimerkintää tarkoittaa ko. vektorin pituutta, esim. A = |A|. Ilmeisestikin A = jos ja vain jos |A| = 0. Tämän vuoksi hyvin usein jätetään vektorimerkintä pois nollavektorista. A + (B + C) = (A + B) + C. Sulut voidaan siis tämän kaltaisissa lausekkeissa jättää merkitsemättä. 1.2 Vektorialgebra • Skalaarilla kertominen on distributiivinen, ts. Skalaarilla kertominen λ(A + B) = λA + λB. Olkoon A = (Ax , Ay , Az ) jokin vektori ja λ jokin reaalinen vakio. Silloin λA on vektori Yksikkövektorit λA = (λAx , λAy , λAz ). (1.3) Yksikkövektori on sellainen√vektori, jonka pituus on yksi. Esim. Vektorin A = (5, 3, 2) suuntainen yksikkövektori Vektorin A pituus A on q √ 2 √ A = |A| = 52 + 32 + 2 = 36 = 6. Skalaarilla λ kerrottaessa vektori siis säilyttää suuntansa jos λ > 0 tai kääntyy vastakkaiseen suuntaan jos λ < 0. Vektorin pituus muuttuu vakiolla λ kerrottaessa kuten |λA| = |λ||A|. Tällöin vektori Yhteen- ja vähennyslasku a= Vektorien A = (Ax , Ay , Az ) ja B = (Bx , By , Bz ) summan määrittelee yhtälö A + B = (Ax + Bx , Ay + By , Az + Bz ). on vektorin A suuntainen. Se on ilmeisestikin myös yksikön mittainen, sillä 1 1 1 |a| = A = |A| = A = 1. A A A (1.4) ja erotuksen yhtälö A−B = = A + (−1)B (Ax − Bx , Ay − By , Az − Bz ). √ 1 1 5 1 1 A = (5, 3, 2) = ( , , √ ) A 6 6 2 3 2 (1.5) 2 Esim. Cauchy-Schwartzin epäyhtälö Olkoot A ja B nollasta poikkeavia vektoreita ja λ mielivaltainen skalaari. Tarkastellaan vektoreiden λA ja B resultanttia λA + B ja erikoisesti sen pituuden neliötä Yksikkövektorit erotetaan usein kirjoittamalla ˆ-merkki vektorin yläpuolelle, kuten esim. b̂. Jos samassa yhteydessä puhutaan myös vektorista b, niin silloin b̂ tarkoittaa yleensä vektorin b suuntaista yksikkövektoria. Koordinaattiakseleiden suuntaisia yksikkövektoreita sanotáan yksikkökoordinaattivektoreiksi tai lyhyesti kantavektoreiksi. Niitä merkitään usein kuten ex ey ez = = = (1, 0, 0) (0, 1, 0) (0, 0, 1). q(λ) = |λA + B|2 . Kuten näimme, vektorin pituuden neliö on vektorin skalaaritulo itsensä kanssa, ts. (1.6) q(λ) = = . Toinen hyvin paljon käytetty merkitsemistapa on i = ex , j = ey ja k = ez . (1.7) = Koska vektori voidaan kirjoittaa kuten A = = (Ax , Ay , Az ) (Ax , 0, 0) + (0, Ay , 0) + (0, 0, Az ) = Ax (1, 0, 0) + Ay (0, 1, 0) + Az (0, 0, 1), = = Ax ex + Ay ey + Az ez Ax i + Ay j + Az k. 1.3.1 Pistetulo Vektoreiden A = (Ax , Ay , Az ) ja B = (Bx , By , Bz ) Pistetulon eli skalaaritulon A · B määrittelee kaava Tämän muodon ensimmäinen termi on neliönä aina ei-negatiivinen, joten funktiolla q(λ) on minimi kun neliötermi on minimissään. Valitsemalla λ = −A · B/|A|2 saadaan neliötermi häviämään joten funktion q(λ) minimi qmin on sama kuin jälkimmäinen termi. Pituuden neliönä q(λ) ei voi olla negatiivinen olipa λ mitä hyvänsä, joten myös sen minimille täytyy olla voimassa qmin ≥ 0. Siis on (1.8) Merkintä A2 tarkoittaa vektorin A skalaarituloa itsensä kanssa eli A2 = = λ2 A · A + λA · B + λB · A + B · B λ2 |A|2 + 2λA · B + |B|2 A·B 2 2 |A| λ + 2λ + |B|2 , |A|2 Hieman sieventäen ja ryhmittäen voimme kirjoittaa edellisen lausekkeen muotoon 2 A·B 2 q(λ) = |A| λ + |A|2 1 |A|2 |B|2 − (A · B)2 + 2 |A| 1.3 Vektoreiden tulot A · B = Ax Bx + Ay By + Az Bz . (λA + B) · (λA + B) missä olemme käyttäneet hyväksi skalaaritulon ominaisuksia (distributiivisuus, kommutatiivisuus jne.). Täydennetään sulkujen sisällä oleva lauseke neliöksi ja saadaan A · B (A · B)2 2 2 q(λ) = |A| λ + 2λ + |A|2 |A|4 2 (A · B) + |B|2 . − |A|2 saadaan sille komponenttiesitykset A = A · A = A2x + A2y + A2z |A|2 . |A|2 |B|2 − (A · B)2 ≥ 0. Vektorin pituus on siis ilmaistavissa skalaaritulon avulla kuten √ √ |A| = A · A = A2 . Tämä on kirjoitettavissa Cauchy-Schwartzin epäyhtälönä tunnettuun muotoon Suoraan määritelmästä nähdään, että pistetulo |A · B| ≤ |A||B|. • on kommutatiivinen, ts. A · B = B · A. Oletimme, että A 6= ja B 6= 0. Jos nyt jompi kumpi tai molemmat ovat nollia, niin epäyhtälö on edelleenkin voimassa (yhtäsuuruutena). Esim. Kolmioepäyhtälö Vektorit A, B ja A + B muodostavat kolmion, jonka sivujen pituudet ovat |A|, |B| ja |A + B|. Kääntäen, • on distributiivinen: A · (B + C) = A · B + A · C. • skalaarilla kerrottaessa toteuttaa relaatiot λ(A · B) = (λA) · B = A · (λB). 3 (1.9) jokainen kolmio voidaan esittää kahtena vektorina ja niiden resultanttina. A + B Edelleen Pythagoraan lausetta soveltaen saamme |A − B|2 B A = = = Kuva 1.6 Kolmioepäyhtälö = = ≤ ≤ = (A + B) · (A + B) |A|2 + 2A · B + |B|2 • vektorin A projektion pituus vektorilla B kertaa vektorin B pituus tai • vektorin B projektion pituus vektorilla A kertaa vektorin A pituus. Vektoreiden välisen kulman θ kosini on lausuttavissa pistetulon avulla kuten (1.10) joka kertoo sen tutun tosiasian, että kolmiossa kahden sivun summa on aina suurempi tai yhtäsuuri kuin kolmas sivu. cos θ = A·B . |A||B| (1.12) Ilmeisestikin vektorit A ja B ovat kohtisuorassa toisiaan vastaan jos A · B = 0 ja yhdensuuntaisia jos A · B = |A||B|. Erikoisesti kantavektoreille i, j ja k on voimassa i·j=i·k=j·k=0 Pistetulon geometrinen merkitys Tarkastellaan nyt vektoreiden A, B ja A − B muodostamaa kolmiota. A -B eli ne ovat toisiaan vastaan kohtisuorassa, ts. ortogonaalisia. Koska vielä on B h (1.11) Kuviosta 1.7 on luettavissa myös tulkinnat: A · B on missä viimeistä edellisessä muodossa olemme soveltaneet Cauchy-Schwarzin epäyhtälöä. Päädymme siten kolmioepäyhtälönä tunnettuun relaatioon A A2 + B 2 − 2AB cos θ. A · B = AB cos θ. |A|2 + 2|A · B| + |B|2 |A|2 + 2|A||B| + |B|2 (|A| + |B|)2 , |A + B| ≤ |A| + |B|, A2 − A2 cos2 θ +B 2 + A2 cos2 θ − 2AB cos θ Vertaamalla tätä aikaisempaan suureen |A − B|2 lausekkeeseen näemme, että Nyt on |A + B|2 h2 + (B − A cos θ)2 B -A c o sq i · i = j · j = k · k = 1, q sanotaan näiden kantavektoreiden olevan ortonormaalisia. Kirjoitetaan vektori A komponenttimuodossa A c o sq Kuva 1.7 Pistetulon geometrinen merkitys A = Ax i + Ay j + Az k. Sivun A − B pituuden neliö on |A − B|2 = = = Kantavektoreiden ortonormaalisuuden perusteella on mm. (A − B) · (A − B) A · i = Ax i · i + Ay j · i + Az k · i = Ax |A|2 + |B|2 − 2A · B A2 + B 2 − 2A · B, Vektorin komponentit voidaan siten lausua skalaarituloina Ax = A · i, Ay = A · j ja Az = A · k. missä A ja B tarkoittavat vektoreiden A ja B pituuksia. Kuviosta 1.7 nähdään, että vektoreiden A, B ja A − B muodostaman kolmion korkeuden h neliö on Kantavektoreiden ortonormaalisuudesta seuraa samoin se, että muodossa A = Ax i + Ay j + Az k ja B = Bx i + By j + Bz k esitettyjen vektoreiden skalaaritulo on A · B = Ax Bx + Ay By + Az Bz h2 = A2 − A2 cos2 θ, missä θ on vektoreiden A ja B välinen kulma. 4 Esim. Voiman F = 2i − j − k tekemä työ sen siirtäessä kappaletta vektorin r = 3i + 2j − 5k kannasta kärkeen Määritelmän mukaan voiman tekemä työ on siirroksen suuntainen voima kerrottuna siirron pituudella. eli yhtäpitävä määritelmän (1.8) kanssa. A k g a F b j i q Kuva 1.8 Suuntakulmat r F c o sq Vektorin ja yksikkövektorin i välisen kulman eli vektorin ja x-akselin välisen kulman α kosini on Kuva 1.9 Voiman tekemä työ A·i Ax cos α = = , |A||i| A Kuvan mukaisesti voiman F tekemä työ on W = (F cos θ)r. Pistetulon avulla tämä saadaan kirjoitettua muotoon missä A = |A|. Vastaavat lausekkeet saadaan vektorin ja y-akselin välisen kulman β sekä vektorin ja z-akselin välisen kulman γ kosineille. Näemme siis, että vektori on kirjoitettavissa suuntakulmiensa α, β ja γ avulla mm. muodossa A = A(cos α, cos β, cos γ). W = F · r. Tässä tapauksessa työ on siis W Olkoon nyt a vektori a= 1 A. A (2i − j − k) · (3i + 2j − 5k) (2)(3) + (−1)(2) + (−1)(−5) 6 − 2 + 5 = 9. Esim. Vektoria A = 2i + 3j + 6k vastaan kohtisuorassa Ensinnäkin on olevan ja vektorin B = i + 5j + 3k kärjen kautta kulkevan tason yhtälö 1 A2 = 1 A2 ja toiseksi vektorien a ja A väliselle kulmalle θaA on voimassa a·a= cos θaA = = = = 1 1 a·A = A · A = 1, |a||A| A A A joten a on vektorin A suuntainen yksikkövektori. Vektorin B projektio p vektorin A suuntaan voidaan nyt lausua yksikkövektorin a avulla kuten r 1 p = A · B = a · B. A B = 4i − 4j + 7k Vektorin B suuntainen yksikkövektori on b = = B 4i − 4j + 7k =p B 42 + (−4)2 + 72 4 4 7 i − j + k. 9 9 9 Kuva 1.10 Tason yhtälö Olkoon r jokin tason piste. Tällöin vektori B − r on jonkin vektoreitten r ja B kärkien kautta kulkevan tason suuntainen. Koska tason piti olla kohtisuorassa vektoria A vastaan, täytyy vektorin B − r olla kohtisuorassa vektoria A vastaan osoittipa r mihin tahansa tason pisteeseen. Saamme siis ehdon Vektorin A projektio tähän suuntaan on p = = B O Esim. Vektorin A = i − 2j + k projektio vektorille B -r 4 4 7 A · b = (i − 2j + k) · ( i − j + k) 9 9 9 4 7 19 4 . (1)( ) + (−2)(− ) + (1)( ) = 9 9 9 9 (B − r) · A = 0 5 tason pisteille r. Sijoittamalla tähän r = xi + yj + zk sekä vektoreiden A ja B eksplisiittiset lausekkeet saadaan 0 = = = 3. kuhunkin valitun rivin tai sarakkeen alkioon liittyy 2 × 2-alideterminantti, joka muodostetaan alkuperäisestä determinantista pyyhkimällä siitä pois ko. alkion kautta kulkeva vaaka- ja pystyrivi. ((1 − x)i + (5 − y)j + (3 − z)k) 4. käydään läpi kaikki valitun rivin tai sarakkeen alkiot kertoen keskenään alkio varustettuna siihen liittyvällä merkillä ja sen alideterminantti. Muodostettujen termien summa on determinantin arvo. ·(2i + 3j + 6k) −2x − 3y − 6z + (1)(2) + (5)(3) + (3)(6) −2x − 3y − 6z + 35. Esim. Determinantti Kysytyn tason yhtälö on siis D= 2x + 3y + 6z = 35. +(−2) A × B = (Ay Bz − Az By , Az Bx − Ax Bz , Ax By − Ay Bx ). (1.13) Vektoritulon muodostamista auttanee muistisääntö: Tulo A × B lasketaan siten, että kolmirivisen determinantin ylimmäksi riviksi kirjoitetaan kantavektorit i, j ja k (tässä järjestyksessä), keskimmäisen rivin muodostavat vektorin A komponentit Ax , Ay ja Az (tässä järjestyksessä) sekä alimman rivin vektorin B komponentit Bx , By ja Bz (tässä järjestyksessä), ts. i j k A × B = Ax Ay Az . (1.14) Bx By Bz a12 a22 . . . an2 ··· ··· .. . ··· a1n a2n . . . ann a12 a22 mukaisesti. + − + 2. valitaan jokin vaaka- tai pystyrivi. = (−2)[(1)(−3) − (4)(−2)] = −10. 2 4 2 1 1 −3 1 −2 = −3[(2)(−3) − (1)(4)] = 30 = 4[(2)(−2) − (1)(1)] = −20. D = (−10) + (30) + (−20) = 0. Determinantteihin liittyy useita laskusääntöjä. Tässä vaiheessa meille riittänee tieto siitä, että • determinantin merkki vaihtuu vaihdettaessa kaksi vaakariviä (tai kaksi pystyriviä) keskenään. • determinantti on nolla, jos sen kaksi vaakariviä (tai kaksi pystyriviä) ovat samoja. Kehitetään determinantti (1.14) ylimmän rivin mukaan, jolloin i j k Ax Ay Az = i Ay Az − j Ax Az By Bz Bx Bz Bx By Bz Ax Ay +k Bx By = (Ay Bz − Az By )i −(Ax Bz − Az Bx )j +(Ax By − Ay Bx )k. Nähdään, että tämä todellakin yhtyy määritelmään (1.13). Determinanttiesityksestä nähdään mm. ominaisuus i i j k j k A × B = Ax Ay Az = − Bx By Bz Bx By Bz Ax Ay Az = −B × A. 1. kuhunkin determinantin alkioon liittyy merkki taulukon − + − Determinantin arvo D on näiden termien summa eli ts. kaksirivisen determinantin arvo saadaan vähentämällä lävistäjäalkioden tulosta sivulävistäjäalkioiden tulo. Kolmirivinen determinantti lasketaan helpoimmin kehittämällä se alideterminanttien avulla: + − + +(4) =a a −a a , 11 22 12 21 −2 −3 ja alin alkio termin Meidän tarkoituksiimme riittävät kaksi- ja kolmiriviset determinantit. Kaksirivisen determinantin arvon määrittelee kaava a11 a21 1 4 −(3) olevia taulukoita. Niissä siis sarakkeiden ja rivien lukumäärä on sama. Puhutaan n × n-determinanteista tai n-rivisisistä determinanteista. Determinanteilla on lukuarvo. −2 3 4 Vastaavasti kehityssarakkeen toinen alkio antaa termin Determinanteista Determinantit ovat muotoa a11 a21 . . . an1 1 −2 −3 Kehitetään vaikkapa oikeanpuoleisimman sarakkeen mukaan. Tämän ylimpään alkioon −2 liittyy merkki +. Vastaava alideterminantti saadaan pyyhkimällä pois ylin rivi ja oikeanpuoleisin sarake. Päädymme termiin 1.3.2 Ristitulo Vektoreiden A = (Ax , Ay , Az ) ja B = (Bx , By , BZ ) ristitulon eli vektoritulon A × B määrittelee kaava 2 1 4 6 Siten ristitulon merkki vaihtuu vaihdettaessa tekijöiden järjestystä: (1.15) A × B = −B × A. Ristitulon geometrinen merkitys Vektorin A × B pituuden neliö on |A × B|2 Ristitulo ei siis ole kommutatiivinen. Ominaisuudesta (1.15) seuraa mm. |A × B|2 joten vektorin ristitulo itsensä kanssa on nolla, (1.16) = = (1.17) |A × B|2 = A2 B 2 (1 − cos2 θ) = A2 B 2 sin2 θ. Näemme siis, että ristitulovektorin A × B pituus on (1.18) |A × B| = AB| sin θ|. Vektoreiden A × B ja A skalaaritulo on A · (A × B) (1, 0, 0) × (0, 1, 0) = (0 − 0, 0 − 0, 1 − 0) (0, 0, 1) = k. = = = k i j = = Samalla tavoin voimme todeta, että muutkin kaavoista i×j j×k k×i −(Ax Bx + Ay By + Az Bz )2 . missä jälleen A ja B tarkoittavat vektoreiden A ja B pituuksia. Kirjoitetaan pistetulo vektoreiden välisen kulman θ avulla, jolloin Katsotaan, millaisia ovat yksikkövektoreiden ristitulot toistensa kanssa. Lasketaan esimerkkinä i×j (A2x + A2y + A2z )(Bx2 + By2 + Bz2 ) |A × B|2 = A2 B 2 − (A · B)2 , Skalaarilla kerrottaessa ristitulo noudattaa yhtälöä λ(A × B) = (λA) × B = A × (λB). = Tämä taas on sama kuin Suoraan määritelmästä nähdään vektoritulon distributiivisuus A × (B + C) = A × B + A × C. (Ay Bz − Az By )2 + (Az Bx − Ax Bz )2 +(Ax By − Ay Bx )2 . Suoraviivainen lasku osoittaa, että tämä voidaan kirjoittaa muotoon A × A = −A × A, A × A = 0. = Ax (Ay Bz − Az By ) +Ay (Az Bx − Ax Bz ) +Az (Ax By − Ay Bx ) 0. Samoin nähdään, että B · (A × B) = 0. Vektori A × B on siis kohtisuorassa molempia tekijöitään vastaan eli kohtisuorassa tekijöiden muodostamaa tasoa vastaan. Tulovektorin suunta on pääteltävissä yksikkövektoreitten ristituloista (1.19): Vektoreiden A ja B ristitulo on (1.19) pitävät paikkansa. Koordinaatistoa, jonka kantavektorit toteuttavat relaatiot (1.19) sanotaan oikeakätiseksi. z A × B = (|A||B| sin θ)n, (1.20) missä θ on vektoreiden välinen kulma ja n vektoreiden muodostamaa tasoa vastaan kohtisuorassa oleva sellainen yksikkövektori että vektoreiden A, B ja n kolmikko (tässä järjestyksessä) muodostaa oikeakätisen systeemin. Oikean käden kolmisormisääntö lienee havainnollisempi: Jos A osoittaa oikean käden peukalon suuntaan ja B etusormen suuntaan niin A × B osoittaa keskisormen suuntaan (ja on kohtisuorassa vektoreita A ja B vastaan). y x Kuva 1.11 Oikeakätinen koordinatisto A ´ B Oikeakätisessä xyz-koordinaatistossa z-akselin suuntainen oikeakätinen ruuvi postiiviseen kiertosuuntaan kierrettäessä (kierretään lyhintä kautta positiiviselta x-akselilta positiiviselle y-akselille) etenee positiivisen z-akselin suuntaan. Sama asia voidaan ilmaista myös ns. oikean käden kolmisormisääntönä: oikean käden peukalon osoittaessa x-akselin suuntaan ja etusormen y-akselin suuntaan osoittaa keskisormi z-akselin suunnan. B q |A ´ B | A Kuva 1.12 Ristitulon geometrinen merkitys 7 Kuvassa 1.12 vektoreiden A ja B muodostaman kolmion korkeus on B sin θ jos kolmion kantana pidetään vektoria A. Tämän kolmion pinta-ala on siten 21 AB sin θ, joten ristitulo on suuruudeltaan tekijävektoreiden muodostaman suunnikkaan pinta-ala. Esim. A = 2i − 3j − k ja B = i + 4j − 2k, a) A × B, b) B × A ja c) (A + B) × (A − B) a) i j k A × B = 2 −3 −1 1 4 −2 −3 −1 − j 2 −1 + k 2 −3 = i 4 −2 1 −2 1 4 = 10i + 3j + 11k. Vääntömomentin suunnasta on sovittu, että voiman kiertämä vaikutuspisteeseen asetettu vaikutustasoa (vektoreiden r ja F muodostama taso) vastaan kohtisuorassa oleva oikeakätinen ruuvi etenee vääntömomentin suuntaan. Voimme siis kirjoittaa M = r × F. w B×A = = = c) (A + B) × (A − B) = = = = = r s in q r q O w Kuva 1.14 Kulmanopeus ja lineaarinen nopeus Esim. Lineaarinen nopeus pyörivässä kappaleessa: Oletetaan, että kiinteä kappale pyörii origon O kautta kulkevan akselin ω ympäri kulmanopeudella ω. Vektori ω orientoidaan siten, että vektorin suuntaan katsottuna kappale pyörii myötäpäivään. Tarkastellaan kappaleen pistettä P . Kappaleen pyöriessä piste P seuraa sellaisen ympyrän kehää, joka on kohtisuorassa keskipisteensä kautta kulkevaa vektoria ω vastaan. Jos nyt r on pisteen P paikka sekä θ vektorien r ja ω välinen kulma, niin tämän ympyrän säde on r sin θ. Ympyräliikkeen lineaarinen nopeus on suuruudeltaan ympyrän säde kertaa kulmanopeus, ts. rω sin θ. Lineaarisen nopeuden suunta taas on ympyrän tangentin suuntainen eli nyt kohtisuorassa vektoreita ω ja r vastaan. Oikean käden kolmisormisäännön perusteella voimme siten kirjoittaa 4 −3 A × (A − B) +B × (A − B) A×A−A×B +B × A − B × B −A×B−A×B− −2A × B −20i − 6j − 22k. v = ω × r. M P v P b) i j k 1 4 −2 2 −3 −1 1 1 −2 4 −2 + k − j i 2 2 −1 −3 −1 −10i − 3j − 11k = −A × B. r s in q 1.3.3 Kolmitulot Skalaarikolmitulo F r Tarkastellaan muotoa A · (B × C) olevia kolmen vektórin tuloja. Vektoreiden A ja B × C pistetulona tämä on skalaari. Siksi sitä nimitetäänkin skalaarikolmituloksi. Skalaarikolmitulon geometrinen merkitys selvinnee alla olevasta kuvasta. q Kuva 1.13 Vääntömomentti Esim. Vääntömomentti: Määritelmän mukaan voiman B × C F vääntömomentti pisteen P suhteen on suuruudeltaan F kertaa pisteen P kohtisuora etäisyys voiman vaikutussuorasta. Olkoon nyt r pisteestä P voiman vaikutuspisteeseen suunnattu vektori ja θ tämän vektorin ja voiman välinen kulma. Kuvasta nähdään, että pisteen P kohtisuora etäisyys vaikutussuorasta on r| sin θ|, joten vääntömomentti on suuruudeltaan A h C B M = F r| sin θ| = |r × F|. Kuva 1.15 Skalaarikolmitulo 8 Vektoreiden A, B ja C muodostaman suuntaissärmiön tilavuus on pohjasuunnikkaan pinta-ala |B × C| kertaa särmiön korkeus h. Korkeus taas on vektorin A projektio pohjatasoa vastaan kohtisuoralle suunnalle, esim. vektorille B × C. Särmiön tilavuus V on siis V = |A · (B × C)|. Vektorikolmitulo Vektorikolmitulolla tarkoitetaan kolmen vektorin ristituloja A × (B × C) ja (A × B) × C. Nämä ovat yleensä erisuuria, joten sulkumerkit ovat oleellisia. Käsitellään edellistä muotoa olevia kolmituloja (jälkimmäisen käsittely menee samalla tavoin). Koska kyseessä on vektoreiden A ja B × C vektoritulo, on tuloskin vektori. Lasketaan näytteeksi sen x-komponentti: (1.21) Komponenttimuodossa skalaarikolmitulo on A · (B × C) = = = = eli (A × (B × C))x = i · (A × (B × C)) 1 0 A A x y = By Bz − Bx Bz Cx Cz Cy Cz (Ax i + Ay j + Az k) · i j k Bx By Bz Cx Cy Cz (Ax i + Ay j + Az k) · Bx Bz By Bz − j i Cx Cz Cy Cz B By +k x Cx Cy B Bz − Ay Bx Bz Ax y Cx Cz Cy Cz B By +Az x Cx Cy Ax Ay Az Bx By Bz Cx Cy Cz Ax A · (B × C) = Bx Cx Ay By Cy Az Bz . Cz = Ay (Bx Cy − By Cx ) + Az (Bx Cz − Bz Cx ) = Bx (Ax Cx + Ay Cy + Az Cz ) −Cx (Ax Bx + Ay By + Az Bz ) = (A · C)(B · i) − (A · B)(C · i) = i · [(A · C)B − (A · B)C] . Samalla tavoin voisimme laskea niin tämän kolmitulon muut komponentit kuin myös jälkimmäisen muodon komponentit jolloin päätyisimme yhtälöihin A × (B × C) (A × B) × C = = (A · C)B − (A · B)C (A · C)B − (B · C)A. (1.24) Muistamista helpottanee molempiin tapauksiin soveltuva sääntö: vektorikolmitulo = (kauempi·ulko)lähempi -(lähempi·ulko)kauempi, missä ”ulko”tarkoitaa sulkujen ulkopuolista tekijää, ”lähempi”lähempänä ja ”kauempi”kauempana ”ulko”-tekijästä olevaa sulkujen sisäpuolista vektoria. (1.22) Koska vaihdettaessa kaksi riviä keskenään determinantti vaihtaa merkkinsä, saamme Ax Ay Az A · (B × C) = Bx By Bz Cx Cy Cz Cx Cy Cz = − Bx By Bz Ax Ay Az Cx Cy Cz = Ax Ay Az = C · (A × B). Bx By Bz Koska skalaaritulo on kommutatiivinen, voimme kirjoittaa tämän myös muotoon A · (B × C) = (A × B) · C 0 Az Bx By Cx Cy (1.23) eli skalaarikolmitulossa pisteen ja ristin paikan voi vaihtaa (sulkumerkkien paikat toki vaihtuvat tässä operaatiossa). 9 2. Raja-arvo ja derivaatta Lineaarinen riippumattomuus Vektorit v1 , v2 , . . . vn ovat lineaarisesti riippumattomia, jos n X ak vk = 0 vain jos a1 = . . . = an = 0 (1.25) k=1 Muussa tapauksessa vektorit ovat lineaarisesti riippuvia. Kolmiulotteisessa avaruudessa on enintään 3 vektorin joukko keskenään lineaarisesti riippumaton. Esim. kantavektorit i, j, k ovat lineaarisesti riippumattomia: 2.1 Raja-arvon määritelmä Funktiolla f (x) on raja-arvo f0 pisteessä x0 jos f (x) lähestyy arvoa f0 kun x lähestyy arvoa x0 . Merkitään f (x) → f0 kun x → x0 (2.1) tai lim f (x) = f0 . x→x0 (2.2) Raja-arvo matemaattisemmin: a1 i + a2 j + a3 k = 0 Intuitiivisesti raja-arvon käsite on varsin selvä. Matemaattisesti se määritellään seuraavasti: funktiolla f (x) on raja-arvo f0 pisteessä x0 , jos vain jos a1 = a2 = a3 = 0. Esim. v1 = i, v2 = j, v3 = i + j ovat lineaarisesti riippuvia: ∀ǫ ∃δ > 0 siten että |f (x) − f0 | < ǫ jos 0 < |x − x0 | < δ Tässä merkintä “∀: kaikille”, “∃: on olemassa”. v3 = v1 + v2 ⇒ v 1 + v2 − v3 = 0 Jos vektorit ovat lineaarisesti riippuvia, ainakin yksi vektoreista voidaan kirjoittaa lineaarikombinaationa muista. Skalaarikolmitulon ja lineaarisen riippumattomuuden välillä on seuraava yhteys: Vektorit a, b ja c ovat lineaarisesti riippumattomia jos ja vain jos a · (b × c) 6= 0. Esim. i · (j × k) = 1, joten i, j, k ovat lineaarisesti riippumattomia. Esim. a = (1, 0, 1), b = (1, 2, 3), c = (3, 2, 5): 1 0 1 a · (b × c) = 1 2 3 3 2 5 2 3 1 3 1 2 = 1 − 0 + 1 2 5 3 5 3 2 = Eli: f on mielivaltaisen lähellä f0 :aa, jos x on riittävän lähellä x0 :aa. Raja-arvo on selkeä esim. tapauksissa lim x2 + x = 2, x→1 x→π/4 xa = 0, a ∈ R x→∞ ex 1 = 0, x→∞ x lim lim (Huom: eksponenttifunktio pesee minkä tahansa potenssin!) Kavalia ovat esim. tapaukset jotka lähenevät muotoa ∞ 0 , 0 × ∞, , ∞ − ∞, 00 , . . . 0 ∞ Esim: 2x4 2x4 + x2 + 1 = lim = −2 4 3 x→∞ −x4 x→∞ −x + x lim 4−0−4=0 Vektorit eivät ole lineaarisesti riippumattomia. Helposti nähdään että a = (c − b)/2. Huom: jos meillä on kolme lineaarisesti riippumatonta vektoria v1 , v2 , v3 , niin mielivaltainen vektori voidaan esittää näiden lineaarikombinaationa: a = a1 v1 + a2 v2 + a3 v3 . Sanotaan että vektorit vi virittävät 3-ulotteisen avaruuden. Tutuin esimerkki näistä on tietysti i, j, k. √ lim sin x = sin π/4 = 1/ 2, (2.3) Suurin potenssi voittaa kun x → ∞. (vastaavasti pienin jos x → 0). Usein raja-arvojen laskemisessa auttavat seuraavat approksimaatiot, kun |x| on pieni: (1 + x)a = 1 x − x3 + O(x5 ) 6 1 2 1 − x + O(x4 ) 2 1 + ax + O(x2 ) ln(1 + x) ex = = x + O(x2 ) 1 + x + O(x2 ) sin x = cos x = (2.4) (2.5) (2.6) (2.7) (2.8) Tässä merkintä O(xn ) tarkoittaa että kaikissa lopuissa termeissä √ x:n potenssi on vähintään n. Esim. 1 + x = 1 + x/2 + O(x2 ) 10 2.3 Derivaatan määritelmä Esim. sin x lim x→0 x = = Funktion f (x) derivaatalla f ′ (x0 ) pisteessä x0 tarkoitetaan raja-arvoa x − x3 /6 + O(x5 ) lim x→0 x lim (1 − x2 /6 + O(x4 )) = 1. f ′ (x0 ) x→0 Määritellään vielä oikeanpuoleinen raja-arvo: f0 = lim f (x) Ilmeisesti limx→0+ θ(x) = 1, mutta limx→0− θ(x) = 0. Huom: askelfunktiolla ei ole tavallista raja-arvoa pisteessä x = 0! Huom: merkitään myös ilmeiset raja-arvot 1 = ∞, x lim x→0− 1 = −∞, x y = f(x ) a Eli x lähestyy arvoa x0 vasemmalta (negatiiviselta) puolelta. Epäjatkuvalla funktiolla oikeanpuoleinen ja vasemmanpuoleinen raja-arvo voivat olla erilaiset: Esim. askelfunktio eli Heavisiden funktio: x>0 1, 1/2, x = 0 θ(x) = (2.11) 0 x<0 lim lim x = ∞ x→∞ 2.2 Jatkuva funktio Funktio f (x) jatkuva pisteessä x0 , jos f on määritelty jossain pisteen x0 ympäristössä ja x = lim [f (x)/g(x)] = x→x0 x→x0 3 f ′ (x0 ) = df (x) . dx x=x0 Kun kyseessä on derivointi ajan suhteen, käytetään fysiikassa usein merkintää . d f (t) = f (t). dt x→x0 x→x0 lim f (x)/ lim g(x) x→x0 x d df (x) f (x) = = Dy = Df (x). dx dx Monesti jätetään funtion f argumenttikin merkitsemättä. Kun halutaan painottaa, että derivaattafunktio f ′ (x) halutaan laskea nimenomaan pisteessä x0 , merkitään joskus lim f (x) lim g(x) x→x0 2 f ′ (x) = y ′ = lim f (x) + lim g(x) x→x0 x Olkoon y = f (x) jokin derivoituva funktio. Derivaattaa f ′ (x) merkitään usein myös pisteessä x = 0, mutta on jatkuva kaikissa pisteissä x 6= 0. Esim. Funktio f (x) = 1/x2 ei ole jatkuva pisteessä x = 0 (ei edes määritelty) Raja-arvoille pätevät myös seuraavat ominaisuudet: jos funktioilla f (x) ja g(x) on raja-arvot kun x → x0 , niin lim [f (x)g(x)] 1 Merkintöjä Fysiikassa funktiot ovat jatkuvia (melkein) kaikkialla. x→x0 x Määritelmässä (2.14) ei ole spesifioitu lähestymissuuntaa, ts. voi olla joko x > x0 tai x < x0 . Molempien lähestymistapojen täytyy johtaa samaan lopputulokseen. Raja-arvo (2.14) ei välttämättä aina ole yksikäsitteinen tai sitä ei ole olemassa. Tällaisessa tapauksessa derivaattaa ei ole määritelty. Jos raja-arvo (2.14)on (yksikäsitteisenä) olemassa, sanotaan, että funktio on derivoituva pisteessä x0 . Esim. funktio f (x) = |x| on jatkuva kaikilla x ∈ R. Jos x > 0, on f (y) − f (x) = 1, f ′ (x) = lim y→x y−x ja vastaavasti jos x < 0 on f ′ (x) = −1. Pisteessä x = 0 ei raja-arvoa ole olemassa (on vain vasemman- ja oikeanpuoleiset raja-arvot), eikä |x| ole derivoituva pisteessä x = 0. Esim. Heavisiden askelfunktio (2.11) ei ole jatkuva = 0 f '( x 0 ) = ta n a Kuva 2.1 Derivaatan geometrinen tulkinta (2.12) lim f (x) = f (x0 ) x→x0 lim [f (x) + g(x)] (2.14) (2.10) x→x0 − x→0+ (2.13) Geometrisesti derivaatta on funktion kuvaajan tangentin kulmakerroin derivointipisteessä. tai f (x) → f0 , kun x → x0 +. Merkintä tarkoittaa että x lähestyy arvoa x0 oikealta (positiiviselta) puolelta. Vastaavasti vasemmanpuoleinen: f0 = lim f (x) lim x→x0 = (2.9) x→x0 + f (x) − f (x0 ) x − x0 f (x0 + h) − f (x0 ) lim h→0 h = Leibnitzin merkintätapa x→x0 df dx on intuitiivisin: funktion muutos kun muutos → 0 muuttujan muutos missä viimeisin edellyttää että limx→x0 g(x) 6= 0. 11 Huom: f ′ (x) = 0: funktio vaakasuora pisteessä x f ′ (x) = 1: funktion kulmakerroin = 1 (45◦ ) pisteessä x) f ′ (x) → ∞: funktio lähestyy pystysuoraa joten cos ∆x − 1 lim ∆x→0 ∆x = = 2.4 Derivaattojen lasku = Derivaatta suoraan määritelmästä Lasketaan esimerkiksi potenssifunktion f (x) = xn derivaatta. Määritelmän mukaan derivaatta f ′ (x) on raja-arvo f ′ (x) = = f (y) − f (x) y−x f (x + ∆x) − f (x) . lim ∆x→0 ∆x − 21 (∆x)2 + O (∆x)4 lim ∆x→0 ∆x lim O (∆x) ∆x→0 0 ja sin ∆x lim ∆x→0 ∆x ∆x − O (∆x)3 lim ∆x→0 ∆x lim 1 − O (∆x)2 = = lim y→x ∆x→0 = 1. Derivaataksi saamme siis d sin x = cos x. dx Tässä tapauksessa on siis laskettava raja-arvo (x + ∆x)n − xn . ∆x→0 ∆x f ′ (x) = lim Trigonometristen funktioiden yhteenlaskukaavoja Sini- kosinifunktiot toteuttavat yhteenlaskukaavat Käyttäen (1 + δ)a = 1 + aδ + O(δ 2 ) (2.6) saamme sin(x + y) cos(x + y) ∆x n ∆x ∆x 2 (x + ∆x)n = xn (1 + ) = xn [1 + n + O(( ) )] x x x = = sin x cos y + cos x sin y cos x cos y − sin x sin y. Koska sin x , cos x voidaan tangentin yhteenlaskukaava kirjoittaa mm. muotoon tan x = joten (x + ∆x)n − xn ∆x→0 ∆x lim = = lim [nxn−1 + xn−1 O( ∆x→0 n−1 nx ∆x )] x tan(x + y) = . tan x + tan y sin x cos y + cos x sin y = . cos x cos y − sin x sin y 1 − tan x tan y Erikoistapauksena saadaan kaksinkertaisille kulmille kaavat n sin 2x cos 2x tan 2x n−1 . Siis saimme dx dx = nx Käsitellään toisena esimerkkinä funktion f (x) = sin x derivaatan laskua. Nyt = = = 2 sin x cos x cos2 x − sin2 x 2 tan x . 1−tan2 x Pythagoraan lauseen perusteella on sin(x + ∆x) = sin x cos ∆x + cos x sin ∆x, sin2 x + cos2 y = 1. Kaksinkertaisen kulman kosini voidaan siten kirjoittaa myös muotoihin joten derivaatan määritelmän mukaan on f ′ (x) = = = sin(x + ∆x) − sin x ∆x sin x cos ∆x + cos x sin ∆x − sin x lim ∆x→0 ∆x sin ∆x cos ∆x − 1 , + cos x lim sin x ∆x→0 ∆x ∆x cos 2x = 2 cos2 x − 1 = 1 − 2 sin2 x. lim ∆x→0 Muutamien tavallisimpien funktioiden derivaattoja on esitetty taulukossa f (x) c (vakio) xn ex ln x sin x cos x tan x missä olemme käyttäneet sinin ja kosinin yhteenlaskukaavoja. Pienillä argumentin arvoilla trigonometriset funktiot käyttäytyvät kuten (2.4,2.5): sin δ = cos δ = 1 δ − δ3 + O δ5 6 1 1 − δ2 + O δ4 , 2 12 Df (x) 0 nxn−1 ex . 1/x cos x − sin x 1/cos2 x = 1 + tan2 x (2.15) d d sin ex = cos(ex ) ex = cos(ex )ex dx dx Derivaatan laskusääntöjä Olkoot f ja g derivoituvia funktioita ja a ja b vakioita. Tällöin on voimassa d [af (x) + bg(y)] = af ′ (x) + bg ′ (x). dx d x x dx (2.16) = = Derivointi on lineaarinen operaatio. Funktioiden tulo f (x)g(x) derivoidaan kuten d x ln x d e = ex ln x x ln x dx dx 1 xx (1 ln x + x ) = xx (1 + ln x) x Käänteisfunktion derivaatta d [f (x)g(x)] = f ′ (x)g(x) + f (x)g ′ (x) dx Olkoon meillä funktion y = f (x), käänteisfunktio x = f −1 (y). Nyt käänteisfunktion derivaatta saadaan funktion derivaatan avulla seuraavasti: (2.17) ja osamäärä f (x)/g(x) kuten d f (x) f ′ (x)g(x) − f (x)g ′ (x) = . dx g(x) g 2 (x) Df −1 (y) = (2.18) 1 f ′ (f −1 (y)) = 1 f ′ (x) . (2.20) Leibnitzin notaatiolla tämä on yksinkertaisesti Tulon derivointi dx 1 = dy dy dx Osoitetaan tulon derivoimissääntö. Suoraan derivaatan määritelmästä nähdään f (x + h) − f (x) = hf ′ (x) + O(h2 ) Nyt d (f (x)g(x)) dx f (x + h)g(x + h) − f (x)g(x) = lim h h→0 (f (x) + hf ′ (x))(g(x) + hg ′ (x)) − f (x)g(x) + O(h2 ) = lim h→0 h h(f ′ (x)g(x) + f (x)g ′ (x)) + O(h2 ) = lim h h→0 = f ′ (x)g(x) + f (x)g ′ (x) (miten todistetaankin käänteisfunktion derivoimissääntö, kun ajatellaan raja-arvoja ∆x, ∆y.) Esim. Johdetaan logaritmin derivoimissääntö. Nyt y = ex , x = ln y: d ln y dy = 1 1 1 dx 1 = dy = dex = x = dy e y dx dx tai D ln y = 1/(Dex ) = 1/ex = 1/y. Syklometriset funktiot Trigonometrisillä funktioilla ei ole yksikäsitteistä käänteisfunktiota. Esimerkiksi yhtälön Yhdistetyn funktion f (g(x)) derivointiin soveltuu ketjusääntö d f (g(x)) = f ′ (g(x))g ′ (x). dx (2.21) sin x = 1 2 ratkaisee mikä tahansa äärettömän joukon (2.19) x= Tämä tulee erityisen selväksi käyttäen Leibnitzin notaatiota: jos merkitään y = f (z) ja z = g(x), saadaan π + 2nπ 6 5π + 2nπ, 6 n kokonaisluku π π ≤x≤ , 2 2 on yhtälöllä sin x = a yksikäsitteinen ratkaisu, jota nimitetään arkussiniksi ja merkitään π π x = arcsin a, − ≤ x ≤ . 2 2 luvuista. Kun rajoitetaan sinin argumentti välille − dy dy dz d f (g(x)) = = = f ′ (g(x))g ′ (x) dx dx dz dx Tämän avulla nähdään muun muassa että Arkussini on siis se sinin käänteisfunktio, jonka arvoalue on π π rajoitettu välille − ≤ x ≤ + . Kosinilla puolestaan on 2 2 yksikäsitteinen arkuskosiniksi sanottu käänteisfunktio, kun rajoitetaan kosinin argumentti välille 0 ≤ x ≤ π. Tästä käytetään merkintää x = arccos z, 0 ≤ x ≤ π. d [f (x)]µ = µ[f (x)]µ−1 f ′ (x) dx d f (x) e = ef (x) f ′ (x) dx f ′ (x) d ln f (x) = dx f (x) Tangentin käänteisfunktio on nimeltään arkustangentti. Sen arvoalue on π π y = arctan x, − ≤ y ≤ . 2 2 Koska sinin ja kosinin arvoalueet kattavat välin [−1, 1], voivat arkussinin ja arkuskosinin argumenttit olla väillä [−1, 1]. Arkustangentin argumentti taas voi olla mikä tahansa reaaliluku, sillä tangentin arvoalueena on koko reaaliakseli. Esimerkkejä: 2 d 2 d x2 e = ex x2 = ex 2x dx dx 13 Joskus halutaan määritellä trigonometristen funktioiden käänteisfunktiot monikäsitteisiksi, esim. halutaan että z = arcsin x antaa kaikki ne arvot z, joilla sin z = x. Tällöin π π rajattua arkussiniä sanotaan ko. arvoalueelle − ≤ arcsin x ≤ 2 2 funktion päähaaraksi. Päähaarasta käytetään merkintää arcsin x. Vastaavat nimitykset ja merkinnät ovat käytössä muillekin trigonometrisille käänteisfunktioille. Trigonometristen funktioiden käänteisfunktioita sanotaan syklometrisiksi funktioiksi tai useimmiten niiden nimen mukaisesti tuttavallisesti arkus-funktioiksi. Lasketaan esimerkkinä funktion arcsin x derivaatta. Nyt arcsin on sinifunktion käänteisfunktio, ts. jos x = sin y niin y = arcsin x. Säännön (2.20) perusteella on 1 1 = . D arcsin x = D sin y cos y Trigonometristen funktioiden ominaisuuksien perusteella voidaan kirjoittaa q p cos y = 1 − sin2 y = 1 − x2 , joten saamme d 1 arcsin x = √ . dx 1 − x2 (2.22) 2.6 Sovelluksia Differentiaalilaskennan lukemattomista käyttökohteista käsitellään muutamia fysiikan kannalta ehkä tärkeähköjä sovelluksia. Suureiden muodostus Intuitiivisesti nopeudella ymmärretään aikayksikössä kuljettua matkaa. Matemaattisen täsmälliseksi nopeuden käsite saadaan määrittelemällä se rajarvona ∆t→0 v(t) = = = 2 dv(t) d x(t) dt =.. dt2 .v(t) x(t). = (2.27) Muista lukemattomista derivaattojen avulla määritellyistä fysiikan käsitteistä mainittakoon vaikkapa sähkövirta 2.5 Korkeamman kertaluvun derivaatat I= ′ Jos funktion f (x) derivaatta f (x) on myöskin derivoituva, voimme laskea senkin derivaatan: dQ dt sähkövarauksen Q muuttuessa ajan t funktiona tai teho (2.24) Sanomme, että funktio f (x) on kahdesti derivoituva ja suure Df ′ (x) funktion f (x) toinen derivaatta. Jos vielä tämä toinen derivaattakin on derivoituva, voisimme edelleen määrätä sen derivaatan DDf ′ (x) jne. Vastaavasti funktion sanotaan tällöin olevan kolmesti, . . ., n kertaa, derivoituva ja puhutaan kolmansista, . . ., n:stä derivaatoista. P = Olkoon funktio f (x) n-kertaisesti derivoituva. Sen n:ttä derivaattaa merkitään mm. kuten dn f (x) f (n) (x) = Dn f (x) = . dxn Alhaisen kertaluvun derivaatoista voidaan myös käyttää sellaisia merkintöjä kuin dW , dt missä W on hetkeen t mennessä tehty työ tai, kolmantena esimerkkinä kappaleen tilavuuden V muutoksesta aiheutuvasta paineen P muutoksesta kertova puristusmoduuli (kompressibiliteetti) B=− Merkintöjä 1 dP . V dV Approksimaatio Derivaatan määritelmästä (2.14) f ′ (x) = lim ∆x→0 f (x + ∆x) − f (x) ∆x voidaan ratkaista f (x + ∆x) likimääräisesti: Jos kyseessä on derivointi ajan suhteen, merkitään usein .. d2 f (t) = f (t). 2 dt (2.26) (2.23) Kaavat (2.22,2.23) ovat hyödyllisiä integraalien laskuissa. f (2) (x) = f ′′ (x) = DDf (x). dx(t) . = x(t). dt Kiihtyvyys puolestaan on nopeuden muutos aikayksikössä. Derivaattojen avulla ilmaistuna on siis pitkin x-akselia liikkuvan kappaleen kiihtyvyys a kirjoitettavissa kuten Samoin voidaan osoittaa f ′ (x + ∆x) − f ′ (x) . Df ′ (x) = lim ∆x→0 ∆x (2.25) kun oletetaan tarkasteltavan objektin liikkuvan pitkin x-akselia ja sen olevan paikassa x(t) hetkellä t. Derivaatan määritelmästä (2.14) nähdään, että nopeus v(t) hetkellä t on a(t) d 1 arctan x = . dx 1 + x2 x(t + ∆t) − x(t) , ∆t v(t) = lim f (x + ∆x) ≈ f (x) + f ′ (x)∆x. (2.28) Tämä relaatio on sitä tarkempi mitä pienempi ∆x on. 14 Väliarvolause Ääriarvot Tarkasti ottaen on voimassa ns. väliarvolause: Funktion maksimikohta on sellainen piste, että poistuttaessa siitä mihin tahansa suuntaan funktion arvo pienee. Vastaavasti minimikohdasta poistuttaessa funktion arvo kasvaa. Maksimi (minimi) on paikallinen eli lokaali, jos funktiolla on muita arvoltaan tätäkin suurempia (pienempiä) maksimeja (minimejä). Jos kyseessä on funktion suurin (pienin) arvo, puhutaan globaalista tai absoluuttisesta maksimista (minimistä). Esim. kuvassa 2.3 minimi kohdassa x0 ja maksimi kohdassa x1 ovat paikallisia. Kohdan x2 minimi saattaisi olla globaali. Olkoon f derivoituva funktio. Tällöin pisteiden x ja x + ∆x välissä on olemassa sellainen piste x0 että f ′ (x0 ) = f (x + ∆x) − f (x) . ∆x Lauseen mukaan on siis tarkasti voimassa f (x + ∆x) = f (x) + f ′ (x0 )∆x, missä x < x0 < x + ∆x (olettaen, että ∆x > 0). Esim. sin x kun x on pieni Kaavan (2.28) mukaan on f(x ) sin x ≈ x sin′ 0 = x cos 0 = x. Esim. Newton-Raphsonin menetelmä Tehtävänä on etsiä funktion f (x) nollakohta, ts. ratkaista yhtälö f (x) = 0. Oletetaan, että f (x) on derivoituva. Olkoon x0 jokin likiarvo ratkaisulle (saatu esim. arvaamalla tai piirtämällä funktion kuvaaja). Approksimoidaan funktiota pisteen x0 läheisyydessä (ks. kuva 2.2) lineaarisella kuvaajalla f (x) ≈ f (x0 ) + f ′ (x0 )(x − x0 ). Tämän suoran ja x-akselin leikkauspiste x1 = x0 − f (x0 ) f ′ (x0 ) x x 1 x 2 x 3 x Kuva 2.3 Funktion ääriarvot Derivoituvan funktion f (x) ääriarvokohdissa, ts. maksimeissa ja minimeissä funktion tangentti on x-akselin suuntainen (ks. kuva 2.3) eli Derivoituvan funktion derivaatta ääriarvopisteissä on nolla. Tarkasti ottaen derivaatta häviää sellaisissa ääriarvopisteissä, jotka sijaitsevat funktion määrittelyalueen sisällä. Jos esim. funktio f (x) on määritelty siten, että on (yleensä) parempi nollakohdan likiarvo kuin alkuperäinen x0 . f (x) = x2 , kun − 1 ≤ x ≤ 1, f(x ) x 0 maksimit (arvoltaan 1) sijaitsevat reunapisteissä x = ±1. Pisteitä, joissa derivaatta häviää sanotaan kriittisiksi pisteiksi. Derivaatan häviäminen on siis ääriarvon välttämätön ehto. Se ei kuitenkaan ole riittävä. Esim. kuvassa 2.3 kohdan x3 vasemmalla puolen funktio on pienempi ja oikealla puolen suurempi kuin pisteessä x3 . Jos funktio on kahdesti derivoituva, voimme toisesta derivaatasta päätellä kriittisen pisteen luonteen: 2 x 1 x 0 x Kuva 2.2 Newton-Raphsonin iteraatio • Jos toinen derivaatta on negatiivinen, siirryttäessä pisteen yli vasemmalta oikealle ensimmäinen derivaatta pienenee positiivisesta negatiiviseksi, ts. kyseessä on maksimi. Toistetaan sama menettely käyttäen pistettä x1 lähtöarvona, jolloin saadaan taas (toivottavasti) parempi likiarvo x2 . Jatketaan samalla tavoin iteroiden, ts. lasketaan likiarvosta xn likiarvo xn+1 = xn − • Jos toinen derivaatta on positiivinen, siirryttäessä pisteen yli vasemmalta oikealle ensimmäinen derivaatta kasvaa negatiivisesta positiiviseksi, ts. minimi. f (xn ) , f ′ (xn ) niin kauan kunnes f (xn ) on halutulla tarkkuudella nolla tai kunnes xn+1 poikkeaa riittävän vähän edellisestä arvosta xn . • jos toinen derivaatta on nolla kriittisessä pisteessä, täytyy tarkastella korkeampia derivaattoja: jos pienin nollasta poikkeava derivaatta on: 15 A) parillista kertalukua (2,4,. . . ), kyseessä on maksimi/minimi jos derivaatan etumerkki on -/+. B) pariton (1,3,. . . ), kyseessä ei ole ääriarvo. Esim. limx→0 sin2 2x/x2 l’Hospitalin sääntö on ilmeisestikin sovellettavissa ja saamme sin2 2x x→0 x2 Esim. Funktion f (x) = 3x4 − 4x3 kriittiset pisteet = lim Derivaatta on nyt = f ′ (x) = 12x3 − 12x2 = 12x2 (x − 1). Kriittiset pisteet saadaan asettamalla f ′ (x) = 0, ts. ratkaistaan yhtälö 12x2 (x − 1) = 0. Kriittiset pisteet ovat siten 0 ja 1. Funktion toinen derivaatta on f ′′ (x) = 36x2 − 24x, joten f ′′ (0) = 0 ja f ′′ (1) = 12. Piste 1 on siis minimi. mutta piste 0 ei ole maksimi eikä minimi. l’Hospitalin sääntö Hyvin monesti raja-arvoja laskettaessa päädytään muotoa 0/0, ∞/∞ tai 0 · ∞ oleviin lausekkeisiin. Jos kyseessä ovat derivoituvat funktiot, voidaan useimmiten soveltaa l’Hospitalin sääntöä Jos f ′ (x) lim ′ =A x→a g (x) ja jos joko Päädymme siten edelleen muotoa 0/0 olevaan lausekkeeseen. Sovelletaan tähän uudelleen l’Hospitalin sääntöä, jolloin saadaan lim 2 x→0 lim x ln x = lim x→0+ f (x) = A. x→a g(x) Tarkastellaan esimerkkinä tapausta, missä a on äärellinen ja missä sekä f (a) = 0 että g(a) = 0. Voimme siis kirjoittaa lim x→a f (x) g(x) = = = = lim x→a f (x) − f (a) . g(x) − g(a) [f (x) − f (a)]/(x − a) . [g(x) − g(a)]/(x − a) limx→a [f (x) − f (a)]/(x − a) . limx→a [g(x) − g(a)]/(x − a) lim f ′ (x) g ′ (x) Esim. limx→0 sin x/x Sekä osoittaja että nimittäjä lähestyvät nollaa argumentin lähestyessä nollaa ja funktiot ovat derivoituvia. Voimme siis soveltaa l’Hospitalin sääntöä: lim 1 x . x→0+ = lim (−x) = 0. x→0+ Implisiittinen derivointi Joskus funktiota y(x) määritellään esim. ehdolla F (x, y) = F (x, y(x)) = c, (2.29) missä c on vakio. Periaatteessa tästä yhtälöstä voitaisiin (ehkä) ratkaista muuttuja y. Tämä ratkaisu riippuisi tietenkin muuttujasta x. Voimme siis ajatella, että yhtälö (2.29) määrää implisiittisesti funktion y(x). Funktion y(x) derivaatta voidaan usein ratkaista suoraan derivoimalla ehtoa F : x→a jos derivaatat ovat olemassa. x→0 1 x x→0+ − 12 x lim x ln x = lim lim Perusteluja ln x x→0+ Nyt sekä osoittaja että nimittäjä lähestyvät ääretöntä ja l’Hospitalin sääntö on jälleen käyttökelpoinen: tai niin cos 2x sin 2x = lim 4 = 4. x→0 x 1 Esim. limx→0+ x ln x Tässä merkintä x → 0+ tarkoittaa, että x lähestyy nollaa positiiviselta puolelta. Tämä rajoitus on asetettu, jotta logaritmifunktio olisi määritelty. Nyt x → 0 ja ln x → −∞, joten l’Hospitalin säännön soveltamiseksi kirjoitetaan raja-arvo muotoon f (x) → 0 ja g(x) → 0 kun x → a g(x) → ±∞ kun x → a, 4 sin 2x cos 2x 2x sin 2x sin 2x lim 2 cos 2x = lim 2 . x→0 x→0 x x lim x→0 sin x cos x 1 = lim = = 1. x→0 x 1 1 d F (x, y(x)) = 0 dx ja ratkaisemalla y ′ (x). Esim. Tason origokeskeinen ympyrä x2 + y 2 = a2 määrittelee implisiittisesti funktion y(x).Nyt d 2 (x + y(x)2 ) = 2x + 2y(x)y ′ (x) = 0 dx ⇒ y ′ (x) = −x/y mikä on ympyrän tangentin kulmakerroin. 16 (2.30) d F (x, y(x)) dx = = =0 3. Potenssisarjoja dy dx yhtälöstä sin(xy) + y = x Tässä tapauksessa siis F (x, y(x)) = sin(xy) + y − x = 0, ja Esim. Muodosta implisiittisesti derivaatta d (sin(xy) + y − x) dx dy dy + −1 cos(xy) y + x dx dx 3.1 Äärettömät sarjat Olkoon {an } jokin lukujono. Summaa S= ∞ X n=0 an = a0 + a1 + a2 + · · · + an + · · · sanotaan äärettömäksi sarjaksi. Lukuja Hieman ryhmittäen voidaan kirjoittaa Sn = dy (1 + x cos(xy)) = 1 − y cos(xy), dx Alkaako sarja nollannesta, ensimmäisestä, toisesta tai jostakin P∞ muusta termistä on vain numerointikysymys. Summat a , k=1 k P∞ P∞ P∞ a , . . . tai lyhyemmin a , a , . . . ovat myöskin k k k k=2 1 2 (äärettömiä) sarjoja. Parametrisesti annetun funktion derivaatta Esim. x = cos t ja y = sin t määrittelee parametrisesti funktion (yksikköympyrän kaari) y(x) (kun 0 ≤ t ≤ π). Yleisemmin: olkoon annettu x = g(t) ja y = f (t) = f (g −1 (x)). Nyt ketjusäännön mukaan Katsotaan esimerkkinä geometrista sarjaa Osasummat ovat Sn (2.31) = = dy = dx Ympyrälle siis √ 1 − x2 cos t dy = =− dx − sin t x n X 0 Tai yksinkertaisesti dy dt dx dt ak kutsutaan osasummiksi. Äärettömän sarjan, tai lyhyesti vain sarjan, sanotaan suppenevan (konvergoituvan) jos raja-arvo limn→∞ Sn on olemassa. Jos raja-arvoa ei ole, sarja hajaantuu (divergoi). 1 − y cos(xy) dy = . dx 1 + x cos(xy) d 1 y (t) dy = f ′ (t) g −1 x = f ′ (t) ′ = ′ dx dx g (t) x (t) n X k=0 josta saamme derivaataksi ′ (3.1) (2.32) = P∞ 0 xn . xk = 1 + x + · · · + xn 1 − xn+1 1−x xn+1 1 − . 1−x 1−x Tiedämme, että xn+1 → 0 kun |x| < 1. Tällöin siis lim Sn = 1 . 1−x Toisaalta sarja selvästikin hajaantuu kun |x| ≥ 1. Olemme siis saaneet tuloksen ∞ X xn = 0 1 , kun |x| < 1. 1−x (3.2) Se, että sarjan termit lähestyvät nollaa, ei takaa sarjan suppenemista. Esimerksi harmoninen sarja ∞ X n=1 hajaantuu. 1 1 1 = 1 + + ··· + + ··· n 2 n On olemassa useita testejä, joilla sarjojen suppenemista voi tutkia. P Näistä ehkä käytetyin on suhdetesti: Olkoon an sellainen positiivisten termien sarja, että raja-arvo lim an+1 /an = q n→∞ on olemassa. Silloin 17 • jos q < 1, niin sarja suppenee, Sarja siis suppenee, jos muuttuja x toteuttaa ehdon • jos q > 1, niin sarja hajaantuu ja |x| < an • jos q = 1, niin sarja voi supeta tai hajaantua. Vaikka suhdetesti käsitteleekin vain positiivitermisiä sarjoja, sitä voidaanP soveltaa yleisempiinkin tapauksiin. Sanotaan että sarja an suppenee itseisesti jos sarja P |an | suppenee. Voidaan osoittaa, että sarjan supetessa itseisesti myös itse sarja suppenee. Jos siis suhdetestillä todetaan sarjan suppenevan itseisesti niin voidaan päätellä sarjan suppenevan sellaisenaankin. P∞ (−1)n n Esim. Osoita, että sarja suppenee 1 2n Kyseessä on ns. vuorotteleva sarja: joka toinen termi on positiivinen ja joka toinen negatiivinen. Osoitetaan, että P∞ (−1)n n sarja suppenee itseisesti, ts. että 1 2n suppenee. Nyt an = 2nn ja 1 (n + 1)2n 1 an+1 1+ = = an n2n+1 2 n 1 → < 1. 2 Suhdetestin mukaan sarja suppenee itseisesti ja niin ollen suppenee sellaisenaankin. 3.2 PotenssisarjatP Geometrinen sarja (3.2) 0 xn esittää funktiota 1/(1 − x). Itseasiassa hyvin monet funktiot voidaan esittää tyyppiä ∞ X an (x − x0 )n joten suppenemissäde R on Esim. Sarjan Nyt n Potenssisarjan suppeneminen riippuu yleensä muuttujan x arvosta. Voidaan osoittaa, että On olemassa sellainen P luku R ≥ 0 (mahdollisesti +∞, että potenssisarja n an xn suppenee itseisesti, kun −R < x < R ja hajaantuu kun |x| > R. Lukua R sanotaan suppenemissäteeksi. Tärkein suppenemissäteen määräämismenetelmä on jälleen suhdetesti: P Olkoon sarja n an xn sellainen, että raja-arvo lim |an+1 /an | = q on olemassa. Suppenemissäde on silloin R = 1/q. P n Suhdetestin mukaan sarja a x suppenee itseisesti, jos n n termien suhteelle on voimassa an+1 xn+1 = lim an+1 |x| < 1. lim n an x an P n R = lim = lim an an+1 an an+1 , . xn /n! suppenemissäde an+1 n! 1 an = (n + 1)! = n + 1 , joten suhdetestin q on 0. Suppenemissäde on niin ollen ääretön eli sarjaPsuppenee kaikilla muuttujan x arvoilla. ∞ 10n n Esim. Sarjan 1 n x suppenemissäde Suhdetesti antaa 10n an n = an+1 10n+1 n+1 = n+1 1 1 1 · → = = R. n 10 10 q Kuten todettua potenssisarjoja voidaan pitää argumenttinsa funktioina. Potenssisarjafunktioilla on mm. ominaisuudet: P Suppenemissäteen sisällä sarjan an xn esittämä funktio • on jatkuva, • voidaan integroida integroimalla sarja termeittäin, • voidaan derivoida (mielivaltaisen monesti) derivoimalla sarja termeittäin. 0 olevina potenssisarjoina. Jatkossa käsittelemme enimmäkseen tapauksia, joissa x0 = 0, sillä vaihtamalla muuttujaan x′ = x − x0 mikä tahansa potenssisarja saadaan muotoon ∞ X n an x ′ . a1 lim n+1 3.3 Taylorin sarjat Olkoon funktio f (x) äärettömän monta kertaa derivoituva pisteen x0 ympäristössä. Tällöin se voidaan esittää Taylorin sarjana pisteen x0 suhteen kehitettynä suppenemissäteen sisällä: f (x) = ∞ X f (n) (x0 ) (x − x0 )n n! n=0 (3.3) Tässä siis f (n) (x0 ) on funktion n:s derivaatta pisteessä x0 , ja f (0) (x0 ) = f (x0 ). Luku n! ≡ n(n − 1)(n − 2) . . . 1, 0! ≡ 1 on n:n kertoma. Jos x0 = 0, Taylorin sarja saadaan usein esiintyvään muotoon ∞ X f (n) (0) n x f (x) = (3.4) n! n=0 18 Todistus: Olkoon meillä potenssisarja f (x) = ∞ X n=0 = f (x) = ∞ X 0 Asettamalla tässä x = x0 nähdään a1 = f (x0 ) = f Derivoimalla k kertaa saamme = = y = x suhdetestille sopivaan muotoon a y . Tämä sarja n n suppenee kun muuttuja y on itseisarvoltaan pienempi kuin testin antama suppenemissäde R. Muuttujalle x = y 1/β suppenemissäde on niin ollen R1/β . ∞ ∞ X n=0 ∞ X n=k an (1) Kääntäen, jos tunnetaan funktion f (x) Taylorin sarja f (x) = (x0 ). mistä jälleen seuraa f (k) (x0 ) = k!ak , mikä jo osoittaakin tuloksen (3.3). Esim. Kosinifunktion Taylorin sarja Nyt = − sin x = − cos x = sin x = cos x f (xβ ) = d2n+1 cos x = dx2n+1 .. . (n − 1)! dn ln x = (−1)n−1 ; (n > 0), dxn xn divergoi kun x = 0, emme voi origon (x0 = 0) ympäristössä Taylorin sarjaa muodostaa. Kehittämällä sen sijaan Taylorin sarja (3.3) pisteen x0 = 1 ympäristössä, saame sarjan ln x cos x = = = f (2) (0) 2 x 2! f (3) (0) 3 f (4) (0) 4 + x + x + ··· 3! 4! 1 1 1 − x2 + x4 + · · · 2 4! (x − 1)2 2 (x − 1)3 (x − 1)4 + − + ··· 3 4 ∞ X (x − 1)n (−1)n−1 . n n=1 ln 1 + (x − 1) − mikä on tapana esittää muodossa (y = x − 1) (−1)n+1 sin x Nähdään, että tässä tapauksessa parittomat derivaatat f (2n+1) (0) häviävät ja jäljelle jäävät ainoastaan parilliset f (2n) (0) = (−1)n . Funktion cos x Taylorin sarja on niin ollen an xβn Katsotaan nyt, miten muodostaisimme logaritmifunktion Taylorin sarjan. Koska sen jokainen derivaatta, = (−1)n cos x X n .. . d2n cos x = dx2n an xn ja sen suppenemissäde R, niin funktion f (xβ ) Taylorin sarja on yksinkertaisesti ja sen suppenemissäde R1/β . an n(n − 1) . . . (n − k + 1)(x − x0 )n−k X n dk (x − x0 )n dxk d cos x dx d2 cos x dx2 d3 cos x dx3 d4 cos x dx4 x2n . (2n)! Suhdetestin avulla todetaan helposti, että tämän sarjan suppenemissäde on ääretön. P Tarkasti ottaen suhdetestillä määrätään sarjan a xn n n P βn suppenemissäde. Sarja a x saadaan muuttujan vaihdolla n n P β n X d an n(x − x0 )n−1 . an (x − x0 )n = dx 1 ′ f (k) (x) (−1)n n=0 an (x − x0 )n . Asettamalla x = x0 vain ensimmäinen termi on nollasta poikkeava, ja nähdään heti a0 = f (x0 ) = f (0) (x0 ). Potenssisarjojen ominaisuuksien mukaan sarjaa voidaan derivoida termeittäin. Silloin ensimmäinen derivaatta suppenemissäteen sisällä on ′ ∞ X ln(1 + y) = ∞ X (−1)n−1 n=1 yn n Näiden sarjojen suppenemissäde on 1 (suppenee jos |y| = |x − 1| < 1) Taylorin sarjat funktioiden approksimaatioina Kirjoitetaan funktion f Taylorin sarja muotoon f (0) + f (1) (0)x + f (x) = f (0) + f (1) (0)x + · · · + f (n) (0) n x + R(x). n! Intuitiivisesti on ilmeistä (ja voidaan osoittaa), että mitä pienempi on argumetti x ja mitä suurempi on n sitä pienempi on jäännöstermi R(x). Tämän perusteella 19 voimme approksimoida funktioita katkaistuilla Taylorin sarjoilla: f (n) (0) n (3.5) x . n! Approksimaatio on siis sitä tarkempi mitä pienempi on x tai mitä suurempi on n. Yleensä approksimoitaessa tyydytään lineaarisiin tai neliöllisiin termeihin. Katkaistaessa yleistetty Taylorin sarja (3.3) tarkkuus on vastaavasti sitä parempi mitä lähempänä argumentti on kehityspistettä. Jotta tarkkuus olisi sitä parempi mitä pienempi argumentti on, useimmiten muutetaan tarkasteltavaa funktiota sen sijaan että kehitettäisiin origosta poikkeavassa pisteessä. Esimerkiksi logaritmifunktion tapauksessa saadaan approksimaatio f (x) ≈ f (0) + f (1) (0)x + · · · + ln(1 + x) = x − Jos µ on positiivinen kokonaisluku, sarjassa on äärellinen määrä termejä (n = 0 . . . µ). Muussa tapauksessa sarjan suppenemissäde on |x| < 1. x3 x2 + + O(x4) 2 3 tai sinille x3 + O(x5 ). 6 Alla olevaan taulukkoon on kerätty muutamia usein tarvittavia Taylorin sarjoja. P f (x) a xn P nxn x e P0 n! n x2n+1 (−1) (2n+1)! sin x P0 n x2n cos x 0 (−1) (2n)! P x2n+1 (3.6) sinh x 0 (2n+1)! P x2n cosh x P0 (2n)!n−1 xn ln(1 + x) 1 (−1) n , |x| < 1 x3 2 5 tan x x + 3 + 15 x + · · · , |x| < π2 sin x = x − Näistä saamme suoraan aiemmin esitetyt approksimaatiot (2.4–2.8). Eksponenttifunktion sarjasta X xn ex = n! 0 seuraa d x dx e = ex , jos sitä ei muuten tunnettaisi: d X xn dx n n! = = X nxn−1 n ∞ X n! X xk xn−1 = (n − 1)! k! n=1 k missä k = n − 1. Toistuvasti derivoimalla saadaan myös sarja (1 + x)µ = = µ(µ − 1) 2 x + ... 2! ∞ X µ(µ − 1) . . . (µ − n + 1) n x n! n=0 1 + µx + 20 Z 4. Integraalilaskentaa 4.1 Integraalifunktio Z Funktio F on funktion f integraalifunktio (integraali), jos F ′ (x) = f (x). Z (4.1) Integraalifunktion laskeminen (integrointi) on siis derivoinnin käänteisoperaatio. Integraalifunktiosta on tapana käyttää merkintää Z F (x) = f (x) dx (4.2) Funktiota f sanotaan integroitavaksi. Integraalifunktio ei ole yksikäsitteinen: Olkoon f integroituva funktio, jonka eräs integraalifunktio on F . Tällöin jokainen funktion f integraalifunktio on muotoa F (x) + C. Todistus: 1. (F (x) + C)′ = F ′ (x) = f (x), joten F (x) + C on integraalifunktio. 2. Olkoon G(x) toinen f (x):n integraalifunktio. Nyt (F (x) − G(x))′ = F ′ (x) − G′ (x) = f (x) − f (x) = 0, joten F (x) − G(x) on vakio. Yleisesti integrointi on huomattavasti vaikeampaa kuin derivointi: alkeisfunktioiden derivaatat ovat alkeisfunktioita, mutta alkeisfunktioiden integraalit eivät yleisesti ottaen ole! Koska derivointi on lineaarinen operaatio, myös integrointi on lineaarinen, ts. Z Z Z [αf (x) + βg(x)] dx = α f (x) dx + β g(x) dx, (4.3) missä α ja β ovat vakioita. Etenkin fysiikassa käytetään usein merkintää missä dx tulee välittömästi integraalimerkin jälkeen, siis Z Z dxf (x) ≡ f (x) dx 4.1.1 Tavallisia integraaleja Johto seuraaville: derivoimalla! Z xµ+1 + C, µ 6= 1 xµ dx = µ+1 Z a dx = ax + C, a vakio Z 1 dx = ln |x| + C = ln |Ax|, missä C = ln |A|. x Z ex dx = ex + C Z ax +C ax dx = ln a Z Z sin x dx = − cos x + C cos x dx = sin x + C tan x dx = − ln | cos x| + C cosh x dx = sinh x + C sinh x dx = cosh x + C Usein esiintyvät myös Z 1 dx 1+x Z 1 dx 1 + x2 Z 1 dx 1 − x2 Z 1 √ dx 1 − x2 Z 1 √ dx 2 x ±1 = ln |1 + x| + C = arctan x + C 1 1 + x ln +C 2 1 − x = = arcsin x + C = ln |x + p x2 ± 1| + C 4.2 Integraalien lasku Toisin kuin derivointi integrointi ei yleensä ole suoraviivainen mekaaninen toimenpide. Läheskään kaikki alkeisfunktioista muodostetut funktiot eivät ole integroituvia alkeisfunktioiden avulla! Integraalifunktion etsinnässä on käytössä lukuisia menetelmiä, joista tärkeimmät ovat muuttujan vaihto ja osittaisintegrointi. Polynomit ja sarjat Koska integrointi on lineaarinen operaatio, voimme laskea esim. minkä tahansa polynomin integraalin. Jos polynomi on muotoa, P (x) = a0 + a1 x + a2 x2 + · · · an xn , on sen integraali Z 1 1 an xn+1 . (4.4) P (x) dx = C + a0 x + a1 x2 + · · · + 2 n+1 Samoin P jos tunnemme funktion Taylorin sarjan, f (x) = n an xn , saamme välittömästi integraalifunktion sarjan Z X an (4.5) xn+1 f (x) dx = C + n + 1 n Tämä sarja ei välttämättä vastaa mitään alkeisfunktiota. 4.2.1 Ketjusäännön käyttö Derivoinnin ketjusäännön (2.19) d g(f (x)) = g ′ (f (x))f ′ (x) dx 21 mukaan on Z g ′ (f (x))f ′ (x) dx = g(f (x)). Jos g(x) = x2 , saadaan usein esiintyvä Z 1 f ′ (x)f (x) dx = f (x)2 + C 2 Tai jos g(x) = ln x, Z ′ f (x) dx = ln |f (x)| + C f (x) Yleisemmin Z f ′ (x)(f (x))n dx = (4.6) Sijoitetaan t = ln x, jolloin dt = 1/x dx eli dx = xdt. (4.7) (4.8) 1 (f (x))n+1 +C, n 6= −1 (4.9) n+1 Esimerkkejä: Z Z 1 sin x cos x dx = sin x(sin x)′ dx = sin2 x + C 2 Z Z sin x −(cos x)′ dx = dx = − ln | cos x| + C cos x cos x 4.2.2 Muuttujan vaihto Ketjusääntöön perustuu myös muuttujanvaihto- eli sijoitustekniikka. Olkoon F funktion f integraalifunktio, joka siis toteuttaa relaation d F (x) = f (x). dx Oletetaan nyt että x on parametrin t funktio, x(t). Ketjusäännön mukaan on d F (x(t)) = F ′ (x(t))x′ (t) = f (x(t))x′ (t). dt Integroimalla yhtälö puolittain saadaan siten Z F (x(t)) = f (x(t))x′ (t) dt, jonka voimme myös kirjoittaa muotoon Z Z f (x) dx = f (x(t))x′ (t) dt. (4.10) Lyhyesti, tämä vastaa sijoitusta dx = Valaistaan muuttujan vaihtoa esimerkillä: integroidaan Z ln x dx. x dx dt dt eli siis muuttuja x “ylennetään” muuttujan t funktioksi. Muuttujan vaihdon jälkeen integraali voi olla helpompi laskea. Tulos on t’n funktio, mutta saadaan x:n funktioksi kääntämällä x = x(t). Integraali on siten Z ln x dx = x Z t x dt = x Z t dt 1 2 t . 2 Sijoitetaan takaisin t = ln x, jolloin saadaan lopulta Z ln x 1 dx = ln2 x. x 2 = Integroinnin tulos kannattaa yleensä tarkistaa derivoimalla. Äskeisessä esimerkissä derivointi antaa h i 1 1 ln x d 1 2 ln x = 2 ln x = dx 2 2 x x kuten pitääkin. Ongelma: kuinka löytää sopiva sijoitus t(x)? Löytyy lukuisia sääntöjä, mutta yleispätevää ei. Kannattaa yrittää tunnistaa sopiva kokonaisuus integroitavasta funktiosta. tyypillisistä sijoituksista: REsimerkkejä (ax + b)µ dx: kokeillaan t = ax + b, dt = adx, joten Z Z dt µ (ax + b) dx = tµ a µ+1 (ax + b)µ+1 t +C = +C = a(µ + 1) a(µ + 1) R Esim. (5x − 6)6 dx. Sijoitetaan t = 5x − 6, dt = 5dx ⇒ dx = dt/5, ja Z Z 1 11 7 1 (5x − 6)6 dx = t6 dt = t +C = (5x − 6)7 + C 5 57 35 vaiheessa sijoitetaan x takaisin. √ RViimeisessä a2 − x2 dx: kokeillaan x = a sin p t, dx = a cos tdt. (Miksi tämä sijoitus? √ Syy: a2 − x2 = a2 − a2 sin2 t = |a cos t|.) Z Z p a2 − x2 dx = a cos t a cos tdt Z Z a2 = a2 cos2 tdt = (1 + cos 2t)dt 2 a2 1 = (t − sin 2t) + C 2 2 x 1 x a2 arcsin − sin(2 arcsin ) + C = 2 a 2 a ! r 2 x2 a x x = arcsin + 1− 2 +C 2 a a a 22 missä viimeisessä käytettiinpcos 2t = 2 cos2 t − 1 ja 2 Rsin√2t = 2 sin t cos t = 2 sin t 1 − sin t. 2 2 a + x dx: p Tässä toimii x = a sinh t, sillä 1 + sinh2 x = cosh x (vertaa edelliseen). R 1 ex +e−x dx: Kokeillaan y = ex , dy = ex dx ja Z Z 1 1 1 dx = dy ex + e−x y + 1/y y Z 1 dy = arctan y + C = arctan ex + C = 1 + y2 R √ 3x 1 − 2x2 dx: Kokeillaan u = 1 − 2x2 , du = −4xdx ⇒ xdx = − 14 du Z Z p 3 √ 2 udu 3x 1 − 2x dx = − 4 32 1 = − u3/2 + C = − (1 − 2x2 )3/2 + C 43 2 Huom: sijoitukset eivät useinkaan ole√yksikäsitteisiä. Esim. yllä voidaan kokeilla myös t = 1 − 2x2 , 1 dt = −2x(1 − 2x2 )−1/2 dx = − 2x t dx ⇒ xdx = − 2 tdt: Z Z p 1 2 3x 1 − 2x dx = 3t(− t)dt 2 1 1 3 = − t + C = − (1 − 2x2 )3/2 + C 2 2 Vinkki: juurilausekkeen sisältävässä integraalissa kannattaa kokeilla uudeksi muuttujaksi joko juuren sisäpuolta tai juurilauseketta kokonaisuudessaan R dx √ : 1+x √ Kokeillaan s = 1 + x, ds = 12 (1 + x)−1/2 dx ja Z Z √ dx √ = 2ds = 2s + C = 2 1 + x + C 1+x Usein juurilausekkeita sisältävät funktiot eivät ole integroitavissa alkeisfunktioiden avulla. Rkuitenkaan √ x+2 dx: x+1+1 √ sijoitus t = x + 1 ⇒ x = t2 − 1, dx = 2tdt: Z Z 2 x+2 t −1+2 √ 2tdt dx = t+1 x+1+1 Z 3 t +t =2 dt t+1 Koska rationaalilausekkeen osoittaja on korkeampaa kertalukua kuin nimittäjä, voimme “jakaa” lausekkeen muotoon polynomi + jakojäännös. Tästä tarkemmin rationaalifunktioiden integroinnin yhteydessä. Tarkistamalla nähdään että integraali on Z 2 2 t −t+2− =2 dt t+1 1 1 = 2( t3 − t2 + 2t − 2 ln(t + 1) + C 3 2 2 = (x + 1)3/2 − (x + 1) + 4(x + 1)1/2 3 √ −4 ln( x + 1 + 1) + C 4.2.3 Osittaisintegrointi Integroimalla tulon derivointisäännön d [f (x)g(x)] = f ′ (x)g(x) + f (x)g ′ (x) dx saamme osittaisintegrointisäännön Z Z ′ f (x)g(x) dx = f (x)g(x) − f (x)g ′ (x) dx. (4.11) R Sovelletaan osittaisintegrointia integraaliin x ln x dx. Olkoon säännön (4.11) f ′ (x) = x ja g(x) = ln x. Silloin on f (x) = 1/2 x2 ja g ′ (x) = 1/x ja saamme Z Z 1 2 1 1 x ln x dx = x2 dx x ln x − 2 2 x Z 1 1 2 = x ln x − x dx 2 2 1 1 2 x ln x − x2 . = 2 4 Kuten nähtiin, funktiot “f ” ja “g” täytyy valita huolellisesti että osittaisintegrointi johtaisi helpommin ratkeavaan integraaliin! Väärä valinta johtaa vain huonompaan lopputulokseen. R Esim. arctan xdx. Valitaan nyt g(x) = arctan x ja ′ 2 f ′ (x) Z = 1! Tästä seuraa g (x) =Z1/(1 + x ) ja f (x) = x, ja x arctan xdx = x arctan x − dx = 1 + x2 1 x arctan x − ln(1 + x2 ) + C 2 missä x/(1 + x2 ) on muotoa 12 u′ (x)/u(x). Tapaus f ′ = 1 on yleisesti R käytetty osittaisintegroinnissa. Esim. ln xdx: valitaan jälleen f ′ = 1, g = ln x, jolloin ′ f= Z x, g = 1/x, ja Z 1 ln xdx = x ln x − x dx = x ln x − x + C. x R Esim. x cos xdx: valitaan f ′ = cos x, g = x, jolloin ′ f= eroon x:n potenssista. Siis Z sin x, g = 1 ja pääsemme Z x cos xdx = x sin x − 1 sin xdx = x sin x + cos x + C. Esimerkin vuoksi katsotaan mitä tapahtuisi jos valitaan f ′ Z= x, g = cos x: nyt f = x2Z/2, g ′ = − sin x ja 1 2 1 x sin xdx x cos xdx = x2 cos x + 2 2 Saatu integraali on pahempi kuin alkuperäinen! Funktiot siis kannattaa valita huolella. Osittaisintegrointia voi joutua toistamaan: R 2 Esim. x sin xdx:kuten edellä, otetaan f ′ = sin x, g = x2 , joten f = − cos x, g ′ = 2x ja 23 Z x2 sin xdx = −x2 cos x + Z 2x cos xdx = −x2 cos x + 2x sin x + 2 cos x + C missä saatu integraali laskettiin jo edellä. Yleisesti: MuotoaZ Z Z xm sin xdx, xm cos xdx, xm ex dx usein integroida standardisijoituksella t = tan (Tämän olisi nähnyt nopeamminkin käyttämällä sin2 x = 21 (1 − cos 2x)) R Yleisemmin: tyyppiä sinn xdx olevat integraalit voidaan laskea palautuskaavan avulla: valitaan f ′ = sin x, g = sinn−1 x, joten f = − cos x, g ′ = (n − 1) sinn−2 x cos x Z sinn xdx Z n−1 = − cos x sin x + (n − 1) cos2 x sinn−2 xdx Z = − cos x sinn−1 x + (n − 1) (1 − sin2 x) sinn−2 xdx Z n−1 = − cos x sin x + (n − 1) sinn−2 xdx Z −(n − 1) sinn xdx Saimme siis jälleen alkuperäisen integraalin. Ratkaisemalla se saamme Z Z 1 n−1 sinn xdx = − cos x sinn−1 x + sinn−2 xdx n n Näin siis sinn x:n integraali saatiin palautettua sinn−2 x:n integraaliksi. Toistamalla tätä päästään aina n = 1 tai 0, ja sin1 x ja sin0 x integraalit tunnetaan. Samalla menetelmällä saamme cosn x:n integraalille palautuskaavan. Näin Z Z esim. 3 1 3 4 sin2 xdx = sin xdx = − cos x sin x + 4 4 Z 3 1 1 1 3 sin0 xdx) = − cos x sin x + (− cos x sin x + 4 4 2 2 3 3 1 − cos x sin3 x − cos x sin x + x + C 4 8 8 (4.12) Tällöin olevat integraalit voidaan laskea osittaisintegroimalla m kertaa R Esim. sin2 xdx: otetaan f ′ Z= g = sin x ⇒ f = − cos x, Zg ′ = cos x ja sin2 xdx = − cos x sin x + cos2 xdx = − cos x sin x + Z Z (1 − sin2 x)dx = − cos x sin x + x − sin2 xdx Saimme siis alkuperäisen integraalin, joka voidaan ratkaista yhtälöstä: Z 1 sin2 xdx = (− cos x sin x + x) + C 2 x 2 dt = cos x = = sin x = = x 1 2 ) dx ⇒ dx = dt, 2 2 1 + t2 x x x cos 2 = cos2 − sin2 2 2 2 1 − tan2 x2 x x 1 − t2 cos2 (1 − tan2 ) = = 2 2 1 + t2 1 + tan2 x2 x x x x 2 sin cos = 2 tan cos2 2 2 2 2 tan x2 2t = 2 1 + t2 1 + tan2 x2 (1 + tan2 Tällä ratkeavat kaikki sin x, cos x rationaalifunktiot. Esim: Z Z Z 1 + t2 2 1 1 dx = dt = dt = ln |t| + C = sin x 2t 1 + t2 t x ln | tan | + C 2 Helpompia sijoituksia usein kuitenkin ovat t = sin x, t = cos x, t = tan x, joita voi myös kokeilla. Monet trigonometrisia funktioita sisältävät integraalit voidaan laskea helpommin kompleksilukujen ja Eulerin kaavan avulla: cos x = sin x = eix = 1 ix (e + e−ix ) 2 1 ix (e − e−ix ) 2i cos x + i sin x (4.13) (4.14) (4.15) Näiden käyttö nojautuu siihen että ex :n integraalit ovat helppoja laskea. Imaginääriyksikö i on vakio, joka toteuttaa i2 = −1. Tästä puhutaan tarkemmin kompleksilukujen yhteydessä. Esim. Z = sin ax cos bxdx Z = 1 4i = 1 4i =− 4.2.4 Trignonometristen funktioiden integrointi: jos integroitava funktio sisältää sin x, cos x, se voidaan 24 Z eiax − e−iax eibx + e−ibx 2i 2 dx (ei(a+b)x + ei(a−b)x − e−i(a−b)x − e−i(a+b)x )dx ei(a+b)x ei(a−b)x e−i(a−b)x e−i(a+b)x + + + i(a + b) i(a − b) i(a − b) i(a + b) 1 cos(a + b) 1 cos(a − b) − +C 2 a+b 2 a−b +C 4.2.5 Rationaalifunktion integrointi Viimeisenä menetelmänä tarkastelemme muotoa R= Pn Qm S , Qm missä Tn−m on astetta n − m oleva osamääräpolynomi ja S jakojäännöspolynomi. Polynomi Tn−m on helppo integroida, joten jäljelle jää jälleen muotoa Pn /Qm oleva murtofunktio, missä nyt on n < m. Kaikki muotoa Pn R= ; (n < m) Qm olevat rationaalifunktiot voidaan integroida, mikäli tunnetaan polynomin Qm nollakohdat. Tällöin rationaalifunktio voidaan hajoittaa osamurtoihin. Polynomien jakolasku Kuinka polynomit jaetaan? Esim. jakokulmassa, kuten numerotkin. Esim: x2 + 5x − 3 P (x) = =? Q(x) x−1 x+6 x2 + 5x − 3 x2 − x 6x − 3 – 6x − 6 3 Jakolaskun tulos on siis x−1 – 2 x + 5x − 3 3 =x+6+ x−1 x−1 mikä on helppo tarkistaa laventamalla. Toinen esimerkki: 2x4 + 6x2 + 2 =? x2 + x + 1 2 x2 + x + 1 – ? = 2x2 − 2x + 6 + −4x − 4 x2 + x + 1 Polynomi in välittömästi integroitavissa. Entä jakojäännöksenjä jäävä rationaalifunktio? olevien murtolausekkeiden integrointia, kun Pn ja Qm ovat asteen n ja m polynomeja (siis suurimmat niissä esiintyvät potenssit ovat m ja n). Jos osoittaja on asteluvultaan suurempi kuin nimittäja, voidaan tehdä polynomien jakolasku ja päädytään lausekkeeseen R = Tn−m + Siis 2x − 2x + 6 2x4 + 6x2 +2 2x4 + 2x3 + 2x2 −2x3 + 4x2 +2 – −2x3 − 2x2 − 2x 6x2 + 2x + 2 – 6x2 + 6x + 6 −4x − 4 Jako osamurtoihin 1-kertaiset reaalijuuret: Oletetaan että yhtälöllä Q(x) = 0 on vain 1-kertaisia reaalijuuria; olkoon nämä juuret x1 , x2 , . . . xn (huom: Q:n asteluku on n, joten löytyy n juurta.) Tällöin voimme jakaa rationaalilausekkeen osamurtoihin n P (x) X Ai = Q(x) x − xi i=1 (4.16) missä Ai ovat vakioita. Selvästi oikea puoli voidaan nyt integroida. Esim: jaetaan 4/(x2 − 1) osamurtoihin: nimittäjän nollakohdat ovat x = ±1, mitkä ovat reaalisia ja yksinkertaisia (x2 − 1 = (x − 1)(x + 1)). Siis x2 4 a b = + −1 x−1 x+1 ja määräämme vakiot a ja b siten, että yhtälö on voimassa kaikilla muuttujan x arvoilla. Kerrotaan yhtälö (x + 1)(x − 1):llä, joten 4 = a(x + 1) + b(x − 1) = (a + b)x + (a − b) Jotta tämä olisi yhtäsuuri alkuperäisen lausekkeen kanssa, täytyy olla a + b = 0 ja a − b = 4, joten a = 2 ja b = −2. Osamurtojen avulla integraali Z 4 dx. 2 x −1 on heti laskettavissa: Z 4 dx = 2 x −1 = = = Z 2 2 dx − dx x−1 x+1 2 ln |x − 1| − 2 ln |x + 1| + C ln(x − 1)2 − ln(x + 1)2 + C 2 x−1 + C. ln x+1 Z Sovelletaan edellistä integraaliin Z 3 x −2 F (x) = dx x2 − 1 Osoittaja on korkeampaa kertalukua, joten tehdään ensin polynomien jakolasku. Nähdään että x−2 x3 − 2 =x+ 2 2 x −1 x −1 25 Jäännöslausekkeen nimittäjän nollakohdat ovat x = ±1, 1-kertaisia. Siis voimme jakaa x−2 x2 − 1 x−2 = = ⇒ ⇒ a b + ⇒ x−1 x+1 a(x + 1) + b(x − 1) = (a + b)x + (a − b) = = = a1 a2 a3 b 3x2 − 37x + 83 = + + + (x − 2)3 (x + 5) x − 2 (x − 2)2 (x − 2)3 x+5 Lavennetaan nimittäjät pois: 3x2 − 37x + 83 = a1 (x − 2)2 (x + 5) +a2 (x − 2)(x + 5) + a3 (x + 5) + b(x − 2)3 a + b = 1, a − b = −2 a = −1/2, b = 3/2 Siis F (x) Siis Z −1/2 3/2 dx + x−1 x+1 1 2 1 3 x − ln |x − 1| + ln |x + 1| + C 2 2 2 1 2 1 (x + 1)3 +C x + ln 2 2 x−1 x+ Moninkertainen juuri: Yleisemmässä tapauksessa polynomilla voi olla moninkertaisia juuria (joiden edelleen oletamme olevan reaalisia). Yleisesti polynomi Q(x) voidaan kirjoittaa muotoon Q(x) = A(x − x1 )n1 (x − x2 )n2 . . . missä xi ovat polynomin nollakohtia, ni nollakohdan xi kertaluku ja A vakio. Tässä tapauksessa osamurtolausekkeella on yleinen muoto n n k=1 k=1 2 1 X P (x) X bk ak + + ... = Q(x) (x − x1 )k (x − x2 )k missä ak , bk . . . ovat vakioita. Esim. 1 b a1 a2 + = + 2 2 (x − 1) (x + 2) x − 1 (x − 1) x+2 x = 1 on 2-kertainen nollakohta, ja x = −2 1-kertainen. Määrätään vakiot kertomalla (x − 1)2 (x − 2):lla: 1 = a1 (x − 1)(x + 2) + a2 (x + 2) + b(x − 1)2 Tästä voidaan ratkaista vakiot vaatimalla että yhtälön kaikkien x:n potenssien kertoimet ovat samat molemmin puolin (x0 , x1 , x2 ). Kuitenkin usein nopeampi menetelmä on sijoittaa x 7→ xi : x = 1 ⇒ 1 = a2 (1 + 2) ⇒ a2 = 31 x = −2 ⇒ 1 = b(−2 − 1)2 = b9 ⇒ b = 91 a1 saadaan esim. x2 :n kertoimista: 0 = a1 + b ⇒ a1 = − 91 . Esimerkki: integroidaan Z 3x2 − 37x + 83 F (x) = (x − 2)3 (x + 5) Osoittaja (2) on alempaa astetta kuin nimittäjä (4), joten voidaan jakaa suoraan osamurtoihin. Nimittäjän nollakohdat ovat x1 x2 = = 2, −5, 3-kertainen 1-kertainen Tästä tulee 4 yhtälöä 4 vakiolle (x:n potenssit x0 . . . x3 ), jotka ovat suoraan ratkaistavissa. Määrätään kuitenkin vakiot jälleen käyttämällä “pikamenetelmää” ja sijoitetaan nollakohdat: x = 2: 3 · 4 − 37 · 2 + 83 = a3 7 ⇒ a3 = 3 x = −5: 3 · 25 + 37 · 5 + 83 = −b73 ⇒ b = −1 Muut vakiot vaativat muita ehtoja, helpoin lienee x:n korkeimman potenssin kerroin, mikä voidaan lukea suoraan: x3 : 0x3 = a1 x3 + bx3 ⇒ a1 = −b = 1 Jäljelle jää a2 . Tämän saa esim x2 :n kertoimesta tai sijoittamalla esim. x = 0: 83 = a1 4 · 5 − a2 2 · 5 + a3 5 − b8 ⇒ a2 = −4 Siis saimme a1 = 1, a2 = −4, a3 = 3, b = 1, ja Z 1 −4 3 −1 F (x) = dx + + + x − 2 (x − 2)2 (x − 2)3 x+5 3 = ln |x − 2| + 4(x − 2)−1 − (x − 2)−2 2 − ln |x + 5| + C x − 2 4 1 3 +C = − + ln x − 2 2 (x − 2)2 x + 5 Kompleksijuuret: Yleisimmässä tapauksessa polynomin Q(x) juuret ovat kompleksisia. Esim. x2 + 1 = 0 ⇒ x = ±i Kompleksijuurisen rationaalifunktion integraalin voi laskea yllä olevia sääntöjä noudattaen, ottaen vain huomioon että joistain kertoimista tulee kompleksilukuja. Näitä varten voidaan myös johtaa omat integrointisäännöt. Tätä ei käsitellä MAPU I:llä tarkemmin. 4.3 Määrätty integraali Tarkastellaan suljetulla välillä [a, b] määriteltyä paloittain jatkuvaa rajoitettua funktiota f (x). Jaetaan väli [a, b] n yhtäsuureen h-mittaiseen osaan, h= b−a n (4.17) ja merkitään xk = a + kh, (4.18) ts. x0 = a, x1 = a + h, x2 = a + 2h, . . . , xn = b. 26 (4.19) f(x ) Integrointirajojen vaihto Määrittelimme (4.21) integraalin ”vasemmalta oikealle”eli integroimisvälissä [a, b] oli a ≤ b. Tällöin jakoväli h = (b − a)/n on positiivinen. Voimme myös ajatella integrointia ”oikelta vasemmalle”, jolloin jakovälistä (4.17) tulee negatiivinen. Tämän huomioonottaen määrittelemme Z a Z b f (x) dx. f (x) dx = − (4.23) f(x 4) A x 1 x 2 h { x 0= a b = x 4 x 6 x 7 Jakoon (4.19) liittyvä porrassumma on Sn = h n−1 X f (xk ). Additiivisuus (4.20) k=0 Jos c on integroimisvälin [a, b] sisäpiste, nähdään määritelmästä (4.21) että voimme koostaa integraalin paloista, kuten Geometrisesti summan jokainen termi Z Ak = hf (xk ) esittää suorakaiteen, leveydeltään h ja korkeudeltaan f (xk ), pinta-alaa. Koska jakovälin pituus h on positiivinen, pinta-ala Ak on positiivinen jos f (xk ) on positiivinen ja negatiivinen jos f (xk ) on negatiivinen. Summa Sn (4.20) approksimoi siten välillä [a, b] käyrän y = f (x) ja x-akselin väliin jäävää pinta-alaa siten, että x-akselin yläpuolinen osa lasketaan positiivisena ja alapuolinen osa negatiivisena. Tämä approksimaatio on ilmeisestikin sitä tarkempi mitä tiheämpi jako on, ts. mitä pienempi on h tai mitä suurempi on n. Voidaan osoittaa, että jaon (4.19) tihentyessä summa (4.20) lähestyy äärellistä raja-arvoa, ts. raja-arvo S = lim Sn n→∞ on olemassa ja äärellinen. Tätä raja-arvoa sanotaan funktion f (x) määrätyksi integraaliksi välillä [a, b]. Sitä merkitään kuten Z b n−1 X f (xk ). f (x) dx = lim h (4.21) n→∞ a b a Kuva 4.1 Porrassumma b f (x) dx = a Z c f (x) dx + a Z b f (x) dx. (4.24) c Ottaen huomioon rajojen vaihto-ominaisuuden (4.23) näemme, että additiivisuus (4.24) on voimassa olivatpa a, b ja c mitä tahansa funktion määrittelyalueen pisteitä. Lineaarisuus Integraalin määritelmästä (4.21) nähdään, että integrointi on lineaarinen operaatio, ts. Z b [αf (x) + βg(x)]dx = α a Z b f (x) dx + β a Z b g(x) dx. a (4.25) Integroimismuuttujan vaihto Rb Integraalin a f (x) dx arvo (käyrän ja x-akselin välinen pinta-ala) ei ilmeisestikään riipu muuttujasta x. On siis aivan samantekevää, millä symbolilla funktion argumenttia merkitään, ts. Z b f (x) dx = a Z b f (s) ds. (4.26) a k=0 Geometrisesti määrätty integraali on ilmeisestikin käyrän y = f (x) ja x-akselin väliin jäävä pinta-ala. 4.3.1 Määrätyn integraalin ominaisuuksia Tyhjä integroimisväli Olkoon integrointiväli [a, a], ts. se sisältää vain yhden pisteen. Tällöin on Z a (4.22) f (x) dx = 0, a sillä integraalin määritelmässä (4.21) jakoväli h = (a − a)/n on aina nolla riippumatta jakopisteiden lukumäärästä. 4.3.2 Kertymäfunktio Funktion f kertymäfunktio K on Z x f (t) dt. K(x) = (4.27) a Ilmeisestikin pisteessä a kertymäfunktio on nolla, sillä Z a f (t) dt = 0. K(a) = a Kertymäfunktio (4.27) ilmoittaa käyrän ja x-akselin välisen pinta-alan kohdasta a kohtaan x. Annetaan kertymäfunktion argumentille (pieni) lisäys ∆x. 27 Vastaava kertymäfunktion muutos Esim. Z ∆K = K(x + ∆x) − K(x) on silloin suuruudeltaan likimain kuvan 4.2 varjostetun alueen pinta-ala ∆A = ∆xf (x), ts. K(x + ∆x) − K(x) ≈ ∆xf (x). b ex dx = / ex = eb − ea a a Esim. Z 2π 2π sin xdx = − / cos x = − cos 2π + cos 0 = 0 0 0 Rx d f (t)dt = f (x), on ketjusäännön Huom: koska dx a mukaan Z g(x) Z g d dg d f (t)dt = f (t)dt = f (g(x))g ′ (x) dx a dx dg a f(x ) D A K (x ) b Esim. a x d dx x + D x Kuva 4.2 Kertymäfunktion derivaatta K(x + ∆x) − K(x) = f (x) ∆x→0 ∆x d K (x) = dx Z 0 (4.28) L→∞ Esim. Z a Täten siis kertymäfunktio K(x) on f (x):n integraalifunktio, katso (4.1), riippumatta määrätyn integraalin alarajasta a. Kertymäfunktiokin on siis muotoa Z x f (t) dt = F (x) + C. K(x) = b a Z Z a Integroimisvakio C määräytyy nyt alkuehdosta Z eli C = −F (a), ∞ 1 ∞ (4.29) Tämä ominaisuus on ilmeisestikin voimassa olipa F mikä hyvänsä funktion f integraalifunktio. Määrättyjä integraaleja laskettaessa käytetään usein sijoitusmerkintää: Z b b f (t) dt = / F (t) = F (b) − F (a). (4.30) a b −1 1 1 = − x a b a ∞ 1 1 dx = x2 ∞ −1 =1 x 1 ∞ 1 dx = / ln x hajaantuu x 1 1 Z b a 1 dx = x2 ∞ √ √ dx √ = 2 x = lim (2 L − 2) hajaantuu L→∞ x 1 joten saamme yhteyden määrätyn integraalin (kertymäfunktion) ja integraalifunktion välille: f (x) dx = F (b) − F (a). a Esim. K(a) = F (a) + C = 0 Z d2x = 2 sin 2x dx Jos raja-arvo on olemassa, sanotaan että integraali suppenee, muuten hajaantuu. x f (t) dt = f (x). sin xdx = sin(2x) a lim ′ 2x Epäoleellinen integraali on määrätty integraali jossa ainakin toinen raja = ∞: Z L Z ∞ f (x)dx (4.31) f (x)dx ≡ lim Tämä relaatio on ilmeisestikin sitä tarkempi mitä pienempi ∆x on, joten saamme eli Z 1 0 1 √ dx √ = 2 x=2 x 0 Huom: kuten edellä, määrätty integraali voi olla olemassa vaikka integroitava → ∞ jossain pisteessä! Esim. Seuraava kaunis tulos pätee (ei näytetä tässä) Z ∞ √ 2 e−x = π −∞ Esim. Oletetaan p 6= −1: Z a 28 ∞ 1 p x dx = ∞ 1 xp+1 1 = ( lim Lp+1 − 1) p+1 p + 1 L→∞ = Z 1 xp dx = 0 ∞ 1/(p + 1) 1 jos p > −1 jos p < −1 Esim. I = ′ = 1 xp+1 = (1 − lim ap+1 ) a→0 p+1 p+1 ln xdx: 0 a→0 jos p > −1 jos p < −1 1/(p + 1) ∞ 1 valitaan f = 1 ja g = ln x, joten f = x ja g ′ = 1/x: Z 1 1 1 1 x dx = (0 − 0) − / x = 1 I = / x ln x − x 0 0 0 Huomaa että tässä on käytetty “0 ln 0 = 0”, sillä lim a ln a = 0. 0 Z Derivointi parametrin suhteen 4.3.3 Muuttujan vaihto määrätyssä integraalissa Integrointimenetelmät määrätylle integraalille ovat samat kuin integraalifunktiollekin, mutta lisäksi tulee ottaa huomioon kuinka integroimisalueen rajat käyttäytyvät! Integraalissa Z b f (x)dx I= Usein näppärä keino integraalien sieventämisessä on derivoida integroitavaa jonkun parametrin suhteen: jos f (x, t) on kahden muuttujan funktio, voimme määritellä Z b f (x, t)dt I(x) = a jolloin I ′ (x) = a sijoitetaan x = g(t), jolloin dx = g ′ (t)dt ja kun x = a tai b, on a b g(ta ) ⇒ ta = g −1 (a) g(tb ) ⇒ tb = g −1 (b) = = b a ∂f (x, t) dt ∂x Tässä osittaisderivaatta ∂f (x, t)/∂x tarkoittaa että f derivoidaan muuttujan x suhteen pitäen t vakiona. Esim. halutaan integroida Z ∞ t2 e−at dt 0 Siis I= Z g −1 (b) ′ f (g(t))g (t)dt = g −1 (a) Z tb ′ f (g(t))g (t)dt (4.32) 0 0 π/2 0 1 (cos 2t + 1)dt = 2 π/2 π 1 1 ( sin 2t + t) = 2 2 4 b a b f ′ (x)g(x)dx = / f (x)g(x) − a Esim. I = Z ∞ Z (4.33) I (a) = Z = e−at dt = 0 ∞ − 1 e−at = a a 0 ∞ Z0 ∞ (−te−at )dt = − t2 e−at dt = 0 1 a2 1 a3 Derivointi parametrin suhteen korvaa usein osittaisintegrointia, mutta voi olla huomattavasti nopeampi. Funktio y = f (x) määrittelee (x, y) -tason käyrän kun x ∈ [a, b]. Kun x muuttuu dx:n verran, y muuttuu dy = f ′ (x)dx:n verran. dy = dx ds dy Kuva 4.3 a xe−x dx: 0 ′′ ≡ ∞ dx f (x)g ′ (x)dx olkoon f ′ = e , g =Z x, joten f = −e−x , g ′ = 1: ∞ ∞ ∞ (−e−x )dx = (0 − 0) − e−x = I = x(−e−x ) − 0 I ′ (a) b 0 −x −(0 − 1) = 1 I(a) Z Käyrän pituus 0 4.3.4 Määrätyn integraalin osittaisintegrointi Kuten arvata saattaa, on osittaisintegrointisääntö määrätylle integraalille Z Tämän voisi integroida osittain, mutta vaihtoehtoisesti voimme määritellä ta Rajojen vaihto on helppo muistaa seuraavasti: jos x:n rajat ovat a, b, niin korvataan ne vain niitä vastaavilla t:n arvoilla. R1√ Esim. I = 0 1 − x2 dx: sopiva sijoitus on x = sin t, ja dx = cos tdt. Nyt kun x = 0, on t = 0, ja kun x = 1 on t = π/2. Siis Z π/2 Z π/2 p 2 1 − sin t cos tdt = cos2 tdt = I= Z Z 0 Tästä saadaan käyrän pituuden differentiaali p p ds = (dx)2 + (dy)2 = 1 + [f ′ (x)]2 dx ja siis koko käyrän (funktion kuvaajan) pituus Z bp L= 1 + [f ′ (x)]2 dx a 29 √ Esimerkki: olkoon y = 1 − x2 , kun 0 ≤ x ≤ 1 (ympyrän neljännes). Mikä on kaaren pituus? Z 1p 1 + y ′ (x)2 dx L = 0 Z 1s −x 2 1+ √ = dx 1 − x2 0 Z 1r x2 1+ dx = 1 − x2 0 Z 1 dx √ = 1 − x2 0 1 π = / arcsin(x) = 2 0 ja tilavuus V = −R π R Z i2 hp R2 − x2 dx = π R −R (R2 − x2 )dx 1 4 (R2 x − x3 ) = πR3 3 3 Toinen mahdollisuus on käyttää symboliseen laskentaan tehtyjä tietokoneohjelmia. Näistä tunnetuimpia ovat Maple ja Mathematica. Nämä osaavat huomattavasti enemmän integrointitemppuja kuin MAPUlla on kuvattu. Jos näitä ei ole saatavilla, löytyy Mathematicaan pohjautuva ilmaiseksi käytettävä “laskin” www-sivulta www.wolframalpha.com (ainakin v. 2010). Tämäkin tuntee kaikki integointitemput mitkä Mathematicakin, ja sen avulla kannattaa muun muassa tarkistaa MAPUn kotitehtävät. r x Oletetaan että käyrä r = f (x) > 0 pyörähtää x-akselin ympäri. Kun rajoitutaan a ≤ x ≤ b, käyrä rajaa pyörähdyskappaleen pinnan, päädyissä x = a, x = b olevien ympyröiden kanssa. Nyt käyrän pyyhkäisemän pinnan alan differentiaali on p dA = 2πrds = 2πf (x) 1 + [f ′ (x)]2 dx joten alaksi saadaan Z b p 2πf (x) 1 + f ′ (x)2 dx + πf (a)2 + πf (b)2 A= a Samoin pyörähdyskappaleen tilavuuden differentiaali on (ympyräkiekon tilavuus) dV = πr2 dx = πf (x)2 dx ja tilavuudeksi tulee b π[f (x)]2 dx a √ R2 − x2 , −R ≤ x ≤ R, pyörähtää x-akselin ympäri määritellen pyörähdyskappaleen (mikä on tässä tapauksessa tietysti pallo). Sen pinta-ala on s Z R 2 p −x dx 2π R2 − x2 1 + √ A = R 2 − x2 −R Z R R 2πRdx = 2πR / x = 4πR2 = Esim. Ympyrän kaari r = −R π Kun omat neuvot eivät riitä, voi turvautua apuvälineisiin. Integraaleja on taulukoitu lukuisiin kirjoihin, joista paras ja tunnetuin lienee Gradshteyn and Ryzhik: Table of Integrals, Series, and Products. y Z R Integroinnin apuvälineet Pyörähdyskappaleen pinta-ala ja tilavuus V = Z −R mikä on tietysti tunnettu tulos. z = −R 30 4.3.5 Numeerinen integrointi puolisuunnikassäännöllä Usein integraalifunktiota ei osata (tai voida) laskea, vaan joudutaan turvautumaan integraalin numeeriseen laskemiseen. Lasku perustuu määrätyn integraalin tulkintaan pinta-alana, lasketaan siis porrassumman kaltainen summa äärellisellä askelvälillä. Porrassumma (4.20) ei kuitenkaan ole käytännössä suositeltava tapa laskea integraalia, sillä se on hyvin tehoton. Yksinkertaisin suositeltava tapa on käyttää ns. puolisuunnikassääntöä: Olkoon laskettavana integraali Z tässä x1 = xi , x2 = xi+1 ): Z x2 h f (x)dx − [f (x1 ) + f (x2 )] V (h) = 2 x1 Z x1 +h [f (x1 ) + f ′ (x1 )(x − x1 ) = x1 b f (x)dx a = • Jaetaan integroimisväli (a, b) N :ään tasaväliin x0 , x1 , . . . xN (tässä x0 = a ja xN = b). Yhden välin pituus on siis h = (b − a)/N . y f(x) = 1 + f ′′ (x1 )(x − x1 )2 + . . . 2 h − [f (x1 ) + [f (x1 ) + f ′ (x1 )h 2 1 ′′ 2 + f (x1 )h + . . .] 2 1 1 1 f (x1 )h + f ′ (x1 ) h2 + f ′′ (x1 ) h3 2 2 3 1 h − [2f (x1 ) + f ′ (x1 )h + f ′′ (x1 )h2 ] + O(h4 ) 2 2 1 − h3 f ′′ (x0 ) + O(h4 ) 12 Siis virhe yhden välin pinta-alassa on O(h3 ). Koko summassa virhe tulee siis olemaan V = N O(h3 ) = O(N h3 ) = O( x0 x1 x2 xN x Kuva 4.4 • Approksimoidaan integraalia summaamalla kunkin välin ala puolisuunnikkaan pinta-alan avulla: Z xi+1 1 f (x)dx ≈ h [f (xi ) + f (xi+1 )] 2 xi f( xi+1) f( xi) xi xi+1 Kuva 4.5 Puolisuunnikkaan ala sillä h = (b − a)/N = O(1/N ). Siis: jos lisäämme jakopisteiden määrää tekijällä 2 (N → 2N ), virhe pienenee tekijällä 4. Harjoitustehtävä: mikä virhe tulee jos arvoidaan integraalia summalla suorakaiteita, eli Z xi+1 f (x)dx = hf (xi ) ? xi Hiven tarkempi tulos integroinnissa saadaan jos käytetään puolisuunnikassäännön sijasta Simpsonin sääntöä: siinä arvoidaan funktiota sovittamalla siihen parabeli (toisen asteen käyrä). Tässä tapauksessa virhe koko integraalissa on vain O(1/N 4 ). Vielä hienostuneemmat menetelmät eivät jaa integroimisaluetta tasaväleihin, vaan tihentävät jakoa niissä kohdissa missä funktio muuttuu nopeimmin. Lisätietoja numeerisesta integroinnista saa erinomaisesta kirjasta N umerical Recipes (Cambridge University Press), ja sen verkkosivulta www.nr.com. Tämä kirja on jokaisen numeriikkaa harrastavan perusteos! • Näin siis koko integraaliksi tulee Z b a f (x)dx ≈ 1 ) N2 N −1 X h h f (xk ) + f (xN ) f (x0 ) + h 2 2 k=1 Kuinka suuri virhe tehdään? Tätä voidaan estimoida kehittämällä yhden välin virhe Taylorin sarjaksi (olkoon 31 5. Kompleksiluvut 5.1 Lukualueen laajennus Luonnolliset luvut N : 1, 2, 3, . . . Luonnollisille luvuille on määritelty Reaalilukujen joukosta löytyy myös vastaus kysymykseen paljonko on x, kun x · x = a ja a ≥ 0. Kysymykseen, onko olemassa sellainen x ∈ R, että x · x = a kun a < 0, vastaus on edelleenkin kielteinen. Laajennetaan lukualuetta kompleksilukuihin C lisäämällä imaginääriluvut. • yhteenlasku: a + b ∈ N , kun a, b ∈ N . • kertolasku: a · b ∈ N , kun a, b ∈ N . Kysymys: Löydetäänkö aina sellainen x ∈ N , että a + x = b kun a, b ∈ N ? Vastaus: ei aina (esim. a = 5, b = 2). Laajennetaan lukualuetta lisäämällä 0 ja negatiiviset luvut. Kokonaisluvut Z : . . . , −2, −1, 0, 1, 2, . . . 5.2 Kompleksilukujen esitys ja algebra 5.2.1 Imaginääriyksikkö Määritellään imaginääriyksikkö i siten, että i2 = −1. Jos nyt a ∈ R on jokin reaaliluku, niin ia on imaginääriluku, joka toteuttaa relaation Kokonaisluvuille on määritelty • yhteenlasku: a + b ∈ Z, kun a, b ∈ Z. • vähennyslasku: a − b = a + (−b) ∈ Z, kun a, b ∈ Z. (ia)2 = i2 a2 = −1 · a2 = −a2 . Kompleksiluku z ∈ C voidaan esittää mm. reaaliluvun ja imaginääriluvun summana z = a + ib, • kertolasku: a · b ∈ Z, kun a, b ∈ Z. Vähennyslasku a − b vastaa kysymykseen: paljonko on x, jos x + b = a. Kysymys: Onko olemassa sellainen x ∈ Z, että a · x = b, kun a, b ∈ Z? Vastaus: ei aina (esim. a = 3, b = 2). Laajennetaan lukualuetta lisäämällä murtoluvut. Rationaaliluvut Q : a ; a, b b ∈ Z, b 6= 0 Rationaaliluvuille on määritelty • yhteenlasku: a + b ∈ Q, kun a, b ∈ Q. • vähennyslasku: a − b ∈ Q, kun a, b ∈ Q. • kertolasku: a · b ∈ Q, kun a, b ∈ Q. • jakolasku: a b Re z Im z • vähennyslasku: a − b ∈ R, kun a, b ∈ R. • kertolasku: a · b ∈ R, kun a, b ∈ R. • jakolasku: a b ∈ R, kun a, b ∈ R ja b 6= 0. a b, (5.3) ax2 + bx + c = 0 ratkaisut ovat x= p 1 (−b ± b2 − 4ac) 2a Jos b2 ≥ 4ac, ratkaisut ovat reaalisia. √ Jos b2 < 4ac, niin ( )2 < 0 ja x= p p 1 1 (−b ± −(4ac − b2 )) = (−b ± i 4ac − b2 ) 2a 2a z 2 − 2z + 5 = 0 Reaaliluvuille on määritelty • yhteenlasku: a + b ∈ R, kun a, b ∈ R. = = kun z = a + ib. Tutustuimme kompleksilukuun 2. asteen yhtälön ratkaisuissa: yhtälön Esim. Reaaliluvut R (5.2) missä a, b ∈ R. Sanotaan, että a on luvun z reaaliosa ja b sen imaginääriosa. Kompleksiluvun reaaliosaa ja imaginäärisosaa merkitään kuten ∈ Q, kun a, b ∈ Q ja b 6= 0. Jakolasku ab vastaa kysymykseen: paljonko on x, kun x · b = a? Kysymys: Onko olemassa sellainen x ∈ Q, että x · x = a, kun a ∈ Q ja a > 0? Vastaus: ei aina (esim. a = 2). Laajennetaan lukualuetta lisäämällä irrationaaliluvut. (5.1) ratkaisut ovat √ √ z = 12 (2 ± 4 − 20) = 12 (2 ± −16) = 1 ± 2i. Kompleksiluku z on (puhtaasti) reaalinen, jos Im z = 0 ja (puhtaasti) imaginäärinen, jos Re z = 0. Kompleksiluvut ovat yhtäsuuria, jos niiden reaali- ja imaginääriosat ovat yhtäsuuria, ts. u = v tarkoittaa, että Re u = Re v ja Im u = Im v. Kompleksiluku on nolla jos ja 32 vain jos sen reaali- ja imaginääriosat ovat nollia, ts. z = 0 on sama kuin Re z = Im z = 0. Kompleksiluvun z = a + ib liittoluku eli kompleksikonjugaatti z ∗ on z ∗ = a − ib, (5.4) Jakolasku Jakolasku on hieman monimutkaisempi. Lavennetaan ensin murtolauseke u/v nimittäjän kompleksikonjugaatilla, jolloin päädytään reaaliseen (ja positiiviseen) nimittäjään: ts. konjugoitaessa vaihdetaan imaginääriosan merkki. Kompleksiluvun z normi |z|2 on |z|2 = zz ∗ = (Re z)2 + (Im z)2 . a + ib (a + ib)(c − id) u = = . v c + id (c + id)(c − id) (5.5) Normin laskusäännön (5.5) mukaan nimittäjä on nyt Normi on siis aina ei-negatiivinen ja nolla vain jos luku itse on nolla. z ∗ on fyysikoiden käyttämä merkintä. Matemaatikot piirtävät kompleksikonjugoidun suureen päälle viivan, z̄. Normiksi kutsutaan silloin tällöin myös suuretta siitä käytetään merkintää |z|. p |z|2 , |v|2 = vv ∗ = (c + id)(c − id) = c2 + d2 ∈ R ja osoittaja jolloin Insinöörit puolestaan merkitsevät imaginääriyksikköä symbolilla j. 5.2.2 Algebra Kompleksilukujen algebra saadaan soveltamalla reaalilukujen algebraa summiin z = a + ib muistaen kuitenkin, että i2 = −1. Tarkastellaan kompleksilukuja u = a + ib ja v = c + id. (a + ib)(c − id) = ac + bd + i(bc − ad). Tämän jälkeen jakolasku on helppoa, jaetaan vain osoittajan reaali- ja imaginääriosat reaalisella nimittäjällä, ts. u v u Im v Re = = Yhteenlasku Vastaavasti kompleksiluvun z käänteisluku z −1 = saadaan seuraavasti: jos z = x + iy, niin Summa u + v voidaan muodostaa kuten u + v = a + ib + c + id = (a + c) + i(b + d), z −1 eli Re (u + v) = Im (u + v) = Re u + Re v Im u + Im v. (5.6) = Vastaavasti vähennyslasku antaa z −1 = u − v = a + ib − c − id = (a − c) + i(b − d) Re (u − v) = Im (u − v) = Re u − Re v Im u − Im v. (5.7) 1 x − iy = x + iy (x + iy)(x − iy) x y x − iy = 2 −i 2 2 2 x +y |z| |z| = = (a + ib)(c + id) ac + (ib)(id) + (ib)c + a(id) = = ac + i2 bd + i(bc + ad) (ac − bd) + i(ad + bc) = = 3 − i2 + (−1 + i) = 3 − 1 + i(−2 + 1) 2−i u−v = 3 − i2 − (−1 + i) = 3 + 1 + i(−2 − 1) ja (Re u)(Re v) − (Im u)(Im v) (Re u)(Im v) + (Re v)(Im u). = 4 − 3i, Kertolasku taas antaa tai = = 1 1 − 2i 1 2 = = −i 1 + 2i (1 + 2i)(1 − 2i) 5 5 u+v Kahden kompleksiluvun tulo puolestaan on Re (uv) Im (uv) 1 z Esim. Olkoot u = 3 − i2 ja v = −1 + i. Laske u + v, u − v, uv ja u/v Yhteen- ja vähennyslasku antavat Kertolasku u·v = (5.9) Esim. Luvun z = 1 + 2i käänteisluku on Vähennyslasku eli (Re u)(Re v) + (Im u)(Im v) |v|2 (Im u)(Re v) − (Re u)(Im v) . |v|2 uv (5.8) 33 = = (3 − i2)(−1 + i) = −3 + 3i + 2i − 2ii −1 + 5i myös napakoordinaatteja, ns. polaariesitystä: ja jakolasku 5.2.3 Kompleksitaso Kompleksiluku voidaan esittää myös x, y-tason pisteinä (vektoreina): z = x + iy 7→ (x, y) = (Re z, Im z). Tässä siis y-akselin yksikkönä on i. Tasoa, jossa kompleksilukuja esitetään sanotaan kompleksitasoksi. Tason akseleita kutsutaan yleensä reaali- ja imaginääriakseleiksi. Kääntäen, jokaista (kompleksi)tason pistettä vastaa kompleksiluku. z = ( x ,y ) { r f R e z Kuva 5.1 Kompleksitaso x = r c o s f Kuva 5.2 Polaariesitys Polaariesityksessä (r, φ) • r on kompleksiluvun itseisarvo |z| = modz, • φ on luvun z vaihekulma eli argumentti. Kuvassa 5.1 r on pisteen etäisyys origosta. Pythagoraan teoreeman mukaan on x y = = r cos φ r sin φ, (5.12) ts. r2 = x2 + y 2 = |z|2 z = x + iy = r cos φ + ir sin φ = reiφ (5.13) missä viimeisessä kohdassa käytettiin Eulerin kaavaa ja r = |z| = Suure R e z Jotta reaali- ja imaginääriosien merkit saataisiin oikein, on tällä kertaa arkustangenttia pidettävä monikäsitteisenä funktiona. Kaikista mahdollisista kulman φ = arctan xy arvoista on valittava se, jolla sekä cos φ ja x keskenään että sin φ ja y keskenään ovat saman merkkisiä. Kääntäen napakoordinaateista (r, φ) päästään luvun z = x + iy karteesisiin koordinaatteihin kaavoilla r x z = ( r c o s f ,r s in f ) Polaariesityksessa kompleksiluvun z = x + iy koordinaatit ovat p r = |z| = x2 + y 2 (5.11) φ = arctan xy . z y z { = = Im Im 3 − 2i 3 − 2i −1 − i −3 − 3i + 2i − 2 = · = −1 + i −1 + i −1 − i 1+i−i+1 5 1 −5 − i = − − i. 2 2 2 y = r s in f u v p (Re z)2 + (Im z)2 = |z| = √ zz ∗ . eiφ = cos φ + i sin φ. (5.10) p √ zz ∗ = |z|2 on kompleksiluvun z itseisarvo, luvun suuruus. Joskus puhutaan myös modulista ja käytetään merkintää |z| = modz. Kun z on puhtaasti reaalinen, on Tämä osoitetaan myöhemmin. √ Esim. Luku 2 + 2 3i polaariesityksessä Nyt moduli on √ √ r = |2 + 2 3i| = 4 + 12 = 4. Vaihekulma on φ = arctan √ √ 2 3 π = arctan 3 = . 2 3 Nyt siis |z| = p (Re z)2 = |Re z| eli itseisarvon määritelmä yhtyy tässä tapauksessa reaaliluvun itseisarvon määritelmään. Huom: kompleksikonjugointi z → z ∗ vastaa heijastusta x-akselin suhteen: iy → −iy. Kompleksitason pisteiden esityksessä voidaan käyttää √ π π 2 + 2 3i = 4eiπ/3 = 4 cos + 4i sin . 3 3 √ Esim. Luku −2 + 2 3i polaariesityksessä Kuten edellä, moduli on r = 4. Vaihekulma on nyt √ √ 2 3 φ = arctan = arctan(− 3). −2 34 (5.14) Tangetille on voimassa tan(φ + nπ) = tan φ. Jos siis φ = arctan x, niin on myös φ + nπ = arctan x. Vaihekulmaa määrättäessä on näistä mahdollisista arvoista valittava sellainen, että reaali- ja imaginäärisosien merkit tulevat oikein. Nyt vaihekulma on √ Esimerkiksi w = f (z) = z 2 on yksiarvoinen. Funktio w = f (z) = z 1/2 on puolestaan moniarvoinen (kaksiarvoinen), mm. piste z = 1 kuvautuu pisteiksi w = ±1. Ellei toisin mainita, funktio tarkoittaa jatkossa yksiarvoista funktiota. Tulkinta Olkoon w = f (z) jokin kompleksifunktio. Kirjoitetaan π φ = arctan(− 3) + nπ = − + nπ. 3 Reaaliosa on negatiivinen ja imaginääriosa positiivinen, joten vaihekulma on välillä π/2 ≤ φ ≤ π, ts. on valittava n = 1 eli 2π . φ= 3 Polaariesitys on siis w = u + iv, u, v ∈ R ja z = x + iy, x, y ∈ R. Nyt w = u + iv = f (z) = f (x + iy), ts. funktion reaali- ja imaginääriosat, √ 2π 2π −2 + 2 3i = 4ei2π/3 = 4 cos + 4 sin i. 3 3 Huom: polaariesitys helpottaa kompleksilukujen kerto- ja jakolaskuja: Olkoon z1 = r1 eiθ1 ja z2 = r2 eiθ2 . Nyt z1 z2 = r1 r2 ei(θ1 +θ2 ) normaalien eksponenttifunktioiden laskusääntöjen mukaan. Samoin r1 z1 = ei(θ1 −θ2 ) z2 r2 u = u(x, y) ja v = v(x, y), ovat muuttujien x ja y funktioita. Voidaan siis ajatella, että kompleksifunktio kuvaa kompleksitason (z-tason) pisteen (x, y) toisen kompleksitason (w-tason) pisteeksi (u, v). Funktion reaali- ja imaginääriosat Tehtävänä on nyt jakaa funktio f (z) reaali- ja imaginääriosiinsa. Polynomien ja polynomien murtolausekkeiden tapauksessa kompleksilukujen algebra määrää jaon. Esimerkiksi w = z 2 jakautuu reaali- ja imaginääriosiinsa kuten Myös potenssit ovat helppoja: z n = (reiθ )n = rn einθ Sen sijaan yhteen- ja vähennyslasku on hankala suorittaa polaariesityksessä. Huom: jos z = reiθ , niin z ∗ = re−iθ . z ∗ z = re−iθ reiθ = r2 = |z|2 . 5.3 Kompleksifunktiot Tarkastellaan funktiota f (z), joka kuvaa kompleksiluvun z kompleksiluvuksi w, ts. w = f (z). Sanotaan, että f (z) on • yksiarvoinen funktio, jos ja vain jos jokainen z kuvautuu täsmälleen yhdeksi luvuksi w. • moniarvoinen funktio, jos ja vain jos jotkin muuttujan z arvot kuvautuvat useammaksi kuin yhdeksi luvuksi w. w = u + iv = (x + iy)2 = x2 − y 2 + 2ixy, joten u = v = x2 − y 2 2xy. Usein halutaan jatkaa (analyyttisesti) reaalimuuttujan reaaliarvoinen funktio kompleksitasoon siten, että alkuperäinen ja jatkettu funktio yhtyvät reaaliakselilla. Jos reaalifunktio f (x) voidaan esittää Taylorin sarjana (3.3), korvataan sarjassa reaalimuuttuja x kompleksimuuttujalla. Koska kompleksiluvut noudattavat samoja laskusääntöjä kuin reaaliluvut, säilyttää analyttinen jatkaminen funktionaaliset ominaisuudet. Esimerkiksi jatkettu eksponenttifunktio toteuttaa edelleenkin relaation ez1 +z2 = ez1 ez2 , z1 , z2 ∈ C. Samoin trigonometristen funktioiden yhteenlaskukaavat ovat voimassa jatketuillekin funktioille. 35 Eulerin kaava Tarkastellaan eksponenttifunktiota w = ez . Koska jatkaminen säilyttää funktionaaliset ominaisuudet, on missä siis r = |z| ja φ = arctan Im z/Re z. Kuten edellä mainittiin, polaariesityksen avulla kompleksilukujen kerto- ja jakolaskut ovat suoraviivaisia: w = ex+iy = ex eiy . z1 z2 Tässä ex on vanha tuttu reaalinen eksponenttifunktio. Selvitetään siis, mitä on eix , kun x ∈ R. Eksponenttifunktion Taylorin sarja (3.6) on z3 z4 z5 z2 + + + + ···. e =1+z+ 2! 3! 4! 5! z = r1 r2 ei(φ1 +φ2 ) = r1 r2 (cos(φ1 + φ2 ) + i sin(φ1 + φ2)) ja z1 z2 (5.15) = = Sijoitetaan tähän z = ix. Imaginääriluvun ix potenssit ovat r1 i(φ1 −φ2 ) e r2 r1 (cos(φ1 − φ2 ) + i sin(φ1 − φ2)) . r2 Potenssifunktiot (ix)2 (ix)3 = = i2 x2 = −x2 ix(ix)2 = −ix3 (ix)4 (ix)5 = = .. . ix(ix)3 = −i2 x4 = x4 ix(ix)4 = ix5 (ix)2n (ix)2n+1 = = .. . (−1)n x2n i(−1)n x2n+1 Kertolaskun erikoistapauksena saadaan potenssiinkorotukselle De Moivren kaavana tunnettu lauseke zn = = x2 x3 x4 x5 −i + + i + ··· 2! 3! 4! 5! x2 x4 1− + + ··· 4! 2! x3 x5 +i x − + + ··· . 3! 5! ei(φ+n2π) 1 + ix − x e = e (cos y + i sin y), = = eiφ ei2nπ eiφ (cos 2nπ + i sin 2nπ) = = eiφ (1 + i0) eiφ . z = reiφ+i2nπ , n = 0, ±1, ±2, . . . . (5.16) Luvun z n:s juuri w = z 1/n on se luku mikä toteuttaa wn = z. Käyttäen polaariesitystä w = ρeiφ , z = reiθ nähdään että on oltava voimassa Yleisesti kompleksinen eksponenttifunktio on siten z (5.19) Kompleksiluku z voidaan siis esittää kuten Vertaamalla reaali- ja imaginääriosia Taylorin sarjoihin (3.6) todetaan niiden esittävän kosini- ja sinifunktioita. Päädymme Eulerin kaavaan eix = cos x + i sin x. rn (cos φ + i sin φ)n = rn eniφ rn (cos nφ + i sin nφ). Polaariesityksen napakulma ei ole yksikäsitteinen. Jos nimittäin φ on luvun z napakulma, niin on myös mikä tahansa muotoa φ + n2π, n = 0, ±1, ±2, . . . , oleva kulma, sillä Eulerin kaavan mukaan on Sijoitetaan nämä potenssit Taylorin kehitelmään (5.15), jolloin saadaan eix = = ρn = r ⇒ ρ = (5.17) √ n r ja kun z = x + iy. Muistetaan, että polaariesityksessa (5.13) kompleksiluku z voitiin kirjoittaa muotoon z = r cos φ + ir sin φ. koska ei k 2π = 1. Siis saamme √ z 1/n = n rei(θ/n+k 2π/n) , k ∈ N (5.20) Helposti nähdään, että vain luvut k = 0, 1, . . . (n − 1) tuottavat erisuuruisen tuloksen: josta, Eulerin kaavaa (5.16) soveltaen saamme standardimuodon polaariesitykselle: z = reiφ , einφ = eiθ ⇒ nφ = θ + k 2π, k ∈ N e0 , ei2π/n , ei4π/n , . . . , ei2(n−1)π/n (5.18) 36 (5.21) Toisaalta positiivinen kokonaisluku k voidaan aina kirjoittaa muodossa k = qn + r, missä q on jakolaskun k/n osamäärä ja r, 0 ≤ r < n, sen jakojäännös. On siis voimassa ei2kπ/n = ei2rπ/n ei2qπ = ei2rπ/n , joten jokainen muotoa exp(i2kπ/n), k ≥ 0, oleva kompleksiluku on joukossa (5.21). Samalla tavoin voidaan todeta, että myös luvut exp(i2kπ/n) kokonaisluvun k ollessa negatiivinen ovat nekin joukossa (5.21). Siis, kompleksiluvulla z = reiφ , r 6= 0, on täsmälleen n erilaista n:ttä juurta: z 1/n = r1/n eiφ/n , r1/n ei(φ+2π)/n , r1/n ei(φ+4π)/n , . . . , r1/n ei(φ+2(n−1)π)/n . (5.22) Hyperboliset kosini- ja sinifunktiot määritellään kaavoilla cosh x sinh x 2 = 2e = 2e = 2e 4πi = 2e 6πi (ex + e−x ) (ex − e−x ) . (5.24) Analogisesti hyperbolinen tangentti määritellään kuten tanh x = sinh x ex − e−x = x . cosh x e + e−x (5.26) Trigonometristen ja hyperbolisten funktioiden välillä vallitsee yhteys cosh iφ sinh iφ tanh iφ Kirjoitetaan Eulerin kaavaa käyttäen 2πi 1 2 1 2 Myös tangenttifunktio voidaan kirjoittaa eksponenttien avulla: sin φ eiφ − e−iφ tan φ = (5.25) = . cos φ i(eiφ + e−iφ ) Esim. Luvun 2 neljännet juuret 0i = = . Näemme, että neljännet juuret ovat 21/4 , 21/4 eπi/2 , 21/4 eπi ja 21/4 e3πi/2 . Eulerin kaavan mukaan on mm. 1 1 eπi/2 = cos π + i sin π = i 2 2 Samoin voimme todeta, että exp(πi) = −1 ja exp 23 πi = −i. Kysytyt juuret ovat niin ollen 21/4 , 21/4 i, −21/4 ja − 21/4 i. Huomattakoon, että jonossa seuraava termi, 2 = 2 exp(8πi), antaisi neljänneksi juureksi 21/4 exp(2πi) = 21/4 . Tämä esiintyy jo juurilistassamme. Trigonometriset funktiot Eulerin kaavan (5.16) eiφ = cos φ + i sin φ mukaan on e−iφ = cos(−φ) + i sin(−φ) = cos φ − i sin φ. Ratkaistaan näistä yhtälöistä sini- ja kosinifunktiot: cos φ = 12 eiφ + e−iφ (5.23) 1 sin φ = 2i eiφ − e−iφ . Voimme itse asiassa tästä lähtien pitää näitä lausekkeita sini- ja kosinifunktioiden määritelminä. Nämä määritelmät ovat voimassa siinäkin tapauksessa, että argumenttikulma φ on kompleksinen. 37 = = = cos φ i sin φ i tan φ. (5.27) 6. Differentiaaliyhtälöistä Kompleksiluvun logaritmi: ln z = w ⇔ z = ew Jos nyt z = reiθ = reiθ ein2π , missä n ∈ Z, niin saadaan w = ln z = ln r + iθ + in2π, n∈Z Logaritmi on siis äärettömän moniarvoinen funktio. Helposti nähdään että ew = z kaikilla n. Logaritmin päähaaraksi sanotaan valintaa n = 0 ja 0 ≤ θ < 2π: lnz = ln r + iθ, Newtonin toisen lain mukaan kappaleeseen vaikuttava voima on yhtäsuuri kuin kappaleen massa kerrottuna sen kiihtyvyydellä. Korkeudella h putoamisliikkeessä olevan 2 kappaleen kiihtyvyys on ddt2h ja siihen vaikuttava gravitaatiovoima −mg, kun kappaleen massa on m. Newtonin lain mukaan on siis m tai 0 ≤ θ < 2π Jos nyt z ∈ R, ja z on positiivinen (> 0): lnz = ln r Jos taas z on negatiivinen reaaliluku, lnz = ln r + iπ Esim. (päähaara-arvot): ln(−1) = ln eiπ ) = iπ ln i = ln eiπ/2 = i π2 √ ln(1 + i) = ln( 12 + 12 eiπ/4 ) = 21 ln 2 + i π4 d2 h = −mg dt2 d2 h = −g. dt2 Tämä on korkeutta h hallitseva differentiaaliyhtälö, ts. siinä esiintyy tuntemattoman funktion derivaattoja. Differentiaaliyhtälön ratkaisemisella tarkoitetaan yhtälön toteuttavan funktion etsimistä. Putoamisliikkeen tapauksessa ratkaisu on helppo löytää. Integroidaan differentiaaliyhtälön d2 h = −g dt2 molemmat puolet, jolloin saadaan dh = −gt + c1 . dt Tämä on edelleenkin differentiaaliyhtälö ja edelleenkin voimme integroida sen puolittain. Päädymme ratkaisuun 1 h = − gt2 + c1 t + c2 . 2 Terminologiaa Putoamisliikkeen ratkaisussa on kummastakin integroinnista aiheutuneet integrointivakiot otettu mukaan. Vakioiden arvot määräytyvät alkuehdoista. Tässä tapauksessa tieto kappaleen korkeudesta ja nopeudesta alkuhetkellä t = 0 riittää. Kun yhtälössä on jonkin muuttujan derivaattoja jonkin toisen muuttujan suhteen, sanotaan edellistä muuttujaa riippuvaksi ja jälkimmäistä riippumattomaksi (vapaaksi). Riippuva muuttuja on siis sama kuin funktio mikä halutaan ratkaista. Jos differentiaaliyhtälössä esiintyy derivaattoja vain yhden riippumattoman muuttujan suhteen, puhutaan tavallisesta differentiaaliyhtälöstä. Jos yhtälössä on osittaisderivaattoja useamman kuin yhden vapaan muuttujan suhteen, kyseessä on osittaisdifferentiaaliyhtälö. Esimerkiksi differentiaaliyhtälö dx d2 x 2 + a dt + kx = 0 dt 38 on tavallinen. Sen riippuva muuttuja on x ja riippumaton t. Yhtälö ∂u ∂u + = x − 3y ∂x ∂y on puolestaan osittaisdifferentiaaliyhtälö, jonka riippumattomat muuttujat ovat x ja y. u on tämän yhtälön riippuva muuttuja. Yhtälön kertaluku on korkein siinä esiintyvien derivaattojen kertaluvuista. Esimerkiksi yhtälön 2 d h = −g dt2 kertaluku on 2. Differentiaaliyhtälö on lineaarinen, jos riippuva muuttuja (y) ja sen derivaatat esiintyvät yhtälön kaikissa termeissä joko ensimmäisessä potenssissa tai ei ollenkaan. Jos differentiaaliyhtälö ei ole lineaarinen, sen sanotaan olevan epälineaarinen. Esimerkiksi yhtälö d2 y + y = x4 dx2 on lineaarinen mutta yhtälöt d2 y + sin y = 0, dx2 y ′ + 2yy ′ = 0 ja y ′ = Esim. φ(x) = c1 e−x + c2 e2x on yhtälön y ′′ − y ′ − 2y = 0 ratkaisu Nyt φ′ (x) = −c1 e−x + 2c2 e2x ja φ′′ (x) = c1 e−x + 4c2 e2x . Sijoitetaan nämä yhtälöön, jolloin (c1 e−x + 4c2 e2x ) − (−c1 e−x + 2c2 e2x ) −2(c1 e−x + c2 e2x ) = (c1 + c1 − 2c1 )e−x + (4c2 − 2c2 − 2c2 )e2x = 0. Tämä on ilmeisestikin voimassa koko reaaliakselilla, joten φ(x) = c1 e−x + c2 e2x on yhtälön ratkaisu välillä (−∞, ∞) olivatpa c1 ja c2 mitä tahansa vakioita. dy + 1 + yexy = 0 ratkaisu Esim. Yhtälön (1 + xexy ) dx määräytyy yhtälöstä x + y + exy = 0 Suoraviivainen menettely olisi ratkaista y yhtälöstä x + y + exy = 0 ja sijoittaa tämä differentiaaliyhtälöön. Valitettavasti vain emme osaa tätä ratkaisua muodostaa. Derivoidaan sen sijaan yhtälö x + y + exy = 0 implisiittisesti, jolloin dy dy = 0. + exy y + x 1+ dx dx Uudestaan ryhmittäen voidaan kirjoittaa x y ovat epälineaarisia. Mikä tahansa kertaluvun n tavallinen differentiaaliyhtälö on kirjoitettavissa muotoon dn y dy , . . . , n = 0. F x, y, dx dx Olkoon I jokin lukuväli ((a, b), [a, b], . . .). Jos sijoitettaessa y = f (x) yhtälöön dn y dy ,..., n = 0 F x, y, dx dx se toteutuu kaikilla x ∈ I, sanotaan että f (x) on ko. yhtälön ratkaisu välillä I. Esim. Yhtälön y ′′ − x22 y = 0 ratkaisu on f (x) = x2 − x−1 Nyt derivaatat f ′ (x) = 2x + x−2 ja f ′′ (x) = 2 − 2x−3 ovat määriteltyjä aina kun x 6= 0. Sijoitetaan f yhtälöön, jolloin saadaan (1 + xexy ) joten yhtälö x + y + exy = 0 todellakin määrää implisiittisesti ko. differentiaaliyhtälön ratkaisun. Osoittautuu, että kertalukua n olevien differentiaaliyhtälöiden ratkaisuihin liittyy aina n mielivaltaista vakiota. Useimmissa tapauksissa vakiot ovat määrättävissä, jos tunnetaan funktio ja sen n − 1 ensimmäisen derivaatan arvot jossakin ratkaisuvälin I pisteessä. Differentiaaliyhtälöön dy dn y F x, y, ,..., n = 0 dx dx liittyvä alkuarvoprobleema kuuluu: Etsi välillä I se differentiaaliyhtälön ratkaisu, joka pisteessä x0 ∈ I toteuttaa n ehtoa y(x0 ) dy (x0 ) dx = y0 = y1 .. . 2 2 (x − x−1 ) x2 (2 − 2x−3 ) − (2 − 2x−3 ) 0. (2 − 2x−3 ) − = = dy + 1 + yexy = 0, dx dn−1 y (x0 ) dxn−1 = yn−1 , missä suureet y0 , y1 , . . . , yn−1 ovat vakioita. Yhtälö siis toteutuu kun x 6= 0 eli f (x) = x2 − x−1 on yhtälön ratkaisu alueissa (−∞, 0) ja (0, ∞). Nimitys alkuarvo on peräisin mekaniikasta, missä y(x0 ) = y0 tarkoittaa usein kappaleen paikkaa alkuhetkellä x0 ja y ′ (x0 ) = y1 sen nopeutta samalla hetkellä. 39 Esim. Määrää se yhtälön y ′′ − y ′ − 2y = 0 ratkaisu, joka toteuttaa alkuehdot y(0) = 2 ja y ′ (0) = −3 Aiemmin näimme, että φ(x) = c1 e−x + c2 e2x on ko. yhtälön ratkaisu olivatpa vakiot c1 ja c2 mitä tahansa. Määrätään nämä kertoimet siten, että alkuehdot toteutuvat: φ(0) ′ φ (0) = c 1 e0 + c 2 e0 = 2 = −c1 e0 + 2c2 e0 = −3, eli c1 + c2 = 2 −c1 + 2c2 = −3. Vastaavanlaisia lauseita on olemassa myös korkeamman kertaluvun differentiaaliyhtälöille. Lause siis kertoo, milloin ratkaisu on löydettävissä ja että ratkaisun löydyttyä ei tarvitse etsiä muita ratkaisuja koska niitä ei ole olemassa. Graafisesti olemassaolo tarkoittaa, että lauseen suorakaiteen jokaisen pisteen kautta kulkee jokin ratkaisu ja yksikäsitteisyys sitä, että kunkin pisteen (x0 , y0 ) kautta kulkee täsmälleen yksi ratkaisu. Tästä johtuen ratkaisujen kuvaajat eivät koskaan leikkaa toisiaan. Valitettavasti lause kertoo vain että ratkaisu on olemassa pisteen x = x0 ympäristössä, mutta ei kerro tämän ympäristön suuruutta. Fysiikan mallintamisessa alkuarvotehtävän ratkaisun olemassaolo ja yksikäsitteisyys ovat ensiarvoisen tärkeitä. Ensinnäkin todellisessa maailmassa ”jotakin tapahtuu”joten mallinnettaessa maailmaa aluarvoprobleemoina olisi ratkaisujen syytä olla olemassa. Toiseksi, jos saman kokeen toisto samoilla ehdoilla johtaa aina samaan tulokseen, täytyy kokeeseen liittyvän mallinkin olla yksikäsitteinen. Mekaniikka on hyvä esimerkki deterministisestä mallista: tulevaisuus määräytyy tarkasti jos alkutila tunnetaan tarkasti. Yhtälöryhmän ratkaisuna saadaan c1 = 7/3 ja c2 = −1/3. Alkuarvot toteuttava ratkaisu on siis φ(x) = 7 −x 1 2x e − e . 3 3 tavallisimmat differentiaaliyhtälöt: Seuraavat differentiaaliyhtälöt esiintyvät usein fysiikassa ja muissa sovelluksissa: d2 y dx2 6.1.1 Separoituvat yhtälöt Jos differentiaaliyhtälö voidaan kirjoittaa muodossa dy = ay, a ∈ R ⇒ y = Ceax dx dy = q(x)p(y) dx d2 y = a2 y, ⇒ y = C1 eax + C2 e−ax dx2 ts. oikea puoli on kirjoitettavissa kahden funktion tulona, joista toinen riippuu vain muuttujasta x ja toinen vain muuttujasta y, sanotaan että yhtälö on separoituva tai että yhtälön muuttujat ovat erotettavissa. Luonnollisesti myös muotoa = −a2 y, ⇒ y = C1 cos(ax) + C2 sin(ax) = D1 eiax + D2 e−iax Viimeinen yhtälö on esim. harmonisen värähtelijän yhtälö: jos kappale liikkuu x-akselia pitkin voiman F = −kx vaikutuksessa, Newtonin lain mukaan (F = ma) d2 x F = −kx = 2 dt 6.1 Ensimmäisen kertaluvun yhtälöt Ensimmäisen kertaluvun differentiaaliyhtälöille voidaan todistaa olemassaolo- ja yksikäsitteisyyslause: Olkoot funktio f (x, y) ja sen osittaisderivaatta ∂f ∂x (x, y) jatkuvia pisteen (x0 , y0 ) sisältävässä suorakaiteessa R = {(x, y)|a < x < b, c < y < d}. Silloin alkuarvoprobleemalla dy = f (x, y), dx q(x) dy p(y) dy = tai = dx p(y) dx q(x) (6.1) (6.2) ovat separoituvia. Separoituva yhtälö q(x) dy = dx p(y) ratkeaa muuttujien separoinnilla: kerrotaan molemmat puolet funktiolla p(y) ja differentiaalilla dx, jolloin p(y) dy = q(x) dx, ja integroimalla näin saatu yhtälö, Z Z p(y) dy = q(x) dx. (6.3) Jos integraalit osataan laskea, voidaan ratkaista y = f (x). y(x0 ) = y0 on yksikäsitteinen ratkaisu φ(x) jollakin välillä x0 − h < x < x0 + h, missä h > 0. Näytetään että (6.3) antaa oikean ratkaisun: Olkoot P (y) ja Q(x) funktioiden p(y) ja q(x) integraalifunktioita, ts. P ′ (y) = p(y), 40 Q′ (x) = q(x) Tälloin yhtälö (6.3) on ekvivalentti yhtälön P (y) = Q(x) + C kanssa. Kirjoittamalla y = y(x) ja derivoimalla x:n suhteen saamme d d P (y(x)) = P ′ (y(x))y ′ (x) = Q(x) ⇒ dx dx p(y)y ′ = q(x) mikä oli alkuperäinen differentiaaliyhtälö. dy = x−5 Esim. Ratkaise dx y2 Kerrotaan yhtälö puolittain tekijällä y 2 dx, jolloin saadaan y 2 dy = (x − 5) dx. 1 1 y = − − x. 2 2 6.1.2 Lineaariset yhtälöt Ensimmäisen kertaluvun lineaarinen yhtälö on muotoa a1 (x) x2 sin x − (cos x)y = (sin x) x2 y3 = − 5x + C. 3 2 y= 3x2 − 15x + 3C 2 y 1/3 . Koska vakio C voi olla mielivaltainen reaaliluku niin sellainen on myös 3C. Voimme siis aivan hyvin korvata sen vaikkapa symbolilla K: y= 3x2 − 15x + K 2 dy dx (6.4) dy dx on selvästikin lineaarinen. Yhtälö Ratkaistaan y: dy + a0 (x)y = b(x), dx missä kertoimet a1 (x), a0 (x) ja oikea puoli b(x) voivat riippua vain vapaasta muuttujasta x mutta eivät riippuvasta muuttujasta y. Esimerkiksi yhtälö Integrointi molemmin puolin antaa Z Z 2 y dy = (x − 5) dx eli Merkitään vakiota ±K jälleen symbolilla C, joka voi nyt siis olla mielivaltainen reaaliluku. Saamme silloin differentiaaliyhtälön ratkaisuksi y = 1 + C(x + 3). Alkuehto oli y(−1) = 1 + C(−1 + 3) = 0 eli C = −1/2. Alkuarvotehtävän siis ratkaisee funktio 1/3 sen sijaan ei ole lineaarinen, sillä sen lisäksi että derivaatan kertoimena on riippuva muuttuja y esiintyy yhtälössä muuttujan y kuutiollinen termi. Olettaen, että kerroin a1 (x) yhtälössä (6.4) on tarkasteltavalla välillä nollasta poikkeava, ensimmäisen kertaluvun yhtälö on kirjoitettavissa standardimuotoon dy + p(x)y = q(x). dx . y−1 x+3 = Esim. Ratkaise alkuarvotehtävä Muuttujien erottaminen johtaa yhtälöön dy + (sin x)y 3 = ex + 1 dx kun y(−1) = 0 dx dy = . y−1 x+3 Tämän integrointi antaa Jos asetetaan q(x) = 0 yhtälöä sanotaan homogeeniseksi, alkuperäistä täydelliseksi. Homogeenisen yhtälön kaikissa termeissä esiintyy siis ainoastaan y:n tai y ′ ensimmäistä potenssia. Ratkaisussa kannattaa lähteä liikkeelle homogeenisen yhtälön ratkaisusta: I) Homogeeninen yhtälö (HY): dy + p(x)y = 0 dx ln |y − 1| = ln |x + 3| + C. Eksponentioidaan yhtälön molemmat puolet ja saadaan Ratkeaa separoimalla: eln |y−1| = eln |x+3|+C eli ⇒ |y − 1| = eC |x + 3| = K|x + 3|, missä olemme merkinneet K = eC > 0. Riippuen muuttujien y ja x arvoista on |y − 1| = ±(y − 1) ja |x + 3| = ±(x + 3). Voimme siis kirjoittaa y − 1 = ±K(x + 3) tai y = 1 + (±K)(x + 3). (6.5) ⇒ dy = −p(x)dx y Z ln |y| = − p(x)dx + A Z y = C exp − p(x)dx missä C = ±eA on integroimisvakio. Tämä on HY:n yleinen ratkaisu. 41 II) Täydellinen yhtälö (TY): Nyt riittää löytää joku ratkaisu TY:lle, olkoon se y0 (x). Tällöin TY:n yleinen ratkaisu on HY:n ja TY:n ratkaisujen summa, yTY (x) = yHY (x) + y0 (x) missä yHY on yllä lasketty HY:n yleinen ratkaisu. Todistus: 1. yTY (x) on selvästi TY:n ratkaisu 2. Olkoon y1 (x) TY:n mielivaltainen ratkaisu. Tällöin y1 (x) − y0 (x) on selvästi HY:n joku ratkaisu, joten y1 (x) = yHY (x) + y0 (x). Kuinka TY:n ratkaisu löydetään? Arvaus: toimii usein, mutta pitää keksiä! Esim. y ′ + xy = x: selvästi yksi TY:n ratkaisu on y = 1. Vakion variointi: Etsitään ratkaisua niin että HY:n ratkaisun vakio “ylennetään” x:n funktioksi: R y = C(x)e− p(x)dx R R y ′ = C ′ e− pdx − Cpe− pdx R = C ′ e− pdx − py Sijoitetaan tämä TY:hyn: R C ′ e− ⇒ ⇒ pdx R − py + py = q C ′ = qe pdx Z R C = qe pdx dx Siis TY:n yleinen ratkaisu saadaan muotoon Z R R pdx − pdx C + qe dx y(x) = e Siis TY:n yleinen ratkaisu on siis näiden kahden ratkaisun summa: y = (C + sin x)x2 Vakio C määräytyy nyt alkuehdosta. Esim. Etsi yhtälön y ′ − 2y = 2 yleinen ratkaisu Yhtälö on lineaarinen: HY: ⇒ ⇒ TY: Täydellisen yhtälön ratkaisu voidaan etsiä vakion varioinnilla, mutta tässä tapauksessa nähdään helposti että y = −1 toteuttaa TY:n. Siis yleinen ratkaisu on y = Ce2x − 1 . Esim. Putoava kappale:kappale jonka massa on m putoaa ilmassa maan vetovoiman vaikutuksesta. Hetkellä t = 0 kappale on levossa. Mikä on kappaleen nopeus ajan funktiona? Kappaleeseen vaikuttavat voimat: maan vetovoima: mg ilmanvastus: −kv (pitää paikkansa jos nopeus v on pieni). Newtonin liikelaki F = ma ⇒ m (6.6) Tässä C -termi on HY:n yleinen ratkaisu. Tätä muotoa ei kannata muistaa, menetelmä kyllä! dy − x2y2 = x cos x yleinen ratkaisu Esim. Etsi yhtälön x1 dx Yhtälö on lineaarinen, joten kirjoitetaan se ensin standardimuotoon kertomalla se tekijällä x: dy 2 − y = x2 cos x. dx x Nyt homogeeninen yhtälö on siis y ′ − x2 y = 0, joka ratkeaa separoimalla: 2 dy = dx ⇒ ln |y| = 2 ln |x| + A ⇒ y = Cx2 y x Täydellinen yhtälö ratkeaa vakion varioinnilla: y = Cx2 ⇒ y ′ = C ′ x2 + C2x dv = mg − kv dt Kyseessä on lineaarinen 1. kertaluvun differentiaaliyhtälö. HY on mv ′ = −kv ⇒ ⇒ ln |v| = − 1 k dv = − dt v m k t + A ⇒ v = Ce−kt/m m TY:n yksittäisratkaisu saadan vakion varioinnilla, tai jälleen arvaamalla: selvästi v = mg/k toteuttaa TY:n, joten yleinen ratkaisu on v(t) = Ce−kt/m + mg/k Hetkellä t = 0 nopeus v(0) = 0 ⇒ C = −mg/k, joten alkuehdon toteuttava ratkaisu on v(t) = mg (1 − e−kt/m ) k Kun t on pieni (t ≪ m/k), kappaleen nopeus v ≈ gt, mutta kun t → ∞, nopeus lähestyy raja-arvoa mg/k. ja TY: C ′ x2 + C2x − dy − 2y = 0 dx dy = 2dx y ln |y| = 2x + A ⇒ y = Ce2x 2 Cx2 = x2 cos x ⇒ C ′ = cos x ⇒ C = sin x x 42 6.2 Lineaariset toisen kertaluvun yhtälöt Toisen kertaluvun differentiaaliyhtälöt ovat tuntuvasti hankalampia ratkaista kuin ensimmäinen. Käsittelemmekin tässä vain tärkeintä erikoistapausta, toisen kertaluvun lineaarista ja vakiokertoimista differentiaaliyhtälöä. Toisen kertaluvun lineaarinen differentiaaliyhtälö on muotoa lineaarisesti riippumatonta HY:n ratkaisua. Tässä tapauksessa lineaarinen riippumattomuus tarkoittaa että a1 y1 (x) + a2 y2 (x) = 0 vain jos a1 = a2 = 0 kaikilla x ∈ I. Helposti nähdään että jos y1 ja y2 ovat HY:n ratkaisuja niin yHY on myös ratkaisu. Normaalisti ratkaisujen lineaarinen riippumattomuus on selvää. Tarkemmin se voidaan laskea Wronskin determinantista: dy d2 y + a0 (x)y = b(x), a2 (x) 2 + a1 (x) dx dx W [y1 , y2 ](x) = ts. se sisältää enintään y:n toista derivaattaa (toinen kertaluku) ja sen termit ovat verrannollisia ainoastaan y 1 tai y 0 (lineaarinen differentiaaliyhtälö). (siinä ei siis esiinny termejä y 2 , y ′ y, ey jne.) Jos kertoimet a0 , a1 ja a2 ovat vakioita, sanotaan yhtälön olevan vakiokertoimisen. Lineaarisen toisen kertaluvun yhtälön standardimuoto on dy d2 y 2 + p(x) dx + q(x)y = g(x), dx dy d2 y 2 + p(x) dx + q(x)y = 0. dx (6.8) Jos standardimuotoisessa yhtälössä (6.7) g(x) 6= 0, sanotaan yhtälön olevan ei-homogeeninen tai täydellinen. 2. kertaluvun lineaarisen dy:n ratkaisujen ominaisuuksia y1 (x) y2 (x) y1′ (x) y2′ (x) y1 (x)y2′ (x) − y2 (x)y1′ (x) (6.10) Käytännössä lineaarista riippuvuutta ei useinkaan testatata Wronskin determinantilla, ei ainakaan silloin kun on kyse tutuista funktioista. On helppo nähdä, että esimerkiksi kaikki eri potenssifunktiot (xr , potenssit r erisuuria) ovat toisistaan lineaarisesti riippumattomia. Tästä seuraa se, että kaikki eri eksponenttifunktiotkin (erx , eri kertoimet r) ovat toisistaan riippumattomia sen lisäksi, että ne ovat riippumattomia myös potenssifunktioista. Samoin sini- ja kosinifunktiot ovat toisistaan rippumattomia. Sen sijaan esim. kosinifunktio riippuu lineaarisesti (kompleksisista) eksponenttifunktioista (Eulerin kaava: cos x = 21 (eix + e−ix )). Tästä voidaan toisaalta päätellä, että funktiot cos rx (kertoimet r itseisarvoltaan erisuuria) ovat riippumattomia sekä toisistaan että funktioista sin rx. Esim. Funktiot y1 (x) = e2x cos 3x ja y2 (x) = e2x sin 3x ratkaisevat homogeenisen yhtälön y ′′ − 4y ′ + 13y = 0. Etsi ratkaisu, joka toteuttaa alkuehdot y(0) = 2 ja y ′ (0) = −5 y1 ja y2 ovat lineaarisesti riippumattomia. Yleinen ratkaisu on siis y(x) = c1 e2x cos 3x + c2 e2x sin 3x Tämän derivaatta on y ′ (x) Toisen kertaluvun lineaarisen differentiaaliyhtälön ratkaisu etenee samaan tapaan kuin ensimmäisen kertaluvun: = c1 (2e2x cos 3x − 3e2x sin 3x) +c2 (2e2x sin 3x + 3e2x cos 3x). Asetetaan y(0) = 2 ja y ′ (0) = −5, jolloin saadaan yhtälöt 1. Etsitään homogeenisen yhtälön yleinen ratkaisu, yHY (x). 2. Etsitään täydellisen yhtälön joku ratkaisu y0 (x). Nyt täydellisen yhtälön yleinen ratkaisu on muotoa yTY (x) = yHY (x) + y0 (x). Tämä ominaisuus seuraa samalla perusteella kuten 1. kl:n yhtälölläkin. Voidaan osoittaa, että homogeenisen yhtälön (HY) (6.8) yleinen ratkaisu (jossain joukossa x ∈ I) voidaan kirjoittaa muodossa yHY (x) = C1 y1 (x) + C2 y2 (x) on = 0 jos ja vain jos y1 ja y2 ovat lineaarisesti riippuvia ratkaisuja. (6.7) missä p(x) = a1 (x)/a2 (x), q(x) = a0 (x)/a2 (x) ja g(x) = b(x)/a2 (x) (olettaen, että a2 (x) 6= 0 tarkasteltavalla välillä). Standardimuotoon (6.7) liittyvä homogeeninen yhtälö on = (6.9) missä C1 , C2 ovat vakioita jotka voidaan kiinnittää alkuehdoista ja y1 (x) ja y2 (x) ovat kaksi mielivaltaista c1 = 2 2c1 + 3c2 = −5. Ratkaisut ovat c1 = 2 ja c2 = −3. Alkuehdot toteuttava differentiaaliyhtälön ratkaisu on siten y(x) = 2e2x cos 3x − 3e2x sin 3x. 6.2.1 Vakiokertoimiset toisen kertaluvun homogeeniset lineaariset yhtälöt MAPUlla rajoitumme ratkaisemaan vakiokertoimisia 2. kertaluvun differentiaaliyhtälöitä. Nämä ratkaistaan ratkaisemalla ensin homogeeninen yhtälö (HY), mikä on muotoa ay ′′ + by ′ + cy = 0, (6.11) 43 missä a, b ja c ovat vakiota ja a 6= 0. Yhtälön mukaan siis vakioilla kerrotun funktion ja sen derivaattojen summan pitäisi olla identtisesti nolla. Ratkaisua kannattaisi varmaankin etsiä sellaisten funktioiden joukosta, joiden derivaatat ovat keskenään ja itse funktion kanssa samaa muotoa, mahdollisesti vakiotekijöillä kerrottuna. Ratkaisu saattaisi siten löytyä funktioiden erx joukosta (r vakio). Sijoitetaan tämä yrite yhtälöön (6.11), jolloin saadaan ar2 erx + brerx + cerx = 0. Koska eksponenttifunktio erx on aina nollasta poikkeava, voimme jakaa yhtälön sillä ja päädytään ns. karakteristiseen yhtälöön ar2 + br + c = 0. Alkuehdot johtavat yhtälöihin y(0) = c1 e0 + c2 e0 = c1 + c2 √ √ −1 = y ′ (0) = (−1 + 2)c1 e0 + (−1 − 2)c2 e0 √ √ = (−1 + 2)c1 + (−1 − 2)c2 , √ √ joiden ratkaisuina ovat c1 = − 2/4 ja c2 = 2/4. Alkuarvoprobleeman siis toteuttaa funktio √ √ 2 (−1+√2)x 2 (−1−√2)x y(x) = − + . e e 4 4 0 = Tapaus 2: b2 < 4ac Nyt karakteristisen yhtälön (6.12) Toisen asteen yhtälönä karakteristinen yhtälö on helppo ratkaista: √ −b + b2 − 4ac r1 = √2a −b − b2 − 4ac r2 = . 2a Funktiot y1 = er1 x ja y2 er2 x ratkaisevat siten differentiaaliyhtälön (6.11). ar2 + br + c = 0 juuret ovat kompleksiset: p 1 (−b ± i |b2 − 4ac|) ≡ α ± iβ 2a √ missä α = −b/(2a) ja β = 4ac − b2 /(2a) ovat reaalisia. Juuret ovat siis toistensa liittolukuja, r1 = r2∗ . Nyt siis differentiaaliyhtälön yleinen ratkaisu saadaan edelleen eksponenttifunktioiden summasta r1,2 = y 2 Tapaus 1: b > 4ac: Tässä tapauksessa karakteristisen yhtälön ratkaisut r1 ja r2 ovat reaalisia, ja r1 6= r2 . Tällöin er1 x ja er2 x ovat lineaarisesti riippumattomia. (Nähdään myös Wronskin determinantista). Yleinen ratkaisu y on näiden superpositio y(x) = c1 er1 x + c2 er2 x . Esim. Yhtälön y ′′ + 5y ′ − 6y = 0 yleinen ratkaisu Karakteristinen yhtälö on nyt r2 + 5r − 6 = 0 −5 ± √ 25 + 24 1 = −6. 2 Yleinen ratkaisu on siten y(x) = c1 ex + c2 e−6x . Esim. Alkuarvotehtävä y ′′ + 2y ′ − y = 0, kun y(0) = 0 ja y ′ (0) = −1 2 Karakteristisen √ yhtälön r +√2r − 1 = 0 ratkaisut ovat r1 = −1 + 2 ja r2 = −1 − 2. Yleinen ratkaisu on niin ollen √ √ y(x) = c1 e(−1+ 2)x + c2 e(−1− 2)x . C 1 er1 x + C 2 er 2 x = = eαx (C1 eiβx + C2 e−iβx ) eαx (A cos βx + B sin βx) missä nyt A = C1 + C2 ja B = iC1 − iC2 . Yllä viimeisin muoto antaa reaalisen ratkaisun (y(x) ∈ R), jos A, B ∈ R. Esim. Yhtälön y ′′ + 2y ′ + 4y = 0 yleinen ratkaisu Karakteristisen yhtälön r2 + 2r + 4 = 0 ratkaisut ovat √ √ −2 ± 4 − 16 = −1 ± i 3. r= 2 Silloin funktiot y1 (x) = e−x cos ja sen ratkaisut r1,2 = = √ 3x ja y2 (x) = e−x sin √ 3x ovat yhtälön lineaarisesti riippumattomia ratkaisuja. Yleinen ratkaisu on siten √ √ y(x) = c1 e−x cos 3x + c2 e−x sin 3x. Esim. Vaimennettu harmoninen värähtelijä Olkoon meillä kappale (massa m) joka liikkuu x -akselia pitkin ja joka on kiinnitetty jousella kiintopisteeseen. Olkoon kappaleen paikka x(t). Jousi aiheuttaa kappaleeseen harmonisen voiman Fjousi = −kx (k > 0), missä x = 0 on piste missä kappale on levossa. Lisäksi kappaleeseen vaikuttaa nopeuteen verrannollinen kitkavoima γv = −γx′ (t). 44 Newtonin lain mukaan F = ma = mx′′ ⇒ Sijoitetaan tähän r0 = −b/2a ja nähdään että −kx − γx′ = mx′′ Tämä on 2. kertaluvun lineaarinen homogeeninen vakiokertoiminen differentiaaliyhtälö. Karakteristinen yhtälö on 2ar0 + b = −2a ja ar02 + br0 + c p 1 (−γ ± γ 2 − 4mk) −k − γr = mr2 ⇒ r = 2m x(t) = Aer1 t + Ber2 t missä r1,2 = ovat reaalisia. p 1 (−γ ± γ 2 − 4mk) < 0 2m ratkaisu on v(x) = C1 x + C2 . Tästä nähdään että y(x) = xer0 x on niin ollen eräs alkuperäisen yhtälömme ratkaisu, ja on helppo nähdä, että tämä on lineaarisesti riippumaton ratkaisusta er0 x . Olemme saaneet aikaan reseptin: Jos yhtälöön ay ′′ + by ′ + cy = 0 liittyvän karakteristisen yhtälön ar2 + br + c = 0 Karakteristisen yhtälön ar2 + br + c = 0 juuret ovat yhtäsuuret, jos b2 − 4ac = 0. Ainoa juuri on tällöin reaalinen ja suuruudeltaan b r0 = − 2a ja er0 x on siten ainoa muotoa erx oleva ratkaisu. Tiedämme toisaalta, että toisen kertaluvun yhtälöllä on aina kaksi lineaarisesti riippumatonta ratkaisua. Etsitään toinen ratkaisu vakion varioinnilla: yrite molemmat juuret ovat yhtäsuuret, r0 , niin yleinen ratkaisu on y(x) = C1 er0 x + C2 xer0 x . Esim. Yhtälön y ′′ + 4y ′ + 4y = 0 yleinen ratkaisu Karakteristinen yhtälö on r2 + 4r + 4 = (r + 2)2 = 0, jonka molemmat juuret ovat −2. Yleinen ratkaisu on silloin y(x) = c1 e−2x + c2 xe−2x . y(x) = v(x)er0 x Vakion variointi soveltuu yleisemminkin tilanteisiin, missä tunnetaan jokin erikoisratkaisu ja pitäisi etsiä toinen tästä lineaarisesti riippumaton ratkaisu. vie differentiaaliyhtälömme Olkoon g jokin yhtälön ay ′′ + by ′ + cy = 0. y ′′ + py ′ + qy = 0 Sijoitamme tähän yritteemme ja derivaatat y y ′′ = = b b2 b2 −b +c=− +c 2 4a 2a 4a b2 − 4ac − = 0, 4a a koska diskriminantti oli b2 − 4ac = 0. Päädymme siten yhtälöön av ′′ = 0 Tapaus 3: b2 = 4ac ′ = = Jos γ 2 < 4km (pieni vaimennus), ratkaisu on x(t) = e−γt/(2m) (A cos ωt + B sin ωt) p missä ω = 4mk − γ 2 /(2m). Kappale siis värähtelee vaimenevasti taajuudella ω. Jos γ = 0, värähtely ei vaimene. Jos taas γ 2 > 4km (voimakas vaimennus), ratkaisu on b +b=0 2a ′ r0 x ratkaisu. Sijoittamalla tähän y(x) = g(x)v(x) päädytään yhtälöön r0 x gv ′′ + 2g ′ v ′ + g ′′ v + pg ′ v + pgv ′ + qgv = 0. v e + r0 ve v ′′ er0 x + 2r0 v ′ er0 x + r02 ver0 x . Uudelleen ryhmittäen voidaan kirjoittaa gv ′′ + (2g ′ + pg)v ′ + (g ′′ + pg ′ + qg)v = 0. Hieman ryhmittäen saadaan Koska g toteutti alkuperäisen yhtälön, g ′′ + pg ′ + qg = 0, saamme av ′′ + (2ar0 + b)v ′ + (ar02 + br0 + c)v er0 x = 0. gv ′′ + (2g ′ + pg)v ′ = 0. Funktion v täytyy siis toteuttaa yhtälö Tämä on funktiolle v ′ = u ensimmäisen kertaluvun yhtälö av ′′ + (2ar0 + b)v ′ + (ar02 + br0 + c)v = 0. g(x) 45 du + [2g ′ (x) + p(x)g(x)]u = 0. dx 2 Tämä separoitavissa yhtälöksi Z du =− u jolloin saadaan Z ln |u| = ln 2g ′ (x) + p(x)g(x) dx, g(x) 1 − [g(x)]2 Eksponenttiointi antaa v ′ (x) = u(x) = Z d d , D2 ≡ dx missä D ≡ dx 2 on merkintätapa. HY:n karakteristinen yhtälö on r2 + ar + b = 0, jonka ratkaisut ovat r1 , r2 . Näiden juurien avulla voimme kirjoittaa karakteristisen polynomin muotoon r2 + ar + b = (r − r1 )(r − r2 ) p(x) dx. 1 − e [g(x)]2 Täten differentiaaliyhtälökin voidaan kirjoittaa R p(x) dx (D2 + aD + b)y(x) = (D − λ1 )(D − λ2 )y(x) = f (x) , josta vielä kerran integroimalla saadaan v. Määritellään nyt u ≡ (D − λ2 )y, jolloin saamme dy:n: 6.2.2 Epähomogeeninen vakiokertoiminen lineaarinen toisen kertaluvun differentiaaliyhtälö Nyt differentiaaliyhtälö (täydellinen yhtälö, TY) on muotoa ay ′′ + by ′ + cy = f (x) (6.13) Helposti nähdään että jos y1 on TY:n joku ratkaisu ja y0 on homogeenisen yhtälön (HY, f (x) = 0) joku ratkaisu niin y = y0 + y1 on myös TY:n ratkaisu. Koska 2. kertaluvun lineaarisen yhtälön täydellinen ratkaisu riippuu kahdesta vakiosta, saadaan TY:n täydellinen ratkaisu = HY:n täydellinen ratkaisu + TY:n joku yksittäisratkaisu. Kuinka siis löytää TY:n yksittäisratkaisu? 1. Arvaus/yrite: toimii hyvin etenkin jos f (x) on polynomi. Tällöin kannattaa yrittää y(x) polynomi, jonka asteluku = f :n asteluku. Esim. y ′′ + ay ′ + by = c: yritetään y = α, vakio. Siis by = bα = c ⇒ α = c/b. Arvaus toimii myös usein jos f (x) = eαx , sillä f :n kaikki derivaatat ovat verrannollisia eαx :ään: (D − λ1 )u = f (x) Tämä on lineaarinen 1. kl:n vakiokertoiminen dy, mikä ratkeaa edellä kuvatulla menetelmällä. Nyt voimme sitten ratkaista y:n yhtälöstä (D − λ2 )y = u(x) mikä siis antaa alkuperäisen TY:n ratkaisun. Esim. y ′′ + y ′ − 2y = ex HY:n karakteristinen yhtälö on r2 + r − 2 = 0 ⇒ r = Täten voimme kirjoittaa y ′′ + y ′ − 2y = (D − 1)(D + 2)y = ex 1.vaihe: olkoon nyt u(x) = (D + 2)y, jolloin u:n differentiaaliyhtälö on (D − 1)u(x) = u′ (x) − u(x) = ex tämän HY: y ′′ + ay ′ + by = eαx u′ − u = 0 ⇒ Yrite: y = Aeαx , sijoitus yhtälöön antaa A(α2 + aα + b)eαx = eαx ⇒ A = (α2 + aα + b)−1 Tämä toimii jollei eαx satu olemaan HY:n ratkaisu (jolloin α2 + aα + b = 0). Tällöin kannattaa kokeilla yritettä Axeαx , ellei sekin satu olemaan HY:n ratkaisu (tällöin α on HY:n karakterisen polynomin kaksinkertainen juuri). Siinä tapauksessa yrite on Ax2 eαx . 2. Integrointi kahdessa vaiheessa: Tämä on yleisempi menetelmä täydellisen yhtälön ratkaisuun. Tässä menetelmässä yhtälöä ryhmitellään muotoon jossa sitä voidaan integroidan suoraan, ja homogeenista yhtälöä ei tarvitse ratkaista erikseen. Kirjoitetaan yhtälö ensin muotoon (jaetaan y ′′ :n kertoimella, jos tarpeen) y ′′ + ay ′ + by = (D2 + aD + b)y = f (x) √ 1 1 3 (−1 ± 1 + 8) = − ± = 1, −2 2 2 2 Z du = u Z dx ⇒ u(x) = Cex TY:n ratkaisu saadaan vakion varioinnilla: u(x) = C(x)ex ⇒ u′ (x) = C ′ ex + Cex , joten sijoitus (C ′ + C)ex − Cex = ex ⇒ C ′ = 1 ⇒ C = x + A Siis TY:n täydellinen ratkaisu on u(x) = Cex + xex 2.vaihe: ratkaistaan y yhtälöstä (D + 2)y = y ′ + 2y = u(x) = (C + x)ex HY: y ′ = −2y ⇒ y = Be−2x TY: jälleen vakion varioinnilla B → B(x): y ′ = B ′ e−2x − 2Bex . 46 Sijoitus differentiaaliyhtälöön antaa ⇒ ⇒ (B ′ − 2B)e−2x + 2Be−2x = (C + x)ex B ′ = (C + x)e3x Z Z C x 1 3x B = (C + x)e3x dx = e3x + e3x − e 3 3 3 C 1 x = ( − )e3x + e3x + D 3 9 3 x 3x 3x = Ee + e + D 3 missä viimeisessä vaiheessa otettiin käyttöön uusi vakio E = C/3 − 1/9. Siis TY:n ratkaisu on x x y = (Ee3x + e3x + D)e−2x = De−2x + (E + )ex 3 3 Nyt ei2x ei ole HY:n ratkaisu, joten TY:n yksittäisratkaisu löytyy yrittellä z = Aei2x : ⇒ Siis TY:n yleinen ratkaisu on z = C1 ex + C2 e−2x + y = Im z = A1 ex + A2 e−2x − missä A1 = Im C1 , A2 = Im C2 . y ′′ + y ′ − 2y = ex voi myös soveltaa arvausmenetelmää. HY:n karakteristinen yhtälö on r2 + r − 2 = 0, minkä juuret ovat r = 1, −2. Koska nyt siis ex on HY:n ratkaisu, TY:n yksittäisratkaisu voidaan löytää yritteellä y = Axex : y ′ = A(ex + xex ), y ′′ = A(2ex + xex ) Nyt dy tulee muotoon A(2 + x)ex + A(1 + x)ex − 2Axex = ex ⇒ 3A = 1 Siis TY:n yksittäisratkaisu on y = x3 ex , ja TY:n täydellinen ratkaisu on HY:n täydellisen ratkaisun ja TY:n yksittäisratkaisun summa: x x e 3 Eksponenttifunktioyritteestä on usein myös hyötyä jos f (x) ∼ sin x, cos x (esim. värähtelevä pakkovoima harmonisella oskillaattorilla). Esim: y ′′ + y ′ − 2y = 4 sin 2x Tämän voi toki ratkaista integroinnilla kahdessa vaiheessa, mutta kirjoitammekin yhtälön muotoon z ′′ + z ′ − 2z = 4ei2x . Tällöin ottamalla imaginaariosa yhtälöstä saadaan alkuperäinen yhtälö, ja y = Im z. HY:n karakteristinen yhtälö on r2 + r − 2 = 0 ⇒ r = −3 − i i2x e 5 ja mikä onkin myös TY:n yleinen ratkaisu. Vakion variointi antaakin yleisesti koko ratkaisun kaupan päälle yksittäisratkaisun lisäksi, vakioista riippuvat osat ovat HY:n yleinen ratkaisu. Edellisen esimerkin yhtälöön y = Aex + Be−2x + A[(2i)2 + 2i − 2]ei2x = 4ei2x 4 2(−3 − i) −3 − i A= = = −6 + 2i (−3 + i)(−3 − i) 5 √ 1 (−1 ± 1 + 8) = 1, −2 2 joten HY:n ratkaisu on zHY = C1 ex + C2 e−2x 47 1 3 cos 2x − sin 2x 5 5 7. Vektorit ja differentiaalilaskenta Esim. Nopeus v, v, kiihtyvyys a ja a kun paikka on r = sin t i + cos t j + k Nopeus on nyt 7.1 Yhden muuttujan vektorifunktiot Liikkuvan kappaleen paikka avaruudessa muuttuu ajan kuluessa. Matemaattisesti voimme ilmaista tämän sanomalla, että kappaleen paikkaa kuvaava radiusvektori r on ajan t funktio r(t), ts. vektorin v = = dr dy(t) dz(t) . dx(t) =r= i+ j+ k dt dt dt dt cos t i − sin t j. Vauhti puolestaan on r(t) = x(t)i + y(t)j + z(t)k komponentit x, y ja z riippuvat yhdestä muuttujasta t. Samoin yhden muuttujan, ajan, vektorifunktioita ovat myös kyseisen kappaleen nopeus ja kiihtyvyys. Usein puhutaan lyhyesti vain vektorifunktioista kun tarkoitetaan yhden muuttujan vektoriarvoisia funktioita. 7.1.1 Vektorifunktion derivaatta Olkoon A(u) jokin yhden muuttujan u vektorifunktio v = |v| = p cos2 t + sin2 t = 1. Kiihtyvyys saadaan derivoimalla nopeus, a = dv . .. = v = r = − sin t i − cos tj, dt ja sen itseisarvo on a = |a| = A(u) = Ax (u)i + Ay (u)j + Az (u)k. p sin2 t + cos2 t = 1. Derivaatan ominaisuuksia A (u ) Olkoot A(u) ja B(u) muuttujan u vektorifunktioita. Lasketaan pistetulon A · B derivaatta: A (u + D u )-A (u ) dA · B du A (u + D u ) = = = Kuva 7.1 Vektorin derivaatta Vektorifunktion derivaatta määritellään analogisesti skalaarifunktion derivaatan kanssa eli dA(u) A(u + ∆u) − A(u) = lim . ∆u→0 du ∆u (7.1) = Kirjoitetaan määritelmä (7.1) komponenteittain, dA(u) du = = Ax (u + ∆u) − Ax (u) lim i ∆u→0 ∆u Ay (u + ∆u) − Ay (u) + j ∆u Az (u + ∆u) − Az (u) k + ∆u dAy (u) dAz (u) dAx (u) i+ j+ k, du du du d (Ax Bx + Ay By + Az Bz ) du dBx dAx Bx + Ax du du dBy dAy By + Ay + du du dBz dAz Bz + Az + du du dAx dAy dAz i+ j+ k · du du du (Bx i + By j + Bz k) +(Ax i + Ay j + Az k) · dBx dBy dBz i+ j+ k du du du dA dB ·B+A· . du du Näemme, että pistetulon derivointiin soveltuu skalaarifunktioista tuttu derivointisääntö (2.17) kunhan vain korvataan tavallinen tulo pistetulolla. Yleensäkin on helppo todeta, että luonnollisella tavalla modifioidut tutut säännöt ovat voimassa myös vektoreille: d (αA + βB) du d(φA) du d(A · B) du d(A × B) du jolloin nähdään, että vektorifunktio derivoidaan derivoimalla sen komponentit. 48 = = = = dA dB α +β du du dφ dA A+φ du du dA dB ·B+A· du du dA dB ×B+A× . du du (7.2) Tässä α ja β ovat mielivaltaisia skalaarivakioita ja φ(u) mielivaltainen derivoituva muuttujan u skalaarifunktio. Analogisesti skalaarifunktion differentiaalin kanssa määrittelemme vektorifunktion differentiaalin: dA = i dAx + j dAy + k dAz . Koska vektorin komponentit Ai ovat nyt vain yhden muuttujan u funktioita, ovat niiden differentiaalit muotoa dAi du du ja vektorin A(u) differentiaali niin ollen dA = du dAy dAz dAx i+ j+ k du du du = dA du. du on käyrän tangentin suuntainen. Tämän vektorin pituus on dr p = (2t)2 + 16 + (4t − 6)2 , dt joten yksikkötangentti on 2ti + 4j + (4t − 6)k dr dr =p . T= dt dt (2t)2 + 16 + (4t − 6)2 Erikoisesti pisteessä, missä t = 2, yksikkötangentti on 2 1 2 4i + 4j + 2k = i + j + k. T= √ 2 2 2 3 3 3 4 +4 +2 (7.3) dr Koska derivaatta du on yksikkötangentin suuntainen, niin toki silloin myös differentiaali 7.1.2 Avaruuskäyrät Tangentti dr = du Olkoon r(u) = x(u)i + y(u)j + z(u)k muuttujasta u riippuva paikkavektori. Muuttujan u käydessä läpi arvoalueensa vektorin r kärki piirtää dr käyrän kolmiulotteisessa avaruudessamme. Derivaatta du on konstruktionsa perusteella (kuva 7.1) ilmeisestikin tämän käyrän pisteeseen r(u) piirretyn tangentin suuntainen. Käyrän tangentin suuntainen yksikkövektori T on niin ollen dr dr /| |. T= (7.4) du du d r on yksikkötangentin suuntainen. Voimme siis kirjoittaa dr = T ds missä olemme symbolilla ds merkinneet differentiaalin dr pituutta p ds = |dr| = dx2 + dy 2 + dz 2 . Voimme siis kirjoittaa yksikkötangentin myös muodossa Differentiaali ds oli infinitesimaalisen muutoksen dr suuruus. Koska muutos dr oli käyrän tangentin suuntainen, on ds siten käyrän kaaren pituuden s infinitesimaalinen muutos. s Esim. Käyrän x = t2 + 1, y = 4t − 3, z = 2t2 − 6t yksikkötangentti kun t = 2 Käyrän piirtää vektorin = = xi + yj + zk (t2 + 1)i + (4t − 3)j + (2t2 − 6t)k kärki kun t käy läpi kaikki arvonsa (kun muuta ei ole sanottu, arvoalueena on yleensä koko reaalilukualue). Paikkavektorin derivaatta dr dt = = d 2 d d (t + 1) + j (4t − 3) + k (2t2 − 6t) dt dt dt 2ti + 4j + (4t − 6)k i (7.5) Kaaren pituus Kuva 7.2 Käyrän tangentti r dr . ds T= T r(u ) dr du 0 s s+ d s d r C Kuva 7.3 Käyrän kaaren pituus Käyrän C kaaren pituus s saadaan summaamalla pitkin käyrää laskettuja differentiaalisia kaaren pituuksia. Formaalisti voimme ilmaista tämän, kuten Z s= ds. (7.6) C 49 Käyrän ulottuessa äärettömyyteen on yleensä on myös spesifioitava integroinnin alkukohta eli kaaren pituuden nollakohta. Kuvassamme tämä voisi olla vaikkapa piste s0 . Laskettaessa kaaren pituutta kaavalla (7.6) integroinnin suunnaksi otetaan differentiaalin dr suunta eli tangentin suunta. Pituus s siis kasvaa kun edetään käyrällä tangentin osoittamaan suuntaan. Jos nyt käyrän yhtälö on annettu muodossa Vektori T on sekin kaaren pituuden s funktio, joten voimme laskea derivaatan dT d2 r = 2. ds ds Olkoon nyt N vektorin dT ds suuntainen yksikkövektori N= r = r(u), missä on merkitty niin tangentti osoittaa vektorin dr du = r(u + du) − r(u) dr = du suuntaan eli suuntaan johon u kasvaa. Pituus s on siten ds muuttujan u kasvava funtio ja derivaatta du silloin positiivinen. Differentiaali ds oli määritelty itseisarvona |dr|, joten on dr ds = |dr| = du, du ds kun du > 0. Toisaalta derivaatta du oli positiivinen, joten voimme kirjoittaa dr = ds . (7.7) du du Jos ratkaisemme relaatiosta s = s(u) muuttujan u pituuden s funktiona, u = u(s), niin voimme pitää käyrää piirtävää vektoriakin kaaren pituuden funktiona: r = r(s). Esim. Käyrän x = sin t, y = cos t, z = 0 kaaren pituus lähtien pisteestä, missä t = 0 Käyrän piirtää vektori Voimme siis kirjoittaa Suuretta κ sanotaan käyrän kaarevuudeksi ja sen käänteisarvoa 1 1 ρ = = dT κ ds (7.8) (7.9) (7.10) käyrän kaarevuussäteeksi. Yksikkötangentti T on nimensä mukaisesti yksikön mittainen, joten on T2 = T · T = |T|2 = 1. Derivoidaan relaatio T · T = 1 kaaren pituuden suhteen, jolloin saadaan d (T · T) ds = = dT dT dT ·T+T· = 2T · ds ds ds 2κT · N = 0, kun on sijoitettu lauseke (7.9). Päädymme yhtälöön Differentiaali dr on dr dt = (i cos t − j sin t) dt dt ja differentiaali ds siten p √ ds = |dr| = cos2 t + sin2 t dt = 1 dt = dt, kun etenemme muuttujan t kasvavaan suuntaan (dt > 0). Kaaren pituus on siis s(t) = dT κ = . ds dT = κN. ds r = i sin t + j cos t + 0k = i sin t + j cos t. dr = 1 dT , κ ds Z ds = C Z t dt = t. 0 T · N = 0, eli vektori N on kohtisuorassa tangenttia T vastaan ja siten myös kohtisuorassa ko. avaruuskäyrää vastaan. Tämän vuoksi vektoria N sanotaan käyrän päänormaaliksi. Esim. Käyrän x = 3 cos t, y = 3 sin t, z = 4t yksikkötangentti, päänormaali, kaarevuus ja kaarevuussäde Käyrän r = i3 cos t + j3 sin t + k4t eräs tangentti on Kaarevuussäde dr = −i3 sin t + j3 cos t + k4. dt Avaruuskäyrän r = r(s), s kaaren pituus, yksikkötangentti on kaavan (7.5) mukaisesti T= dr . ds (7.11) Normitetaan tämä, ts. muodostetaan yksikön mittainen saman suuntainen vektori jakamalla vektori pituudellaan. 50 Tangentin pituus on p dr = (−3 sin t)2 + (3 cos t)2 + 42 dt q = 9(sin2 t + cos2 t) + 16 √ 9 + 16 = 5. = ja kaarevuussäde ρ= −i3 sin t + j3 cos t + k4 dr Ajan t funktiona massapisteen paikkavektori olkoon r = r(t). Nopeus on tällöin dt = 3 4 3 −i sin t + j cos t + k . 5 5 5 Yksikkötangentiksi saatiin siis 3 3 4 T = −i sin t + j cos t + k . 5 5 5 Derivoidaan tämä muuttujan t suhteen: 3 3 dT = −i cos t − j sin t. dt 5 5 Toisaalta, koska kaaren pituus s on jokin muuttujan t funktio, voimme ketjusäännön perusteella kirjoittaa v= r · r = R2 . Tämän derivointi antaa . 2r · r = 2v · r = 0. Nopeus on kohtisuorassa radiusvektoria r vastaan (eli kohtisuorassa ympyrän sädettä vastaan, ympyrän tangentin suuntainen). Tarkastellaan erikoisesti sellaista xy-tason liikettä, missä r = iR cos ωt + jR sin ωt joten dT dT = ds dt ds dt Aikaisemmin (kaava (7.7)) totesimme, että kaaren pituuden derivaatta käyrää parametrisoivan muuttujan suhteen noudattaa kaavaa ds dr = dt dt dT dT = ds dt dr dt Määritelmän (7.9) mukaan on siis dT dr dT = κN = ds dt dt = −i 53 = −i cos t − 5 j 35 dr . = r. dt Kun piste kulkee pitkin origokeskeisen R säteisen ympyrän kehää, on vektorin r pituus vakio R: |r| = R tai dT dT ds = , dt ds dt eli 1 25 = . κ 3 Esim. Ympyräliike Yksikkötangentti on siten T = Kaarevuus on silloin s 2 3 3 (sin2 t + cos2 t) = κ= 25 25 sin t 3 3 cos t − j sin t. 25 25 Koska N on yksikön mittainen, on voimassa dT = |κ||N| = κ, κ ≥ 0. ds kun ω on vakio. Nyt q |r| = R2 (cos2 ωt + sin2 ωt) = R, joten kyseessä on ympyräliike. Nopeus on . v = r = −iRω sin ωt + jRω cos ωt. Kuten todettiin, tämä on kohtisuorassa paikkavektoria r vastaan. Vauhti on nyt q |v| = (ωR)2 (cos2 ωt + sin2 ωt) = ωR, joten liikkeen vauhtikin on vakio. Kiihtyvyys taas on . a = v = −iRω 2 cos ωt − jRω 2 sin ωt. Vauhdin vakioisuudesta (v · v = ω 2 R2 = vakio) seuraa että kiihtyvyys on kohtisuorassa nopeutta vastaan (ja siten joko radiusvektorin suuntainen tai sille vastakkaissuuntainen). Itseasiassa näemme, että a = −ω 2 r. Kiihtyvyyden suuruus on sekin vakio, sillä |a| = | − ω 2 r| = ω 2 R. 51 7.2 Gradientti, divergenssi, roottori jyrkimmin. |∇φ|:n pituus on korkeuden kulmakerroin ∇φ:n suuntaan. Osittaisderivaatta ja kentät φ=vakio Olkoon f koordinaattipisteen r = (x, y, z) funktio, f (r) = f (x, y, z). funktion osittaisderivaattaa esim. muuttujan x suhteen merkitään φ=vakio ∆ ja se lasketaan derivoimalla x:n suhteen pitämällä muut muuttujat vakiona. Esim. Olkoon f (x, y, z) = xyz + x2 y. Nyt ∂f = yz + 2xy, ∂x ∂f = xz + x2 , ∂y ∂f = xy ∂z Kuva 7.4 Gradientti ∇φ Avaruudessa (x, y, z) ∈ R3 tai sen osajoukossa määriteltyä funktiota kutsutaan usein kentäksi. Jos f on reaaliluku, f (r) ∈ R, kyseessä on skalaarifunktio eli skalaarikenttä, jos taas funktio on vektori, ~v (r) = ivx (r) + jvy (r) + kvz (r) ∈ R3 , kyseessä on vektorifunktio eli v ektorikenttä. Esim. skalaarikenttiä (-funktioita) ovat ilman paikallinen lämpötila T (r), paine p(r), sähkövarauksen tiheys ρ(r). Vektorikenttiä ovat esim. kaasun (nesteen) virtausnopeus v(r), sähkökenttä E(r), sähkövirran tiheys J(r). . . Nabla Määritellään “derivaattavektori” nabla: ∇≡i X ∂ ∂ ∂ ∂ +j +k = êi ∂x ∂y ∂z ∂x i i (7.12) Nabla ∇ on siis yhtä aikaa derivaatta ja vektori. Sillä voidaan operoida skalaari- tai vektorifunktioihin: ∇f (r) gradientti (vektori) ∇ · v(r) divergenssi (skalaari) ∇ × v(r) roottori (vektori) 7.2.1 Gradientti Olkoon φ(r) skalaarifunktio. Funktion gradientti on vektorifunktio ∇φ = X ∂φ ∂φ ∂φ ∂φ i+ j+ k= êi ∂x ∂y ∂z ∂ri i φ tangenttitaso ∂f (r) ∂f (x, y, z) = = ∂x f (r) ∂x ∂x (7.13) Graafisesti: gradientti ∇f (r) on vektori, joka on kohtisuorassa pintaa f (r) = vakio vastaan, ja |∇f | kertoo kuinka nopeasti funktio muuttuu ko. suuntaan. Vielä havainnollisemmin: kartta ja korkeuskäyrät (kahdessa ulottuvuudessa): olkoon φ(x, y) maaston korkeus koordinaattipisteessä (x, y). Nyt yhtälö φ(x, y) = vakio määrittelee korkeuskäyrän, jossa korkeus on vakio, ja ∇φ osoittaa suuntaan mihin φ kasvaa Todistus: tehdään pieni muutos r → r + ∆r. Nyt f (r + ∆r) = = = f (x + ∆x, y + ∆y, z + ∆z) ∂f ∂f ∂f f (r) + ∆x + ∆y + ∆z + O(∆2 ) ∂x ∂y ∂z f (r) + (∇f ) · (∆r) Pistetulosta näkee, että funktion muutos ∆f = f (r + ∆r) − f (r) on suurin, kun ∆r k ∇f on = 0, kun ∆r ⊥ ∇f Siis: – pinnan f = vakio yksikkönormaali on ∇f /|∇f | – pinnan f = vakio tangenttitaso on vektoria ∇f kohtisuoraan – funktion f kasvunopeus suuntaan n̂ on n̂ · ∇f (n̂ yksikkövektori) Näistä viimeisimmän näkee valitsemalla yllä ∆r k n̂. Esim. Funktion φ(x, y, z) = 3x2 y − y 3 z 2 gradientti ∇φ pisteessä (1, −2, −1) Gradientti mielivaltaisessa pisteessä (x, y, z) on ∂ ∂ ∂ ∇φ = i (3x2 y − y 3 z 2 ) +j +k ∂x ∂y ∂z ∂ ∂ = i (3x2 y − y 3 z 2 ) + j (3x2 y − y 3 z 2 ) ∂x ∂y ∂ +k (3x2 y − y 3 z 2 ) ∂z = 6xyi + (3x2 − 3y 2 z 2 )j − 2y 3 zk, joten pisteessä (1, −2, −1) se on ∇φ = = 6(1)(−2)i + (3(1)2 − 3(−2)2 (−1)2 )j −2(−2)3 (−1)k −12i − 9j − 16k. Suunnattu derivaatta Edellisestä esimerkistä yleistäen voimme todeta, että skalaarikentän φ muutos pituusyksikköä kohti suunnassa 52 n, |n| = 1, on ∇φ · n. Sanomme, että suure n · ∇φ = (∇φ) · n, |n| = 1 Katsotaan esimerkkinä nesteen virtausta tarkemmin. Jokaisessa avaruuden pisteessä (ajattelemme nestettä jatkuvasti jakautuneena aineena unohtaen sen atomaarisen rakenteen) r = (x, y, z) neste virtaa paikasta riippuvalla nopeudella (7.14) on funktion φ suunnattu derivaatta (suuntaan n). Kuten olemme nähneet, suunnattu derivaatta on suurimmillaan gradientin suunnassa. Huom: voimme kirjoittaa derivaattaoperaattorin suuntaan n X ∂ n·∇= ni ∂r i i v = v(r) = vx (x, y, z)i + vy (x, y, z)j + vz (x, y, z)k. µ Jos nesteen massatiheys on ρ (kg/m3 ), massavirtatiheys ((kg/m3 )(m/s)=kg/(m2 s)) pisteessä r on µ = ρv . m Jos esim. n k i, saamme tavallisen osittaisderivaatan x:n suuntaan. Esim. Funktion φ = x2 yz + 4xz 2 derivaatta pisteessä (1, −2, −1) suuntaan 2i − j − 2k Gradientti pisteessä (1, −2, −1) on ∇φ = = = = A = A 2 i− 3 = = = Katsotaan, mitä massavirralle tapahtuu pisteen r infinitesimaalisessa ympäristössä. Kuvitellaan tätä tarkoitusta varten ko. piste sijoitetuksi sellaisen suorakulmaisen särmiön keskelle, jonka särmien pituudet ovat dx, dy ja dz. Virta µ tuo särmiön pohjan kautta materiaa virtatiheydellä µz (x, y, z − dz/2), joten kaiken kaikkiaan pohjan läpi virtaa aikayksikössä särmiöön materiaa määrä µz (x, y, z − dz/2)dx dy (kg/s). Vastaavasti kannen läpi poistuu aikayksikössä materiamäärä µz (x, y, z + dz/2)dx dy. Näiden virtausten seurauksena särmiön nestemäärän vähenemä aikayksikössä on 2i − j − 2k √ 22 + 12 + 22 1 2 j − k. 3 3 ∇φ · a dmz 1 2 2 (8i − j − 10k) · ( i − j − k) 3 3 3 37 16 1 20 + + = . 3 3 3 3 = = = µz (x, y, z + dz/2)dx dy −µz (x, y, z − dz/2)dx dy ∂µz (x, y, z) dz dx dy ∂z 2 i h dz ∂µz (x, y, z) − µz (x, y, z) + − dx dy ∂z 2 ∂µz = dx dy dz. ∂z Differentiaalien tulo dx dy dz on infinitesimaalisen särmiömme (infinitesimaalinen) tilavuus = 7.2.2 Divergenssi Olkoon nyt v(r) = (vx (r), vy (r), vz (r)) vektorikenttä. Vektorikentän divergenssi on ∇ · v) d z d y Kuva 7.5 Divergenssin tulkinta Tähän suuntaan laskettu derivaatta on ∇a φ y d x 2 Vektorin A = 2i − j − 2k suuntainen yksikkövektori on = m x ( x ,y ,z ) m ( x ,y ,z - d z /2 ) +(1) (−1)j + ((1) (−2) + 8(1)(−1))k 8i − j − 10k. a z m (2xyz + 4z 2 )i + x2 zj + (x2 y + 8xz)k (2(1)(−2)(−1) + 4(−1)2 )i 2 m ( x ,y ,z + d z /2 ) m ∂ ∂ ∂ +j + k ) · (ivx + jvy + kvx ) ∂x ∂y ∂z ∂vx ∂vy ∂vz + + ∂x ∂y ∂z h µz (x, y, z) + i dV = dx dy dz. (i Pohjan ja pinnan läpi suuntautuvien virtausten aiheuttama massan nettomuutos (nettopoistuma) aikayksikössä tilavuudessa dV on siten ∂µz dV. dmz = ∂z Vastaava lasku osoittaa, että xz- ja yz-suuntaisten pintojen läpi kulkevat virrat aiheuttavat aikayksikössä nettopoistumat Graafisesti: vektorikentän divergenssi on (yksikkötilavuudessa) syntyvän vuon (vesi!) määrä: ∂µy dV ∂y ∂µx dV. dmx = ∂x Massan kokonaismuutos aikayksikössä tilavuusalkiossa dV on siten dmy ∇ · v > 0, lähde (source)) ∇ · v < 0, nielu (sink) Jos ∇ · v = 0 koko määrittelyjoukossa, sanotaan että vektorikenttä v on lähteetön dm = = 53 = dmx + dmy + dmz ∂µy ∂µz ∂µx dV. + + ∂x ∂y ∂z Vektorimerkintää käyttäen voimme kirjoittaa tämän muotoon dm = ∂ ∂ ∂ i +j +k ∂x ∂y ∂z · (µx i + µy j + µz k)dV. Kun huomaamme, että skalaaritulon ensimmäinen tekijä on operaattori ∇, saamme tämän kompaktimpaan muotoon ∇ × v = i(∂y z − ∂z y) − j(∂x z − ∂z x) + k(∂x y − ∂y x) = 0 Kyseessä on pyörteetön kenttä Esim. v = −yi + xj dm = ∇ · µ dV. ∇ · v = 0 lähteetön ∇ × v = 2k 6= , pyörre Esim. Maxwellin yhtälöt:kuvaavat sähködynamiikkaa Massatieyden muutos dm/dV pisteessä (x, y, z) dm/dV = ∇ · µ voi aiheutua mm. siitä, että • neste puristuu kokoon tai laajenee, jolloin ∂ρ ∂t 6= 0, ∇·E= • ko. pisteeseen ruiskutetaan lisää nestettä eli pisteessä on lähde tai ko. pisteestä poistetaan nestettä eli pisteessä on nielu. Massatiheyden muutos (pienennys) voidaan siten ilmaista kahden termin summana ∂ρ + ψ, dm/dV = − ∂t missä jälkimmäinen termi ψ kuvaa nielujen ja lähteiden vaikutusta. Näin olemme johtaneet nesteiden (ja kaasujen) virtausta hallitsevan kontinuiteettiyhtälön ∂ρ = ψ, ∂t muistaen, että massavirtatiheys oli µ = ρv. ∇ · (ρv) + ∇·B=0 = ∇·B = (7.15) 1 ρ ǫ0 0 Tässä E on sähkökenttä, B magneettikenttä, ρ sähkövaraustiheys (lähde sähkökentälle!). Magneettisia varauksia ei ole olemassa (magneettinen monopoli), joten magneettikentän lähdetermi = 0, ja magneettikenttä on lähteetön. 7.2.3 Roottori Vektorikentän v(r) roottori ∇ × v lasketaan seuraavasti: i j k (7.16) ∇ × v = ∂x ∂y ∂z vx vy vz = + i ∇ × r = ∂x x j ∂y y k ∂z z =0 Esim. Gradientti ∇f (r) on pyörteetön: ∇ × (∇f ) = (∇ × ∇)f = 0 (näin voidaan tehdä, sillä ∇:n vektorikomponentit menevät tavallisen ristitulon tapaan, ja derivaatat kaikki vaikuttavat f :ään.) Huom: usein käytetään derivaattaoperaattoreita v · ∇ ja v × ∇. Näissä ei derivoida v:tä, derivaatta ei ole vielä operoinut!PSiis esim. v · ∇ = i vi ∂i v × ∇ = i(vy ∂z − vz ∂y ) + j . . . Laplacen operaattori Määritellään i(∂y vz − ∂z vy ) − j(∂x vz − ∂z vx ) k(∂x vy − ∂y vx ) (7.17) Tämä on siis tavallinen ristitulo vektoreille, mutta derivaatta vaikuttaa aina eteenpäin, “alariville”: ∂x ∂y vx vy = ∂x vy − ∂y vx 1 ∂E = µ0 j c2 ∂t ∂B =0 ∇×E+ ∂t ∇×B− E sähkö, B magneettikenttä, ρ sähkövaraustiheys, j sähkövirrantiheys, c valon nopeus, ǫ0 tyhjiön permittiivisyys ja µ0 permeabiliteetti (vakioita). Vektorikenttä v on pyörteetön, jos ∇ × v = 0. Esim. r on pyörteetön: Sähkömagnetismi, Maxwellin yhtälöt: ∇·E 1 ρ ǫ0 ∇ · ∇ ≡ ∇2 = ∂x2 + ∂y2 + ∂z2 = X ∂2 ∂ri2 i Tämä on skalaaridifferentiaalioperaattori, jota käytetään usein fysiikassa. Roottori mikroskooppisesti Roottori kuvaa vektorikentän pyörteisyyttä: Tarkastellaan jälleen ρ-tiheyksisen nesteen virtausta. Kun virtausnopeus pisteessä r = (x, y, z) on v(r), on µ = ρv massavirtatiheys tässä pisteessä. Tutkitaan tällä kertaa, miten pyörteellistä virtaus on. Katsotaan esimerkkinä pisteen (x, y, z) ympäri kiertyvää virtausta. Lasketaan erikseen nettokiertymät kunkin koordinaattitason suuntaisissa virtauksissa, esimerkkinä Esim. v = xi + yj + zk ∇ · v = 3 lähde (kaikilla r!) 54 Siis xy-tason suuntainen taso. ( x ,y ) Laskusääntöjä m y( x + d x /2 ,y ) m y( x - d x /2 ,y ) m x( x ,y + d y /2 ) m x( x ,y - d y /2 ) Kuva 7.6 Virtauksen kiertymä Kuvitellaaan piste (x, y, z) (kuvassa z-koordinaattia ei ole merkitty) sijoitetuksi tässä tasossa dx dy-sivuisen suorakaiteen keskelle. Suorakaiteen alalaidalla kokonaisvirtaus positiiviseen kiertosuuntaan on µx (x, y − dy/2, z)dx, oikeanpuoleista laidalla µy (x + dx/2, y, z)dy, ylälaidalla −µx (x, y + dy/2, z)dx ja vasemmanpuoleisella laidalla −µy (x − dx/2, y, z)dy. z-akselin ympäri kiertyvä kokonaisvirtaus dSz (kg/(ms)) on näiden neljän termin summa dSz = µx (x, y − dy/2, z)dx + µy (x + dx/2, y, z)dy = [µy (x + dx/2, y, z) − µy (x − dx/2, y, z)] dy −µx (x, y + dy/2, z)dx − µy (x − dx/2, y, z)dy − [µx (x, y + dy/2, z) − µx (x, y − dy/2, z)] dx ∂µx ∂µy dx dy − dy dx = ∂x ∂y i h ∂µx ∂µy dx dy. (7.18) − = ∂x ∂y Jakamalla tämä suorakaiteen pinta-alalla dx dy saamme z-akselin ympäri aikayksikössä kiertyväksi massatiheydeksi ∂µy ∂µx dSz = − . sz = dx dy ∂x ∂y Menettelemme samoin kuin kulmanopeuden tapauksessa ja muodostamme pyörteisyydeksi sanotun vektorisuureen sz , jonka pituus ilmoittaa aikayksikössä kiertyvän massatiheyden määrän ja suunta kiertoakselin, ts. h i ∂µy ∂µx s z = sz k = k. − ∂x ∂y Vastaavasti x- ja y-akseleiden suuntaiset pyörteisyydet ovat i h ∂µy ∂µz i − sx = ∂y ∂z h i ∂µx ∂µz sy = j. − ∂z ∂x Vektoreiden sx , sy ja sz resultantin s pituus kertoo silloin pisteeseen (x, y, z) asetetun resultanttivektorin ympäri aikayksikössä kiertyvän massatiheyden kokonaismäärän. Virtauskentän pyörteisyys on siis i h i h ∂µy ∂µx ∂µz ∂µz i+ j − − s = ∂y ∂z ∂z ∂x h i ∂µy ∂µx + k. − ∂x ∂y Nähdään helposti että muotoon s = s on µ:n roottori. s voidaan kirjoittaa determinantin avulla i j k ∂ ∂ ∂ ∂x ∂y ∂z = ∇ × µ µx µ y µ z Nablalle on helppo näyttää mm. seuraavat laskusäännöt: ∇(a + b) = ∇a + ∇b ∇(ab) = (∇a)b + a(∇b) ∇ · (u + v) = ∇ · u + ∇ · v ∇ · (au) = (∇a) · u + a∇ · ~u ∇ × (u + v) = ∇ × u + ∇ × v ∇ × (au) = (∇a) × u + a∇ × u ∇ × (∇a) = ∇ × ∇a = 0 eli ∇a on pyörteetön ∇ · (∇ × v) = (∇ × ∇) · v = 0 eli ∇ × v on lähteetön (tässä käytettiin skalaarikolmituloa, a · (b × c) = (a × b) · c Joskus esiintyy myös ∇ × (∇ × u) = ∇(∇ · u) − (∇ · ∇)u missä käytettiin vektorikolmitulon laskusääntöä. Siis sääntö: derivaattaosa - käytä derivoimissääntöjä, vektoriosa - vektoreiden laskusääntöjä. Huom: jos kehität ∇-lausekkeita skalaari- tai kolmitulon avulla, muista järjestys: Esim: u × (∇ × v) = ∇(uc · v) − (u · ∇)v missä siis uc pidetään vakiona derivoinnissa. Samoin esim. ∇·(u×v) = ∇·(u×vc )+∇·(uc ×v) = v·(∇×u)+u·(∇×v). Esim. Olkoon u = xyi + yzj + zxk.Nyt ∇×(∇×u) = ∇(∇·u)−∇2 u = ∇(y +z +x)−0 = i+j+k Tai suoraan ja i ∇ × u = ∂x xy j ∂y yz i ∇ × (∇ × u) = ∂x −y k ∂z zk = −iy − jz − kx j ∂y −z k ∂z −x Esim. ∇ × A pisteessä (1 − 1, 1), kun =i+j+k A = xz 3 i − 2x2 yzj + 2yz 4 k Nyt ∂ ∂ ∂ i+ j+ k × ∇×A = ∂x ∂y ∂z = = 55 (xz 3 i − 2x2 yzj + 2yz 4 k) i j k ∂ ∂ ∂ ∂y ∂z ∂x xz 3 −2x2 yz 2yz 4 ∂ ∂ 4 2 (2yz ) − (−2x yz) i ∂y ∂z ∂ ∂ 4 3 − (2yz ) − (xz ) j ∂x ∂z ∂ ∂ 2 3 + (−2x yz) − (xz ) k ∂x ∂y = = = (2z 4 + 2x2 y)i + 3xz 2 j − 4xyzk 4 2 ja 2 (2(1) + 2(1) (−1))i + 3(1)(1) j −4(1)(−1)(1)k ∇2 3j + 4k. Jos pätee ∇2 f = 0, funktio f (r) on harmoninen. Samoin edelleen Esim. ∇ × (∇ × A), kun A = x2 yi − 2xzj + 2yzk Nyt ∇ × (∇ × A) = = = = i ∂ ∇ × ∂x x2 y j ∂ ∂y −2xz ∇2 f (r) k ∂ ∂z 2yz = (2x + 2)j. 7.2.4 Paikkavektorin derivaatat Paikkavektori on p r = xi + yj + zk, r = x2 + y 2 + z 2 = |r| i ∇×r = ∇r = (7.19) i 0 (ks. aiemmin) (7.20) r = r̂ r:n suuntainen 1-vektori (7.21) r Viimeisin tulee siitä, että ∂x r = 21 (x2 + y 2 + z 2 )−1/2 2x = x/r, joten X X ri r ∇r = êi ∂i r = êi = r r i i Jos nyt f (r) on r:n funktio, niin ketjusääntö saa muodon ∇f (r) = f ′ (r)∇r = f ′ (r) r r Tämä tulee suoraan tavallisesta ketjusäännöstä: i∂x f (r) = if ′ (r)∂x r = if ′ (r)r/r. Näin esim ∇ · (rf (r)) = = = ∂x (xf (r)) + ∂y (yf (r)) + ∂z (zf (r)) x y z 3f (r) + xf ′ (r) + yf ′ (r) + zf ′ (r) r r r 3f (r) + rf ′ (r) tai suoraan: ∇ · (rf (r)) = f (r)∇ · r + r · ∇f (r) = 3f (r) + rf ′ (r) Usein tavataan 1 d ∇ = r dr = = ∇ × [(2x + 2z)i − (x2 + 2z)k] i j k ∂ ∂ ∂ ∂x ∂y ∂z 2x + 2z 0 −x2 − 2z Nyt saamme heti tulokset X X ∇·r = ∂i ri = 1=3 3 r r 1 r 1 = ∇ · (∇ ) = ∇ · ( 3 ) = 3 − 3 4 · = 0 r r r r r r 1 r 1 r ∇r = − 2 = − 3 r r r r 56 r ∇ · ∇f (r) = ∇ · (f ′ (r) ) r r 3 r r r f ′′ (r) ) · + f ′ (r) − f ′ (r) 2 · r r r r r 2 f ′′ (r) + f ′ (r) r 8. Viiva-, pinta- ja tilavuusintegrointi 8.1 Viivaintegraali Luvussa 7.1.2 käsiteltiin viivan pituuden integrointia. Tässä luvussa yleistetään integrointi avaruuskäyrää, viivaa pitkin. Olkoon meillä käyrä C, jonka piirtää paikkavektori Integrointitiellä on määrätty suunta: kussakin käyrän pisteessä etenemissuunta on sama kuin käyrällä lasketun differentiaalin suunta. Kun siis tien C kuvaaja on r = r(u), niin integrointi etenee parametrin u kasvavaan suuntaan. Jos nyt −C on muuten sama käyrä kuin C mutta suunnaltaan päinvastainen, niin näemme että Z Z F · dr = − F · dr, (8.2) −C r = r(u) = x(u)i + y(u)j + z(u)k. Oletamme edelleen, että pistettä A vastaa paikkavektori r(a) ja pistettä B paikkavektori r(b). Käyrällä C laskettu differentiaali dr on dr du dr = idx + jdy + kdz = du ja osoittaa, kuten aiemmin olemme nähneet (ks. (7.4)), käyrän tangentin suuntaan. Käyrää C pitkin voidaan muodostaa useita viiva- eli polkuintegraaleja: Jos f (r) on skalaarifunktio, saamme f :n integraalin viivan pituuden suhteen Z Z b ds f (r) du f (r)ds = du a C missä r dr drx 2 ds dry 2 drz 2 = = + + du du du du du Jos f (r) = 1, integraali antaa käyrän C pituuden. Jos nyt F(r) on vektorifunktio, saamme erittäin yleisen viivaintegraalin sillä käyrällä C laskettu differentiaali on vastakkaisuuntainen käyrällä −C lasketulle differentiaalille. C : r(u r (b )= r (a + b -a ) ) -C : r B (a + A b -u ) r(a )= r(a + b -b ) Kuva 8.2 Suunnan vaihto Kuvassa integroinnin alku- ja loppupisteitä yhdistävä tie on C : r(u). Kuvan mukaisesti pistettä A vastaa paikkavektori r(a) ja pistettä B paikkavektori r(b). Jos nyt a > b, niin käyrän ja siis integroinnin suunta on pisteestä A pisteeseen B. Integroinnin suunnan kääntö voidaan toteuttaa helposti esimerkiksi vaihtamalla parametri u käyrän C kuvaajassa parametriksi a + b − u, ts. käännettyä integrointisuuntaa vastaava tie on −C : p(u) = r(a + b − u). Vielä selvemmäksi geometrinen merkitys käy, kun kirjoitamme differentiaalin dr muotoon F dr = T(r) ds. A B C r(a ) Tässä T on käyrän yksikkötangentti ja s käyrän kaaren pituus (mitattuna jostakin pisteestä). Viivaintegraalissa esiintyvä skalaaritulo on tällöin r(b ) d r r(u ) F(r) · dr = |F(r)||T(r)| cos θ ds = F (r) cos θ ds, missä θ on vektorin F ja integrointitien tangentin välinen kulma. Viivaintegraali saadaan nyt muotoon Z Z F(r) · dr = F (r) cos θ ds. O Kuva 8.1 Viivaintegraali Z F(r) · dr C Z = (Fx dx + Fy dy + Fz dz) C Z b C (8.1) dy(u) dz(u) dx(u) du. + Fy + Fz du du du a R Geometrisesti viivaintegraali C F · dr tarkoittaa vektorin F käyrän C tangentin suuntaisten projektioiden summaa. = C Fx C Tästä muodosta nähdään esimerkiksi, että vektorin F ollessa massapisteeseen vaikuttava voima tarkoittaa viivaintegraali tehtyä työtä siirrettäessä massapistettä pitkin käyrää C. R Esim. Integraali C F · dr pitkin xy-tason käyrää y = 2x2 pisteestä (0, 0) pisteeseen (1, 2), kun F = 3xyi − y 2 j Parametrisoidaan käyrä C siten, että x = t ja y = 2t2 . Tällöin alkupisteessä t = 0 ja loppupisteessä t = 1. 57 Differentiaali dr on Tehty työ on dr = dx i + dy j dx dy dt i +j dt dt (i + 4tj)dt. = = W = = C Z 1 0 = = Z (6t3 − 16t5 )dt = 1 6 4 16 6 t − t 4 6 dy = 1 dx. 2 0 B 3 8 7 − [0] = − . − 2 3 6 y = x /2 A Kuva 8.3 Integrointitie a) Tehty työ on nyt y = y(x). Wa F · dr pitkin xy-tason käyrää y = 2x2 C pisteestä (0, 0) pisteeseen (1, 2), kun F = 3xyi − y 2 j Otetaan käyrää C parametrisoivaksi muuttujaksi x, jolloin y = 2x2 . Alkupisteessä x = 0 ja loppupisteessä x = 1. Differentiaali dr on R dr = dx i + dy j dy dx dx i + j dx (i + 4xj)dx. = = = Z (xy dx − y 2 dy) " # 2 1 1 1 x x dx − x dx 2 2 2 0 = C Z 2 = Z 2 0 3 2 x dx = 8 = C Z 1 0 = = Z x3 = 1. 8 b) Integroidaan ensin pitkin y-akselia pisteestä (0, 0) pisteeseen (0, 1) ja sitten x-akselin suuntaisesti pisteestä (0, 1) pisteeseen (2, 1). B (3x(2x2 )i − (2x2 )2 j) · (i + 4xj)dx 1 3 0 2 0 Viivaintegraali on siis Z Z (3xyi − y 2 j) · (dx i + dy j) F · dr = C C (xy dx − y 2 dy). 1 x, 2 jolloin Käyrää parametrisoivaksi muuttujaksi voidaan usein ottaa jokin muuttujista x, y tai z. Esimerkiksi xy-tason käyrät esitetään monesti muodossa Esim. Integraali Z y= (3(t)(2t2 )i − (2t2 )2 j) · (i + 4tj)dt 1 0 C F · dr = a) Otetaan integrointitieksi suora Viivaintegraali on siis Z Z F · dr = (3xyi − y 2 j) · (dx i + dy j) C Z 5 (6x − 16x )dx = 1 6 4 16 6 x − x 4 6 0 7 3 8 − [0] = − . − 2 3 6 Esim. Tehty työ siirrettäessä kappale xy-tasossa pisteestä A = (0, 0) pisteeseen B = (2, 1), kun kappaleeseen vaikuttava voima on F = xyi − y 2 j Nyt A Kuva 8.4 Integrointitie b) Reitillä (0, 0) → (0, 1) on x = 0 ja dx = 0. Reitillä (0, 1) → (2, 1) taas on y = 1 ja dy = 0. Työ on siten Z 1 ((0)y(0) − y 2 dy) Wb = y=0 Z 2 + F · dr = (xyi − y 2 j) · (dx i + dy j) = xy dx − y 2 dy. x=0 58 (x(1)dx − (1)(0)) = 1 y3 − 3 0 + 2 1 5 x2 =− +2= . 2 3 3 Näemme siis, että kenttä φ toteuttaa ehdon ∇φ · 0 du du =F· dt dt tai Konservatiiviset kentät Edellisen esimerkin tapauksessa tehty työ riippui siirtoreitistä. Toisaalta hyvin monissa kiinnostavissa fysikaalisissa syteemeissä työ riippuu ainoastaan siirroksen alku- ja loppupisteistä mutta ei lainkaan näitä pisteitä yhdistävästä reitistä. Tällöin siis pisteitä P1 ja P2 yhdistävää käyrää myöten laskettu voiman F viivaintegraali Z P2 F · dr W = P1 on tiestä riippumaton ja voimakentän F sanotaan olevan konservatiivinen. Oletetaan nyt, että kenttä F on konservatiivinen. Silloin pisteitä P1 = (x1 , y1 , z1 ) ja P = (x, y, z) yhdistävää tietä myöten laskettu viivaintegraali φ(x, y, z) = Z Konservatiivinen kenttä on siis esitettävissä jonkin skalaarikentän gradienttina. Oletetaan nyt, että vektorikenttä F on skalaarikentän φ gradientti, ts. F = ∇φ. Lasketaan pisteestä P1 pisteeseen P2 pitkin käyrää C viivaintegraalia Z P2 Z P2 ∇φ · dr. F · dr = W = P1 P1 (x,y,z) (x1 ,y1 ,z1 ) du = 0. dt Koska u(t) oli mielivaltainen pisteitä P1 ja P yhdistävä käyrä, täytyy olla F = ∇φ. (∇φ − F) · F · dr määrittelee yksikäsitteisesti integrointitiestä riippumattoman ja vain integroinnin loppupisteestä (pidetään alkupistettä kiinnitettynä) riippuvan skalaarikentän φ. Olkoon r = u(t) jokin sellainen pisteitä P1 ja P yhdistävä käyrä, että (x1 , y1 , z1 ) = u(t1 ) ja (x, y, z) = u(t). Skalaarifunktion φ differentiaali on dφ(x, y, z) = ∇φ · dr, joten työ W on kirjoitettavissa muotoon Z P2 dφ. W = P1 Olkoon nyt r = r(t) sellainen käyrän C parametriesitys, että Tällä käyrällä on du dt, dr = dt joten tätä käyrää myöten laskettuna kentän φ arvoksi saadaan Z t du F· φ(x, y, z) = dt. dt t1 (x1 , y1 , z1 ) = r(t1 ) ja (x2 , y2 , z2 ) = r(t2 ). Tällä käyrällä kenttä φ saa arvot φ(x(t), y(t), z(t)) eli voimme pitää käyrällä kenttää yhden muuttujan t funktiona ψ(t) = φ(x(t), y(t), z(t)). Käyrällä laskettu differentiaali on Kentän φ argumentteja voidaan näin pitää integrointimuuttujan t funktioina. Tällöin ensinnäkin integraalifunktion määritelmän (4.1) mukaan on du dφ =F· . dt dt Toiseksi, koska kentän φ differentiaali käyrällä r = u(t) on dφ = dψ(t) = eli pitkin käyrää C tehty työ on nyt Z t2 Z P2 dψ(t) dφ = dt W = dt t1 P1 t2 = dφ = ∇φ · du, derivaatta parametrin t suhteen on kirjoitettavissa myös muotoon dφ du = ∇φ · . dt dt dψ(t) dt, dt / ψ(t) = ψ(t2 ) − ψ(t1 ) t1 = φ(x2 , y2 , z2 ) − φ(x1 , y1 , z1 ). Integraalin arvo riippuu näin ollen ainoastaan päätepisteistä eikä lainkaan valitusta integrointitiestä. 59 Olemme johtaneet lauseen RP Integraali P12 F · dr on riippumaton integrointitiestä (ts. F on konservatiivinen) jos ja vain jos kenttä F on esitettävissä jonkin skalaarifunktion φ gradienttina F = ∇φ. Eräs operaattoriin ∇ liittyvä ominaisuus oli Muuttujan y suhteen osittaisderivaatta on Z z ∂φ ∂Fz (x, y, z) = Fy (x, y, z1 ) + dz ∂y ∂y z1 Z z ∂Fy (x, y, z) dz = Fy (x, y, z1 ) + ∂z z1 z ∇ × (∇φ) = 0 = olipa φ mikä tahansa skalaarikenttä. Jos siis kenttä F on konservatiivinen ja siten ilmaistavissa jonkin skalaarikentän gradienttina, sen roottori häviää: = = ∇ × F = 0. Oletetaan nyt että kentän F roottori on nolla, ts. i j k ∂ ∂ ∂ ∇ × F = ∂x ∂y ∂z Fx Fy Fz ∂Fz ∂Fx ∂Fy ∂Fz = i+ j − − ∂y ∂z ∂z ∂x ∂Fy ∂Fx k + − ∂x ∂y = 0. z1 y z = Fx (x, y1 , z1 ) + / Fx (x, y, z1 ) + / Fx (x, y, z) = Fx (x, y1 , z1 ) + Fx (x, y, z1 ) − Fx (x, y1 , z1 ) z1 y1 ∂Fy ∂Fx ∂Fz ∂Fy ∂Fx ∂Fz = , = ja = . ∂y ∂z ∂z ∂x ∂x ∂y C Fy (x, y, z1 ) + Fy (x, y, z) − Fy (x, y, z1 ) Fy (x, y, z), missä olemme käyttäneet hyväksi roottorin häviämisestä seuranneita ehtoja. Funktion φ osittaisderivaatta muuttujan x suhteen on Z y ∂φ ∂Fy (x, y, z1 ) = Fx (x, y1 , z1 ) + dy ∂x ∂x y1 Z z ∂Fz (x, y, z) + dz ∂x z1 Z y ∂Fx (x, y, z1 ) dy = Fx (x, y1 , z1 ) + ∂y y1 Z z ∂Fx (x, y, z) + dz ∂z z1 Kentän komponenttien osittaisderivaatat toteuttavat siis ehdot Lasketaan viivaintegraali Z Z F · dr = (Fx dx + Fy dy + Fz dz) Fy (x, y, z1 ) + / Fy (x, y, z) = +Fx (x, y, z) − F (x, y, z1 ) Fx (x, y, z), missä jälleen olemme käyttäneet osittaisderivaattojen välisiä ehtoja. Kenttä F voidaan siis kirjoittaa muodossa C pisteestä P1 = (x1 , y1 , z1 ) pisteeseen P = (x, y, z) pitkin käyrää C. Valitaan erikoisesti täksi käyräksi koordinaattiakselien suuntaiset viivasegmentit pisteestä (x1 , y1 , z1 ) pisteeseen (x, y1 , y2 ), siitä pisteeseen (x, y, z1 ) ja tästä lopuksi pisteeseen (x, y, z). Olkoon φ(x, y, z) tätä käyrää myöten laskettu viivaintegraalin arvo, ts. Z x Fx (x, y1 , z1 )dx φ(x, y, z) = x1 Z y Fy (x, y, z1 )dy + + Z y1 z Fz (x, y, z)dz. F= Skalaarikentän gradienttina kenttä F on siten edellisen lauseemme mukaisesti konservatiivinen. Olemme saaneet kentän konservatiivisuudelle kätevän kriteerin: Vektorikenttä on konservatiivinen (ts. esitettävissä skalaarifunktion gradienttina) jos ja vain jos sen roottori häviää. Lausetta johtaessamme muodostimme sellaisia derivaattoja kuin R ∂ ∂y φ(x, y)dx siirtämällä derivoinnin integraalin sisälle, ts. ∂ ∂y z1 Z φ(x, y)dx = Z ∂φ(x, y) dx. ∂y Tämä on sallittua silloin kun integraalit ovat kyllin ”siistejä”(tasaisesti suppenevia). Fysikaalisissa systeemeissä voidaan useimmiten näin olettaa. Tästä esityksestä funktion φ osittaisderivaataksi muuttujan z suhteen saadaan ∂φ = Fz (x, y, z). ∂z ∂φ ∂φ ∂φ i+ j+ k = ∇φ. ∂x ∂y ∂z Konservatiivista kenttää vastaavaa skalaarifunktiota sanotaan kentän potentiaaliksi. 60 Jos integrointitie C on suljettu, ts. integrointitien alkupiste yhtyy loppupisteeseen, on viivaintegraalista tapana käyttää merkintää I Z F · dr = F · dr. (8.3) C C F · dr = 0. (8.4) Tämä on voimassa myös toisin päin. Oletetaan siis, että mitä tahansa suljettua käyrää myöten laskettu viivaintegraali häviää. Olkoot Pa ja Pb kaksi avaruuden pistettä ja C1 jokin pisteestä Pa pisteeseen Pb kulkeva käyrä. Jos C2 on jokin toinen käyrä välillä Pa −→ Pb , niin I Z Z F · dr F · dr = F · dr − C C2 C1 = 0, Pa −→ Pb −→ Pa . C1 = 2xy + z 3 = x2 = 3xz 2 . Integroimalla nämä lausekkeet saamme 2 x y + xz 3 + f (y, z) x2 y + g(x, z) φ= xz 3 + h(x, y) Tulokset ovat yhtäpitäviä, kun valitsemme f (y, z) = 0, g(x, z) = xz 3 ja h(x, y) = x2 y. Haettu skalaaripotentiaali on siis φ = x2 y + xz 3 , mihin voidaan vielä lisätä mielivaltainen vakio. Esim. Tehty työ siirrettäessä massapistettä pisteestä P1 = (1, −2, 1) pisteeseen P2 = (3, 1, 4), kun vaikuttava voima on F = (2xy + z 3 )j + x2 j + 3xz 2 k Konservatiivista kenttää F vastaava skalaaripotentiaali on edellisen esimerkin perusteella kun C on yhdistetty suljettu käyrä Pa ∂φ ∂x ∂φ ∂y ∂φ ∂z C Jos kenttä on konservatiivinen, niin pitkin mitä tahansa suljettua käyrää C myöten laskettu viivaintegraali on nolla, I Viivaintegraali Z Pb On siis etsittävä sellainen φ, että −C2 φ = x2 y + xz 3 . F · dr = Z C1 F · dr = Z C2 F · dr ei siis riipu lainkaan integrointitiestä, joten kenttä F on konservatiivinen. Esim. Onko kenttä F = (2xy + z 3 )j + x2 j + 3xz 2 k konservatiivinen? Lasketaan kentän roottori i j k ∂ ∂ ∂ ∇ × F = ∂x ∂y ∂z 2xy + z 3 x2 3xz2 ∂(3xz 2 ) ∂(x2 ) = i − ∂y ∂z ∂(2xy + z 3 ) ∂(3xz 2 ) j − + ∂z ∂x ∂(x2 ) ∂(2xy + z 3 ) k − + ∂x ∂y = 0, joten kenttä F on konservatiivinen. Esim. Kenttää F = (2xy + z 3 )j + x2 j + 3xz 2 k vastaava skalaaripotentiaali Edellisen esimerkin perusteella F on konservatiivinen, joten on olemassa sellainen potentiaali φ, että F = ∇φ. Voiman konservatiivisuudesta johtuen tehty työ on W Z = P2 P1 F · dr = φ(3, 1, 4) − φ(1, −2, 1) 201 − (−1) = 202. = Muita viivaintegraaleja R R Edellä käsittelimme integraaleja C f ds C F · dr. Muunkinnäköisiä yhdistelmiä esiintyy: Z Z Z f dr, Fds, F × dr C C C Nämä kaikki muunnetaan tavallisiksi integraaleiksi käyräparametrin u yli: r(u) = (x(u), y(u), z(u)). Näistä esim Z Z b Z b i j k dr Fx Fy Fz du = F× F × dr = du = du a C a x′ y′ z′ Z b a [i(Fy z ′ − Fz y ′ ) + j . . .] Esim. (x, y)-tason käyrän C rajoittaman alueen ala:Olkoon r käyrän C koordinaattivektori, ja dr differentiaali C:n suuntaisesti. Näiden vektoreiden 61 virittämän kolmion ala on 21 |r × dr|. Koko alueen ala saadaan integroimalla (piirrä kuva!) I I 1 1 (r × dr)z = (xdy − ydx) 2 C 2 C Tämä toimii riippumatta siitä onko origo käyrän C sisällä vai ei. 8.2 Pintaintegraali tasoalueen yli Olkoon meillä funktio f (x, y) jonka haluamme integroida yli tason alueen A: y (x) 2 y-akselin (vakio x) suuntaiset suorat enintään 2 kertaa. Jos näin ei ole, alue täytyy joko jakaa kahteen tai useampaan säännölliseen osaan tai vaihtaa integroimismuuttujia. Usein riittä että vaihdetaan vain x, y-integrointijärjestystä. 8.2.1 Muuttujien vaihto pintaintegraalissa Usein kannattaa vaihtaa koordinaatistosysteemi johonkin muuhun kuin karteesiseen (x, y)-koordinaatistoon, integroimisalueen tai funktion mukaan. (esim. integraali riippuu vain vektorin r pituudesta, ei suunnasta). 1-ulotteisessa tapauksessa muuttujan vaihto x → u tapahtui muuttamalla differentiaalia: du = du dx dx. Tämä yleistyy myös tasolle (tai useampaankin ulottuvuuteen: jos vaihdetaan muuttujat (x, y) ↔ (u, v), niin v y y (x) 1 x x1 2 Kuva 8.5 Pintaintegraali I Z = f (x, y)da = A Z x2 = u dx x1 Z y2 (x) Z Z x f (x, y)dxdy Kuva 8.6 Koordinaattien vaihto dyf (x, y) y1 (x) Tämä palautuu siis kahdeksi sisäkkäiseksi integraaliksi. Tässä da = dxdy on infintesimaalinen pinta-alaelementti. Huom: joskus pintaintegraaleja kahdella, joskus yhdellä R R merkitään R integraalimerkillä: f dxdy = f dxdy. Kaksi integraalimerkkiä on tarpeen jos merkitään eksplisiittisesti muuttujien rajat. Näissä muistiinpanoissa käytetään pääsääntöisesti vain yhtä integraalimerkkiä. tai kääntäen, 0 = = Z 1 dx 0 x 0 1 1 3 1 x = 2 0 2 Z 1 0 ∂x ∂u ∂y ∂u ∂x ∂v ∂y ∂v dudv dudv = ∂u ∂x ∂v ∂x ∂u ∂y ∂v ∂y dudv Jos u → u + du, v vakio, r:n muutos on ∆u r = ∂u rdu = (∂u xi + ∂u y j)du. Samoin jos v → v + dv, r:n muutos on ∆v r = ∂v rdv = (∂v xi + ∂v y j)dv. Vektorien ∆u r ja ∆v r virittämän suunnikkaan pinta-ala on 1 dx(x2 + x2 ) 2 R R y (x) R Huom: jako A da = dx y12(x) dy toimii vain jos alue on riittävän säännöllinen, ts. että suljettu käyrä C leikkaa dxdy = Osoitetaan tämä: tutkitaan kuinka kuvautuu pinta-alan differentiaali dudv xy-tasolle. Olkoon r = x(u, v)i + y(u, v)j tason koordinaattivektori. 0 1 (xy + y 2 ) = 2 x = x(u, v) y = y(u, v) (||J||, determinantin itseisarvo). Determinanttia kutsutaan Jacobin determinantiksi. R Esim: Alueen A pinta-ala on A dxdy Esim: Olkoon A pisteiden (0,0), (1,0), (1,1) määräämä kolmio, ja f (x, y) = x + y. Nyt Z Z 1 Z x dy(x + y) dx f dxdy = A tai kääntäen Differentiaaleille pätee R On syytä huomata että . . . dxdy ei spesifioi integrointien suoritusjärjestystä eikä myöskään kerro eksplisiittisesti integrointirajoja. Nämä valitaan tilanteen mukaan, useista vaihtoehdoista tietenkin helpoimmin laskettava. Usein R käytetään R myös sellaisia samaa tarkoittavia merkintöjä kuin dx dy . . .. Vastaavia merkintöjä käytetään myös kolmi- ja useampiulotteisille integroinneille. u = u(x, y) v = v(x, y) |∆u r×∆v r| = | i j ∂u x ∂v x ∂u y ∂u y k 0 |dudv = | 0 ∂u x ∂v x ∂u y ∂u y |dudv Siis: jos vaihdetaan muuttujia (x, y) → (u, v), eli sijoitetaan x = x(u, v), y = y(u, v), Z Z ∂(x, y) |dudv f (x(u, v), y(u, v))| f (x, y)dxdy = ∂(u, v) A′ A 62 √ π. missä A′ on sama alue mutta ilmaistu u, v-koordinaateilla. Siis saamme I = 8.2.2 Napakoordinaatisto Kaksiulotteisen tason rφ-napakoordinaatiston määrittelevät yhtälöt 8.2.3 Tilavuusintegraalit Tilavuusintegraali yleistyy suoraan tasointegraalista: x y y e e f r = = r cos φ r sin φ. (8.5) f (x, y, z)dV = V x Z r = v a k io dV = V Tämän muunnoksen Jacobin determinantti on ∂r x ∂φ x cos φ −r sin φ = ∂r y ∂φ y sin φ r cos φ = r Siis saamme tuloksen dxdy = rdrdθ, ja Z Z f (x, y)dxdy = f rdrdφ A′ Esim. Integroidaan f = r = p x2 + y 2 1-ympyrän alan yli: 1. karteesisissa (x, y)-koordinaateissa: Z 1 Z √1−x2 p ei yksinkertainen! dy x2 + y 2 = . . . dx √ − 1−x2 0 2. napakoordinaatistossa: Z 2π Z dφ 0 1 0 = = Z −∞ dθdrre R2 2π ∞ 0 −r 2 = Z 2 1 − e−r = π 2 z2 2π dθ 0 Z Z dz z1 = = Z 1 dz 0 1 dz 0 1 0 Z Z 1−z dy 0 y2 (z) dy y1 (z) Z x2 (y,z) dxf (x, y, z) x1 (y,z) drre−r 1−y−z dx 0 dy(1 − y − z) = 0 Z 1 dz 0 1−z 1 (1 − z)y − y 2 2 0 1 1 dz[(1 − z)2 − (1 − z)2 ] = 2 6 Muuttujan vaihto: tapahtuu jälleen Jacobin determinantin avulla, (x, y, z) → (u, v, t): ∂ u x ∂ v x ∂ t x ∂r dxdydz = | |dudvdt = ∂u y ∂v y ∂t y ∂u ∂ u z ∂ v z ∂ t z dudvdt Kaksi tärkeää erikoistapausta: sylinterikoordinaatisto ja pallokoordinaatisto 8.2.4 Sylinterikoordinaatisto Sylinterikoordinaatiston ρφz määrittelevät yhtälöt x y z R2 ∞ Z 1−z 2π drrr = 3 Helppoa! Kannattaa valita siis koordinaatisto ongelman mukaan! R∞ 2 Esim. Mikä on I = −∞ e−x dx?Käytetään tässä seuraava temppua ja muutetaan integraali tasointegraaliksi: Z Z ∞ Z ∞ 2 2 2 2 dye−y = dxe−x dxdye−(x +y ) I2 = −∞ Z Z Kuva 8.7 Napakoordinaatisto A Z (tai joku muu x, y, z-järjestys!). Jos f = 1, integraali antaa suoraan alueen V tilavuuden. Tässä tilavuuden differentiaali dV = dxdydz. Esim. Määritellään tilavuus niin että x, y, z > 0, ja x + y + z < 1 (tetraedri). Lasketaan tämän tilavuus. Nyt kiinteällä z, 0 < z < 1, pätee 0 < y < 1 − z. Samoin kiinteällä y, z 0 < x < 1 − y − z. Siis f = v a k io ( x ,y ) f Z z z f e r = v a k io z = v a k io r f 0 r ρ cos φ ρ sin φ z. r = v a k io f = v a k io e z z 2 = = = e r f f = v a k io z = v a k io r y x Kuva 8.8 Sylinterikoordinaatisto 63 (8.6) Kuten kuvasta nähdään, on ρ pisteen xy-tasolla olevan projektion etäisyys origosta, φ tämän projektion napakulma ja z pisteen korkeus xy-tasosta mitattuna. Koordinaattikäyrät ovat olevan projektion ja x-akselin välisenä atsimuuttikulmana φ. z • ρ-käyrät: z-akselia vastaan kohtisuorat (= xy-tason suuntaiset) ja sitä leikkaavat suorat. r si n q yksikkövektorit nähdään suoraan (8.7) Kuvasta nähdään, että pallokoordinaateista rθφ siirrytään karteesisiin koordinaatteihin kaavoilla x y z f Siis: dV = ρdρdφdz. Tämän näkee myös tutkimalla suoraan tilavuuselementtiä: r v a k io f v a k io Kuva 8.11 Pallokoordinaatiston koordinaattikäyrät Pallokoordinaatiston koordinaattikäyrät ovat • r-käyrät: origon kautta kulkevat suorat. Kuvasta nähdään, että sylinterikoordinaattien differentiaalisia muutoksia dρ, dφ ja dz vastaa tilavuuselementti dV = ρ dρ dφ dz. R Esim. laske V f dV , kun V on sylinteri 0 ≤ z ≤ 1, x2 + y 2 = ρ2 ≤ 1, ja f = ρ2 : 2π dφ 0 r q x tossa V r q v a k io f v a k io f Kuva 8.9 Tilavuuselementti sylinterikoordinaatis- ρ2 dV = (8.8) y r d f Z r sin θ cos φ r sin θ sin φ r cos θ. d z d V Z = = = z r v a k io q v a k io q d f d r r rs in Kuva 8.10 Pallokoordinaatit i cos φ + j sin φ −i sin φ + j cos φ k. Sylinterikoordinaatistossa tilavuuden differentiaali antaa Jacobin determinantin cos φ −ρ sin φ 0 dV = dxdydz = | sin φ ρ cos φ 0 |dρdφdz = ρdρdφdz 0 0 1 z q r s in q s in f x y f co s f • z-käyrät: z-akselin suuntaiset suorat. r c o sq • φ-käyrät: z-akselikeskeiset ja sitä vastaan kohtisuorat ympyrät. Sylinterikoordinaatiston kuvasta: eρ = eφ = ez = r q Z 1 dz 0 Z 1 dρρρ2 = 0 • θ-käyrät: origokeskiset ympyrät, joiden halkaisijana on z-akselin suuntaiset origokeskiset janat (= joiden taso on kohtisuorassa xy-tasoa vastaan). • φ-käyrät: z-akselikeskeiset ja sitä vastaan kohtisuorassa olevat (= xy-tason suuntaiset) ympyrät. π 2 8.2.5 Pallokoordinaatisto Pallokoordinaatistossa pisteen paikka ilmoitetaan etäisyytenä r origosta, paikkavektorin ja z-akselin välisenä korkeuskulmana θ sekä paikkavektorin xy-tasolla Pallokoordinaatistossa Jacobin determinantti on ∂(x, y, z) 2 ∂(r, θ, φ) = r sin θ Siis nyt dV = r2 sin θdrdθdφ = r2 drd(cos θ)dφ. 64 R Esim. Laske integraali V f dV , kun tilavuus V on pallonkuori 1 ≤ r ≤ 2 ja f = 1/r2 : Z 1 Z 2π Z π Z 1 1 drr2 2 = 4π dθ sin θ dφ dV = 2 r r 0 0 0 V • Kantavektorit Tässä siis R 4π dω = = −i sin φ + j cos φ. eφ Usein merkitään kulmaosia yhdessä avaruuskulmalla Ω: Z Z Z dV = dΩ drr2 V = i sin θ cos φ + j sin θ sin φ + k cos θ = i cos θ cos φ + j cos θ sin φ − k sin θ er eθ • Gradientti ∇ψ = er 4π R 2π 0 dφ Rπ eφ ∂ψ ∂ψ eθ ∂ψ + + . ∂r r ∂θ r sin θ ∂φ dθ sin θ 0 • Divergenssi 8.2.6 Nabla sylinteri- ja pallokoordinaatistoissa: Samoin kuin integaaleja voidaan sylinteri- ja pallokoordinaateissa, joskus on edullista laskea myös differentiaaleja ko. koordinaateissa. Näiden osoittaminen on varsin suoraviivaista mutta työlästä, joten annetaan tässä vain tulokset: ∇·A • Muunnoskaavat = = ρ cos φ ρ sin φ z = z. 1 ∂ ∂ 1 r2 Ar + (Aθ sin θ) r2 ∂r r sin θ ∂θ 1 ∂Aφ . + r sin θ ∂φ • Laplacen operaattori ∂ 1 ∂ 1 2 ∂ψ 2 2 ∂ψ ∇ ψ = r + 2 2 sin θ r2 ∂r ∂r ∂θ r sin θ ∂θ 2 1 ∂ ψ . + 2 2 r sin θ ∂φ2 Sylinterikoordinaatisto x y = 8.3 Pintaintegraali yli käyrän pinnan • Kantavektorit eρ = i cos φ + j sin φ eφ ez = −i sin φ + j cos φ = k. • Gradientti ∇ψ = eρ ∂ψ 1 ∂ψ ∂ψ + eφ + ez . ∂ρ ρ ∂φ ∂z • Divergenssi ∇·A= 8.3.1 Skalaarifunktion integraalit Olkoon φ(x, y, z) on jokin skalaarifunktio, A jokin kolmiulotteisen avaruuden pinta ja dA tämän pinnan infinitesimaalinen pinta-alkio. Tehtävänä on nyt laskea pintaintegraali Z I= Samalla tavoin kuin tavallisen yhden muuttujan integraalinkin tapauksessa tämä tarkoittaa sitä, että 1. jaetaan pinta A pieniin ∆A suuruisiin palasiin, 1 ∂Aφ ∂Az 1 ∂ (ρAρ ) + + . ρ ∂ρ ρ ∂φ ∂z 2. lasketaan kussakin palasessa funktion φ(x, y, z) arvo ja kerrotaan tämä palasen pinta-alalla ∆A, • Laplacen operaattori 1 ∂ ∂ψ 1 ∂2ψ ∂2ψ 2 + . ∇ ψ= ρ + 2 ρ ∂ρ ∂ρ ρ ∂φ2 ∂z 2 Pallokoordinaatisto • Muunnoskaavat x = r sin θ cos φ y z = = r sin θ sin φ r cos θ. φ(x, y, z)dA. A 3. summataan yhteen kaikki termit φ(x, y, z)∆A ja 4. annetaan palasten pinta-alan lähestyä nollaa. Pintaintegraali on usein helpompi laskea palauttamalla se koordinaattien yli suoritettaviksi integroinneiksi. Jos esimerkiksi pinta A voidaan esittää muodossa z = f (x, y), kannattaa yleensä integroida muuttujien x ja y yli, ts. viedä integraali muotoon Z y1 Z x1 φ(x, y, f (x, y))h(x, y)dx dy. I= y0 65 x0 Tässä h(x, y) on skaalaustekijä, jolla xy-tason pinta-alkio dA0 = dx dy on kerrottava, jotta saataisiin pinnan alkio dA. Integrointien rajat riippuvat pinnasta. Se, kannattaako ensin integroida muuttujan x (kuten yo. lausekkeessa) vai muuttujan y yli riippuu paitsi pinnasta niin myös funktiosta φ. k z g n d A y x 0 d y g = 0. Tällöin kaavassa (8.10) tarvittavat osittaisderivaatat ovat ∂f ∂g ∂f ∂g ∂g = , = ja =1 ∂x ∂x ∂y ∂y ∂z ja pintaelementin skaalaustekijä vastaavasti s 2 2 ∂f ∂f 1 + + 1. = |∇g| = cos γ ∂x ∂y A d A pinnan yhtälö on d x Kuva 8.12 Pintaintegraali Kuten kuvasta nähdään, xy-tason pinta-alkiota dA0 ja sitä pinnalla A vastaavaa alkiota sitoo toisiinsa relaatio dA0 = dx dy = dA cos γ, (8.9) missä γ on pinnan normaalin n ja z-akselin välinen kulma. Tässä tapauksessa pintaintegraali on siis kirjoitettavissa muotoon Z Z dx dy I= φ dA = φ(x, y, z) . cos γ A Pinta-integraali I on nyt s 2 Z 2 ∂f ∂f I = φ(x, y, f (x, y)) + + 1dx dy. ∂x ∂y (8.11) Esim. Funktion φ = z integraali puolipallon x2 + y 2 + z 2 = R2 , z ≥ 0 pinnan yli Nyt p z = R2 − x2 − y 2 = f (x, y), jolloin Oletetaan nyt, että pinnan A yhtälö on annettu muodossa Kyseessä on siis skalaarikentän g eräs tasa-arvopinta. Kuten gradientin yhteydessä näimme, on skalaarin gradientti kohtisuorassa tasa-arvopintaa vastaan. Eräs pinnan A normaali on niin ollen ∇g ja normaalin suuntainen yksikkövektori silloin ∇g . |∇g| ∂f ∂y = 1 cos2 γ −p −p x R2 − x2 − y 2 y R 2 − x2 − y 2 2 2 ∂f ∂f + ∂x ∂y 2 2 x +y = 1+ 2 R − x2 − y 2 R2 . = 2 R − x2 − y 2 = 1+ Integrointialueena xy-tasossa on puolipallon pinnan projektio eli kehän Tämän projektio z-akselille on n · k = cos γ = = ja g(x, y, z) = C. n= ∂f ∂x ∂g ∂z |∇g| x2 + y 2 = R 2 ; z = 0 . Pintaintegraalimme on nyt kirjoitettavissa muotoon Z |∇g| I = φ(x, y, z) ∂g dx dy. (8.10) rajoittama ympyrä. xy-tason integraali kannattaa tehdä nyt napakoordinaatteja käyttäen: ρ2 = x2 + y 2 : I = ∂z Jos pinta A on annettu muodossa = z = f (x, y), = niin asettamalla g = z − f (x, y) 66 2π R 1 dρρz cos γ 0 0 A s Z R p R2 dρρ R2 − ρ2 2π 2 R − ρ2 0 Z φdA = Z dφ R 1 2π / R ρ2 = πR3 2 0 Z 8.3.2 Vuointegraalit: vektoreiden pintaintegraalit Tavallisin tapaus pintaintegraaleista on laskea vektorikentän vuo pinnan läpi: Tarkastellaan pintaa A ja sillä pisteessä P (x, y, z) olevaa pinta-alkiota dA. Määritellään vektoriaalinen pinta-alkio dA siten, että dA = n dA, eli radiusvektorin suuntainen yksikkövektori. Edelleen ∇ × F · dA = 2k · n dA = 2 cos θ dA, missä θ on radiusvektorin ja z-akselin välinen kulma. z missä n on pisteessä P laskettu pinnan normaalin suuntainen yksikkövektori. Olkoon F(x, y, z) jokin (integroituva) vektorikenttä. Eräs vektorikentän F pintaintegraali on Z Z F · dA = F · n dA. (8.12) A r s in q d f r q A Tämä integraali kuvaa vektorin F vuota pinnan A läpi. Huom: jos kyseessä on suljettu pinta, integraalia merkitään I A F · dA. Jos pinta ei ole suljettu, sillä on luonnollisesti reunaviiva. Esim. Nesteen virtaus Jos ρ on nesteen tiheys ja v sen nopeus, niin r d q d A r s in q d f d q Kuva 8.13 Pintaelementti pallolla Kuvassa φ radiusvektorin xy-tasolla olevan projektion ja x-akselin välinen kulma. Kuten kuvasta nähdään, pallon pinnalla pallokoordinaattien θ ja φ differentiaalisia muutoksia dθ ja dφ vastaava pintaelementti dA on dA = r2 sin θ dθ dφ. (8.13) ρv · dA = ρv · n dA on pintaelementin dA läpi aikayksikössä kulkevan nesteen R määrä. Vektorin µ = ρv vuo pinnan A läpi, A µ · dA, on aikayksikössä pinnan A läpi kulkevan nesteen määrä. Muunlaisia pintaintegraaleja ovat esim. Z Z Z Z F × dA = F × n dA; φ dA; φ dA. A A A A Esim. Radiaalikenttä pallokuoren yli: Olkoon v = rf (r), ja pallonkuori |r|2 = r2 = R2 . Nyt n = r/r, ja I I I dA = 4πR3 f (R) f (R)r·r/RdA = f (R)R v·dA = A Puolipallon pinnalla kulmat θ ja φ saavat arvot = = 2 missä käytettiin tietoa pallon ala = 4πR . R Esim. I = A (∇ × F) · dA, kun F = −yi + xj + zk, ja A on puolipallon x2 + y 2 + z 2 = R2 ; z ≥ 0 pinta Nyt i j k ∂ ∂ ∂ ∇ × F = ∂x ∂y ∂z = 2k. −y x z Pinnan A yhtälö on g = x2 + y 2 + z 2 = R 2 , joten ∇g = 2xi + 2yj + 2zk = 2r. Pallopinnan A yksikkönormaali n on siis ∇g r xi + yj + zk n= = = , |∇g| r r θ 0≤ φ π 2 ≤ 2π. ≤ Integraali I on siis Z I = ∇ × F · n dA A A 0≤ = Z A π/2 dθ 0 4πR2 4πR2 Z Z 2π dφ 2 cos θ R2 sin θ 0 π/2 0 π/2 cos θ sin θ dθ sin2 θ = 2πR2 . 2 0 8.4 Gaussin lause Edellä laskettiin vektorikentän v = rf (r) vuo R-säteisen pallon pinnan läpi, tuloksella I v · dA = 4πR3 f (R) A Lasketaan nyt ∇ · v integroituna pallon tilavuuden yli: nyt ∇·v = ∇·(rf (r)) = f (r)∇·r +r·f ′ (r)∇r = 3f (r)+rf ′ (r) 67 Siis Z Z Z ∇·vdV = dΩ V R drr2 (3f (r)+rf ′ (r)) = 4π 0 Z R alapinnalla: dr∂r (r3 f (r)) = 4πR3 f (R) joten Z (8.14) V missä A on alueen V pinta. Tämä tulos pätee yleisesti, kaikille vektorikentille ja tilavuuksille, ja sitä sanotaan Gaussin laiksi: vektorin v normaalikomponentin integraali yli suljetun pinnan on sama kuin sen divergenssin integraali pinnan sulkeman tilavuuden yli. Toisin: kentän v vuo suljetun pinnan läpi = kentän v lähteet pinnan sisällä! Gaussin laki on 3-ulotteinen yleistys 1-ulotteisia integraaleja koskevalle totuudelle Z b a [Fz (x, y, f2 ) − Fz (x, y, f1 )] dxdy R = = Z Z Fz k · n2 dA2 + A2 Fz k · n dA. ∂Fz dV = ∂z V ZZZ Z ZV Z ∂Fy dV ∂y = ∂Fx dV ∂x = Z Z Fy j · n dA A Fx i · n dA, A joten kaiken kaikkiaan on ZZZ ZZZ ∂Fz dV. ∂z ∂Fx ∂Fy ∂Fz + + ∂x ∂y ∂z V V = 2 eli 2 ZZZ Z dV Fx i + Fy j + Fz k · n dA, A ∇ · F dV = V Z F · n dA = A Z F · dA. A 1 Esim. Vektorin r vuo a-säteisen ja h-korkuisen sylinterin pinnan läpi Olkoon A sylinteriä rajoittava pinta (mukaan lukien pohjat) ja V sylinterin tilavuus. z 1 d y Fz k · n dA. A V ja tarkastellaan integraalia A Z Vastaavasti voidaan osoittaa, että F = Fx i + Fy j + Fz k, n Fz k · n1 dA1 A1 A ZZZ df dx = f (b) − f (a) dx A Z Saamme siis Gaussin lauseen tarkempi todistus Kirjoitetaan vektori F komponenteittain: n dxdy = −k · n1 dA1 dxdy = k · n2 dA2 dxdy = k · n dA, yläpinnalla: pinnalla: 0 Saimme siis tuloksen I Z v · dA = ∇ · vdV A Olkoon n pinnan A yksikkönormaali, n1 alapinnan A1 yksikkönormaali ja n2 yläpinnan A2 yksikkönormaali. Nyt d x R Kuva 8.14 Gaussin lauseen todistus Olkoot A1 ja A2 tilavuutta V ympäröivän suljetun pinnan A alaja yläpinta, joita esittävät yhtälöt A1 : z = f1 (x, y) A2 : z = f2 (x, y). a Olkoon R pinnan A (tai A1 tai A2 ) projektio xy-tasolla. Tällöin ZZZ ∂Fz dV ∂z = ZZZ ∂Fz dzdxdy ∂z f2 (x,y) = Z Z R = Z R y x Kuva 8.15 Sylinteri V V h f1 (x,y) ∂Fz dz ∂z dxdy [Fz (x, y, f2 ) − Fz (x, y, f1 )] dxdy a) Divergenssilauseen perusteella vuo I on Z Z I= r · dA = ∇ · r dV. A 68 V Koska jolloin r = xi + yj + zk, on ∂x ∂y ∂z + + = 3, ∂x ∂y ∂z ∇·r= joten I=3 Z ∇ · K = −∇2 φ = −4πGρ. dV = 3V = 3πa h. yläpinta r · n dA = Z h dA = πa2 h. (ii) Pohjalla n = −k ja r · n = −z = 0, joten Z V ∇ · K dV pohja n= xi + yj , a ρ dV V −4πGM. V A kun A on tilavuutta V rajoittava pinta. Oletetaan, että M -massainen kappale on pallosymmetrinen ja otetaan tilavuudeksi V ko. kappaleen sisäänsä sulkeva r-säteinen kappalekeskinen pallo. Tällöin ilmeisestikin |K| on vakio pallon pinnalla ja K on radiusvektorin suuntainen (tai vastakkaissuuntainen), ts. voidaan kirjoittaa K = K(r)er , missä er on radiusvektorin suuntainen yksikkövektori. Vektori er on tietystikin myös yksikkönormaali ko. pallon pinnalla, joten Z sillä vaipan yhtälö on f = x 2 + y 2 = a2 , r-säteinen pallo K · dA = = ja niin ollen vektori = ∇f = 2xi + 2yj Z Toisaalta Gaussin lauseen mukaan on Z Z ∇ · K dV = K · dA, r · n dA = 0. (iii) Vaipalla yksikkönormaali on −4πG = = V r · n = r · k = z = h, Z Z 2 b) Lasketaan vuo pintaintegraalina. (i) Yläpinnalla n = k ja joten Jos tilavuudessa V oleva kokonaismassa on M , niin Z K(r)er · er dA Z K(r) dA = K(r) · 4πr2 −4πGM. Saamme siis tutun Newtonin gravitaatiolain on kohtisuorassa vaippaa vastaan. Nyt K(r) = − x2 + y 2 a2 r·n= = = a, a a joten GM , r2 tai vektoriaalisesti Z vaippa r · n dA = a Z dA = a · 2πah. K(r) = − GM er . r2 Laskemalla kaikki vuot yhteen saadaan I = 3πa2 h. Esim. Newtonin gravitaatiopotentiaali φ toteuttaa yhtälön ∇2 φ = 4πGρ, 8.5 Stokesin lause Roottorin fysikaalista tulkintaa etsiessämme saimme tuloksen (7.18), jonka mukaan xy-tasossa pisteen (x, y) ympäri kiertyvä virtaus oli missä G on gravitaatiovakio ja ρ massatiheys. Määritetään gravitaatiokenttävoimakkuus pallosymmetrisessä tapauksessa Merkitään K = −∇φ, dSz = = 69 µx (x, y − dy/2, z)dx + µy (x + dx/2, y, z)dy −µx (x, y + dy/2, z)dx − µy (x − dx/2, y, z)dy ∂µy ∂µx dx dy. − ∂x ∂y Summassa (8.16) yhteisiin reunoihin liittyvät termit kumoutuvat, joten jäljelle jäävät vain alueen A reunoihin rajoittuvien pinta-alkioiden ulkoreunat eli X X (∇ × F) · dAi = F · dr. d x y 3 4 2 d y d A i 1 x Kuva 8.16 xy-tason pinta-alkio Kuvan mukaisesti voimme kirjoittaa tämän muotoon 4 X i=1 µ · dri = (∇ × µ)z dx dy, missä vektoriaaliset differentiaalit ovat dr1 = dx i, dr2 = dy j, dr3 = −dx i sekä dr4 = −dy j ja virtatiheys on laskettava aina vastaavalla infinitesimaalisen suorakaiteen sivulla. Yhtälön oikeakin puoli on lausuttavissa kompaktimmin, kun otamme käyttöön vektoriaalisen pinta-alkion dA = dx dy k. Näin päädymme relaatioon 4 X i=1 µ · dr = (∇ × µ) · dA, missä nyt sekä dr että µ on laskettava summausindeksiin liittyvällä suorakaiteen sivulla. Tämä yhtälö on toki voimassa mielivaltaisellekin (differentioituvalle) vektorikentälle F ja miten tahansa orientoituneelle pintaelementille dA: 4 X i=1 F · dr = (∇ × F) · dA, (8.15) missä vasemmalla puolen kierretään dA vastapäivään. Tarkastellaan nyt mielivaltaista pintaa A. Jaetaan A infinitesimaalisiin palasiin dAi . Kussakin pinta-alkiossa on voimassa 4 X F · dr, (∇ × F) · dAi = A:n ulkoreuna Yhtälön vasen puoli on suureen ∇ × F pintaintegraali yli pinnan A ja oikea puoli viivaintegraali pintaa A rajoittavan reunakäyrän C ympäri. Koska jokainen pinta-elementti yhtälön (8.15) ja kuvan 8.16 mukaisesti kierrettiin positiiviiseen kiertosuuntaan, samaan suuntaan kierretään myös pinta A. Olemme näin päätyneet Stokesin lauseena tunnettuun pinta- ja viivaintegraaleja sitovaan relaatioon I Z F · dr = (∇ × F) · dA. (8.17) C A Sanallisesti Stokesin lause on ilmaistavissa muodossa Vektorikentän F viivaintegraali pinnan A reunakäyrän C ympäri on sama kuin kentän F roottorin normaalikomponentin pintaintegraali pinnan A yli. Huom. Integraalin arvo ei muutu sellaisissa integrointipinnan deformaatioissa, joissa reunakäyrä säilyy muuttumattomana. R Esim. A ∇ × F · dA kun F = −yi + xj + zk ja A on puolipallon x2 + y 2 + z 2 = a2 ; z ≥ 0 pinta 1) Suoraan pintaintegraalina. Katso edellä (pintaintegraalit). 2) Viivaintegraalina Stokesin lausetta soveltaen. Nyt F · dr = = (−yi + xj + zk) · (dx i + dy j + dz k) −y dx + x dy + z dz. Puolipallon pinnan A reunakäyrä C on xy-tason ympyrä x2 + y 2 = a2 ; z = 0. Tällä käyrällä x y z j=1 missä vasemmalla puolen roottori lasketaan alueen dAi keskipisteessä ja oikealla puolen seka F että differentiaalit alueen dAi summausindeksistä j riippuvalla reunalla. Summataan yli kaikkien palasten, jolloin X i (∇ × F) · dAi = 4 XX i j=1 F · dr. = = = a cos θ a sin θ 0, kun θ on vektorin r = (x, y, 0) ja x-akselin välinen kulma. Tällöin dx dy dz (8.16) = −a sin θ dθ = a cos θ dθ = 0, joten käyrällä C Tarkastellaan kahta vierekkäistä pinta-alkiota, sanotaan alkioita 1 ja 2. Näiden yhteisellä reunalla toisen suorakaiteen dr on vastakkainen toisen suorakaiteen vastaavalle differentiaalille kun taas kenttä F on sama. F · dr 70 = = = −y dx + x dy a2 sin2 θ dθ + a2 cos2 θ dθ a2 dθ. Stokesin lauseen mukaan on Z I Z (∇ × F) · dA = F · dr = A C = 2π a2 dθ 0 2πa2 . 3) Pintaintegraali on sama mille tahansa käyrän C rajoittamalle pinnalle. Valitaan xy-tason ympyrä. Koska ∇ × F = 2k, on Z x2 +y 2 ≤a2 (∇ × F) · dA = = Z 2k · k dA x2 +y 2 ≤a2 2 2A = 2πa . Stokesin lauseen perusteella pyörteettömälle kentälle F on voimassa I Z F · dr = (∇ × F) · dA = 0, C A olipa C mikä tahansa suljettu käyrä ja A sen sisäänsä sulkema pinta. Tähän tulokseen päädyimme jo viivaintegraalien yhteydessä konservatiivisia vektorikenttiä tarkastellessamme (ks. kaava (8.4). 71 9. Lineaarikuvaukset, matriisit 9.1 Vektoriavaruudet Aiemmin olemmme puhuneet tason (R2 ) ja kotiavaruuden (R3 ) vektoreista. Nämä (kuten myös pelkkä R) ovat esimerkkejä reaalisista vektoriavaruuksista. Yleisesti vektoriavaruudet ovat joukkoja V joille on määritelty 1. Yhteenlasku: x + y ∈ V , jos x ja y ∈ V . 2. Skalaarilla kertominen: ax ∈ V , jos x ∈ V ja a ∈ R. Vektoriavaruus sisältää yksikäsitteisen nollavektorin: ∈ V siten, että x + = x. Lisäksi jokaisella alkiolla x ∈ V on vastavektori −x ∈ V : x + (−x) = . Erilaiset vektoriavaruudet ovat matematiikassa ja fysiikassa hyvin yleisiä. Rn :n lisäksi usein puhutaan funktionaalisista avaruuksista, esim. asteluvun n polynomit muodostavat n P + 1-ulotteisen n vektoriavaruuden: p(x) = i=0 ai xi (polynomeja voidaan laskea yhteen ja kertoa skalaarilla, ja tuloksena on edellen polynomi). Vektoriavaruuden V aliavaruus S on sellainen V :n alijoukko S, että: jos x, y ∈ S ja a ∈ R, niin x + y ∈ S ja ax ∈ S Esim. R3 :n aliavaruuksia ovat esim. kaikki origon kautta kulkevat suorat ja tasot. Myös {} ja R3 ovat R3 :n aliavaruuksia. Sen sijaan esim. R3 :n yksikkövektorien joukko (|x| = 1) ei ole aliavaruus. Vektoriavaruuksissa Rn on määritelty muitakin laskusääntöjä, esim. vektorien pistetulo x · y. Oletetaan jatkossa että pistetulo on määritelty. Lineaarinen riippumattomuus Muistetaan, että vektorit v1 . . . vk ovat lineaarisesti riippumattomia (eli vapaita), jos k X Huom: ylläolevan kaltainen lineaarikombinaatio vektoreista on niin yleinen, että siitä usein käytetään oikeanpuoleista merkintätapaa: toistuvan indeksin yli summataan automaattisesti (implisiittisesti). Einsteinin summaussääntö. Sanotaan että vektorit ei muodostavat V :n kannan, ja ai :t ovat v:n komponentit tässä kannassa. Kanta ei ole yksikäsitteinen. Yksinkertaisin kanta on ortonormaali kanta: ei · ej = δij = 1, 0, jos i = j jos i = 6 j Tässä δij on nimeltään Kroneckerin delta. Siis ortonormaalit vektorit ovat kohtisuorassa toisiaan vastaan ja niiden pituus |~ei | = 1. Ortonormaalissa kannassa kahden vektorin a, b pistetulo on n n n X X X a i bj bj e j = ai e i · a·b= i=1 j=1 i=1 Tai lyhyemmin: a · b = ai bi . Tutuin esimerkki ortonormaalista kannasta on R3 :n kanta i, j, k. Palaamme myöhemmin siihen miten ei-ortonormaalista kannasta voidaan tehdä ortonormaali. Huom: ortonormitetussa kannassa X X ej · a = ai ej · ei = ai δij = aj i i eli ai = a · ei Kertoimet ai siis ilmaisevat vektorin a projektion ei suuntaan. 9.2 Lineaarikuvaus ai v i = 0 i=1 vain jos kaikki a1 = a2 = . . . = ak = 0. Muussa tapauksessa vektorit ovat lineaarisesti riippuvia, ja ainakin yksi vektori voidaan lausua muiden lineaarikombinaationa. n-ulotteisessa vektoriavaruudessa voidaan valita enintään n:n keskenään lineaarisesti riippumattoman vektorin joukko. Kolmiulotteisessa avaruudessa on enintään 3 vektorin joukko keskenään lineaarisesti riippumaton. Jos vektorit e1 , e2 . . . en ovat lineaarisesti riippumattomia n-ulotteisen vektoriavaruuden V alkioita, sanotaan että ne virittävät V :n: mikä tahansa v ∈ V voidaan esittää niiden lineaarikombinaatioina: n X ai ei ≡ ai ei v= i=1 Olkoon A kuvaus (funktio) vektoriavaruudesta V vektoriavaruuteen U : jos nyt A(x + y) = A(x) + A(y), A(αx) = αA(x) kaikilla x, y ∈ V ja α ∈ R, niin A on lineaarikuvaus. Esim. Kuvaus A : R → R, A(x) = cx, c vakio, on lineaarikuvaus: A(x + y) = c(x + y) = cx + cy = A(x) + A(y) A(αx) = cαx = αA(x) Esim. Kuvaus B : R → R, B(x) = cx + d, d 6= 0, ei ole lineaarinen (HT). Lineaarikuvaukset ovat hyvin rajoitettu funktiojoukko, ja pelkästään R:n kuvauksina ne ole kovinkaan mielenkiintoisia (tavallisin sovellus: yleisen funktion f (x) approksimaatio lineaarisesti). Useampiulotteisissa avaruuksissa sen sijaan niillä on paljon käyttöä! 72 9.2.1 Tason kuvaus itselleen Tarkastellaan tason vektorien lineaarikuvausta A, joka muuttaa tason vektorin v = (x, y) toiseksi tason vektoriksi v′ = (x′ , y ′ ): A(v) = v′ , tai ′ x = a11 x + a12 y y ′ = a21 x + a22 y Tässä aij ovat lukuja, jotka määrittelevät A:n. Kyseessä on todellakin lineaarikuvaus (HT): A(v1 + v2 ) = A(v1 ) + A(v2 ) A(αv) = αA(v) On kätevää ottaa käyttöön pystyvektorit ja matriisit: Merkitään nyt ′ x x v= v′ = y′ y ja A= a11 a21 a12 a22 a12 · x y = 0 0 ··· 1 eli Iij = δij . Se kuvaa vektorin itselleen: Ix = x nollamatriisi: 0 ··· 0 0 ··· 0 0= . .. 0 ··· 0 mikä kuvaa kaikki vektorit nollavektoreiksi: 0x = . Tässä notaatiossa merkitään ′ a11 a12 x x a11 x + a12 y = = a21 a22 y′ y a21 x + a22 y Siis esimerkiksi ′ a11 x = ·′ · Tässä siis A:n on oltava m vaakariviä ja n pystyriviä, jotta lasku yllä voidaan tehdä! A on siis m × n -matriisi. Jos m = n, on A neliömatriisi Erikoisasemassa ovat yksikkömatriisi (neliömatriisi) 1 0 ··· 0 0 1 ··· 0 I= . .. a11 x + a12 y · Siis: tulosvektorin rivi k lasketaan siten, että kerrotaan matriisin rivin k alkiot elementti elementiltä alkuperäisen vektorin elementeillä, ja lasketaan yhteen. Vielä systemaattisemmin: merkitään ′ v1 v1 v= v′ = v2 v2′ Rotaatio tasossa Tärkeä tason lineaarikuvaus on rotaatio: vektorien kierto kulman θ verran origon suhteen positiiviseen suuntaan. Matriiseina ′ cos θx − sin θy x cos θ − sin θ x = = sin θx + cos θy y sin θ cos θ y′ eli x′ = R(θ)x. Rotaatio kääntää vektoria muuttamatta sen pituutta: |x′ | = |x|, kuten helposti nähdään. Vektorien väliset kulmat säilyvät rotaatioissa (pituuden lisäksi): jos x ja y ovat kaksi vektoria, niin (R(θ)x) · (R(θ)y) = x · y kuten suoraviivaisesti nähdään laskemalla. Standardikannan kuvautuminen Nyt v1′ v2′ = a11 a21 a12 a22 v1 v2 tai lyhyesti ja ytimekkäästi X vi′ = aij vj = aij vj Rn :n standardikanta e1 . . . en on sellainen jossa 0 .. . k:s rivi ek = 1 . . . 0 j Yleinen lineaarikuvaus Rn → Rm Kuvaus A : Rn → Rm voidaan myös esittää matriisimuodossa: jos y ∈ Rm ja x ∈ Rn , niin y = Ax ⇔ yi = eli eksplisiittisesti a11 y1 y2 a21 .. = .. . . am1 ym n X j=1 eli (ek )i = δki (vektorin ek elementti i). Se kuvautuu lineaarikuvauksessa A seuraavasti: X X (Aek )i = aij (ek )j = aij δkj = aik aij xj , 1 ≤ j ≤ m j a12 a22 ··· ··· a1n a2n .. . am2 ··· amn x1 x2 .. . xn eli j Aek = 73 a1k a2k .. . ank Tuloksena on siis A:n pystyrivin k alkioista muodostuva vektori. Kääntäen, jos tunnemme kuinka standardikanta kuvautuu lineaarikuvauksessa A, saamme A:n matriisiesityksen. Siis jos tiedämme, että Aek = fk , täytyy olla (f1 )1 (f1 )2 A= .. . (f1 )n (f2 )1 (f2 )2 ··· ··· (fn )1 (fn )2 .. . (f2 )n ··· (fn )n = (f1 , f2 , · · · , fn ) Eli: tulomatriisin elementti ij, (AB)ij , saadaan kertomalla A:n i:s vaakarivi ja B:n j:s pystyrivi alkio alkiolta keskenään ja laskemalla yhteen. Tämä on helppo näyttää tutkimalla mielivaltaisen vektorin v ∈ Rn kuvausta: (ABv)i = (A(Bv))i = Aij (Bv)j = Aij Bjk vk ja toisaalta (ABv)i = (AB)ik vk . Huom: matriiseille ei yleensä päde AB = BA! Sanotaan että matriisitulo ei kommutoi. Huom: Jos B on m × 1-matriisi, matriisitulo AB palautuu matriisin ja vektorin tuloksi. Siis vektori = matriisi, jossa on vain yksi pystyrivi. Esim. Olkoon lineaarikuvaukset A : R3 → R2 ja B : R2 → R3 , ja niiden matriisiesitykset 1 1 0 1 0 A= , B= 0 2 1 0 1 1 0 missä viimeinen merkintätapa tarkoittaa että kyseessä on vektoreista fi koottu matriisi. Esim. Etsi R3 :n lineaarikuvauksen matriisi, joka vie standardikannan i, j, k vektoreiksi 0 1 1 Ai = 1 ≡ f1 , Aj = 0 ≡ f2 , Ak = 0 ≡ f3 Nyt 1 1 0 Edellisen mukaan siis on oltava 1 1 0 A = 1 0 0 = (f1 , f2 , f3 ) 0 1 1 9.3 Kuvausten yhdistäminen: matriisien kertolasku Kuten yhdistetyissä funktioissa yleensä, matriiseilla voidaan myös tehdä yhdistetty kuvaus: olkoon lineaarikuvaukset A : Rs → Rm ja B : Rn → Rs Nyt yhdistetty kuvaus AB : Rn → Rm on lineaarikuvaus. Kuvauksen AB matriisi on A:n m × s -matriisin ja B:n s × n-matriisin matriisitulo. Sen saamme (AB)ij = s X Aik Bkj = Aik Bkj k=1 Huom: B:ssä on oltava sama määrä vaakarivejä kuin A:ssa on pystyrivejä (s), muuten matriisituloa ei ole määritelty! Siis · · · · (AB)ij · = · · · · B1j · · · · · · B2j · Ai1 Ai2 · · · Ais .. · . · · · · · · Bsj · AB = = = 0 1 1 0 0 1 1 1 0 2 1 0 0·1+1·0+0·1 1·1+0·0+1·1 0 2 2 1 0·1+1·2+0·0 1·1+0·2+1·0 on kuvaus R2 → R2 ja 1 1 BA = 2 0 0 1 1 2 0 on kuvaus R3 → R3 . Sen sijaan tulot AA tai BB eivät ole määriteltyjä, johtuen siitä että A ja B eivät ole neliömatriiseja. Esim. Rotaatioiden yhdistäminen Rotaatiomatriisi tasossa oli cos θ − sin θ R(θ) = sin θ cos θ Jos teemme peräkkäin kaksi rotaatiota, niin matriisituloa ja sinin ja kosinin laskusääntöjä käyttäen saamme (HT) R(θ2 )R(θ1 ) = R(θ1 + θ2 ) 9.4 Matriisilaskentoa Matriiseille (ja niiden määrittämille lineaarikuvauksille) on määritelty Yhteenlasku: (A + B)ij = Aij + Bij . Tässä A:n ja B:n täytyy olla samankokoisia (m × n) matriiseja. 74 Skalaarilla kertominen: (λA)ij = λAij . Matriisien kertolasku: (AB)ij = Aik Bkj , missä A on n × r ja B on r × m matriisi. Jos m 6= n, tule BA ei ole määritelty. Diagonaalimatriisi: neliömatriisia A sanotaan diagonaaliseksi, jos se on muotoa A= A11 0 .. . 0 A22 ··· ··· 0 0 0 0 ··· Ann Jos kaikki A11 = A22 = . . . = λ, voidaan A kirjoittaa muotoon A = λI missä I on yksikkömatriisi Iij = δij . Jos A on neliömatriisi, niin AI = IA = A. Transpoosi AT Kaikille matriiseille A voidaan määritellä transpoosi AT . Sen elementit ovat T (A )ij = Aji (joskus merkitään AT = Ã). Siis vaakarivit käännetään pystyriveiksi ja päinvastoin. Esim. A= 1 2 4 5 3 6 1 4 ⇒ AT = 2 5 3 6 Jos A on n × m-matriisi, on AT m × n -matriisi. Transpoosille on voimassa seuraava tärkeä tulos: T T (ilman lihavointia x, kompaktiuden vuoksi). Tämä on siis n × 1 -matriisi. Transponoimalla saamme vaakavektorin xT = (x1 x2 · · · xn ) (1 × n -matriisi!) Jos nyt x ja y ovat Rn :n (pysty)vektoreita, niin x1 y T x = (y1 · · · yn ) ... = yi xi = y · x xn y T x antaa siis vektoreiden pistetulon. Jos taas kerrotaan pystyvektorilla vaakavektori, saadaan matriisi: x 1 y1 · · · x 1 yn x1 .. .. xy T = ... (y1 · · · yn ) = . . Todistus: nyt [(AB)T ]ij = (AB)ji = Ajk Bki Toisaalta (B T AT )ij = (B T )ik (AT )kj = Bki Ajk = Ajk Bki . Huom: viimeisessä vaiheessa järjestys voidaan vaihtaa, sillä Ajk , Bki ovat pelkkiä lukuja (matriisin elementtejä), eivät matriiseja! Yleensä matriisien järjestystä ei voida vaihtaa. Olkoon A neliömatriisi. Silloin A on symmetrinen, jos AT = A eli Aij = Aji . (samat elementit symmetrisesti diagonaalin molemmin puolin!) antisymmetrinen, jos AT = −A eli Aij = −Aji . Antisymmetristen matriisien diagonaalielementit häviävät, ts. Aii = −Aii = 0. Useimmat matriisit eivät ole symmetrisiä eivätkä antisymmetrisiä. Ilmeisesti pätee: x n y1 xn ··· x n yn tai (xy T )ij = xi yj . Esim. Tason rotaatioille pätee RT R = I, mikä nähdään suoraan laskemalla. Sen saa myös siitä että rotaatiot säilyttävät pistetulon: y T x = (Ry)T (Rx) = y T RT Rx ⇒ RT R = I T (AB) = B A (AT )T = A, vektorit: Otetaan nyt käyttöön merkintätapa Rn :n pystyvektoreille x1 x2 x= . .. xn Tässä tapauksessa sanotaan että RT on R:n käänteismatriisi. Konjugaatti A∗ Yleistetään lineaarikuvaukset kompleksisiin avaruuksiin, ts. olkoon A : C n → C m . Nyt A:ta voidaan kuvata matriisilla jonka elementit ovat kompleksilukuja. Tälle matriisille ovat voimassa kaikki samat tulokset kuin yllä reaaliselle matriisillekin. Matriisin A konjugaatti A∗ on matriisi jonka kaikki elementit ovat A:n elementtien kompleksikonjugaatteja: (A∗ )ij = A∗ij Jos pätee A∗ = A, matriisi on reaalimatriisi. Hermiittinen konjugaatti A† Hermiittinen konjugointi on transpoosin ja konjugoinnin yhdistelmä: A† = (A∗ )T = (AT )∗ , (A + B)T = AT + B T 75 (A† )ij = (Aji )∗ A on hermiittinen, jos A† = A, ja antihermiittinen, jos A† = −A. Ominaisuuksia: (A† )† = A, (A + B)† = A† + B † , (AB)† = B † A† Esim. Paulin spinmatriisit σ1 = 0 1 1 0 , σ2 = 0 i −i 0 , σ3 = 1 0 0 −1 σ1 ja σ3 ovat symmetrisiä: σ1T = σ1 , σ3T = σ3 . σ2 on antisymmetrinen: σ2T = −σ2 . σ1 ja σ3 ovat reaalimatriiseja: σ1∗ = σ1 Kaikki σi ovat hermiittisiä, esim. σ2† = σ2 . Jos x, y ∈ C n eli ovat n-komponenttisia kompleksivektoreita, niin niiden sisätulo (eli pistetulo) voidaan esittää muodossa x† y = x∗i yi , y † x = yi∗ xi = (x† y)∗ Käänteismatriisi A−1 Olkoot A ja B n × n -neliömatriiseja. Jos pätee AB = BA = I matriisia B kutsutaan A:n käänteismatriisiksi ja merkitään A−1 . Siis A−1 A = AA−1 = I Huom. Kaikille neliömatriiseille ei löydy käänteismatriisia. Jos A−1 on olemassa, sanotaan että A on säännöllinen eli kääntyvä Jos A−1 ei ole olemassa, A on singulaarinen tai ei-säännöllinen. Käänteismatriisi on yksikäsitteinen: jos sekä B että C ovat A:n käänteismatriiseja, niin välttämättä B = C. Todistus: B(AC) = (BA)C ⇒ BI = IC ⇒ B = C. 76 Käänteismatriiseille pätee Esim. Paulin spinmatriisit ovat kaikki unitaarisia: esim. (AB)−1 = B −1 A−1 σ1† σ1 = Todistus: (B −1 A−1 )(AB) = B −1 B = I, ja (AB)(B −1 A−1 ) = A−1 A = I. Siis (AB)−1 = B −1 A−1 . Jos käänteismatriisi on olemassa, niin pätee (AT )−1 = (A−1 )T , −1 T T T −1 T Tod. (A ) A = (AA ) = I = I, eli (A ) on AT :n käänteismatriisi. Ei-singulaarisen matriisin käänteismatriisin löytäminen ei ole aina kovin yksinkertaista. Myöhemmin palataan konsteihin joilla käänteismatriisi voidaan löytää. Suurten matriisien käänteismatriisien löytäminen numeerisesti onkin oma tieteenalansa, ja yksi tärkeimmistä numeeristen algoritmien luokasta. Esim. Matriisi 1 1 A= 0 1 on säännöllinen, sen käänteismatriisi on 1 −1 −1 A = 0 1 AA−1 = A−1 A = I (tarkista!) Matriisi 1 B= 1 0 1 1 0 = 1 0 0 1 9.5 Matriisin jälki Tr A ja determinantti det A Neliömatriisien jälki (engl. trace) ja sen determinantti ovat tärkeimpiä matriiseja karakterisoivia lukuja. Ne ovat määriteltyjä ainoastaan neliömatriiseille. 9.5.1 Jälki Tr A Neliömatriisin jälki on sen diagonaalielementtien summa: X Tr A = A11 + A22 + . . . + Ann = Aii i Jos A on n × m matriisi ja B on n × m-matriisi, niin AB on n × n ja Tr (AB) = n X (AB)ii = i=1 m n X X Aij Bji n m X X Bji Aij i=1 j=1 BA on taas m × m ja Tr (BA) = 1 1 0 1 1 0 Samoin σ2† σ2 = I, σ3† σ3 = I. σ1 ja σ3 ovat myös ortogonaalisia, mutta σ2 ei ole. (A† )−1 = (A−1 )† . −1 T m X j=1 (BA)jj = j=1 i=1 (Tai lyhyesti Tr (AB) = (AB)ii = Aij Bji jne.) Siis pätee on puolestaan singulaarinen: jos C on mielivaltainen Tr (AB) = Tr (BA) 2 × 2-matriisi, mikä yleistyy muotoon c11 c12 c11 + c21 c12 + c22 1 1 = BC = c21 c22 c11 + c21 c12 + c22 1 1 Tr (A1 A2 . . . Ak ) = Tr (Ak A1 . . . Ak−1 ) mikä selvästikään ei voi olla yksikkömatriisi millään cij :n eli matriiseja voi permutoida syklisesti ilman että jälki arvoilla. muuttuu. Neliömatriisi on ortogonaalinen, jos Esim. Tr (ABC) = Tr (CAB) = Tr (BAC). T −1 Heti nähdään että myös A =A . Tr (A + B) = Tr A + Tr B ja unitaarinen, jos † −1 A =A Ortogonaaliset matriisit säilyttävät reaalivektorien pistetulon: (Ay)T (Ax) = y T AT Ax = y T A−1 Ax = y T x ja unitaariset matriisit kompleksivektorien: (Ay)† (Ax) = y † A† Ax = y † x Huom: jos A on reaalimatriisi, AT = A† . 9.5.2 Determinantti det A Tarkastellaan tason lineaarikuvausta y1 1 1 x1 y = Ax ⇔ = y2 x2 −1 2 Tämä kuvaa tason neliöt suunnikkaiksi (yleinen lineaarikuvausten ominaisuus!). Esim. yksikköneliö kuvautuu seuraavasti: 77 (0, 0) → (0, 0) (1, 0) → (1, −1) (0, 1) → (1, 2) (1, 1) → (2, 1) Nämä pisteet muodostavat todellakin suunnikkaan (piirrä!). Yksikköneliön pinta-ala on 1, ja suunnikkaan pinta-ala saadaan esim. ristitulosta Determinantin määritelmästä voidaan suoraviivaisesti nähdä det(. . . , Ai , . . . , Aj , . . .) = − det(. . . , Aj , . . . , Ai , . . .) eli determinantti vaihtaa etumerkkiä jos kaksi pystyriviä (tai vaakariviä) vaihdetaan keskenään. det(A1 , . . . , λAi , . . .) = λ det(A1 , . . . , Ai , . . .) i |(1, −1) × (1, 2)| = 1 1 j k −1 0 = |1 × 2 + 1 × 1| = 3 2 0 Huomataan myös että det A = 2 + 1 = 3. Tämä tulos pätee täysin yleisesti: mielivaltainen 2 × 2 matriisi A kuvaa pinta-alan a pinta-alaksi a det(A). Tämä yleistyy: n × n-matriisi A kuvaa n-ulotteisen tilavuuselementin detA-kertaiseksi, missä detA on matriisin determinantti. Vertaa Jacobin determinanttiin! Se pohjautuu juuri tähän tulokseen. Katsotaan nyt kuinka determinantti lasketaan. 2 × 2 ja 3 × 3-matriisien determinantti tuli jo tutuksi vektorien kolmitulon yhteydessä. Yleisesti n × n-matriisin A determinantti on det A = n X ijk...=1 ǫijk... A1i A2j A3k . . . missä λ on reaali- tai kompleksiluku. Tästä seuraa det(λA) = λn det A jos A on n × n matriisi. Determinantin kehittäminen vaakarivin suhteen: Determinantti voidaan kehittää mielivaltaisen vaakarivin i suhteen seuraavasti: det A = n X Aij cofAij j=1 missä kofaktori on cofAij = (−1)i+j Dij (9.1) ja missä Dij on sen (n − 1) × (n − 1) matriisin determinantti mikä saadaan poistamalla matriisista A vaakarivi i ja pystyrivi j. Tätä sääntöä käytettiin aiemmin 3 × 3 matriisien determinantteihin. Tämä pätee myös mielivaltaisille pystyriville j: missä indeksejä ijk . . . on n kappaletta. Tässä ǫijk... on n Levi-Civita symboli: X Aij cofAij det A = kun ijk . . . on 123 . . . parillinen permutaatio +1, i=1 −1, kun ijk . . . on 123 . . . pariton permutaatio ǫijk... = Determinantille pätee: 0, kun mikä tahansa indeksi toistuu det A = 0, jos A:ssa on kaksi samaa vaaka- tai pystyriviä Siis: valitaan matriisin jokaiselta vaakariviltä yksi alkio det A ei muutu, jos sen johonkin vaaka/pystyriviin siten, että ne ovat aina eri pystyriveiltä ja kerrotaan lisätään tai siitä vähennetään muiden vaaka/pystyrivien keskenään. Jos rivit ovat 123. . . :n pariton permutaatio mielivaltainen lineaarikombinaatio kerrotaan -1:llä. Käydään läpi kaikki permutaatiot ja Näitä sääntöjä voidaan käyttää determinanttien summataan yhteen. “sieventämiseen” ja oikomaan niiden laskemista. Esim. 2 × 2-matriisin determinanttiNyt ǫ12 = −ǫ21 = 1, Esim. Lasketaan ǫ11 = ǫ22 = 0. 1 0 3 1 1 2 3 1 a11 a12 det A = det 0 1 1 1 a21 a22 −1 1 1 0 2 X ǫij a1i a2j = lisäämällä ja vähentämällä lineaarikombinaatioita niin ij=1 että 1. vaakarivi tulee nollaksi, paitsi 1. elementti. = ǫ11 a11 a21 + ǫ12 a11 a22 + ǫ21 a12 a21 + ǫ22 a12 a22 Vähennetään 3×(pystyrivi 1) pystyrivistä 3, vähennetään = a11 a22 − a12 a21 pystyrivi 1 pystyrivistä 4, ja kehitetään 1. vaakarivin suhteen: mikä on sama tulos kuin aiemmin. Samoin 3 × 3 1 0 0 0 -matriisin determinantti palautuu vanhaan tulokseen. 2 0 0 1 2 0 0 Kirjoitetaan mukavuuden vuoksi matriisi A pystyriviensä = (−1)1+1 1 × 1 1 1 = Ai avulla: 0 1 1 1 1 4 1 −1 1 4 1 A = (A1 , A2 , . . . , An ) 78 vaivattomin tapa laskea sitä (suurille matriiseille), vaan käytetään esim. Gaussin eliminointimenetelmää (myöhemmin). Esim. 2 × 2 matriisin käänteismatriisi: Olkoon a b , det A 6= 0 A= c d Kehitetään jälleen 1. rivin suhteen: 1+1 1 1 = 2(1 − 4) = −6 = (−1) 2 4 1 HUOM: kuten yllä, determinanttia merkitään usein samalla merkinnällä kuin itseisarvoa: |A| = det A. Tällöin determinantin itseisarvoa merkitään ||A||. Matriisien tulon determinantille pätee tärkeä tulos Nyt Dij on se determinantti mikä saadaan poistamalla A:sta rivi i ja pystyrivi j. 2 × 2 matriiseille tämä on yksinkertaisesti d c D= b a det(AB) = det A det B Tämän näkee suoraviivaisella mutta hieman työläällä pyörittämisellä, ja jätetään todistus tässä väliin. Nyt siis Käänteismatriisi ja determinantti (A−1 )ij = Determinantti ilmoittaa suoraan onko matriisi A säännöllinen, ts. löytyykö A−1 : det A 6= 0 ⇔ A säännöllinen ⇔ A−1 olemassa Käänteismatriisin elementit ovat eli A−1 = cof Aji (−1)i+j Dji = det A det A (A−1 )ij = X Aik cof Aik ja Ajk cof Aik = δji det A (A−1 )ij = k sillä jos j 6= i, niin kaavan vasen puoli vastaa sellaisen matriisin determinanttia mikä saadaan A:sta korvaamalla rivi i rivillä j. Koska nyt matriisissa on kaksi samaa vaakariviä, sen determinantti = 0. k eli Ajk −b a = 1 ad − bc 1 2 2 3 d −c −b a 1 (−1)i+j Dji = det A eli A−1 = Jakamalla det A:lla saadaan X d −c Nyt det A = −1 6= 0, siis A−1 on olemassa. Nyt 3 2 D= 2 1 k Nyt huomataan että A= Näytetään tämä: muistetaan että det A = 1 det A Esim. missä kofaktorit määriteltiin kaavassa (9.1). Huomaa että kofaktorin indeksit tulevat “väärässä” järjestyksessä. X (−1)i+j Dji det A X cof Aik Ajk Bki = δji = det A −3 2 2 −1 9.6 Lineaariset yhtälöryhmät Monissa yhteyksissä tapaamme lineaarisen yhtälöryhmän, esim. k AB = I A11 x1 + A12 x2 A21 x1 + A22 x2 missä Bki = cof Aik / det A. Tämä näytti että jos det A on olemassa, käänteismatriisin lauseke saadaan sen ja kofaktorin avulla. Näytetään vielä että jos matriisi A on säännöllinen (siis A−1 on olemassa), siitä seuraa että det A 6= 0: det I = 1 = det(A−1 A) = det A det A−1 ⇒ det A 6= 0. Lisäksi nähdään det A−1 = 1/ det A HUOM: yllä esitetty tapa antaa käänteismatriisin suljetussa muodossa. Se ei kuitenkaan ole tavallisesti = = b1 b2 eli lyhyesti Ax = b Tässä siis A on joku tunnettu kerroinmatriisi, b annettu vektori ja halutaan ratkaista x. Kukin kahdesta yo. yhtälöstä määrää suoran (x1 , x2 )-koordinaateissa. Kahden yhtälön yhtälöryhmällä siis pyritään määräämään suorien leikkauspiste. Milloin yo. yhtälöryhmällä on ratkaisu? Jos nyt det A 6= 0, käänteismatriisi A−1 on olemassa ja A−1 Ax = x = A−1 b 79 on yhtälön ainoa ratkaisu. Entä jos det A = A11 A22 − A12 A21 = 0? Tällöin ei yleensä ratkaisua ole, ellei sitten käy niin että yllä molemmat yhtälöistä ovat vakiokerrointa vaille samat. Nimittäin tällöin A:n ensimmäinen ja toinen rivi ovat kerrointa vaille samat, ja det A = 0. Tässä tapauksessa yhtälöt määräävät saman suoran, ja ratkaisuja on äärettömästi: x2 = 1 (b1 − A11 x1 ) A12 Siis: a) jos det A 6= 0, suorat eivät ole yhdensuuntaisia ja ∃ ratkaisu x = A−1 b. b) jos det A = 0, suorat ovat yhdensuuntaiset. Nyt riippuu vektorista b kuvaavatko yhtälöt kahta yhdensuuntaista suoraa (ei ratkaisua) vai samaa suoraa (äärettömästi ratkaisuja). Tämä kaikki yleistyy luonnollisesti n × n-matriiseihin. Siis, jos det A 6= 0, yhtälöryhmällä Ax = b on yksikäsitteinen ratkaisu x = A−1 b. Erityisesti yhtälöllä Ax = 0 on vain ratkaisu x = 0, jos det A 6= 0. Kirjoittamalla tämä muotoon X X Aij xj = 0 ⇒ Âj xj = 0 j j vain jos xj = 0, ja missä Âi on A:n pystyrivistä i koostuva pystyvektori, niin nähdään seuraava tulos: det A 6= 0 ⇔ A:n pystyvektorit lineaarisesti riippumattomia. Sama pätee myös vaakavektoreille. 9.6.1 Yhtälöryhmän ratkaisu eliminointimenetelmällä Olkoon meillä yhtälö (det A 6= 0) ×1/2 5 2 1 −5 1 −2 1 1/2 5/2 väh. rivi 1 1 −2 −5 1 1/2 5/2 0 −5/2 −15/2 × − 2/5 1 1/2 5/2 väh. rivi 2 ×1/2 0 1 3 1 0 1 0 1 3 Yhtälön ratkaisu on siis x = (1 3)T , mikä voidaan heti tarkistaa. Päämäärä on siis lisätä ja vähentää rivejä sopivasti kerrottuina niin että vasemmalle saadaan yksikkömatriisi. Esim. 1 1 1 −1 1 x 0 1 −1 y = 1 2 −3 z −1 Eliminoidaan 1 −1 1 0 1 1 −1 1 1 2 −3 −1 1 −1 1 0 0 2 −2 1 0 3 −4 −1 1/2 1 0 0 0 1 −1 1/2 −5/2 0 0 −1 1 0 0 1/2 0 1 0 3 0 0 1 5/2 Siis ratkaisu on Tässä tapauksessa käänteismatriisia ei useimmiten kannata laskea, vaan ratkaista yhtälöryhmä eliminointimenetelmällä: 1/2 x= 3 5/2 9.6.2 Matriisin kääntäminen Gaussin eliminointimenetelmällä Eliminointimenetelmällä voidaan (lähes) samalla vaivalla ratkaista usea muotoa Ax = bi , Esim. 2 1 1 −2 x y = 2x + y x − 2y −rv.3 ×−1 Huom: jos matriisin det = 0, eliminointimenetelmä kertoo sen: ei voida konstruoida I-matriisia. Ax = b ⇒ x = A−1 b −rv.1 −rv.1 +(1/2)rv.2 ×1/2 −(3/2)rv.2 = 5 −5 Nyt det A = −5 6= 0, joten yhtälö kääntyy. Pyrkimyksenä on eliminoida jälkimmäisestä yhtälöstä x lisäämällä ensimmäinen yhtälö sopivasti kerrottuna. Lisäksi ensimmäisestä eliminoidaan y. Tämä voidaa systematisoida seuraavasti: i = 1...n oleva yhtälö: kirjoitetaan vain rinnan (A)(b1 )(b2 ) . . . ja eliminoidaan rivejä niin että A:n tilalle tulee yksikkömatriisi, ja tehdään sama eliminointi kaikille bi . Lopputuloksena voimme lukea bi :n paikalta yhtälöryhmän Ax = bi ratkaisun. 80 Tämä toimii myös jos bi = êi , standardikannan vektori. Nyt lopputuloksena saadaan A:n käänteismatriisi. Esim. Edellisen esimerkin matriisin 1 −1 1 1 1 −1 1 2 −3 käänteismatriisi: 1 −1 1 1 0 0 1 1 −1 0 1 0 −rv.1 1 2 −3 0 0 1 −rv.1 1 −1 1 1 0 0 +(1/2)rv.2 0 2 −2 −1 1 0 ×1/2 0 3 −4 −1 0 1 −(3/2)rv.2 1 0 0 1/2 1/2 0 0 1 −1 −1/2 1/2 0 −rv.3 ×−1 1/2 −3/2 1 0 0 −1 1 0 0 1/2 1/2 0 0 1 0 −1 2 −1 0 0 1 −1/2 3/2 −1 Siis käänteismatriisi on 1/2 1/2 0 −1 2 −1 −1/2 3/2 −1 mikä nähdään kokeilemalla. HUOM: joskus diagonaalille uhkaa tulla 0. Tämä ei ole ongelma, sillä tähän riviin voidaan lisätä/vähentää sopivasti joku alla olevista riveistä niin että diagonaalille tulee 1. Jos tämä ei millään onnistu, on det = 0. Usein eliminointi on helpompaa tehdä niin että ei tule murtolukuja. Esim. Matriisin 2 3 5 A= 1 2 4 3 1 0 käänteismatriisi. 1 0 0 2 3 5 1 2 4 0 1 0 ×2 − (rv.1) −3 × (rv.2) 0 0 1 3 1 0 2 3 5 1 0 0 −3 × (rv.2) 0 1 3 −1 2 0 0 −3 1 +5 × (rv.2) 0 −5 −12 2 0 −4 4 −6 0 ×3 + 4 × (rv.3) 0 1 3 −1 2 0 −(rv.3) 0 0 3 −5 7 1 6 0 0 −8 10 4 ×1/6 0 1 0 4 −5 −1 0 0 3 −5 7 1 ×1/3 1 0 0 −4/3 5/3 2/3 0 1 0 4 −5 −1 0 0 1 −5/3 7/3 1/3 Käänteismatriisi on siis −4 1 A−1 = 12 3 −5 5 −15 7 2 −3 1 9.7 Ominaisarvot ja -vektorit Jos A on n × n-matriisi, ja jos löytyy vektori x 6= 0 siten että Ax = λx missä λ on skalaari (yleisesti kompleksiluku), sanotaan että x on A:n ominaisvektori ja λ on vektoriin x liittyvä ominaisarvo Ominaisvektorit siis säilyttävät suuntansa lineaarikuvauksissa. Ne ovat aina erityisasemassa, ja vastaavat kuvausten “pääakseleita”. Ominaisarvoille pätee: A on säännöllinen ↔ A:n kaikki ominaisarvot 6= 0. Tod. Jos λ = 0, niin vastaava ominaisvektori Ax = 0. Koska x 6= 0, tämä toteutuu jos ja vain jos det A = 0, siis A ei ole säännöllinen. Ominaisvektorit eivät ole yksikäsitteisiä: ne voidaa kertoa vakiolla ja ne ovat edelleen ominaisvektoreita. Samalla ominaisarvolla voi myös olla useita lineaarisesti riippumattomia ominaisvektoreita. Esim. Yksikkömatriisi I toteuttaa Ix = x kaikilla x. Siis kaikki vektorit ovat sen ominaisvektoreita ominaisarvolla 1. Pätee: A:n ominaisarvot ovat yhtälön det(A − λI) = 0 juuret. Tod. Jos λ on ominaisarvo, on Ax = λx = λIx ⇒ (A − λI)x = 0. Tällä on ratkaisu kun x 6= 0 vain jos det(A − λI) = 0. Jos A on n × n-matriisi, det(A − λI) on n:n asteen polynomi λ:n suhteen: A11 − λ A12 ··· A1n A21 A − λ · · · A 22 2n det(A−λI) = ≡ Pn (λ) .. . An1 ··· Ann − λ (9.2) Yhtälö Pn (λ) = 0 on A:n karakteristinen yhtälö, ja sen ratkaisut ovat A:n ominaisarvot. Näiden avulla Pn voidaan kirjoittaa muotoon Pn (λ) = (−1)n (λ − λ1 )(λ − λ2 ) . . . ≡ (−1)n 81 n Y i=1 (λ − λi ) (9.3) (nähdään kaavasta (9.2) että λn :n kerroin on (−1)n ). Tästä seuraa että Pn (0) = n Y = −(2 − λ)(1 + λ)(1 − λ) + 4(1 − λ) + 6 − 3(1 − λ) = −λ3 + 2λ2 − 6λ + 5 = (1 − λ)(λ2 − λ + 5) = 0 Ominaisarvot ovat siis λi = det A λ1 = 1, i=1 λ2,3 = √ 1 1 1√ 1 − 20 = (1 ± i 19) ± 2 2 2 Kertalukuun λn−1 on otettava (9.2) diagonaalilta kaikki λ:t paitsi vuorollaan yksi Aii . Samoin karakteristisen polynomin ekspansiosta (9.3): X X termi λn−1 : Aii (−λ)n−1 = (−λ)n−1 λi Ominaisarvoa λ vastaava ominaisvektori saadaan yhtälöstä Av = λv Siis saamme tulokset: niin sen ominaisarvot ovat 1−λ det(A − λI) = 2 i det A = λ1 λ2 . . . = n Y λi λ1 + λ2 + . . . = n X Esim. Matriisin A= 2 1 0 1 ominaisarvot: 2−λ det(A − λI) = 0 1 = (2 − λ)(1 − λ) = 0 1−λ minkä ratkaisut ovat λ = 2 ja λ = 1. Tässä tapauksessa karakteristinen yhtälö oli yksinkertainen. Esim. Yleinen 2 × 2-matriisi a b , A= c d Karakteristinen yhtälö on a−λ b det(A − λI) = c d−λ 1 = λ2 − λ + 2 = 0 −λ 2. ominaisvektori: x2 x2 1 1 = −1 y2 2 0 y2 x2 + y2 = −x2 ⇒ ⇒ y2 = −2x2 2x2 = −y2 = λ2 − (a + d)λ + (ad − bc) Siis ominaisarvoa λ2 = −1 vastaava ominaisvektori v2 = vakio Huom: tämä pätee vain 2 × 2-matriiseille. −2 3 −1 0 1 1 2−λ −2 3 −1 − λ 0 ominaisarvot: det(A − λI) = 2 −1 1 1 − λ −1 − λ 2 0 0 − (−2) + = (2 − λ) 1 1−λ −1 1 − λ 2 −1 − λ 3 −1 1 1 −2 Ominaisvektorit on usein tapana normittaa: määrätään vakio niin että |v| = 1. Edellä normitetut vektorit ovat siis 1 1 1 1 v2 = √ v1 = √ 1 −2 2 5 Esim. Etsitään matriisin 2 A= 2 −1 1 1 2 0 minkä ratkaisu on x1 = y1 (molemmista sama ehto). Siis ominaisarvoa λ1 = 2 vastaava ominaisvektori 1 v1 = vakio 1 λ2 − Tr Aλ + det A = 0 joten ominaisarvot λ1 = 2, λ2 = −1. 1. Ominaisvektori: 1 1 x1 x1 =2 y1 y1 2 0 x1 + y1 = 2x1 ⇒ 2x1 = 2y1 λi i=1 = A= i i=1 Tr A = Esim. jos Pystyvektorit ovat ortogonaalisia, jos niiden välinen pistetulo (sisätulo) häviää: x† y = n X x∗i yi = 0 i=1 Olkoon matriisi A hermiittinen, ts. A† = A. Sille pätee 82 Hermiittisen matriisin ominaisarvot ovat reaaliset, ja eri ominaisarvoja vastaavat ominaisvektorit ortogonaaliset Tod. Olkoon Ax = λx. Nyt x† Ax = λx† x ja toisaalta x† Ax = x† A† x = (Ax)† x = (λx)† x = λ∗ x† x Siis λ∗ = λ. Olkoon nyt λ1 , λ2 kaksi erisuurta ominaisarvoa, ja niiden ominaisvektorit x1 , x2 . Nyt x†2 Ax1 = λ1 x†2 x1 . Toisaalta x†2 A† x1 = (Ax2 )† x1 = λ2 x†2 x1 Koska λ2 6= λ1 , tämä voi pitää paikkansa vain jos x†2 x1 = 0. Liite A. Kreikkalaiset kirjaimet Pienet kirjaimet α alfa β beta γ gamma δ delta ǫ epsilon ζ zeta η eta ψ psi Isot kirjaimet Γ Gamma ∆ Delta Θ Theta Ψ Psi 83 θ ι κ λ µ ν ξ ω theta iota kappa lambda my ny xi omega π ρ σ τ υ φ χ Λ Ξ Π Ω Lambda Xi Pi Omega Σ Υ Φ pi ro sigma tau ypsilon fi khi Sigma Ypsilon Fi Liite B. Joukko-oppia Joukko koostuu alkioista (jäsenistä, elementeistä). Kun halutaan ilmoittaa, että joukon A alkiot ovat a1 , a2 , . . . käytetään usein merkintää A = {a1 , a2 , . . .}. Joukko voi olla tyhjä, ts. siinä ei ole yhtään jäsentä. Tyhjästä joukosta käytetään merkintää ∅. Jos joukon A jäsenet toteuttavat jonkun tietyn ehdon, merkitään A = {x|ehto x:lle}. Esimerkiksi I = {x|0 ≤ x ≤ 1} on välillä 0 ja 1 olevien (reaali)lukujen joukko. Merkintä a ∈ A ilmoittaa, että a on joukon A jäsen, a kuuluu joukkoon A. Jos kaikki joukon A alkiot ovat myös joukon B alkioita, merkitään A ⊂ B (B ⊃ A) ja sanotaan, että A kuuluu joukkoon B tai että A on joukon B osajoukko. Joukkojen A ja B yhtäsuuruus tarkoittaa, että molemmissa joukoissa on samat jäsenet, ts. A ⊂ B ja B ⊂ A. Luonnollinen merkintä yhtäsuuruudelle on A = B. Kahden joukon A ja B yhteisistä jäsenistä koostuvaa joukkoa A ∩ B sanotaan leikkaukseksi. Ilmeisestikin on voimassa A ∩ B = B ∩ A, A ∩ B ⊂ A ja A ∩ B ⊂ B. Yhdiste A ∪ B on molempien joukkojen A ja B alkioista koostuva joukko. Se toteuttaa mm. relaatiot A ∪ B = B ∪ A, A ⊂ A ∪ B ja B ⊂ A ∪ B. Liite C. Kvanttorit Matematiikassa käytetään usein ilmauksia on olemassa ja kaikilla. Esimerkkilauseita voisivat olla vaikkapa: on olemassa sellainen reaaliluku x, että x2 = a kun a ≥ 0 tai kaikilla reaaliluvuilla x on voimassa x2 ≥ 0. Päästään hieman vähemmällä kirjoittamisella, kun otetaan käyttöön formaalin logiikan kvanttorit ∃ ja ∀ ilmaisemaan olemassaoloa (eksistenssiä) ja yleispätevyyttä (universaalisuutta). Kvanttoreiden avulla esimerkkilauseet voitaisiin kirjoittaa vaikkapa muotoihin ∃x ∈ R siten, että x2 = a kun a ≥ 0 ja x2 ≥ 0 ∀x ∈ R. Symbolilla R on tässä merkitty reaalilukujen joukkoa. 84 Liite D. Intervalleja, jatkuvuuksia, . . . Reaaliakselin yhtenäisistä osista intervalleista käytetään usein merkintöjä suljettu väli [a, b] tarkoittaa reaaliakselin väliä a ≤ x ≤ b, ts. alku- ja loppupisteet kuuluvat mukaan. avoin väli (a, b) tarkoittaa väliä a < x < b, ts. alku- ja loppupisteet eivät kuulu väliin. puoliavoimet välit (a, b] ja [a, b) tarkoittavat vastaavasti välejä, joissa vain toinen päätepiste kuuluu joukkoon. Funktio f (x) on rajoitettu jos tarkasteltavalla välillä on |f (x)| ≤ M , missä 0 ≤ M < ∞. jatkuva jos se ei ”hyppää”pisteestä toiseen, paloittain jatkuva funktio jos se on jatkuva muualla paitsi mahdollisesti äärellisen monessa tarkasteltavan välin pisteessä. 85
© Copyright 2025