Luentomoniste

Matriisit ja optimointi
kauppatieteilijöille
802160P
Luentomoniste
Kari Myllylä
Niina Korteslahti
Topi Törmä
Oulun yliopisto
Matemaattisten
tieteiden laitos
Kevät 2015
Sisältö
1 Matriisialgebra
1.1 Määritelmä . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Matriisien laskutoimituksia . . . . . . . . . . . . . . . . . . . .
1.2.1 Matriisien yhteen- ja vähennyslasku . . . . . . . . . . .
1.2.2 Skalaarilla kertominen . . . . . . . . . . . . . . . . . .
1.2.3 Matriisien kertolasku: . . . . . . . . . . . . . . . . . . .
1.3 Erikoistyyppisiä matriiseja . . . . . . . . . . . . . . . . . . . .
1.3.1 Diagonaalimatriisi . . . . . . . . . . . . . . . . . . . .
1.3.2 Identtinen matriisi (Yksikkömatriisi) . . . . . . . . . .
1.3.3 Nollamatriisi . . . . . . . . . . . . . . . . . . . . . . .
1.4 Transponoitu matriisi . . . . . . . . . . . . . . . . . . . . . . .
1.5 Matriisin determinantti . . . . . . . . . . . . . . . . . . . . . .
1.5.1 Determinantin määrääminen: . . . . . . . . . . . . . .
1.5.2 Determinantin ominaisuuksia: . . . . . . . . . . . . . .
1.6 Käänteismatriisi . . . . . . . . . . . . . . . . . . . . . . . . . .
1.6.1 Menetelmiä käänteismatriisin ratkaisemiseksi: . . . . .
1.6.2 Käänteismatriisin ominaisuuksia: . . . . . . . . . . . .
1.7 Lineaarisen yhtälöryhmän matriisimuoto ja sen ratkaiseminen
1.8 Lineaarinen riippuvuus ja matriisin aste . . . . . . . . . . . .
1.8.1 Lineaarinen riippuvuus . . . . . . . . . . . . . . . . . .
1.8.2 Matriisin aste . . . . . . . . . . . . . . . . . . . . . . .
1.8.3 Matriisin asteen ominaisuuksia . . . . . . . . . . . . .
1.9 Matriisin ominaisarvot ja ominaisvektorit . . . . . . . . . . . .
1.9.1 Ominaisarvojen määrääminen . . . . . . . . . . . . . .
1.9.2 Ominaisvektoreiden määrittäminen . . . . . . . . . . .
1.10 Panos-tuotos–malli . . . . . . . . . . . . . . . . . . . . . . . .
1.11 Matriisien sovellutus regressioanalyysissä . . . . . . . . . . . .
2 Yhden muuttujan funktion optimointi
2.1 Funktion f (x) tutkiminen derivaatan avulla .
2.1.1 Funktion monotonisuus ja derivaatta .
2.1.2 Funktion kuperuus ja toinen derivaatta
2.2 Funktion f (x) ääriarvo . . . . . . . . . . . . .
2.2.1 Paikallisten ääriarvokohtien löytäminen
2.2.2 Paikallisten ääriarvokohtien laatu . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
3
4
4
4
5
6
6
7
7
8
8
9
10
11
12
13
14
17
17
18
19
20
20
21
22
24
.
.
.
.
.
.
28
28
28
29
30
32
35
1
3 Kahden muuttujan funktion ääriarvoista
3.1 Normaalit ääriarvot (ei sidotut) . . . . . . . . . . . . . . . . .
3.1.1 Kahden muuttujan funktion paikalliset ääriarvokohdat
3.1.2 Kahden muuttujan funktion ääriarvon laatu . . . . . .
3.2 Sidotut ääriarvot . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.1 Sidotut ääriarvot yhtälörajoitteen tapauksessa . . . . .
3.2.2 Sidotut ääriarvot epäyhtälörajoitteen tapauksessa . . .
3.2.3 Absoluuttiset ääriarvot ehtoalueessa . . . . . . . . . . .
3.2.4 Hyötyfunktion maksimi . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
38
38
39
39
40
40
42
43
43
.
.
.
.
.
.
46
46
46
47
48
48
50
5 Lineaarinen optimointi
5.1 Geometrinen ratkaisu . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Kantaratkaisu–menetelmä . . . . . . . . . . . . . . . . . . . . . .
5.3 SIMPLEX–menetelmä . . . . . . . . . . . . . . . . . . . . . . . .
52
52
54
55
.
.
.
.
.
.
.
.
4 Usean muuttujan funktion ääriarvoista
4.1 Normaali ääriarvo (ei sidottu) . . . . . . . . . . . . . . . . . . .
4.1.1 Usean muuttujan funktion ääriarvokohta . . . . . . . . .
4.1.2 Usean muuttujan funktion ääriarvon laatu . . . . . . . .
4.2 Sidotut ääriarvot . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.1 n muuttujan ja m yhtälörajoitteen tapaus, missä m < n
4.2.2 n muuttujan ja yhden epäyhtälörajoitteen tapaus . . . .
2
1
Matriisialgebra
Matriisien avulla voidaan
1.1
käsitellä yhtälöitä tehokkaasti
ratkaista yhtälöryhmiä
ratkaista optimointitehtäviä
regressioanalyysi
laatia erilaisia malleja esim. panos-tuotos–malli
Määritelmä
Matriisi on taulukko


a11 a12 · · · a1n
 a21 a22 · · · a2n 


= Am×n = (aij ) = (aij )m×n ,
A= .
..
.. 
.
.
.
 .
.
.
. 
am1 am2 · · · amn m×n
missä luvut aij ovat reaalilukuja. Lukuja aij sanotaan matriisin A alkioiksi. Alkio
aij on matriisin A i:nnellä vaakarivillä ja j:nnellä pystyrivillä oleva alkio. Matriisi,
jossa on m vaakariviä ja n pystyriviä, on m × n–matriisi; merkitään Am×n . Jos
m = n, niin A on neliömatriisi.
Kaksi matriisia

a11
 ..
A= .
am1



· · · a1n
b11 · · · b1s


.. 
..
ja B =  ... . . . ... 
.
. 
· · · amn m×n
br1 · · · brs r×s
ovat samat eli A = B, jos ja vain jos
(i) m = r ja n = s
(ii) aij = bij ∀ i, j.
Jos matriisissa n =
1u1eli
se on m × 1-matriisi, niin kysymyksessä on m–ulotteinen
.. , missä ui on vektorin ū i. komponentti.
pystyvektori ū =
.
um
Vastaavasti v̄ = (v1 , . . . , vn ) on n-ulotteinen vaakavektori eli 1 × n–matriisi ja vi
on vektorin v̄ i. komponentti.
3
1.2
Matriisien laskutoimituksia
1.2.1 Matriisien yhteen- ja vähennyslasku
Matriisit A ja B voidaan laskea yhteen (vähentää toisistaan) jos ja vain jos ne
ovat molemmat m × n–matriiseja.
Olkoot A ja B m × n–matriiseja, ts.


a11 · · · a1n

.. 
...
A =  ...
. 
am1 · · ·
Tällöin
amn

b11
 ..
B= .
bm1 · · ·
m×n

a11 + b11

..
A+B =
.
···
...
am1 + bm1 · · ·
Vastaavasti

a11 − b11

..
A−B =
.
···
...
···
...
am1 − bm1 · · ·

b1n
.. 
. 
bmn
.
m×n

a1n + b1n

..
.

.
amn + bmn m×n

a1n − b1n

..
.

.
amn − bmn m×n
Matriisien yhteenlasku on
1. vaihdannainen: A + B = B + A
2. liitännäinen: A + (B + C) = (A + B) + C.
Esimerkki 1.1.
2 5 10
0 3 4
20 8 7
−
+
=
9 1 −7
5 12 6
−1 9 −6
1.2.2 Skalaarilla kertominen
Matriisilaskennassa reaalilukua kutsutaan skalaariksi.
Olkoon nyt A = (aij )m×n ja k ∈ R. Tällöin



a11 · · · a1n
ka11 · · ·
 ..


.
.
...
..
.. 
kA = k ·  .
=  ...
am1 · · ·
amn
m×n
kam1 · · ·

ka1n
.. 
. 
kamn
= (kaij )m×n = Ak.
m×n
4
Esimerkki 1.2.
0 2 1
3·
=
−5 3 8
Huomautus. A − B = A + (−B) = A + (−1) · B
1.2.3 Matriisien kertolasku:
Matriisien A = (aij )m×n ja B = (bij )r×s tulo AB on mahdollinen jos ja vain
jos n = r. Siis matriisin A pystyrivien lukumäärä = matriisin B vaakarivien
lukumäärä. Matriisi A on tulon AB edellinen tekijä ja B jälkimmäinen tekijä.
Olkoon A = (aij )m×n ja B = (bij )n×s .
Tällöin Am×n · Bn×s = (AB)m×s = (cij )m×s , missä cij =
n
X
aik bkj eli alkio cij
k=1
saadaan matriisin A i:nnen vaakarivin ja matriisin B j:nnen pystyrivin pistetulona.
Siis

b11 · · · b1s


·  ... . . . ... 
bn1 · · · bns n×s
am1 · · · amn m×n

X
n
n
X
a1k bk1 · · ·
a1k bks 


 k=1
k=1


.
.
.

..
..
..
=
.


X

n
n
X


amk bk1 · · ·
amk bks

···
...
a11
 ..
AB =  .


a1n
.. 
. 
k=1
k=1
m×s
Esimerkki 1.3.
A=

3 5 8
10 4 1
,
2×3

6 9
B = 1 7 
5 11 3×2
4 7 1
ja C =
.
9 2 5 2×3
Laske AB, BA ja AC.
5
Matriisien kertolasku on
1. liitännäinen: A(BC) = (AB)C
2. ei vaihdannainen: siis yleensä AB 6= BA.
Esimerkki 1.4.
 
0
(2, 1, 0) · 1 =
 
0
1 · (2, 1, 0) =
2
2
1 1
0 1
·
=
0 1
1 1
0 1
1 1
·
=
1 1
0 1
Falk-kaavio:
Esimerkki 1.5.
A=
1.3
3 5 8
10 4 1
2×3


6 9
B = 1 7 
5 11 3×2
AB =
Erikoistyyppisiä matriiseja
1.3.1 Diagonaalimatriisi
Olkoon A = (aij )n×n neliömatriisi. Matriisin A päälävistäjän muodostavat alkiot
a11 , a22 , . . . , ann . Matriisi A on diagonaalimatriisi, jos matriisin A muut alkiot
paitsi mahdollisesti päälävistäjän alkiot ovat nollia.
6
Eli

a11 · · ·
 ..
..
A= .
.
an1 · · ·

a1n
.. 
. 
ann
n×n
on diagonaalimatriisi, jos aij = 0, kun i 6= j.
1.3.2 Identtinen matriisi (Yksikkömatriisi)
Identtinen matriisi on diagonaalimatriisi, jonka kaikki päälävistäjän alkiot ovat
ykkösiä.
Siis A = (aij )n×n on identtinen matriisi, jos
(
aij = 0, i 6= j
aii = 1,
i = 1, 2, . . . , n.
Identtistä matriisia merkitään symbolilla In (= In×n ). Siis esimerkiksi
I1 = (1),
I2 =
1 0
,
0 1


1 0 0
I3 = 0 1 0 .
0 0 1
Lause 1.1. Olkoon A m × n–matriisi. Tällöin Am×n In = Im Am×n = Am×n .
1.3.3 Nollamatriisi
Matriisi A = (aij )m×n on nollamatriisi, jos aij = 0 ∀ i, j. Nollamatriisia merkitään Ōm×n .
Siis esimerkiksi
0 0 0
Ō2×3 =
.
0 0 0
Lause 1.2. Olkoon A m × n–matriisi. Tällöin
Am×n + Ōm×n = Ōm×n + Am×n = Am×n
Am×n Ōn×k = Ōm×k
ja
sekä Ōk×m Am×n = Ōk×n .
7
1.4
Transponoitu matriisi
Olkoon A m×n–matriisi. Matriisin A transponoitu matriisi AT on n×m–matriisi,
jonka i. vaakarivi on matriisin A i. pystyrivi (ja j. pystyrivi on matriisin A j.
vaakarivi).
Jos

a11
 a21

A= .
 ..
a12
a22
..
.
···
···
..
.
am1 am2 · · ·

a1n
a2n 

.. 
. 
amn

m×n

a11 a21 · · · am1
 a12 a22 · · · am2 


T
, niin A =  .
.
..
.. 
.
.
.
 .
.
.
. 
a1n a2n · · · amn n×m
Huomautus.

u1
 
(u1 , . . . , un )T =  ... 
 T
v1
 .. 
 .  = (v1 , . . . , vn ).

ja
un
vn
Diagonaalimatriisin D transponoitu matriisi DT on aina alkuperäinen diagonaalimatriisi, eli DT = D.
Esimerkki 1.6.


1 −2 6


 7 4 11
A=

14 5 9 
0 1 2
AT =
Neliömatriisi A = (aij )n×n on symmetrinen, jos aij = aji
∀ i, j. Tällöin A = AT .
Huomautus. Olkoot A = (aij )m×n , B = (bij )m×n ja C = (cij )n×r . Tällöin
(A + B)T = AT + B T
1.5
ja (BC)T = C T B T .
Matriisin determinantti
Determinantti on yksikäsitteinen reaaliluku ja määritellään vain neliömatriiseille.
Matriisin A determinanttia merkitään det A ja |A|.
8
1.5.1 Determinantin määrääminen:
2 × 2–matriisin determinantti
a11 a12
Kun A =
, niin det A = |A| = a11 a22 − a12 a21 .
a21 a22 2×2
1 × 1–matriisin determinantti
Kun A = a11
Esimerkki 1.7.
1×1
, niin det A = |A| = a11 .
−8 1
3 4 =
Determinantin määrittäminen yleisesti:
Jos n > 2, niin matriisin An×n determinantti palautuu 2×2–matriisin tapaukseen
seuraavasti:
Mij on sellainen (n−1)×(n−1)–matriisi, joka saadaan matriisista A poistamalla
siitä i. vaakarivi ja j. pystyrivi. Mij on matriisin A (alkioon aij tai paikkaan ij
liittyvä) alimatriisi.
Determinantti det Mij = |Mij | on matriisin A (alkioon aij tai paikkaan ij liittyvä)
alideterminantti.
Skalaari Aij = (−1)i+j |Mij | on matriisin A (alkioon aij tai paikkaan ij liittyvä)
kofaktori.
Tällöin matriisin A determinantti
det A = |A| =
n
X
aij (−1)(i+j) |Mij | ∀ i ∈ {1, . . . , n}.
j=1
Tällöin det A on kehitetty i. vaakarivin mukaan.
Samoin
det A = |A| =
n
X
aij (−1)(i+j) |Mij | ∀ j ∈ {1, . . . , n},
i=1
9
jolloin det A on kehitetty j. pystyrivin mukaan.
Siis n × n–matriisin determinantti määrätään sen tiettyjen (n − 1) × (n − 1)–
alimatriisien determinanttien avulla.
Toistamalla yo. menettelyä jokaisen n × n–matriisin A determinantti voidaan
palauttaa sen tiettyjen 2 × 2–alimatriisien determinanteiksi.
Esimerkki 1.8. Olkoon

3 0 −2
A = 6 −8 1  .
0 3
4

Määrää |A|.
Sarruksen menetelmä: Tämä menetelmä toimii vain 3 × 3-matriiseille. Olkoon


a11 a12 a13
A = a21 a22 a23  .
a31 a32 a33 3×3
Tällöin
|A| = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 − a11 a23 a32 − a12 a21 a33 .
Esimerkki 1.9. Olkoon

3 0 −2
A = 6 −8 1  .
0 3
4

Määrää |A| Sarruksen menetelmällä.
1.5.2 Determinantin ominaisuuksia:
Olkoon A n × n-matriisi.
1) Jos matriisin A kaksi samansuuntaista riviä vaihdetaan keskenään, determinantin merkki vaihtuu.
Esimerkki 1.10.
9 12 15
1 7 1 =
1 1 1 10
2) Jos matriisin A jokin vaakarivi (tai pystyrivi) kerrotaan vakiolla c ∈ R,
determinantti muuttuu c–kertaiseksi.
Esimerkki 1.11.
9 12 15
1 7 1 =
1 1 1 3) Jos matriisin A johonkin riviin lisätään jokin muu samansuuntainen rivi
vakiolla kerrottuna, determinantin arvo ei muutu.
Tavoite: Paljon 0:ia riville, jonka suhteen determinantti kehitetään.
Esimerkki 1.12.
3 0 −2
6 −8 1 =
0 3
4
4) Jos A = (aij ) on yläkolmiomatriisi (tällöin kaikki alkiot päälävistäjän alapuolella nollia) tai alakolmiomatriisi (kaikki alkiot päälävistäjän yläpuolella nollia), niin
det A = |A| = a11 a22 · · · ann .
5) Jos A = (aij ) on diagonaalimatriisi, niin |A| = a11 a22 · · · ann .
6) Jos matriisin A jokin vaakarivi (tai pystyrivi) koostuu pelkästään nollista,
niin |A| = 0. (Kehitetään determinantti ko. rivin suhteen.)
7) Jos matriisin A kaksi samansuuntaista riviä ovat samat, niin |A| = 0.
8) |A| = |AT |
9) Olkoot A ja B n × n–matriiseja. Tällöin |AB|=|BA|=|A||B|.
Esimerkki 1.13. Olkoon

3 0 −2
A = 6 −8 1  .
0 3
4

Määritetään |A| käyttämällä ominaisuutta 3).
1.6
Käänteismatriisi
Olkoon A n × n–neliömatriisi. Sellaista n × n–matriisia B, joka toteuttaa ehdon
AB = BA = In sanotaan matriisin A käänteismatriisiksi ja merkitään B = A−1 .
11
Kaikilla neliömatriiseilla ei ole käänteismatriisia. Matriisi, jolla on käänteismatriisi, on säännöllinen.
Lause 1.3. Matriisilla A on käänteismatriisi olemassa jos ja vain jos det A 6= 0.
Huomautus. Käänteismatriisi on yksikäsitteinen.
Todistus. Jos B1 ja B2 ovat sellaisia matriiseja, että
AB1 = B1 A = In
ja
AB2 = B2 A = In ,
niin
B1 = B1 In = B1 (AB2 ) = (B1 A)B2 = In B2 = B2 .
Siis
B1 = B2 .
Huomautus. Jos AB = In , niin myös BA = In .
1.6.1 Menetelmiä käänteismatriisin ratkaisemiseksi:
1) Käänteismatriisi kofaktorien ja determinantin avulla.
Olkoon A n × n–matriisi, jolle det A 6= 0. Olkoon K seuraava matriisin A
kofaktorien Aij muodostama matriisi:


A11 A12 · · · A1n
 A21 A22 · · · A2n 


,
K= .
.
.
.
..
..
.. 
 ..

An1 An2 · · ·
Ann
missä Aij = (−1)i+j |Mij | (paikan ij kofaktori).
Tällöin
1
A−1 =
KT .
det A
Esimerkki 1.14. Määritä matriisin


0 −2 −3
A= 1
3
3
−1 −2 −2
käänteismatriisi.
12
2) Gaussin eliminoimismenetelmä
Olkoon

a11 · · ·
 ..
...
A= .
an1 · · ·
Muodostetaan matriisi

A In


=


a1n
.. 
. 
ann
a11 a12 · · · a1n
a21 a22 · · · a2n
..
..
..
..
.
.
.
.
an1 an2 · · · ann
.
n×n

0 ··· 0
1 ··· 0 

.
.. . . .. 
. . 
.
0 0 · · · 1 n×2n
1
0
..
.
Tässä matriisissa voidaan
i) vaakarivi kertoa millä tahansa vakiolla,
ii) jokin vaakarivi lisätä vakiolla kerrottuna toiseen vaakariviin,
iii) vaihtaa vaakarivit keskenään.
Näillä operaatioilla pyritään muuttamaan matriisi
I B , jolloin matriisi B = A−1 .
Esimerkki 1.15. Määritä matriisin


0 −2 −3
A= 1
3
3
−1 −2 −2
A I
muotoon
käänteismatriisi.
1.6.2 Käänteismatriisin ominaisuuksia:
Olkoon A n × n–matriisi, jolle det A 6= 0 eli A−1 on olemassa. Tällöin
1) (A−1 )−1 = A
2) (A−1 )T = (AT )−1
3) (AB)−1 = B −1 A−1 , jos B −1 ja AB ovat olemassa
1
.
4) det (A−1 ) =
det A
13
1.7
Lineaarisen yhtälöryhmän matriisimuoto ja sen ratkaiseminen
1) Tarkastellaan yhtälöryhmää, jossa muuttujien lukumäärä on sama kuin
yhtälöiden lukumäärä


a11 x1 + a12 x2 + . . . + a1n xn = c1




a21 x1 + a22 x2 + . . . + a2n xn = c2
(1)
..

.




a x + a x + . . . + a x = c ,
n1 1
n2 2
nn n
n
missä kertoimet aij ja vakiot ci ovat tunnettuja. Tämä on n:n muuttujan
x1 , . . . , xn vakiokertoiminen lineaarinen n:n yhtälön ryhmä. (Siis muuttujien lkm = yhtälöiden lkm.)
Yhtälöryhmä (1) voidaan esittää matriisimuodossa:
 
 


c1
x1
a11 a12 · · · a1n
 c2 
 x2 
 a21 a22 · · · a2n 
 
 


(2)
=.
· . 
 ..
..
.. 
..
.
 .. 


 .

.
.
.
.
an1 an2 · · ·
ann
n×n
xn
n×1
cn
n×1
eli muodossa
A · X̄ = C̄.
(3)
Jos kerroinmatriisilla A on käänteismatriisi, kerrotaan yhtälö (3) puolittain
vasemmalta käänteismatriisilla A−1 ja saadaan:
A−1 (AX̄) = A−1 C̄ ⇔
(A−1 A)X̄ = A−1 C̄ ⇔
I X̄ = A−1 C̄ ⇔
(4)
X̄ = A−1 C̄.
Lause 1.4. Jos matriisi A on säännöllinen eli A−1 on olemassa (det A 6= 0),
niin yhtälöryhmän (1) yksikäsitteinen ratkaisu on X̄ = A−1 C̄. (Yhtälöryhmällä
yksikäsitteinen ratkaisu ⇔ A säännöllinen.)
Esimerkki 1.16. Ratkaise yhtälöryhmä



−2y − 3z = 1
x + 3y + 3z = 2


−x − 2y − 2z = 1 .
14
Lause 1.5. (Cramerin sääntö). Oletetaan, että yhtälöryhmässä (1) on n tuntematonta ja n yhtälöä sekä det A 6= 0 eli yhtälöryhmällä on yksikäsitteinen ratkaisu
X̄ = A−1 C̄.
Cramerin sääntö yhtälöryhmän ratkaisemiseksi ilman käänteismatriisin A−1 laskemista on seuraava:
c1 a12 · · · a1n a11 c1 a13 · · · a1n 1 c2 a22 · · · a2n 1 a21 c2 a23 · · · a2n x1 =
x2 =
.
.
.. . .
..
.. . .
.. ,
.. ,
|A| ..
|A| ..
.
.
.
.
.
.
. cn an2 · · · a2n an1 cn an3 · · · a2n a11
1 a21
· · · , xn =
.
|A| ..
an1
· · · a1(n−1) c1 · · · a2(n−1) c2 ..
.. .
..
.
.
.
· · · an(n−1) cn Esimerkki 1.17. Ratkaise yhtälöryhmä



3x + y − z = 2
x − 2y + z = −9


4x + 3y + 2z = 1 .
2) Tarkastellaan yhtälöryhmää


a11 x1 + a12 x2 + . . . + a1n xn = c1




a21 x1 + a22 x2 + . . . + a2n xn = c2
..

.




a x + a x + . . . + a x = c ,
m1 1
m2 2
mn n
m
(5)
eli n:n muuttujan x1 , . . . , xn ja m:n yhtälön ryhmä, joka voidaan esittää
matriisimuodossa


 
 
a11 a12 · · · a1n
x1
c1
 a21 a22 · · · a2n 
 x2 
 c2 


 
 
· . 
= . 
(6)
 ..
..
.. 
..
.
 .



 .. 
.
.
.
.
am1 am2 · · · amn m×n
xn n×1
cm m×1
15
Matriisiesitys on tällöin muotoa:
A · X̄ = C̄,
missä A = (aij )m×n .
(7)
Tapauksessa m 6= n A−1 ei ole olemassa ja det A ei ole olemassa, joten
menetelmät X̄ = A−1 C̄ ja Cramer eivät toimi. Samoin, jos m = n, mutta
|A| = 0, niin menetelmät X̄ = A−1 C̄ ja Cramer eivät toimi.
Lause 1.6 (Gaussin eliminoimismenetelmä). Gaussin eliminoimismenetelmää
voidaan soveltaa myös tapauksissa, joissa kerroinmatriisilla A ei ole käänteismatriisia, det A = 0, ja silloinkin, kun yhtälöryhmän yhtälöiden ja tuntemattomien
muuttujien lukumäärä ei ole sama.
Menetelmä perustuu siihen, että yhtälöryhmään (5) voidaan soveltaa seuraavia
alkeismuunnoksia sen ratkaisun muuttumatta
(a) yhtälöiden järjestyksen vaihto
(b) yhden tai useamman yhtälön kertominen vakiolla (6= 0)
(c) yhden tai useamman yhtälön kerrannaisen lisääminen muihin yhtälöihin.
Yhtälöryhmän asemasta tarkastelemme täydennettyä kerroinmatriisia


a11 a12 · · · a1n c1
 a21 a22 · · · a2n c2 


.
(A|C̄) =  .
..
..
.. 
...
 ..
.
.
. 
am1 am2 · · ·
amn cm
(8)
m×(n+1)
Nyt yhtälöryhmän (5) alkeismuunnoksia (a), (b) ja (c) vastaa täydennettyyn
kerroinmatriisiin (8) kohdistuvat muunnokset:
(a) vaakarivien järjestyksen vaihto
(b) yhden tai useamman vaakarivin kertominen nollasta eroavalla vakiolla
(c) vaakarivin kertominen vakiolla ja sen lisääminen toiseen vaakariviin.
Huomautus. Vain vaakarivimuunnoksia.
Näillä muunnoksilla matriisi (8) pyritään saamaan muotoon


1 0 ··· 0
 0 1 ··· 0



 .. .. . . .. X̄  = I A−1 C̄ = I X̄ ,
 . .

. .
0 0 ···
(9)
1
16
josta saadaan ratkaisu X̄. (Tapaus m = n ja yksikäsitteinen ratkaisu.)
Tai muotoon










1
0
..
.
0 ···
1 ···
..
.
0
0
..
.
0
..
.
0 ···
..
.
0
..
.
0 0 ···
0





B 
,



(10)
joka avataan takaisin yhtälöryhmäksi. (Tapaukset m 6= n tai ei yksikäsitteistä
ratkaisua.)
Esimerkki 1.18.



x + 3y − z = 1
x − 2y + z = 2


2x − y + z = 3
Esimerkki 1.19.



x + 2y − z = 10
2x + 4y − 2z = 20


x + y + z = 6
Esimerkki 1.20.



x + 2y − z = 10
2x + 4y − 2z = 5


x + y + z = 6
1.8
Lineaarinen riippuvuus ja matriisin aste
1.8.1 Lineaarinen riippuvuus
Olkoot v̄1 , v̄2 , . . . , v̄m n–komponenttisia vektoreita (vaaka- tai pystyvektoreita).
Vektorit v̄1 , v̄2 , . . . , v̄m ovat lineaarisesti riippuvia, jos on olemassa sellaiset reaaliluvut r1 , r2 , . . . , rm , jotka eivät kaikki ole nollia, että
r1 v̄1 + r2 v̄2 + . . . + rm v̄m = 0̄.
17
Tällöin jotkut vektorit voidaan esittää toisten lineaarisena yhdisteenä.
Jos ehdosta
r1 v̄1 + r2 v̄2 + . . . + rm v̄m = 0̄.
seuraa, että r1 = r2 = . . . = rm = 0, niin vektorit v̄1 , v̄2 , . . . , v̄m ovat lineaarisesti riippumattomia. Tällöin mitään vektoria ei voida esittää toisten lineaarisena
yhdisteenä.
Esimerkki 1.21. Tutki, ovatko seuraavat vektorit lineaarisesti riippumattomat.
a) (1, 2, 1), (0, 1, 2) ja (1, 3, 3)
b) (1, 2) ja (2, 0)
1.8.2 Matriisin aste
Matriisi A = (aij )m×n on muodostunut m:stä vaakarivistä (-vektorista) ja n:stä
pystyrivistä (-vektorista). Jokaisella matriisilla lineaarisesti riippumattomien vaakarivien lukumäärä on sama kuin lineaarisesti riippumattomien pystyrivien lukumäärä. Tätä lukumäärää sanotaan matriisin A asteeksi ja merkitään r(A).
Tietysti 1 ≤ r(A) ≤ min(m, n).
Esimerkki 1.22.

1

a) A = 5
1

1

b) A = 3
2
Määritä matriisin A aste, kun

4
3
2

3
9 .
6
Matriisin A = (aij )m×n alimatriisi on matriisi, joka saadaan poistamalla matriisista A nolla tai useampia pysty- ja/tai vaakarivejä.
Lause 1.7. Olkoon A matriisi ja k suurin sellainen kokonaisluku, että matriisilla
A on olemassa k × k–alimatriisi, jonka determinantti 6= 0. Tällöin r(A) = k.
Esimerkki 1.23.

1

a) A = 5
1
(Toisella tavalla.) Määritä matriisin A aste, kun

4
3
2
18

1
b) A = 3
2

1

c) A = 0
1

3
9
6

2 1
1 2.
3 3
1.8.3 Matriisin asteen ominaisuuksia
Olkoot A ja B n × n–matriiseja.
1) Diagonaalimatriisin aste = matriisin nollasta eriävien alkioiden lukumäärä.
Erityisesti r(In ) = n.
2) r(A) = r(AT ).
3) r(AB) ≤ min{r(A), r(B)}.
Lause 1.8. r(An×n ) = n jos ja vain jos A on säännöllinen eli det A 6= 0 eli A−1
on olemassa.
Siis A on säännöllinen jos ja vain jos sen kaikki pystyrivit (vast. vaakarivit) ovat
lineaarisesti riippumattomat.
Matriisissa voidaan sen astetta muuttamatta:
a) Vaihtaa samansuuntaisten rivien järjestystä.
b) Kertoa mikä tahansa vaaka- tai pystyrivi nollasta eroavalla vakiolla.
c) Lisätä mihin tahansa riviin jokin toinen samansuuntainen rivi vakiolla
kerrottuna.
Tavoite: Yläkolmio/alakolmiomatriisin aste on helppo laskea Lauseen 1.7 menettelyllä.
Esimerkki 1.24. Määrää matriisin


−1 3 2 6


1 5 2
4
A=

−3 −8 6 9 
−5 −4 1 −3
aste.
19
1.9
Matriisin ominaisarvot ja ominaisvektorit
Matriisien sovelluksissa joudutaan joskus tilanteeseen, jossa on ratkaistava n × n–
matriisia A koskeva yhtälö
An×n X̄n×1 = λX̄n×1 ,
(11)
missä X̄ = (x1 , . . . , xn )T ja λ ∈ R ovat tuntemattomia.



2x + 3y + 5z = λx
Esimerkiksi
x + 2y + 2z = λy , x, y, z ja λ tuntemattomia.


 x + 3y + 3z = λz
Yhtälö (11) pätee aina, kun X̄n×1 = 0̄n×1 .
Jos on olemassa nollavektorista eroava vektori X̄ ∈ Rn ja reaaliluku λ, joille
AX̄ = λX̄, niin luku λ on matriisin A ominaisarvo ja X̄ on ominaisarvoa λ
vastaava ominaisvektori X̄ 6= 0̄.
Huomautus. Olkoon X̄ matriisin A ominaisvektori ja λ vastaava ominaisarvo. Jos
a 6= 0, niin myös aX̄ on matriisin A ominaisarvoa λ vastaava ominaisvektori.
Todistus.
A(aX̄) = (Aa)X̄ = (aA)X̄ = a(AX̄) = aλX̄ = λ(aX̄)
1.9.1 Ominaisarvojen määrääminen
Tarkastellaan yhtälöä (11)
AX̄ = λX̄
⇔ AX̄ − λX̄ = 0̄
⇔ AX̄ − λI X̄ = 0̄
⇔ (A − λI)X̄ = 0̄.
Tällä yhtälöllä on yksikäsitteinen ratkaisu, kun (A − λI) on säännöllinen, eli
|A − λI| =
6 0 eli (A − λI)−1 on olemassa. Tämä ratkaisu on
X̄ = (A − λI)−1 · 0̄ = 0̄.
20
Siten ratkaisu X̄ = 0̄ on yksikäsitteinen (eli ainoa) ratkaisu, kun (A − λI) on
säännöllinen, eli |A − λI| =
6 0.
Täten yhtälöllä (A − λI)X̄ = 0̄ on (ei-triviaali) ratkaisu X̄ 6= 0̄ täsmälleen silloin,
kun A−λI ei ole säännöllinen eli täsmälleen silloin, kun det (A − λI) = |A−λI| =
0.
Siten matriisin A ominaisarvot saadaan yhtälön |A − λIn | = 0 reaalijuurina.
Lauseke |A−λI| on λ:n suhteen astetta n oleva polynomi. Sitä sanotaan matriisin
A karakteristiseksi polynomiksi ja yhtälöä |A − λI| = 0 matriisin A karakteristiseksi yhtälöksi.
Huomautus. Karakteristisen polynomin nollakohdat eivät välttämättä ole reaalisia (siis eivät ominaisarvoja) ja jokin nollakohta voi olla moninkertainen.
Esimerkki 1.25. Määritä matriisin
10 3
A=
3 2
ominaisarvot.
Huomautus. Ala- ja yläkolmiomatriisin ominaisarvot ovat päälävistäjän alkiot.
1.9.2 Ominaisvektoreiden määrittäminen
Olkoon λ matriisin A = (aij )n×n ominaisarvo. Ominaisarvoon λ liittyvät ominaisvektorit saadaan yhtälön (A − λIn )X̄ = 0̄ ratkaisuna X̄, missä X̄ 6= 0̄.
Esimerkki 1.26. Määritä matriisin
A=
1 −2
−2 1
ominaisarvot ja ominaisvektorit.
21
1.10 Panos-tuotos–malli
Tunnetaan eräs panos-tuotos–taulu:
xi1 xi2
x1
x2
x3
..
.
x11
x21
x31
..
.
x12
x22
x32
..
.
xi3
...
xin
yi
x13
x23
x33
..
.
...
...
...
...
x1n
x2n
x3n
..
.
y1
y2
y3
..
.
xn xn1 xn2 xn3 . . . xnn yn
Vaakarivillä toimialan i kokonaistuotannon xi käyttö välituotteina xij toimialoilla
j ja lopputuotteena yi .
Muodostetaan malli, joka kertoo yleisesti lopputuotteiden kysynnän perusteella
toimialojen kokonaistuotannon.
xi1 xi2 xi3 . . . xin yi
x1
x2
x3
..
.
x11
x21
x31
..
.
x12
x22
x32
..
.
x13
x23
x33
..
.
...
...
...
..
.
x1n
x2n
x3n
..
.
y1
y2
y3
..
.
xn
xn1
xn2
xn3
...
xnn
yn
Mallin muodostaminen tapahtuu vaakarivien perusteella:
xi =
n
X
xij + yi ,
missä n on toimialojen lukumäärä.
(12)
j=1
Mallin kiinteät kertoimet lasketaan eräästä tunnetusta panos-tuotos–taulusta
seuraavasti:
aij =
xij
⇔ xij = aij xj ,
xj
missä 0 ≤ aij ≤ 1.
(13)
Panoskerroin aij ilmaisee kuinka paljon toimialalla j tarvitaan toimialan i tuotantoa yhden tuoteyksikön tuottamiseen.
Sijoittamalla yhtälö (13) yhtälöön (12) saadaan:
xi =
n
X
aij xj + yi ,
missä i = 1, . . . , n.
j=1
22
Eli


x1 = a11 x1 + a12 x2 + . . . + a1n xn + y1 ,



x2 = a21 x1 + a22 x2 + . . . + a2n xn + y2 ,
..

.




x = a x + a x + . . . + a x + y .
n
n1 1
n2 2
nn n
n
Yleinen muoto:
X̄ = AX̄ + Ȳ ,
X̄ = kokonaistuotanto
missä Ȳ = loppukysyntä
.
A = nk. teknillinen matriisi
Eli

x1
 x2 
 
 .. 
.


xn
n×1

 
 
a11 a12 · · · a1n
x1
y1
 a21 a22 · · · a2n 
 x2 
 y2 


 
 
= .
+ . 
.
 .. 
..
.. 
..
 ..



 .. 
.
.
.
.
an1 an2 · · · ann n×n xn n×1
yn n×1
Tästä saadaan ratkaistua toimialojen tuotannot xi , kun tunnetaan kertoimet aij
ja lopputuotteiden kysynnät yi , eli tiedetään halutut lopputuotemäärät ja suhde
kuinka paljon toimiala tarvitsee toisten toimialojen tuotantoa välituotteina. Siis
⇔
⇔
⇔
⇔
X̄ = AX̄ + Ȳ
X̄ − AX̄ = Ȳ
I X̄ − AX̄ = Ȳ
(I − A)X̄ = Ȳ
| (I − A)−1 ·
X̄ = (I − A)−1 Ȳ
Näin johdettu yhtälö X̄ = (I − A)−1 Ȳ on panos-tuotos–malli, joka ilmaisee
toimialojen kokonaistuotannon riippuvuuden lopputuotteiden kysynnästä. Käänteismatriisi (I − A)−1 on Leontief:n käänteismatriisi. Merkitään sen alkioita bij :
 


 
x1
b11 b12 · · · b1n
y1
 x2 
 b21 b22 · · · b2n 
 y2 
 


 
= .
.
 .. 
 .. 
.. . .
.. 
.
 ..

.
.
.
.
xn
n×1
bn1 bn2 · · ·
bnn
n×n
yn
n×1
Siis xi = bi1 y1 + bi2 y2 + . . . + bin yn .
23
Leontief:n käänteismatriisi ilmaisee toimialojen kokonaistuotannon ja lopputuotteiden kysynnän välisen riippuvuuden. Eli alkio bij ilmaisee, kuinka paljon tuotantoa tarvitaan toimialalla i, jotta toimialalla j voitaisiin tuottaa yksi lopputuoteyksikkö.
Esimerkki 1.27. Kahden teollisuudenalan tuotantoa kuvaa seuraava taulukko.
Muodosta sen avulla panos-tuotos–malli. (luvut milj. euroa)
tuottaja
A
B
kokonaistuotanto
600
480
välikäyttö
A
B
150 240
200 120
loppukysyntä
210
160
1.11 Matriisien sovellutus regressioanalyysissä
Usean muuttujan Pienimmän neliösumman–regressioanalyysissä ajatellaan, että
(selitettävä) muuttuja y riippuu (selittävistä) muuttujista x1 , x2 , . . . , xk ja häiriötekijästä u yhtälön
y = β0 + β1 x1 + β2 x2 . . . + βk xk + u
mukaisesti.
Vakioita β0 , β1 , . . . , βk ei tunneta ja käytettävissä on n:n kappaleen otos muuttujan y ja muuttujien x1 , x2 , . . . , xk arvoja. Siis n kpl y:n arvoja ja niitä vastaavat
xi :n arvot ovat tiedossa:
yi = β0 + β1 x1i + β2 x2i . . . + βk xki + ui ,
i = 1, 2, . . . , n.
(14)
Tehtävänä on löytää estimaatit (arviot) vakioille β0 , β1 , . . . , βk eli löytää (paras)
lineaarinen funktio, jonka kautta y riippuu muuttujista xi . Merkitään:
 


 
 
y1
1 x11 x21 · · · xk1
β0
u1
 y2 
1 x12 x22 · · · xk2 
β1 
 u2 
 


 
 
, β̄ =  .  ja ū =  .  .
Ȳ =  .  , X =  . .
..
.. 
..
.
 .. 
 .. ..



 .. 
.
.
.
.
yn
1 x1n x2n · · ·
xkn
n×k+1
βk
un
Yhtälöryhmä (14) saadaan nyt matriisimuotoon
Ȳ = X β̄ + ū .
(15)
24
Vakioiden β0 , β1 , . . . , βk estimaattien löytämiseksi käytetään ns. pienimmän neliösumman menetelmää.
Merkitään vektorin β̄ estimaattia
 
β̂0
β̂1 
 
β̂ =  .  .
 .. 
β̂k
Tällöin
Ȳ = X β̂ + ē ,
missä ē = Ȳ − X β̂ = (e1 , e2 , . . . , en )T on n:n ns. jäännöstermin muodostama
pystyvektori.
Siis
ei = yi − (β̂0 + β̂1 x1i + . . . + β̂k xki ) .
Pienimmän neliösumman menetelmässä summa
n
X
e2i = ēT ē
i=1
minimoidaan. (Virheen minimointi.)
Siis etsitään β̂, jolla virhe minimoituu.
Nyt
n
X
e2i = ēT ē = (Ȳ − X β̂)T · (Ȳ − X β̂)
i=1
= (Ȳ T − (X β̂)T ) · (Ȳ − X β̂)
= (Ȳ T − β̂ T X T ) · (Ȳ − X β̂)
= Ȳ T Ȳ − Ȳ T X β̂ − β̂ T X T Ȳ + β̂ T X T X β̂ .
Vektorin β̂ määrittämiseksi etsitään lausekkeen ēT ē pienin arvo kuten normaalissa
ääriarvotehtävässä.
25
Etsitään ensin KRP derivoimalla lauseke tuntemattoman β̂ suhteen ja asettamalla se nollaksi:
∂
∂ β̂
(ēT ē) = −X T (Ȳ T )T − X T Ȳ + 2X T X β̂
= −2X T Ȳ + 2X T X β̂ = 0̄
⇔ X T X β̂ = X T Ȳ ⇔
β̂ = (X T X)−1 X T Ȳ ,
mikäli X T X säännöllinen.
Jotta voidaan osoittaa, että β̂ = (X T X)−1 X T Ȳ on minimiratkaisu, on tutkittava
toista derivaattaa
∂ 2 ēT ē
∂ β̂ 2
=
∂
∂ β̂
(−2X T Ȳ + 2X T X β̂) = 2X T X .
Jos matriisi X T X on positiividefiniitti, niin kyseessä on minimiratkaisu.
Käytännön tilanteissa X T X on aina positiividefiniitti.
Paras lineaarinen funktio
y = β 0 + β 1 x1 + β 2 x2 . . . + β k xk ,
joka selittää muuttujan y riippuvuuden muuttujista x1 , x2 , . . . , xk , löytyy siis yhtälöstä
 
β̂0
β̂1 
 
β̂ =  .  = (X T X)−1 X T Ȳ ,
 .. 
β̂k
missä matriisit X ja Ȳ saadaan

1 x11 x21
1 x12 x22

X = . .
..
 .. ..
.
n kappaleen otoksesta seuraavasti:
 

· · · xk1
y1



· · · xk2 
 y2 
ja Ȳ =  .  ,
.. 
..
 .. 
.
. 
1 x1n x2n · · ·
xkn
n×k+1
yn
missä yi on muuttujan y arvo i. otoksessa ja x1i , x2i , . . . , xki ovat sitä vastaavat
muuttujien x1 , x2 , . . . , xk arvot i. otoksessa.
26
Esimerkki 1.28. Estimoi yhtälön y = β0 + β1 x1 kertoimia β pienimmän neliösumman menetelmällä, kun havaintoaineisto on seuraava:
y1 = 5
x11 = −1
y2 = 3
x12 = 0
y3 = −2
x13 = 1
y4 = 8
x14 = −2
27
2
Yhden muuttujan funktion optimointi
2.1
Funktion f (x) tutkiminen derivaatan avulla
2.1.1 Funktion monotonisuus ja derivaatta
Funktio f (x) on monotoninen välillä I, jos se on joko kasvava tai vähenevä välillä
I. Funktio f (x) on aidosti monotoninen välillä I, jos se on aidosti kasvava tai
aidosti vähenevä välillä I.
Monotonisuuden yhteys derivaattaan on seuraava:
Lause 2.1. Oletetaan, että funktio f (x) on derivoituva (ja siten myös jatkuva)
välillä I. Tällöin funktio f (x) on
(i ) kasvava välillä I, jos f 0 (x) ≥ 0 kaikilla x ∈ I (tangentit välillä I nousevia
tai x-akselin suuntaisia suoria),
(ii ) aidosti kasvava välillä I, jos f 0 (x) > 0 kaikilla x ∈ I (tangentit välillä I
nousevia suoria),
(iii ) vähenevä välillä I, jos f 0 (x) ≤ 0 kaikilla x ∈ I (tangentit välillä I laskevia
tai x-akselin suuntaisia suoria),
(iv ) aidosti vähenevä välillä I, jos f 0 (x) < 0 kaikilla x ∈ I (tangentit välillä I
laskevia suoria).
(i)
(ii)
(iii)
(iv)
28
Esimerkki 2.1. Milloin funktio f (x) = 3x4 − 20x3 + 36x2 on kasvava?
2.1.2 Funktion kuperuus ja toinen derivaatta
Lause 2.2. Käyrä y = f (x) on aidosti alaspäin kupera välillä ]a, b[
⇔
tangenttien kulmakertoimet tulevat aidosti suuremmiksi muuttujan x
kasvaessa
⇔
derivaatta f 0 (x) on aidosti kasvava välillä ]a, b[
⇔
f 00 (x) > 0 välillä ]a, b[
Lause 2.3. Käyrä y = f (x) on aidosti ylöspäin kupera välillä ]a, b[
⇔
tangenttien kulmakertoimet tulevat aidosti pienemmiksi muuttujan x
kasvaessa
⇔
derivaatta f 0 (x) on aidosti vähenevä välillä ]a, b[
⇔
f 00 (x) < 0 välillä ]a, b[
29
2.2
Funktion f (x) ääriarvo
Funktiolla f (x) on kohdassa x0 ∈ Df suurin arvo, jos f (x) ≤ f (x0 ) kaikilla
x ∈ Df . Vastaavasti funktiolla f (x) on kohdassa x0 ∈ Df pienin arvo, jos
f (x) ≥ f (x0 ) kaikilla x ∈ Df . Suurinta arvoa sanotaan myös absoluuttiseksi
maksimiksi ja pienintä arvoa absoluuttiseksi minimiksi.
Esimerkki 2.2. Välillä [−1, 1] funktion f (x) = 2x − 1 pienin arvo on f (−1) = −3
ja suurin arvo on f (1) = 1.
Esimerkki 2.3. Funktion f (x) = x2 pienin arvo R:ssä on f (0) = 0. Suurinta arvoa
funktiolla ei ole.
Esimerkki 2.4. Funktiolla f (x) = x3 ei ole pienintä eikä suurinta arvoa R:ssä.
30
Piste x0 ∈ Df on funktion f paikallinen maksimikohta, jos on olemassa sellainen
r > 0, että f (x) ≤ f (x0 ) aina, kun x ∈ Df ja x ∈]x0 − r, x0 + r[. Tällöin f (x0 )
on funktion f paikallinen maksimiarvo.
Vastaavasti kohta x0 ∈ Df on funktion f paikallinen minimikohta, jos on olemassa
sellainen r > 0, että f (x) ≥ f (x0 ) aina, kun x ∈ Df ja x ∈]x0 − r, x0 + r[. Tällöin
f (x0 ) on funktion f paikallinen minimiarvo.
31
Paikallisia ääriarvoja kutsutaan myös lokaaleiksi ääriarvoiksi.
2.2.1 Paikallisten ääriarvokohtien löytäminen
Lause 2.4. Olkoon f (x) välillä I ∈ R derivoituva funktio. Jos kohta x0 ∈ I on
funktion f (x) paikallinen ääriarvokohta, niin
f 0 (x) = 0.
(KRP )
Geometrisesti:
f 0 (x0 ) = 0 jos ja vain jos käyrän pisteeseen x0 piirretyn tangentin kulmakerroin
on nolla eli kyseinen tangentti on x-akselin suuntainen suora.
Lauseen 2.4 mukaan siis derivoituvan funktion f (x) mahdolliset paikalliset ääriarvokohdat löytyvät derivaatan f 0 (x) nollakohdista. Derivaatan
nollakohtia kutsutaan kriittisiksi pisteiksi.
32
Lause 2.4 ei kuitenkaan päde kääntäen: Jos f 0 (x0 ) = 0, niin kriittinen piste x0 ei
ole välttämättä funktion f ääriarvokohta, vaan se voi olla myös ns. satulapiste.
Lause 2.5. Jatkuvan funktion f (x) mahdolliset paikalliset ääriarvokohdat löydetään tutkimalla
1) derivaatan f 0 (x) nollakohdat eli milloin f 0 (x) = 0,
2) epäderivoituvuuskohdat eli kohdat, joissa derivaattaa f 0 (x) ei ole olemassa.
Esimerkki 2.5. Etsi funktion f (x) = x5 + 5x3 + 8x + 1 mahdolliset paikalliset
ääriarvokohdat.
Lause 2.6. Jos funktion f (x) määrittelyjoukko on suljettu tai puoliavoin väli,
niin paikallinen ääriarvo voi esiintyä myös välin päätepisteissä.
33
Lause 2.7. Edellä olevien tulosten nojalla funktion f (x) paikallisia ääriarvokohtia voivat siis olla
1)
2)
3)
4)
funktion f (x) epäjatkuvuuskohdat
funktion f (x) epäderivoituvuuskohdat
funktion f (x) derivaatan f 0 (x) nollakohdat
välin päätepisteet, mikäli funktio f (x) on määritelty suljetulla tai puoliavoimella välillä.
Etsittäessä funktion absoluuttisia ääriarvoja on vertailtava paikallisia ääriarvoja
ja lisäksi tarvittaessa tutkittava raja-arvot lim f (x) ja lim f (x).
x→∞
x→−∞
34
2.2.2 Paikallisten ääriarvokohtien laatu
Lause 2.8 (Ääriarvon olemassaolo ja laatu, derivaatan merkkikaavion käyttö).
Olkoon funktio f derivoituva eräässä kohdan x0 ympäristössä. Olkoon lisäksi
f 0 (x0 ) = 0 tai x0 epäderivoituvuuskohta eli x0 on mahdollinen paikallinen ääriarvokohta. Jos funktion f derivaatta muuttuu kohdassa x0
(i ) positiivisesta negatiiviseksi, kyseessä on paikallinen maksimikohta.
(f muuttuu aidosti kasvavasta aidosti väheneväksi )
(ii ) negatiivisesta positiiviseksi, kyseessä on paikallinen minimikohta.
(f muuttuu aidosti vähenevästä aidosti kasvavaksi )
Jos f 0 (x) ei muuta merkkiään kohdassa x0 , niin funktiolla f (x) ei ole ääriarvokohtaa kohdassa x0 , vaikka f 0 (x0 ) = 0 tai x0 on epäderivoituvuuskohta.
Huomautus. Lause 2.8 ei päde epäjatkuvuuskohdissa, vaan ne on tutkittava tarkemmin.
(
x3 + x, kun − 2 ≤ x < 0
Esimerkki 2.6. Määritä funktion f (x) =
ääriarvot.
−x,
kun 0 ≤ x ≤ 3
Esimerkki 2.7. Määritä funktion f (x) = x4 − 2x2 ääriarvot välillä [0, 3].
Esimerkki 2.8. Etsi funktion f (x) = x3 paikalliset ja absoluuttiset ääriarvot.
Esimerkki 2.9. Määritä funktion f (x) = x4 − 8x2 + 24 ääriarvot.
Esimerkki 2.10. Määritä seuraavan funktion paikalliset ja absoluuttiset ääriarvot.
(
x2 + x, kun x < 0
f (x) =
− x2 ,
kun x ≥ 0
Lause 2.9. Olkoon f derivoituva eräässä kohdan x0 ympäristössä ja oletetaan,
että x0 on kriittinen piste eli että f 0 (x0 ) = 0. Tällöin
1) jos f 00 (x0 ) < 0, niin x0 on paikallinen maksimikohta,
2) jos f 00 (x0 ) > 0, niin x0 on paikallinen minimikohta,
3) jos f 00 (x0 ) = 0, niin x0 voi olla maksimikohta, minimikohta tai satulapiste
(ks. derivaatan merkkikaavio Lause 2.8 tai Lause 2.10)
35
Esimerkki 2.11. Määrää funktion f (x) = 3x4 − 4x3 − 36x2 + 2 ääriarvokohdat.
Lause 2.10. Olkoon f (x) jatkuva funktio, joka on n kertaa derivoituva pisteessä
x0 . Tällöin f (x0 ) on paikallinen ääriarvo jos ja vain jos on olemassa sellainen
parillinen kokonaisluku n, että
f (k) (x0 ) = 0
kaikilla k = 1, 2, . . . , n − 1 ja f (n) (x0 ) 6= 0.
Kyseessä on lisäksi paikallinen minimi, jos f (n) (x0 ) > 0 ja paikallinen maksimi,
jos f (n) (x0 ) < 0.
Esimerkki 2.12. Määrää funktion f (x) = x3 paikalliset ääriarvot.
Esimerkki 2.13. Määrää funktion f (x) = x4 paikalliset ääriarvot.
Lause 2.11. Suljetulla välillä [a, b] jatkuva funktio f (x) saavuttaa tällä välillä
suurimman ja pienimmän arvonsa.
36
37
3
Kahden muuttujan funktion ääriarvoista
3.1
Normaalit ääriarvot (ei sidotut)
Funktiolla z = f (x, y) on pisteessä (x0 , y0 ) ∈ Df suurin arvo (absoluuttinen
maksimi), jos f (x, y) ≤ f (x0 , y0 ) kaikilla (x, y) ∈ Df . Vastaavasti funktiolla on
pisteessä (x0 , y0 ) ∈ Df pienin arvo (absoluuttinen minimi), jos f (x, y) ≥ f (x0 , y0 )
kaikilla (x, y) ∈ Df .
Esimerkki 3.1. Olkoon z = f (x, y) = x + y. Funktion kuvaaja on taso eikä sillä
siksi ole suurinta eikä pienintä arvoa.
Esimerkki 3.2. Olkoon z = f (x, y) = x2 +y 2 −1. Funktion kuvaaja on paraboloidi.
Suurinta arvoa ei ole, mutta pienin arvo on f (0, 0) = −1.
Piste (x0 , y0 ) ∈ Df on funktion f paikallinen maksimikohta, jos
f (x, y) ≤ f (x0 , y0 ) eräässä pisteen (x0 , y0 ) ympäristössä. Tällöin f (x0 , y0 ) on
funktion paikallinen maksimiarvo. Vastaavasti (x0 , y0 ) ∈ Df on funktion f paikallinen minimikohta ja f (x0 , y0 ) paikallinen minimiarvo, jos f (x, y) ≥ f (x0 , y0 )
eräässä pisteen (x0 , y0 ) ympäristössä.
38
3.1.1 Kahden muuttujan funktion paikalliset ääriarvokohdat
Lause 3.1 (KRP:n etsiminen). Olkoon funktio f (x, y) jatkuva ja derivoituva. Jos
funktiolla on paikallinen ääriarvo pisteessä (x0 , y0 ), niin
∂f
(x0 , y0 ) = 0,
∂x
∂f
(x0 , y0 ) = 0.
∂y
Mahdolliset paikalliset ääriarvokohdat saadaan siis ratkaisemalla yhtälöryhmä
(
fx = 0
fy = 0.
Huomautus. KRP, joka ei ole ääriarvokohta, on satulapiste.
Esimerkki 3.3. Määrää kriittiset pisteet funktiolle f (x, y) = x2 − y 2 .
3.1.2 Kahden muuttujan funktion ääriarvon laatu
Lause 3.2. Olkoon z = f (x, y) 2. kertaluvun osittaisderivaattoineen jatkuva.
Tällöin z = f (x, y) on ylöspäin kupera täsmälleen silloin, kun
2 2
∂ 2f
∂ f
∂ 2f
∂ 2f ∂ 2f
≤ 0,
≤0
ja
· 2 −
≥0
2
2
2
∂x
∂y
∂x ∂y
∂y∂x
kaikilla (x, y) ∈ Df ja alaspäin kupera täsmälleen silloin, kun
2 2
∂ 2f
∂ 2f ∂ 2f
∂ f
∂ 2f
≥ 0,
≥0
ja
· 2 −
≥0
2
2
2
∂x
∂y
∂x ∂y
∂y∂x
kaikilla (x, y) ∈ Df .
Esimerkki 3.4. Tutki funktion f (x, y) = x2 + 4y 2 + 3xy kuperuutta.
Lause 3.3. Oletetaan, että z = f (x, y) on 2. kertaluvun osittaisderivaattoineen
jatkuva. Jos funktio on ylöspäin kupera, sen jokainen kriittinen piste on absoluuttinen maksimikohta. Jos funktio on alaspäin kupera, sen jokainen kriittinen
piste on absoluuttinen minimikohta.
39
Lause 3.4. Olkoon funktio z = f (x, y) 2. kertaluvun osittaisderivaattoineen jatkuva ja (a, b) on funktion kriittinen piste. Tällöin kriittinen piste (a, b) on
(i ) paikallinen minimikohta, jos
2
2
∂ 2f
∂ 2f
∂ f
∆=
(a, b) > 0
(a, b) · 2 (a, b) −
∂x2
∂y
∂y∂x
∂ 2f
∂ 2f
ja
(a,
b)
>
0,
(a, b) > 0
∂x2
∂y 2
(ii ) paikallinen maksimikohta, jos
2
2
∂ 2f
∂ f
∂ 2f
(a, b) > 0
(a, b) · 2 (a, b) −
∆=
∂x2
∂y
∂y∂x
∂ 2f
∂ 2f
ja
(a,
b)
<
0,
(a, b) < 0
∂x2
∂y 2
(iii ) satulapiste, jos
2
2
∂ 2f
∂ 2f
∂ f
∆=
(a, b) · 2 (a, b) −
(a, b) < 0
∂x2
∂y
∂y∂x
(iv ) Testi ei kerro mitään, jos ∆ = 0.
Tutki tarkemmin.
Esimerkki 3.5. Määrää funktion f (x, y) = x3 − y 3 + 3xy paikalliset ääriarvot.
3.2
Sidotut ääriarvot
3.2.1 Sidotut ääriarvot yhtälörajoitteen tapauksessa
Oletetaan, että funktiot f (x, y) ja g(x, y) ovat 2. kertaluvun osittaisderivaattoineen jatkuvia määrittelyjoukossaan. Määrättävä funktion f (x, y) paikalliset ääriarvot ehdolla g(x, y) = 0.
Sijoitusmenetelmä
Ratkaistaan x tai y ehtoyhtälöstä g(x, y) = 0 (jos mahdollista) ja sijoitetaan funktioon f (x, y), jolloin saadaan yhden muuttujan funktio, jolle lasketaan ääriarvot
normaalisti.
Esimerkki 3.6. Etsi funktion f (x, y) = 5x2 +6y 2 −xy ääriarvot ehdolla x+2y = 24.
40
Lagrangen menetelmä
Muodostetaan kohdefunktio F (x, y, λ) = f (x, y) − λg(x, y). Määritetään kohdefunktion F (x, y, λ) kriittiset pisteet eli mahdolliset ääriarvokohdat ratkaisemalla
yhtälöryhmä

∂f
∂g
∂F


 ∂x = ∂x − λ · ∂x = 0
∂g
∂F
= ∂f
− λ · ∂y
=0
∂y
∂y


 ∂F = −g(x, y) = 0 ⇔
∂λ
g(x, y) = 0
Ääriarvon laadun testaaminen kriittisessä pisteessä:
∂ 2F ∂ 2F
∆=
·
−
∂x2 ∂y 2
∂ 2F
∂x∂y
2
> 0,
∂ 2F
<0
∂x2
ja
∂ 2F
<0
∂y 2
∂ 2F
>0
∂x2
ja
∂ 2F
>0
∂y 2
⇒
paikallinen maksimikohta
2 2
∂ F
∂ 2F ∂ 2F
∆=
·
−
> 0,
∂x2 ∂y 2
∂x∂y
⇒
paikallinen minimikohta
2 2
∂ F
∂ 2F ∂ 2F
·
−
≤0
∆=
2
2
∂x
∂y
∂x∂y
⇒
testi ei anna tulosta (tutkittava funktioita tarkemmin)
Esimerkki 3.7. Etsi funktion f (x, y) = 5x2 +6y 2 −xy ääriarvot ehdolla x+2y = 24.
Lagrangen kertoimen tulkinta
Tehtävä alunperin muotoa:
Maksimoi/minimoi funktio f (x, y) ehdolla g(x, y) = b. Voidaan osoittaa, että
optimikohdassa (x0 , y0 )
∂f (x, y)
.
λ=
∂b
Eli kerroin λ arvioi kuinka paljon optimiarvo muuttuu, jos alkuperäisen tehtävän
rajoitetta b muutetaan.
Eli jos rajoitteessa oleva vakio b muuttuu yhden yksikön, niin optimiarvo muuttuu
λ yksikköä.
41
Usein b kuvaa jonkin resurssin määrää (työ, luonnonvarat), jolloin λ ilmoittaa
resurssin varjohinnan. Eli paljonko kannattaa maksaa, jos saa yhden yksikön
lisää resurssia.
Huomautus. Jotta arviointimenetelmä toimii, ehdossa on oltava muuttujien kertoimien positiivisia.
Esimerkki 3.8. Anna arvio funktion f (x, y) = 5x2 + 6y 2 − xy ääriarvoille ehdolla
x + 2y = 25.
Esimerkki 3.9. Anna arvio funktion f (x, y) = 5x2 + 6y 2 − xy ääriarvoille ehdolla
x + 2y = 23.
3.2.2 Sidotut ääriarvot epäyhtälörajoitteen tapauksessa
Etsittävä ääriarvot funktiolle f (x, y) ehdolla g(x, y) ≤ 0.
Menetelmä on seuraava:
1. Ääriarvotetaan funktio f (x, y) ilman ehtoa g(x, y) ≤ 0. Ratkaistaan kuten normaali ääriarvotehtävä. Siten mahdollinen paikallinen ääriarvokohta
(x0 , y0 ) löytyy funktion f (x, y) osittaisderivaattojen nollakohtana.
Suoritetaan normaali laatutarkastelu kriittiselle pisteelle (x0 , y0 ).
Jos kriittinen piste toteuttaa ehdon g(x, y) ≤ 0, niin se on myös tämän
ehdon mukainen sidottu paikallinen ääriarvokohta.
(Ääriarvokohta löytyy alueen sisältä, g(x, y) ≤ 0.)
2. Tarkastellaan epäyhtälörajoitteen g(x, y) ≤ 0 sijaan yhtälörajoitetta
g(x, y) = 0.
Ratkaistaan kuten normaali sidottu ääriarvotehtävä Lagrangen menetelmällä, missä kohdefunktio on nyt muotoa
F (x, y, λ) = f (x, y) − λg(x, y).
Olkoon ratkaisuna saatu kriittinen piste (x0 , y0 ).
Suoritetaan Lagrangen menetelmän laatutarkastelu löydetylle kriittiselle
pisteelle.
(Ääriarvokohta löytyy alueen reunalta, g(x, y) = 0.)
42
3. Lopullinen päättely kohtiin 1. ja 2. perustuen.
Esimerkki 3.10. Maksimoi/minimoi f (x, y) = 5x2 + 6y 2 − xy ehdolla x + 2y ≤ 24.
Esimerkki 3.11. Maksimoi/minimoi f (x, y) = 5x2 + 6y 2 − xy ehdolla x + 2y ≥ 24.
3.2.3 Absoluuttiset ääriarvot ehtoalueessa
Maksimoi/minimoi funktio f (x, y) usean ehdon määräämässä ehtoalueessa
E = {(x, y) | gi (x, y) ≤ 0, i = 1, . . . , m}.
Ehdot toteuttavat absoluuttiset ääriarvot löytyvät joko paikallisista ääriarvokohdista ehtoalueen E sisältä, (gi (x, y) < 0), tai sidotuista ääriarvokohdista ehtoalueen E reunalta, (gi (x, y) = 0).
Lause 3.5. Derivoituvan funktion f (x, y) mahdolliset ääriarvokohdat löydetään
tutkimalla:
1. Osittaisderivaattojen 0–kohdat
2. Määrittely-/tarkastelujoukon E reunat (ja nurkat).
Jos funktio on jatkuva ja derivoituva suljetussa joukossa E, niin mahdolliset ääriarvokohdat löytyvät kohtien 1. ja 2. avulla. Näistä valitaan pienin ja suurin.
Esimerkki 3.12. Etsi funktion f (x, y) = 5x2 + 6y 2 − xy ääriarvot joukossa
E = {(x, y) | x ≥ 0, y ≥ 0, x + 2y ≤ 24}.
3.2.4 Hyötyfunktion maksimi
Kuluttajan oletetaan valitsevan hyödykkeitä siten, että niiden käytöstä saatava
tyytyväisyys maksimoituu.
Oletetaan, että kuluttajan ostot rajoittuvat kahteen hyödykkeeseen Q1 ja Q2 .
Hyötyfunktio on
U = f (q1 , q2 ),
missä q1 ja q2 ovat hyödykkeiden kulutusmäärät.
Siis hyötyfunktio U = f (q1 , q2 ) kuvaa hyödykkeiden kulutusmääristä aiheutuvaa
tyytyväisyyttä.
43
Oletetaan, että hyötyfunktiolla U = f (q1 , q2 ) on jatkuvat 1. ja 2. kertaluvun osittaisderivaatat olemassa. Nämä osittaisderivaatat ovat hyödykkeiden rajahyötyjä.
Tyytyväisyys kasvaa kulutuksen kasvaessa eli
∂U
>0
∂q1
ja
∂U
> 0.
∂q2
Kuluttaja haluaa maksimoida hyötynsä, mutta kulutusta rajoittaa budjettirajoite
y0 = p1 q1 + p2 q2 ,
missä y0 on ostamiseen käytettävissä oleva rahamäärä ja p1 ja p2 ovat hyödykkeiden Q1 ja Q2 yksikköhintoja.
Maksimoidaan siis hyötyfunktio U = f (q1 , q2 ) budjettirajoitteella y0 = p1 q1 +p2 q2 .
Budjettirajoitteesta saadaan
q2 =
y 0 − p1 q1
.
p2
Näin ollen hyötyfunktio
y 0 − p1 q1
U = f q1 ,
p2
on yhden muuttujan q1 funktio.
Maksimoidaan hyötyfunktio U muuttujan q1 suhteen.
Asetetaan ensin
∂U
= 0.
(Etsitään siis KRP)
∂q1
Tämä ehto on välttämätön, muttei riittävä. Toisen derivaatan negatiivisuus takaa
maksimin olemassaolon. Täytyy siis vielä olla
∂ 2U
< 0.
∂q12
Esimerkki 3.13. Maksimoi hyötyfunktio U = q1 q2 , kun p1 = 15, p2 = 5 ja kuluttajan tulot y0 = 150.
Ratkaisu: Budjettirajoite on
15q1 + 5q1 = 150
⇔
5q2 = 150 − 15q1
⇔
q2 = 30 − 3q1
44
ja hyötyfunktio
U = q1 q2 = q1 (30 − 3q1 ) = 30q1 − 3q12 .
Etsitään kriittinen piste:
⇔
Koska
∂U
= 30 − 6q1 = 0
∂q1
6q1 = 30
⇔
q1 = 5
⇒
q2 = 30 − 3q1 = 30 − 15 = 15.
∂ 2U
(q1 = 5) = −6 < 0,
∂q12
niin q1 = 5 on maksimikohta. Vastaava maksimiarvo on
Umax = q1 q2 = 5 · 15 = 75.
45
4
Usean muuttujan funktion ääriarvoista
4.1
Normaali ääriarvo (ei sidottu)
Funktiolla y = f (x1 , . . . , xn ) on pisteessä (a1 , . . . , an ) ∈ Df suurin arvo (absoluuttinen maksimi), jos f (x1 , . . . , xn ) ≤ f (a1 , . . . , an ) kaikilla (x1 , . . . , xn ) ∈ Df .
Vastaavasti funktiolla on pisteessä (a1 , . . . , an ) ∈ Df pienin arvo (absoluuttinen
minimi), jos f (x1 , . . . , xn ) ≥ f (a1 , . . . , an ) kaikilla (x1 , . . . , xn ) ∈ Df .
Piste (a1 , . . . , an ) ∈ Df on funktion f paikallinen maksimikohta, jos
f (x1 , . . . , xn ) ≤ f (a1 , . . . , an ) eräässä pisteen (a1 , . . . , an ) ympäristössä. Tällöin
f (a1 , . . . , an ) on funktion paikallinen maksimiarvo. Vastaavasti (a1 , . . . , an ) ∈ Df
on funktion f paikallinen minimikohta ja f (a1 , . . . , an ) paikallinen minimiarvo,
jos f (x1 , . . . , xn ) ≥ f (a1 , . . . , an ) eräässä pisteen (a1 , . . . , an ) ympäristössä.
4.1.1 Usean muuttujan funktion ääriarvokohta
Lause 4.1 (KRP:n etsiminen). Olkoon funktio f jatkuva ja derivoituva. Jos funktiolla on paikallinen ääriarvo pisteessä (a1 , . . . , an ), niin
∂f
(a1 , . . . , an ) = 0,
∂x1
∂f
(a1 , . . . , an ) = 0,
∂x2
...
∂f
(a1 , . . . , an ) = 0.
∂xn
Mahdolliset paikalliset ääriarvokohdat saadaan siis ratkaisemalla yhtälöryhmä
 ∂f

=0

∂x1


 ∂f = 0
∂x2

...



 ∂f
∂xn
= 0.
Huomautus. KRP, joka ei ole ääriarvokohta, on satulapiste.
Esimerkki 4.1. Määrää kriittiset pisteet funktiolle f (x1 , . . . , xn ) = x21 + . . . + x2n .
46
4.1.2 Usean muuttujan funktion ääriarvon laatu
Olkoon y = f (X̄) = f (x1 , . . . , xn ), eli f on n muuttujan funktio.
Funktion f Hessin matriisi muodostetaan seuraavasti:


f11 f12 · · · f1n
 f21 f22 · · · f2n 
∂
∂f


H = fxx =  .
, missä fij =
.
.. . .
.. 
∂xj ∂xi
 ..
.
.
. 
fn1 fn2 · · · fnn n×n
Olkoon


a11 · · · a1n

.. 
...
A =  ...
.
. 
an1 · · · ann n×n
Matriisi A on positiividefiniitti, jos sen alideterminantit
a11 a12 a13 A1 = a11 , A2 = a11 a12 , A3 = a21 a22 a23 , . . .
a21 a22 a
31 a32 a33
An = A ovat kaikki positiivia.
Vastaavasti matriisi A on negatiividefiniitti, jos
A1 < 0 , A2 > 0 , A3 < 0 ,
eli
...
(−1)i |Ai | > 0 .
Lause 4.2. Olkoon löydetty kriittinen piste X̄0 = (a1 , a2 , . . . , an ) ja H = H(X̄0 )
funktion f (X̄) Hessin matriisi kriittisessä pisteessä X̄0 . Tällöin
1) Kriittinen piste X̄0 on funktion f (X̄) paikallinen maksimikohta, jos funktion f (X̄) Hessin matriisin alideterminanteille Hi (X̄0 ) pätee
(−1)i |Hi (X̄0 )| > 0
kaikilla i = 1, . . . , n eli Hessin matriisi H on negatiividefiniitti.
47
2) Kriittinen piste X̄0 on funktion f (X̄) paikallinen minimikohta, jos funktion
f (X̄) Hessin matriisin alideterminanteille Hi (X̄0 ) pätee
|Hi (X̄0 )| > 0
kaikilla i = 1, . . . , n eli Hessin matriisi H on positiividefiniitti.
3) Kriittinen piste X̄0 ei ole paikallinen ääriarvokohta, jos
|Hi (X̄0 )| =
6 0
kaikilla i = 1, . . . , n, mutta 1) tai 2) ei toteudu.
4) Jos |Hi (X̄0 )| = 0 jollakin i = 1, . . . , n, niin testi ei kerro mitään, joten
tutki tarkemmin.
Esimerkki 4.2. Etsi paikalliset ääriarvot funktiolle f (x, y) = x2 y + y 3 − y.
4.2
Sidotut ääriarvot
4.2.1 n muuttujan ja m yhtälörajoitteen tapaus, missä m < n
Maksimoi (vast. minimoi) funktio f (x1 , . . . , xn ) ehdoilla gi (x1 , . . . , xn ) = 0, missä
i = 1, . . . , m.
Lagrange–funktio:
L(x1 , . . . , xn , λ1 , . . . , λm ) = f (x1 , . . . , xn ) −
m
X
λj gj (x1 , . . . , xn ),
j=1
missä λj :t ovat Lagrange-kertoimia.
1o Ääriarvon mahdollinen olemassaolo: (KRP)
(
∂L
∂xi
∂L
∂λj
=0
=0
eli
(
Lxi = 0 , kaikilla i = 1, . . . , n
gj = 0
, kaikilla j = 1, . . . , m.
Näin saadaan mahdollinen paikallinen ääriarvokohta X̄0 .
2o Ääriarvon olemassaolo ja laatu:
48
Määritellään laajennettu Hessin matriisi

∂g1
∂g1
···
0 ···
0
∂x1
∂xn
 .
..
..
..
..
..
 ..
.
.
.
.
.

∂gm
∂gm
 0 ···
0
···

∂x1
∂xn

H̄ = 
 ∂g1
m
 ∂x1 · · · ∂g
Lx1 x1 · · · Lx1 xn
∂x1
 .
..
..
..
...
 .
...
.
.
.
 .
∂gm
∂g1
·
·
·
Lxn x1 · · · Lxn xn
∂xn
∂xn
0̄m×m Jm×n
=
.
T
Jn×m
Hn×n (n+m)×(n+m)













(m+n)×(m+n)
Laajennetun Hessin matriisin tarvittavat alideterminantit |H̄i | ovat
|H̄i (X̄0 )| = 0
..
.
0
∂g1
∂x1
..
.
∂g1
∂xi
···
..
.
···
0
..
.
∂g1
∂x1
···
...
∂g1
∂xi
0
∂gm
∂x1
···
∂gm
∂xi
···
..
.
···
∂gm
∂x1
..
.
∂gm
∂xi
..
.
..
.
L x1 x1 · · · L x1 xi
..
..
...
.
.
Lxi x1 · · · Lxi xi
,
missä i = m + 1, . . . , n.
Eli |H̄i | on ”vasemmasta yläkulmasta” i:nteen muuttujaan asti otettu alideterminantti. Siis nollamatriisin lisäksi otetaan mukaan i kappaletta pysty- ja vaakarivejä.
Nyt ääriarvon laatu mahdollisessa paikallisessa ääriarvokohdassa X̄0 määräytyy
seuraavasti:
1) Jos (−1)i |H̄i | > 0, kaikilla i = m + 1, . . . , n, niin KRP on paikallinen
sidottu maksimikohta.
2) Jos (−1)m |H̄i | > 0, kaikilla i = m + 1, . . . , n, niin KRP on paikallinen
sidottu minimikohta.
3) Jos kumpikaan ei toteudu, testi ei kerro mitään, joten tutki tarkemmin.
49
Esimerkki 4.3. Määritä funktion f (x, y, z) = −x2 − 7y − 10z − 3 paikalliset ääriarvot ehdoilla x + y + z = 0 ja x + 2y + 3z = 0.
3o Lagrangen kertoimen tulkinta:
Tehtävä alunperin muotoa:
Maximoi/minimoi funktio f (X̄) ehdoilla gj (X̄) = bj , missä
X̄ = (x1 , . . . , xn ) ja j = 1, . . . , m.
Voidaan osoittaa, että optimikohdassa X̄
λj =
∂f (X̄)
.
∂bj
Eli kerroin λj osoittaa kuinka paljon optimiarvo muuttuu, jos alkuperäisen tehtävän rajoitetta gj muutetaan.
Eli jos rajoitteessa oleva vakio bj muuttuu yhden yksikön, niin optimiarvo muuttuu λj yksikköä.
Usein bj kuvaa jonkin resurssin määrää (työt, luonnonvarat), jolloin λj ilmoittaa
resurssin varjohinnan. Eli paljonko kannattaa maksaa, jos saa yhden yksikön lisää
resurssia?
Esimerkki 4.4. Anna arvio funktion f (x, y) = 5x2 + 6y 2 − xy ääriarvoille ehdolla
x + 2y = 25.
Esimerkki 4.5. Anna arvio funktion f (x, y) = 5x2 + 6y 2 − xy ääriarvoille ehdolla
x + 2y = 23.
P
Huomautus. Ehtojen kertoimien on oltava positiivisia ja L = f − λj gj .
4.2.2 n muuttujan ja yhden epäyhtälörajoitteen tapaus
Ääriarvot funktiolle f (x1 , . . . , xn ) ehdolla g(x1 , . . . , xn ) ≤ 0.
Menetelmä on seuraava:
1) Ääriarvotetaan funktio f (x1 , . . . , xn ) ilman epäyhtälöehtoa
g(x1 , . . . , xn ) ≤ 0.
Mahdollinen paikallinen ääriarvokohta X̄0 löytyy siis funktion f (X̄) osittaisderivaattojen nollakohtana.
Suoritetaan normaali laatutarkastelu kriittiselle pisteelle X̄0 Hessin matriisin avulla.
50
Jos kriittinen piste toteuttaa ehdon g(x1 , . . . , xn ) ≤ 0, niin se on myös
epäyhtälöehdon mukainen sidottu paikallinen ääriarvokohta.
(Ääriarvokohta löytyy siis ehtoalueen sisältä, g(x1 , . . . , xn ) ≤ 0.)
2) Tarkastellaan epäyhtälörajoitteen g(x1 , . . . , xn ) ≤ 0 sijaan yhtälörajoitetta
g(x1 , . . . , xn ) = 0.
Ratkaistaan kuten normaali sidottu ääriarvotehtävä, missä Lagrange-funktio on nyt muotoa
L(x1 , . . . , xn , λ) = f (x1 , . . . , xn ) − λg(x1 , . . . , xn ).
Olkoon ratkaisuna saatu kriittinen piste X̄0 .
Suoritetaan Lagrangen mukainen laatutarkastelu kriittiselle pisteelle X̄0
laajennetun Hessin matriisin avulla.
(Ääriarvokohta löytyy siis ehtoalueen reunalta, g(x1 , . . . , xn ) = 0.)
3) Kohtiin 1) ja 2) perustuva päättely.
Esimerkki 4.6. Maksimoi/minimoi f (x, y) = 5x2 + 6y 2 − xy ehdolla x + 2y ≤ 24.
Esimerkki 4.7. Maksimoi/minimoi f (x, y) = 5x2 + 6y 2 − xy ehdolla x + 2y ≥ 24.
51
5
Lineaarinen optimointi
Tehtävä: Maksimoi/minimoi kohdefunktio
z = f (x1 , x2 , . . . , xn ) = c1 x1 + c2 x2 + . . . + cn xn + c0
(Lineaarinen!!!)
rajoitteilla


a11 x1 + a12 x2 + . . . + a1n xn ≥ b1 (Lineaariset!!!)






a21 x1 + a22 x2 + . . . + a2n xn ≤ b2
..
.



am1 x1 + am2 x2 + . . . + amn xn ≤ bm




xj ≥ 0 ∀ j = 1, . . . , n .
5.1
Geometrinen ratkaisu
Kahden päämuuttujan tapaus:
Max/min f (x1 , x2 ) = c1 x1 + c2 x2 + c0 rajoitteilla


a11 x1 + a12 x2 ≥ b1






a21 x1 + a22 x2 ≤ b2
..
.





am1 x1 + am2 x2 ≤ bm


x1 , x2 ≥ 0, ei pakollinen.
Muodostetaan ratkaisumonikulmio eli etsitään ehtoalue, jossa rajoitteet toteutuvat.
Lause 5.1. Jos ratkaisumonikulmio on suljettu, niin optimointitehtävän yksikäsitteinen ratkaisu löytyy ratkaisumonikulmion kärjistä. Jos ratkaisuja on useita,
niin ainakin kaksi niistä löytyy ratkaisumonikulmion kärkipisteistä. Jos ratkaisumonikulmio on avoin alue, tutki tarkemmin.
Esimerkki 5.1. Max/min f (x1 , x2 ) = 2x1 + 10x2 rajoitteilla



2x1 + x2 ≤ 6
5x1 + 4x2 ≥ 20


x , x ≥ 0 .
1
2
52
Huomautus. Ratkaisumonikulmio ei välttämättä ole suljettu rajoitteilla. Esimerkiksi:
(
(
2x1 + x2 ≤ 6
2x1 + x2 ≥ 6
5x1 + 4x2 ≥ 40
5x1 + 4x2 ≥ 40
Esimerkki 5.2. Min/max f (x, y) = 2x + 10y rajoitteilla



2x + y ≥ 6
5x + 4y ≥ 20


x, y ≥ 0 .
Esimerkki 5.3. Min/max f (x, y) = −2x + 10y rajoitteilla



2x + y ≥ 6
5x + 4y ≥ 20


x, y ≥ 0 .
53
5.2
Kantaratkaisu–menetelmä
Tehtävä: Maksimoi/minimoi kohdefunktio
z = f (x1 , x2 , . . . , xn ) = c1 x1 + c2 x2 + . . . + cn xn + c0
rajoitteilla


a11 x1 + a12 x2 + . . . + a1n xn ≤ b1






a21 x1 + a22 x2 + . . . + a2n xn ≥ b2
..
.




am1 x1 + am2 x2 + . . . + amn xn ≤ bm




xj ≥ 0 ∀ j = 1, . . . , n.
Rajoite-epäyhtälöt muutetaan lisämuuttujien (xn+1 , . . . , xn+m ) avulla yhtälöiksi:


a11 x1 + a12 x2 + . . . + a1n xn + xn+1 = b1





a21 x1 + a22 x2 + . . . + a2n xn − xn+2 = b2
..
.




am1 x1 + am2 x2 + . . . + amn xn + xn+m = bm




xj ≥ 0 ∀ j = 1, . . . , n + m.
Kantaratkaisu on eo. yhtälöryhmän sellainen ratkaisu, jossa tuntemattomista
x1 , . . . , xn+m on n kappaletta nollia ja lisäksi positiivisuusehtoa ei huomioida.
Kantamuuttujat ovat ne m muuttujaa, joita ei aseteta nolliksi.
Hyväksyttävä kantaratkaisu on kantaratkaisu, joka toteuttaa myös positiivisuusehdon.
Optimaalinen kantaratkaisu on hyväksyttävä kantaratkaisu, joka antaa kohdefunktion optimiarvon.
Lause 5.2. Jos kohdefunktiolla on äärellinen optimi, niin ainakin yksi optimaalinen ratkaisu löytyy hyväksyttävänä kantaratkaisuna.
Optimointi:
1) haetaan kantaratkaisut
2) valitaan hyväksyttävät kantaratkaisut
3) lasketaan funktion arvot kohdan 2) pisteissä
54
4) valitaan näistä haettu optimiarvo.
Esimerkki 5.4. Min/max f (x1 , x2 ) = 2x1 + 10x2 rajoitteilla



2x1 + x2 ≤ 6
5x1 + 4x2 ≥ 20


x , x ≥ 0 .
1
2
.
Huomautus. Kantaratkaisu–menetelmä ei toimi avoimessa alueessa. Pienellä varovaisuudella kylläkin.
5.3
SIMPLEX–menetelmä
Tehtävä. Maksimoi/minimoi kohdefunktio
z = f (X̄) = c1 x1 + c2 x2 + . . . + cn xn
rajoitteilla


a11 x1 + a12 x2 + . . . + a1n xn ≤ b1





a21 x1 + a22 x2 + . . . + a2n xn ≥ b2
..
.




am1 x1 + am2 x2 + . . . + amn xn ≤ bm




xj ≥ 0 ∀ j = 1, . . . , n.
Rajoite-epäyhtälöt muutetaan lisämuuttujien avulla yhtälöiksi:
Esimerkiksi rajat
(
a11 x1 + a12 x2 + . . . + a1n xn ≤ b1
⇒
a21 x1 + a22 x2 + . . . + a2n xn ≥ b2
(
a11 x1 + a12 x2 + . . . + a1n xn + xn+1 = b1
a21 x1 + a22 x2 + . . . + a2n xn − xn+2 + xn+3 = b2 .
Lisämuuttujat:
xn+1 ei kohdefunktioon, kylläkin arvotaulukkoon.
55
xn+3 kohdefuntioon ja arvotaulukkoon.
(
minimointi
⇒ M xn+3
M suuri positiivinen luku.
maksimointi ⇒ −M xn+3 ,
xn+2 ei kohdefunktioon eikä arvotaulukkoon lisämuuttujana.
Esimerkki 5.5. Minimoi z = f (x1 , x2 ) = 2x1 + 10x2 rajoitteilla



2x1 + x2 ≤ 6
5x1 + 4x2 ≥ 20


x , x ≥ 0 .
1
2
Rajoite-epäyhtälöt muutetaan lisämuuttujien avulla yhtälöiksi:



2x1 + x2 + x3 = 6
5x1 + 4x2 − x4 + x5 = 20


x , x , x , x ≥ 0 .
1
2
3
4
⇒ minimoi z = f (x1 , x2 ) = 2x1 + 10x2 + M x5 edellä olleilla rajoitteilla.
Muodostetaan arvotaulukko seuraavasti:
cj
2
10
0
0
M
cj
lisämuuttujat
arvot
x1
x2
x3
x4
x5
0
M
x3
x5
zj
cj − zj
6
20
20M
2
5
5M
2 − 5M
1
4
4M
10 − 4M
1
0
0
0
0
−1
−M
M
0
1
M
0
(Kun x3 = 6 ja x5 = 20, niin x1 = x2 = 0 ⇒ z = 20M )
zj :n arvot saadaan laskemalla lisämuuttujien arvoiksi sarakkeen luvut ja kertoimiksi c3 ja c5 .
cj − zj edustaa lisäystä funktion arvoon, joka saavutetaan muuttujan j yhden
yksikön lisäyksellä (ko. arvoista).
Optimaalisuuden tarkistus:
Maksimointitehtävä:
56
Jos rivin cj −zj kaikki arvot ovat negatiivisia (≤ 0), niin tulosta ei voida parantaa
ja on löydetty maksimikohta.
Minimointitehtävä:
Jos rivin cj − zj kaikki arvot ovat positiivisia (≥ 0), niin tulosta ei voida parantaa
ja on siten löydetty minimikohta.
Nyt 2 − 5M < 0 ja 10 − 4M < 0 ⇒ ei minimikohta.
Korvaavan ja väistyvän muuttujan valinta:
Suurin parannus eli tässä tapauksessa pienennys funktion arvoon saadaan muuttujan x1 lisäyksestä
(2 − 5M < 10 − 4M, M suuri positiivinen luku)
⇒ x1 korvaava muuttuja ja x1 :n sarake optimisarake.
Jaetaan lisämuuttujien arvot vastaavilla optimisarakkeen arvoilla:
x3 :
6
=3
2
x5 :
20
=4
5
Se, jolla on pienempi positiivinen arvo, valitaan väistyväksi muuttujaksi.
⇒ x3 väistyvä muuttuja
Muodostetaan uusi arvotaulu:
Korvaavan muuttujan x1 rivi saadaan väistyvän muuttujan x3 rivin alkioista jakamalla ne optimisarakkeen x1 muuttujan x3 arvolla.
cj
2
10
0
0
M
cj
lisämuuttujat
arvot
x1
x2
x3
x4
x5
2
M
x1
x5
3
20
1
5
1
2
1
2
4
0
0
−1
0
1
Muut rivit:

 
 
 

uuden
vanhan
vanhan rivin
vastaava
 rivin  =  rivin  − alkio optimi- · alkio korvaa-
alkio
alkio
sarakkeessa
valla rivillä
57
cj
2
10
0
0
M
x2
x3
x4
x5
1
2
0
−1
−M
M
0
1
M
0
cj
lisämuuttujat
arvot
x1
2
M
x1
x5
zj
cj − zj
3
5
6 + 5M
1
0
2
0
1
9
1
2
3
2
+ 32 M
− 32 M
− 52
1 − 52 M
−1 + 25 M
Ei minimiratkaisu, sillä 9 − 32 M < 0.
Nyt x2 on korvaava muuttuja ja x2 :n sarake on optimisarake.
Lisäksi
x1 :
3
1
2
5
= 6 ja x5 :
3
2
=
10
3
⇒ x5 väistyvä muuttuja
Muodostetaan uusi arvotaulu:
cj
2
10
0
0
M
cj
lisämuuttujat
arvot
x1
x2
x3
x4
x5
2
10
x1
x2
3
1
0
1
2
1
2
0
− 23
0
10
3
cj
2
3
10
0
0
M
x3
x4
x5
= 43
− 53
−42
= −14
3
14
1
3
− 13
lisämuuttujat
arvot
x1
x2
2
10
x1
x2
zj
cj − zj
4
3
10
3
1
0
2
0
0
1
10
0
= 36
1
2
cj
108
3
− 35
8
6
− 23
−18
= −6
3
6
18
3
2
3
=6
M −6
Tämä on minimiratkaisu, sillä 14 > 0, 6 > 0 ja M − 6 > 0.
Siis minimiratkaisu on x1 =
4
3
ja x1 =
10
,
3
jolloin minimiarvo on 36.
58
Esimerkki 5.6. Maksimoi z = f (x1 , x2 ) = 2x1 + 10x2 rajoitteilla



2x1 + x2 ≤ 6
5x1 + 4x2 ≥ 20


x , x ≥ 0 .
1
2
Muutetaan epäyhtälörajoitteet yhtälöiksi:



2x1 + x2 + x3 = 6
5x1 + 4x2 − x4 + x5 = 20


x , x , x , x ≥ 0 .
1
2
3
4
⇒ maksimoi z = f (x1 , x2 ) = 2x1 + 10x2 − M x5 edellä olleilla rajoitteilla.
Muodostetaan arvotaulukko seuraavasti:
cj
2
10
0
0
−M
cj
lisämuuttujat
arvot
x1
x2
x3
x4
x5
0
−M
x3
x5
zj
cj − zj
6
20
−20M
2
5
−5M
2 + 5M
1
4
−4M
10 + 4M
1
0
0
0
0
−1
M
−M
0
1
−M
0
(Kun x3 = 6 ja x5 = 20, niin x1 = x2 = 0 ⇒ z = −20M )
Optimaalisuuden tarkistus:
Nyt 2 + 5M > 0 ja 10 + 4M > 0 ⇒ ei maksimikohta.
Korvaavan ja väistyvän muuttujan valinta:
Suurin parannus funktion arvoon saadaan muuttujan x1 lisäyksestä
(2 + 5M > 10 + 4M,
M suuri positiivinen luku)
⇒ x1 korvaava muuttuja ja x1 :n sarake optimisarake.
Jaetaan lisämuuttujien arvot vastaavilla optimisarakkeen arvoilla:
x3 :
6
=3
2
x5 :
20
=4
5
59
Se, jolla on pienempi positiivinen arvo, valitaan väistyväksi muuttujaksi.
⇒ x3 väistyvä muuttuja
Muodostetaan uusi arvotaulu:
Korvaavan muuttujan x1 rivi saadaan väistyvän muuttujan x3 rivin alkioista jakamalla ne optimisarakkeen x1 muuttujan x3 arvolla.
cj
2
10
0
0
−M
cj
lisämuuttujat
arvot
x1
x2
x3
x4
x5
2
−M
x1
x5
3
20
1
5
1
2
1
2
4
0
0
−1
0
1
cj
2
10
0
0
−M
x2
x3
x4
x5
1
2
0
−1
M
−M
0
1
−M
0
cj
lisämuuttujat
arvot
x1
2
−M
x1
x5
zj
cj − zj
3
5
6 − 5M
1
0
2
0
1
9
1
2
3
2
− 32 M
+ 32 M
− 52
1 + 25 M
−1 − 52 M
Ei maksimiratkaisu, sillä 9 + 32 M > 0.
Nyt x2 on korvaava muuttuja ja x2 :n sarake optimisarake.
Lisäksi
x1 :
3
1
2
= 6 ja x5 :
5
3
2
=
10
3
⇒ x5 väistyvä muuttuja
Muodostetaan uusi arvotaulu:
cj
2
10
0
0
−M
cj
lisämuuttujat
arvot
x1
x2
x3
x4
x5
2
10
x1
x2
3
1
0
1
2
1
2
0
− 32
0
10
3
1
− 53
2
3
60
cj
2
10
0
0
−M
x2
x3
x4
x5
4
1
0
3
3
1 − 53 − 32
10 −14 −6
0
14
6
− 13
cj
lisämuuttujat
arvot
x1
2
10
x1
x2
zj
cj − zj
4
3
10
3
1
0
2
0
36
2
3
6
−M − 6
Tämä ei ole maksimiratkaisu, sillä 14 > 0 ja 6 > 0. Koska 14 > 6, niin x3 on
korvaaja muuttuja ja x3 :n sarake on optimisarake. Lisäksi
4
3
4
3
x1 :
10
3
−5
3
= 1 ja x2 :
= −2
⇒ x1 väistyvä muuttuja
Muodostetaan uusi arvotaulu:
cj
2
10
0
0
−M
cj
lisämuuttujat
arvot
x1
x2
x3
x4
x5
0
10
x3
x2
1
3
4
0
1
1
− 53
1
4
− 14
10
3
0
cj
− 32
2
3
2
10
0
0
−M
cj
lisämuuttujat
arvot
x1
x2
x3
x4
x5
0
10
x3
x2
zj
cj − zj
1
5
50
3
4
5
4
50
4
− 42
4
0
1
10
0
1
0
0
0
1
4
− 41
Ei maksimiratkaisu, sillä
optimisarake. Lisäksi
10
4
x3 :
− 14
− 10
4
10
4
1
4
10
4
−M −
10
4
> 0. Nyt x4 on korvaava muuttuja ja x4 :n sarake
1
1
4
= 4 ja x2 :
5
= −20
− 41
⇒ x3 väistyvä muuttuja
61
Muodostetaan uusi arvotaulu:
cj
2
10
0
0
−M
cj
lisämuuttujat
arvot
x1
x2
x3
x4
x5
0
10
x4
x2
4
5
3
0
1
4
0
1
− 14
−1
5
4
cj
1
4
2
10
0
0
−M
x2
x3
x4
x5
1
0
0
0
−1
0
0
−M
cj
lisämuuttujat
arvot
x1
0
10
x4
x2
zj
cj − zj
4
6
60
3
2
20
−18
0
4
1
1
10 10
0 −10
Selvästi kyseessä on maksimiratkaisu. Nyt
(
x2 = 6
x4 = 4
⇒
5x1 + 4 · 6 − 4 + x5 = 20
⇒
x1 = x5 = 0
Optimikohta on siis x1 = 0, x2 = 6.
z = 2 · 0 + 10 · 6 − M · 0 = 60.
62