Konvexa mängder och funktioner

Den 17 juli 1991
Konvexa m¨angder och funktioner
Christer Kiselman
Inneh˚
all:
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
Inledning
Konvexa h¨
oljet av en m¨
angd
Separerande hyperplan
St¨
odjande halvrum och st¨
odjande hyperplan
Extremalpunkter
Carath´eodorys sats
Den utvidgade reella axeln
Konvexa funktioner
Fencheltransformationen
Dualitet
St¨
odfunktionen
Spelteori och line¨
ar programmering
Litteratur
1. Inledning
Avsikten med dessa anteckningar ¨
ar att komplettera Lars-˚
Ake Lindahls och Christer
Borells bok Linj¨
ar och konvex optimering vad g¨
aller konvexa m¨
angder och funktioner,
speciellt betr¨
affande separationssatser och begreppet extremalpunkt. Separationssatserna leder till ett studium av dualitet i konvexitetsteorin, som uttrycks med hj¨
alp
av Fencheltransformationen och st¨
odfunktionen.
2. Konvexa h¨
oljet av en m¨angd
Tv˚
a punkter a och b i Rn definierar ett segment
[a, b] = {(1 − t)a + tb; 0 6 t 6 1} ⊂ Rn .
Detta ¨
ar en delm¨
angd av hela linjen {(1 − t)a + tb; t ∈ R}. Om a = b s˚
a blir b˚
ade
n
segmentet och linjen bara en punkt f¨
orst˚
as. En m¨angd A i R kallas konvex om
den inneh˚
aller hela segmentet [a, b] s˚
a fort den inneh˚
aller a och b. En m¨
angd kallas
f¨
or ett affint delrum om den med a och b inneh˚
aller hela linjen genom a och b.
Vi kallar K ⊂ Rn f¨
or en kon om f¨
or det f¨
orsta 0 ∈ K, f¨
or det andra tx tillh¨
or
K s˚
a fort x ∈ K och t ¨
ar ett positivt tal. En kon K blir d˚
a konvex precis n¨
ar den
inneh˚
aller varje punkt sa + tb f¨
or alla a, b ∈ K och alla s, t > 0. Slutligen kallar vi A
n
f¨
or ett line¨
art delrum av R om det ¨
ar s˚
a att 0 ∈ A och A inneh˚
aller sa + tb f¨or
varje a, b ∈ A och varje s, t ∈ R. Vi kan allts˚
a sammanfatta alla kraven under den
gemensamma implikationen
a, b ∈ A ⇒ sa + tb ∈ A,
men med olika villkor p˚
a s, t: f¨
or konvexa m¨angder s > 0, t > 0 och s + t = 1;
f¨
or affina delrum s, t ∈ R och s + t = 1; f¨
or koner s > 0, t = 0; f¨
or konvexa
1
koner s, t > 0; f¨
or line¨
ara rum s, t ∈ R. Dessutom har vi olika krav vad g¨
aller den
tomma m¨
angden: tydligen ¨
ar Ø den minsta konvexa m¨angden och det minsta affina
delrummet; medan {0} ¨
ar den minsta konen, den minsta konvexa konen och det
minsta line¨
ara delrummet. (H¨
ar finns det naturligtvis ett visst godtycke: vi skulle
kunna kr¨ava att en konvex m¨angd ¨
ar icke-tom; vi skulle kunna acceptera Ø som ett
line¨
art delrum. Men det ¨
ar ¨
onskv¨
art att fastl¨
agga en viss konvention, och den vi gjort
verkar att fungera bra.)
Vi har nu implikationerna:
konvex m¨angd
⇐
⇑
kon
⇐
affint delrum
⇑
konvex kon
⇐
line¨
art delrum
Snittet av en familj av konvexa m¨
angder ¨
ar konvext. Det ¨
ar l¨
att att se. Vi
definierar det konvexa h¨
oljet av en godtycklig m¨angd X som snittet av alla konvexa
m¨
angder som inneh˚
aller X. Det betecknas cvx X, allts˚
a
\
cvx X = (A; A konvex och A ⊃ X).
Det ¨
ar d˚
a klart att cvx X ¨
ar en konvex m¨angd, och dessutom den minsta konvexa
m¨
angd som inneh˚
aller X. P˚
a samma s¨
att kan vi definiera h¨
oljen i flera andra fall.
S˚
a fort vi har en familj F av m¨angder s˚
a kan vi ju s¨
atta
\
(2.1)
h(X) = (A; A ∈ F och A ⊃ X).
Vi kallar h(X) f¨
or F-h¨
oljet av X. Det visar sig d˚
a att denna operation h alltid har
f¨
oljande tre egenskaper:
1. X ⊂ h(X) (h ¨
ar st¨
orre ¨
an identiteten);
2. X ⊂ Y medf¨
or h(X) ⊂ h(Y ) (h ¨
ar v¨
axande);
3. h(h(X)) = h(X) (h ¨
ar idempotent).
Vi kan definiera till exempel det affina h¨
oljet till X p˚
a detta s¨att: det ¨
ar det
minsta affina delrum som inneh˚
aller X. P˚
a samma s¨att kan vi definiera det slutna
h¨
oljet: d˚
a tar vi F som m¨
angden av alla slutna m¨
angder; det handlar h¨
ar om topologi
och inte om geometri, men de tre egenskaperna hos h¨
oljesoperationen ¨
ar desamma.
En intressant geometrisk h¨
oljesoperation f˚
ar man om man tar F som m¨
angden av
alla slutna halvrum (se avsnitt 3). D˚
a blir h¨
oljet av en m¨
angd snittet av alla slutna
halvrum som inneh˚
aller den. Vi skall visa att detta snitt ¨
ar det slutna konvexa h¨
oljet.
S˚
aledes kan tv˚
a olika familjer F definiera samma operation.
Beskrivningen av ett h¨
olje som ett o¨
andligt snitt ger enkelt vissa egenskaper
hos operationen, men ¨
ar inte s¨arskilt geometrisk: vi ¨
onskar d¨
arf¨
or en mer anv¨
andbar
representation. F¨
oljande sats ger en s˚
adan.
Sats 2.1. L˚
at X vara en delm¨
angd av Rn . De olika h¨
oljena vi inf¨
ort kan beskrivas
p˚
a f¨
oljande s¨
att med hj¨
alp av line¨
arkombinationer
(2.2)
N
X
λj xj
j=1
2
d¨
ar λj ∈ R och xj ∈ X:
1. Det konvexa h¨
oljet ¨
ar lika med m¨
angden av alla line¨
arkombinationer (2.2) d¨
ar
P
N ¨
ar ett heltal > 1, λj > 0 och
λj = 1. (S˚
adana line¨
arkombinationer kallas
konvexa.)
2. P
Det affina h¨
oljet ¨
ar motsvarande m¨
angd men med kravet N > 1, λj ∈ R och
λj = 1. (De kallas affina line¨
arkombinationer.)
3. Det koniska h¨
oljet (konen som sp¨
anns av X) f˚
as om N > 0, λ1 > 0 och λj = 0
d˚
a j > 2.
4. Det koniskt konvexa h¨
oljet f˚
ar man om N > 0 och λj > 0.
5. Det line¨
ara h¨
oljet av X ¨
ar lika med m¨
angden av alla line¨
arkombinationer (2.2)
d¨
ar N ¨
ar ett heltal > 0, λj ∈ R.
Bevis. Notera f¨
orst skillnaden i kraven p˚
a N . Om vi alltid kr¨
aver att N skall vara
minst 1, s˚
a blir h(Ø) = Ø; s˚
a har vi gjort f¨
or de affina och konvexa h¨
oljena. Men
om vi d¨
aremot till˚
ater N = 0 i summan av alla line¨
arkombinationer (2.2) s˚
a kommer
h(Ø) att bli {0}; detta g¨
aller f¨
or de koniska, koniskt konvexa och line¨
ara h¨
oljena.
P0 P
Anledningen ¨
ar att 1 = Ø = 0 kan bildas om vi till˚
ater N = 0, men inte om vi
kr¨
aver N > 1 och X ¨
ar tom.
Vi g¨
or endast beviset f¨
or det konvexa h¨
oljet; de andra fallen ¨
ar likadana (eller
annu enklare). S¨
¨
att A lika med m¨angden av alla konvexa line¨
arkombinationer av
punkter i X. Tydligen omfattar A m¨
angden X: tag N = 1 och λ1 = 1. Vidare ¨
ar A
konvex, ty om vi har tv˚
a punkter a och b i A s˚
a finns framst¨
allningar
a=
N
X
λj xj ;
M
X
b=
1
µj yj
1
f¨
or n˚
agra punkter xj och yj i X. F¨
or att visa att A ¨
ar konvex skall vi visa att en
punkt c = (1 − t)a + tb tillh¨
or A. Detta f¨
oljer av att vi kan skriva
c = (1 − t)a + tb =
N
X
(1 − t)λj xj +
1
M
X
tµj yj =
1
NX
+M
νj zj ,
1
d¨
ar vi inf¨
ort zj = xj och νj = (1 − t)λj f¨
or j = 1, ..., N , medan zj = yj−N och
νj = tµj−N f¨
or j = N + 1, ..., N + M . Man kontrollerar att
X
νj = (1 − t)
X
λj + t
X
µj = (1 − t) + t = 1.
Det betyder att A ¨
ar konvex, och d¨
arf¨
or att A ⊃ cvx X.
Omv¨
ant skall vi visa att A ⊂ cvx X. Det f¨
oljer om vi kan visa att varje konvex
m¨
angd Y som omfattar
X ocks˚
a omfattar A. Vi skall allts˚
a visa att varje konvex
P
line¨
arkombination λj xj tillh¨
or Y om xj ∈ X. F¨
or N = 1 ¨
ar det klart; f¨
or N = 2 ¨ar
det definitionenP
p˚
a konvexitet. Antag nu att N > 3 och att vi redan visat resultatet
N −1
f¨
or N − 1. Om 1
λj 6= 0 s˚
a kan vi skriva
N
X
1
λj xj =
N
−1
X
1
λj xj + λN xN =
−1
NX
1
3
λk
−1
NX
1
λj
PN −1
1
λk
xj + λN xN
= (1 − λN )
N
−1
X
µj xj + λN xN = (1 − λN )y + λN xN .
1
PN −1
P
H¨
ar ¨
ar
µj = 1 s˚
a y =
µj xj ∈ Y enligt induktionsantagandet. Och s˚
a
1
till¨
ampar vi resultatet f¨
or N = 2 och f˚
ar att (1 − λN )y + λN xN ∈ Y . Om ˚
a andra
PN −1
PN
sidan 1
λj = 0 s˚
a¨
ar 1 λj xj = xN ∈ Y . Detta avslutar beviset.
I beviset ser det ut som om talet N v¨
axer obegr¨
ansat: om a kan representeras
med N punkter, och b med M , s˚
a kan den mellanliggande punkten c representeras
med N + M punkter. Men kanske ¨
ar talet N + M on¨
odigt stort, kanske kan man
reducera p˚
a n˚
agot s¨att. En intressant fr˚
aga ¨
ar d¨
arf¨
or om det g˚
ar att begr¨ansa antalet
N . Fr˚
agan ¨
ar viktig bland annat av det sk¨alet att vi vill ha slutna konvexa m¨angder.
L˚
at K vara en kompakt m¨
angd och fixera ett tal N . D˚
a¨
ar det klart att m¨
angden
KN =
X
N
λj xj ; λj > 0,
j=1
X
λj = 1 och xj ∈ K
¨r kompakt. Den ¨
a
ar n¨
amligen bilden av n˚
agon kompakt m¨
angd under en kontinuerlig
avbildning. Och det konvexa h¨
oljet av K ¨
ar ju som vi sett unionen av alla KN d˚
a
N = 1, 2, 3, ... . En uppr¨
aknelig union av kompakter ¨
ar emellertid inte alltid kompakt.
Det ¨ar d˚
a intressant att veta att f¨
oljden (KN ) ¨
ar station¨
ar, dvs. att det finns ett tal
m s˚
adant att unionen ¨
ar lika med Km . I sj¨
alva verket kan man ta m = n + 1, d¨
ar n
ar dimensionen i rummet. L˚
¨
at oss emellertid redan nu notera att om X ¨
ar en ¨
andlig
m¨angd s˚
a blir cvx X kompakt: d˚
a r¨
acker det att ta N lika med antalet element i X.
Detta visar f¨
orsta delen av f¨
oljande sats.
Sats 2.2. Det konvexa h¨
oljet av en ¨
andlig m¨
angd ¨
ar kompakt. Det koniskt konvexa
h¨
oljet av en ¨
andlig m¨
angd ¨
ar slutet.
Notera att det koniskt konvexa h¨
oljet av en kompakt m¨
angd inte s¨
akert ¨
ar slutet
(exempel: ett klot med origo p˚
a randen).
Bevis. Det ˚
aterst˚
ar att visa att det koniskt konvexa h¨
oljet av en ¨
andlig m¨
angd ¨
ar
slutet. Vi g¨
or induktion ¨
over antalet element. Uppenbarligen ¨
ar resultatet sant d˚
a
N = 0. Antag nu att resultatet ¨
ar sant f¨
or N − 1 element, och l˚
at K vara en konvex
kon som genereras av N − 1 element. Tag ett element till, s¨ag a. D˚
a g¨
aller det att
visa att m¨angden Ka av alla element av formen x + λa, d¨
ar x ∈ K och λ > 0, ¨
ar
sluten. Antag d¨
arf¨
or att yj = xj + λj a → y. Vi skall d˚
a visa att y ∈ Ka . Om nu
f¨
oljden av λj ¨
ar begr¨
ansad s˚
a finns det en konvergent delf¨
oljd, s¨ag λjk → λ, och man
f˚
ar d˚
a att motsvarande delf¨
oljd av xj konvergerar, ty
xjk = yjk − λjk a → y − λa = x,
och x ∈ K eftersom xjk ∈ K och K ¨
ar sluten enligt induktionsantagandet. Allts˚
a
g¨
aller att y = x + λa ∈ Ka . Men det kan intr¨
affa att f¨
oljden (λj ) ¨
ar obegr¨
ansad,
och d˚
a skall vi visa att Ka ¨
ar sluten med ett helt annat resonemang. Antag allts˚
a
att f¨
oljden (λj ) ¨
ar obegr¨
ansad. D˚
a finns det en delf¨
oljd (λjk ) som g˚
ar mot plus
o¨
andligheten, och vi kan skriva
K3
yj
xjk
= k − a → −a,
λjk
λjk
4
vilket visar att −a ∈ K. Det medf¨
or att Ka = K + Ra, dvs. vektorsumman av konen
K och den r¨
ata linjen Ra. Nu kan vi anv¨
anda induktionsantagandet f¨
or att se att
n
n
K + Ra ¨
ar sluten. L˚
at π: R → R vara en line¨
ar avbildning med nollrum π −1 (0)
−1
exakt lika med Ra. D˚
a¨
ar K + Ra = π (π(K)). Vidare ¨
ar π(K) genererad av N − 1
−1
element, s˚
a den ¨
ar sluten, och K +Ra = π (π(K)) ¨
ar sluten som urbild av en sluten
m¨
angd under en kontinuerlig avbildning. Detta visar satsen.
3. Separerande hyperplan
Ett hyperplan ¨
ar ett affint delrum av codimension 1. Det betyder att det ges av en
enda ekvation ξ · x = b, d¨
ar ξ inte ¨
ar noll. I koordinatform blir det
H = {x ∈ Rn ; ξ1 x1 + · · · + ξn xn = b},
d¨
ar inte alla koefficienterna ξj ¨
ar noll. Codimensionen ¨
ar den komplement¨
ara dimenn
sionen, dvs. den ¨
ar lika med dim R − dim H = n − (n − 1) = 1. Ett hyperplan delar
alltid in rummet Rn i tv˚
a halvrum :
D+ = {x ∈ Rn ; ξ · x > b}
och
D− = {x ∈ Rn ; ξ · x 6 b}.
Deras snitt D+ ∩ D− ¨
ar f¨
orst˚
as lika med hyperplanet H. Vidare ¨
ar r¨
anderna ∂D+ =
−
+
+ ◦
∂D = H. Det inre av D (betecknat (D ) ) definieras av den strikta olikheten
ξ · x > b. Om vi vill vara mer precisa kallar vi D+ f¨
or ett slutet halvrum och dess inre
(D+ )◦ f¨or ett ¨oppet halvrum. Vi har ∂(D+ )◦ = ∂(D− )◦ = H och (D+ )◦ ∩(D− )◦ = Ø.
Ett hyperplan best¨ammer inte sin ekvation entydigt. Om vi i st¨
allet anv¨
ander
+
−
ekvationen (−ξ)·x = −b s˚
a byter D och D plats, ty tecknet definieras ju med hj¨
alp
av ξ. S˚
a H best¨ammer inte vilket av halvrummen som skall vara D+ . Nedanst˚
aende
definition inneh˚
aller en s˚
adan teckenkomplikation, men denna skapar knappast n˚
agra
problem.
Definition 3.1. L˚
at tv˚
a m¨
angder X och Y vara givna i Rn , och l˚
at H beteckna ett
hyperplan med ekvationen ξ · x = b. Man s¨
ager att H separerar X och Y om det
g¨
aller att
ξ·x6b6ξ·y
f¨
or alla x ∈ X, y ∈ Y.
Vi s¨
ager att H separerar X och Y strikt om det g¨
aller att
ξ·x<b<ξ·y
f¨
or alla x ∈ X, y ∈ Y.
Vi kan slutligen s¨
aga (med ett mer tillf¨
alligt uttryckss¨
att) att H separerar X och
Y mycket strikt om det finns tv˚
a tal b1 och b2 s˚
adana att
ξ · x 6 b 1 < b < b2 6 ξ · y
f¨
or alla x ∈ X, y ∈ Y.
Separation betyder allts˚
a att X och Y ligger i varsitt halvrum, varvid vi arbetar
med slutna halvrum f¨
or vanlig icke-strikt separation, och med ¨
oppna halvrum f¨
or
den strikta separationen.
Om Y = {y} best˚
ar av bara en punkt s¨ager vi f¨
orst˚
as att H separerar X och
y om H separerar X och {y}. Detta specialfall ¨
ar i sj¨
alva verket ekvivalent med
5
det allm¨
anna. Beteckna med Hb hyperplanet som definieras av ξ · x = b. Man
ser l¨
att att Hb separerar X och Y f¨
or n˚
agot tal b om och endast om H0 separerar
X − Y = {x − y; x ∈ X & y ∈ Y } och origo. F¨
or den strikta separationen blir
det en aning annorlunda: om Hb separerar X och Y strikt, s˚
a f˚
ar vi bara att H0
separerar X − Y och origo (icke-strikt). Och om H0 separerar X − Y och origo strikt
s˚
a separerar Hb m¨
angderna X och Y mycket strikt f¨
or n˚
agot b. Det verkar kanske
litet irriterande, men skillnaden mellan mycket strikt och strikt f¨
orsvinner ofta. Om
den ena m¨
angden ¨
ar kompakt s˚
a¨
ar det helt enkelt ingen skillnad.
Vi ¨ar intresserade av att hitta m˚
anga hyperplan – tillr¨
ackligt m˚
anga f¨
or att
visa att varje sluten konvex m¨angd ¨
ar ett snitt av slutna halvrum (sats 3.7), och
tillr¨
ackligt m˚
anga f¨
or att visa att varje konvex kompakt ¨
ar det konvexa h¨
oljet av sina
extremalpunkter (avsnitt 5).
I konvexitetsteorin finns det tv˚
a viktiga separationssatser:
Sats 3.2. Om F ¨
ar en sluten konvex m¨
angd i Rn och y ∈
/ F , s˚
a finns det ett
hyperplan som separerar F och y mycket strikt.
Sats 3.3. Om A ¨
ar en konvex m¨
angd i Rn och y ∈
/ A, s˚
a finns det ett hyperplan
som separerar A och y. Detsamma g¨
aller om y ∈ ∂A.
Av dessa tv˚
a satser s˚
a f¨
oljer genast separationssatser f¨
or tv˚
a m¨
angder:
Sats 3.4. Om F och K ¨
ar tv˚
a disjunkta slutna konvexa m¨
angder i Rn och K dessutom ¨
ar begr¨
ansad, s˚
a finns det ett hyperplan som separerar F och K mycket strikt.
Sats 3.4 f¨
oljer av sats 3.2 genom att vi kan separera F − K och origo strikt. H¨
ar ser
man n¨
amligen att F − K ¨
ar en sluten konvex m¨angd som inte inneh˚
aller origo.
Sats 3.5. Om X och Y ¨
ar tv˚
a disjunkta konvexa m¨
angder i Rn s˚
a finns det ett
hyperplan som separerar X och Y .
Sats 3.5 f¨oljer av sats 3.3 genom att man bildar A = X − Y som ¨
ar en konvex m¨
angd
som inte inneh˚
aller origo.
Farkas’ lemma i den form som det har hos Borell & Lindahl s. 17 ¨
ar ett specialfall
av den f¨
orsta separationssatsen. Den slutna m¨
angden F ¨
ar d¨
ar en konvex kon som
genereras av en ¨
andlig m¨angd. Explicit har vi:
Sats 3.6. L˚
at A vara en ¨
andlig m¨
angd i Rn och l˚
at y ∈ Rn . D˚
a g¨
aller att y inte
tillh¨
or det koniskt konvexa h¨
oljet av A om och endast om det finns en line¨
arform ξ
s˚
adan att ξ(a) > 0 f¨
or varje a ∈ A och ξ(y) < 0.
Bevis. Vi till¨
ampar sats 3.2 p˚
a det koniskt konvexa h¨
oljet F av A; vi vet tack vare
sats 2.2 att F ¨
ar slutet. Vi f˚
ar ξ(y) < b < ξ(λa) f¨
or varje a ∈ A och varje λ > 0. Om
vi l˚
ater λ g˚
a mot noll s˚
a ser vi att b 6 0 och att allts˚
a ξ(y) < 0; om vi l˚
ater λ g˚
a mot
+∞ s˚
a ser vi att ξ(a) > 0. Detta visar satsen.
Den geometriska betydelsen av sats 3.6 ¨
ar att det koniskt konvexa h¨
oljet F av
en ¨
andlig m¨angd A kan beskrivas med hj¨
alp av halvrum. L˚
at n¨
amligen
Dξ = {x ∈ Rn ; ξ(x) > 0}
vara det halvrum som definieras av en line¨
arform ξ 6= 0. D˚
a s¨
ager sats 3.6 att y ∈
/F
om och endast om det finns ett ξ s˚
adant att Dξ ⊃ A och y ∈
/ Dξ . Ekvivalent med
6
detta ¨ar att F ¨
ar snittet av alla Dξ med Dξ ⊃ A, dvs. att det koniskt konvexa
h¨
oljet av en ¨
andlig m¨
angd ¨
ar snittet av alla halvrum som inneh˚
aller m¨
angden och
har origo p˚
a randen; j¨
amf¨
or sats 3.7 nedan. (Ett oberoende bevis av Farkas’ lemma
– som hos Borell & Lindahl – ger direkt att det koniskt konvexa h¨
oljet ¨
ar slutet; med
uppl¨
aggningen h¨
ar b¨
or man f¨
orst visa detta, vilket vi gjort i sats 2.2, f¨
or att sedan
till¨
ampa sats 3.2. V¨
agen h¨
ar blir d¨
armed n˚
agot l¨
angre; ˚
a andra sidan har vi redan
fr˚
an b¨
orjan f˚
att en allm¨
annare sats.)
En annan form av Farkas’ lemma ¨
ar denna: ekvationssystemet
n
X
ajk xk = bj ,
j = 1, ..., m,
k=1
P
har en
osning med xk > 0 om och endast om uj bj > 0 f¨
or alla vektorer (u1 , ..., um )
Pl¨
med
uj ajk > 0 f¨
or k = 1, ..., n. I den ena riktningen ¨
ar detta ju l¨
att att visa: om
det finns en l¨osning x med den angivna egenskapen s˚
a blir
X
X X
XX
u j bj =
uj
ajk xk =
uj ajk xk > 0
j
k
k
j
P
s˚
a fort
uj ajk > 0. F¨
or att bevisa den andra riktingen skall vi anta att det inte
finns n˚
agon l¨
osning x med den angivna egenskapen och till¨
ampa sats 3.6.
a
P Titta p˚
konen F i Rm som best˚
ar av alla vektorer y = (y1 , ..., ym ) med yj =
ajk xk f¨or
n˚
agot x ∈ Rn med xj > 0. M¨
angden F ¨
ar allts˚
a det koniskt konvexa h¨
oljet av
punkterna ak = (a1k , ..., amk ) ∈ Rm , k = 1, ..., n, och kan f¨
or ¨
ovrigt ocks˚
a beskrivas
som bilden i Rm av den positiva konen i Rn under den line¨
ara avbildning som
definieras av matrisen (ajk ). Antagandet att det inte finns en l¨
osning x med angiven
positivitetsegenskap betyder just att b inte liggerPi konen F . Enligt sats 3.6 finns
det d˚
a en line¨
arform ξ s˚
adan
or alla xk > 0. Nu
P att ξ(b) < 0 och ξ( ajk xk ) > 0 f¨
m˚
aste
ξ
ha
formen
ξ(y)
=
u
y
f¨
o
r
n˚
agot
val
av
u
.
Slutligen
konstaterar vi att
j j
jP
P
uj ajk xk > 0 f¨
or alla xk > 0 ¨
ar ekvivalent med att
uj ajk > 0 f¨
or alla k. Detta
avslutar beviset av p˚
ast˚
aendet.
Vi kan omformulera denna variant av Farkas’ lemma som f¨
oljer. Vi betraktar de
tv˚
a systemen
(S)
n
X
ajk xk = bj ,
j = 1, ..., m,
xk > 0,
k = 1, ..., n.
k=1
och
∗
(S )
m
X
uj ajk > 0,
k = 1, ..., n,
j=1
j=1
I matrisform kan vi skriva
(S)
m
X
Ax = b
x>0
7
uj bj < 0.
och
∗
(S )
AT u > 0
bT u < 0.
(Vi anv¨
ander h¨
ar ¨
ovre index T f¨
or att beteckna transponering.) Det vi visat betyder
d˚
a att systemet (S) ¨
ar l¨
osbart om och endast om (S∗ ) ¨
ar ol¨
osbart. Hos Borell &
Lindahl finns en hel serie av liknande p˚
ast˚
aenden, med strukturen att ett visst system
av likheter och olikheter ¨
ar l¨
osbart precis d˚
a ett annat system, kallat det duala, ¨
ar
ol¨
osbart. Systemet (S) best˚
ar av m likheter och n icke-strikta olikheter och definierar
en sluten polyeder P i Rn , medan (S∗ ) best˚
ar av n icke-strikta olikheter och en enda
∗
strikt olikhet och definierar en polyeder P i Rm . Och resultatet s¨ager att precis en
av polyedrarna ¨
ar tom.
En viktig konsekvens av separationssatserna ¨
ar att vi nu f˚
att en ny beskrivning
av det slutna konvexa h¨
oljet ¨
aven av en o¨
andlig m¨angd:
Sats 3.7. Om X ¨
ar en godtycklig m¨
angd i Rn s˚
a¨
ar dess slutna konvexa h¨
olje cvx X
lika med snittet av alla slutna halvrum som inneh˚
aller X. (Speciellt ¨
ar slutna konvexa
m¨
angder lika med detta snitt.)
Bevis. Snittet av alla slutna halvrum ¨
ar en sluten konvex m¨
angd, s˚
a det m˚
aste
inneh˚
alla F = cvx X. Omv¨
ant, om x ∈
/ F s˚
a finns enligt sats 3.2 ett slutet halvrum
D som inneh˚
aller F men inte x. D¨
arf¨
or blir snittet lika med F .
Man kan s¨
aga att sats 3.7 beskriver det slutna konvexa h¨
oljet utifr˚
an, medan
sats 2.1 beskriver det konvexa h¨
oljet inifr˚
an.
Vi skall nu bevisa separationssatserna.
Bevis f¨
or sats 3.2. Vi kan
√ anta att x = 0 (translatera) och att F 6= Ø. Studera
funktionen ϕ(x) = |x| = x · x p˚
a F och dess infimum
d = inf(ϕ(x); x ∈ F ).
Det ¨
ar tydligt att 0 < d < +∞: den f¨
orsta olikheten f¨
or att F ¨
ar sluten och inte
inneh˚
aller origo; den andra f¨
or att F ¨
ar icke-tom. Vi vet att en kontinuerlig funktion
– och ϕ ¨
ar kontinuerlig – antar sitt infimum p˚
a en sluten begr¨ansad m¨
angd. Nu ¨ar
F inte s¨akert begr¨
ansad, men det ¨
ar inte farligt i detta fall. Vi kan n¨
amligen bilda
K = {x ∈ F ; |x| 6 2d},
som ¨
ar kompakt, och d˚
a antar ϕ sitt infimum p˚
a K. Men detta infimum m˚
aste vara
detsamma som infimum p˚
a F : v¨
ardena i F \K kan inte t¨
avla med dem i K. L˚
at allts˚
a
a vara en punkt i F s˚
adan att ϕ(a) = d. (I sj¨
alva verket ¨
ar a unik, men det beh¨
ovs
inte nu.) Denna punkt definierar ett hyperplan H genom ekvationen a · x = b = a · a
och ett slutet halvrum D genom olikheten a · x > a · a. Med andra ord ¨
ar H helt
enkelt det plan som ¨
ar ortogonalt mot siktlinjen [0, a] fr˚
an origo mot den n¨
armaste
punkten i F och som g˚
ar genom denna punkt. Vi p˚
ast˚
ar nu att b 6 a · x f¨
or alla
x ∈ F . Det betyder att
0=a·0<c<b6a·x
8
f¨
or varje x ∈ F och varje tal c med 0 < c < b, s˚
a att varje hyperplan a · x = c med
ett s˚
adant c ¨
ar strikt separerande. Vi skall allts˚
a bevisa att F ligger i halvrummet
D. Tag en godtycklig punkt x ∈ F . D˚
a vet vi att hela segmentet [a, x] ligger i F ,
eftersom F ¨
ar konvex. En punkt (1 − t)a + tx p˚
a detta segment m˚
aste ha avst˚
andet
minst d till origo enligt definitionen av d. Det betyder att
d2 = |a|2 = ϕ(a)2 6 ϕ((1 − t)a + tx)2 = ((1 − t)a + tx) · ((1 − t)a + tx)
= (1 − t)2 |a|2 + 2(1 − t)ta · x + t2 |x|2 .
Studera funktionen f (t) = ϕ((1 − t)a + tx)2 . Den m˚
aste ha icke-negativ derivata i
0
origo, ty om f (0) < 0 s˚
a f¨
oljer att f (t) < f (0) f¨
or sm˚
a positiva t, vilket allts˚
a inte
ar m¨
¨
ojligt. Men nu kan vi l¨
att r¨
akna ut dess derivata:
f 0 (t) = 2(1 − t)(−1)|a|2 + 2(−1)ta · x + 2(1 − t)a · x + 2t|x|2 .
S¨
att in t = 0: det ger 0 6 f 0 (0) = −2|a|2 + 2a · x. Allts˚
a g¨
aller a · x > |a|2 , vilket ¨ar
precis vad vi ¨
onskade.
Kanske blir det l¨
attare om man g¨
or ett mots¨
agelsebevis: om man antar att det
a blir f (t) < f (0) f¨
or sm˚
a positiva t. Rita en figur!
finns ett x ∈ F med a · x < |a|2 s˚
Bevis av sats 3.3. Vi kan f¨
orst˚
as anta att y = 0. V¨
alj en uppr¨
aknelig t¨
at m¨
angd
{xj } i A, och l˚
at Am vara det konvexa h¨
oljet av den ¨
andliga m¨angden {x1 , ..., xm }.
Eftersom Am ¨
ar sluten (sats 2.2) och inte inneh˚
aller origo, s˚
a kan vi till¨
ampa sats
3.2 och f˚
ar ett separerande hyperplan med ekvationen ξm · x = cm som separerar Am
och origo (strikt). Motsvarande plan genom origo, med ekvationen ξm · x = 0, ¨
ar
d˚
a separerande i alla fall. Vad h¨
ander nu n¨
ar m → +∞? Om vi v¨
aljer ξm som den
n¨
armaste punkten i Am s˚
a kan ju mycket v¨
al ξm g˚
a mot noll och det ¨
ar inte bra. L˚
at
oss d¨
arf¨
or normalisera s˚
a att |ξm | = 1. D˚
a ligger allts˚
a ξm p˚
a enhetsf¨
aren S, som ¨ar
en v¨
alk¨
and kompakt m¨angd, och vi vet att n˚
agon delf¨
oljd av (ξm ) konvergerar. L˚
at
ξ vara ett gr¨
ansv¨
arde. Vi kan nu hoppas att hyperplanet
H = {x; ξ · x = 0}
kommer att separera A fr˚
an origo, dvs. att A ligger p˚
a ena sidan. Vi kan v¨
alja tecknen
s˚
a att Am ligger i halvrummet
Dm = {x; ξm · x > 0},
och skall d˚
a visa att ξ · x > 0 f¨
or alla x ∈ A. Antag att detta ¨
ar fel, allts˚
a att det
finns x ∈ A s˚
a att ξ · x < 0. D˚
a finns punkter xk godtyckligt n¨
ara x och likas˚
a ξm
godtyckligt n¨
ara ξ. D¨
arf¨
or g¨aller ocks˚
a ξm · xk < 0 f¨
or l¨
ampliga index m och k, och
aven f¨
¨
or n˚
agra s˚
adana med m > k, vilket mots¨ager konstruktionen att xk ligger i
halvrummet Dm d˚
a m > k.
Om nu y ∈ ∂A s˚
a finns det punkter yk som inte ligger i A och s˚
a att yk → y. Om
vi tar halvrum Dk som separerar yk fr˚
an A s˚
a kan vi som i resonemanget nyss hitta
en delf¨
oljd av s˚
adana halvrum som konvergerar mot ett halvrum D som inneh˚
aller A
och har y p˚
a randen.
4. St¨
odjande halvrum och st¨
odjande hyperplan
9
Definition 4.1. L˚
at A vara en konvex m¨
angd i Rn . Ett slutet halvrum D s¨
ages vara
st¨
odjande till A om A ing˚
ar i D och det finns en gemensam randpunkt i A och D.
Ett hyperplan H s¨
ages vara st¨
odjande till A om ett av de tv˚
a slutna halvrummen
som definieras av H ¨
ar st¨
odjande till A.
Ett st¨
odjande hyperplan karakt¨
ariseras allts˚
a av att m¨
angden A ligger p˚
a ena sidan
av H och att H inneh˚
aller n˚
agon randpunkt till A.
Om vi tar ett hyperplan H som har A p˚
a ena sidan, s¨
ag att ξ · a > b f¨
or alla
a ∈ A, och H inte ¨
ar st¨odjande, s˚
a kan det h¨
anda att n˚
agot hyperplan ξ · x = b + ε ¨
ar
st¨
odjande (konstanten b var helt enkelt f¨
or liten). Men det kan ocks˚
a h¨
anda att inget
av halvrummen ξ · x > b + ε med ε > 0 inneh˚
aller A. D˚
a finns det helt enkelt inget
st¨
odjande hyperplan med normal ξ. Ett exempel p˚
a detta ¨
ar A lika med m¨
angden
2
av alla x ∈ R med x1 > 0 och x1 x2 > 1. D˚
a¨
ar linjen x2 = 0 ett hyperplan som inte
ar st¨
¨
odjande, men det finns inte heller n˚
agot parallellt hyperplan som ¨
ar st¨
odjande.
Ett slutet halvrum som inneh˚
aller en given konvex m¨
angd beh¨
over allts˚
a inte g˚
a
att parallellf¨
orflytta s˚
a att det blir st¨
odjande. Det blir d¨
armed intressant att fr˚
aga
om man i sats 3.7 kan n¨
oja sig med att ta st¨
odjande halvrum. Att svaret ¨
ar jakande
trots det nyss framlagda exemplet f¨
oljer av det arbete vi redan lagt ned f¨
or att visa
sats 3.2. Vi formulerar satsen s˚
a:
Sats 4.2. L˚
at F vara en sluten konvex m¨
angd. D˚
a ¨
ar F lika med snittet av alla
st¨
odjande halvrum till F .
Bevis. Det ¨
ar klart att snittet av alla st¨
odjande halvrum inneh˚
aller F . L˚
at nu y ∈
/ F.
Enligt sats 3.2 finns det ett hyperplan som separerar F och y strikt. Ett s˚
adant
hyperplan beh¨
over som vi sett inte vara st¨odjande, och kanske g˚
ar det inte heller att
parallellf¨
orskjuta det s˚
a att det blir st¨odjande. Men om vi tittar p˚
a beviset av sats
3.2 s˚
a ser vi att vi gjort n˚
agonting b¨
attre. Den punkt a i F som vi hittade och som
ar den n¨
¨
armaste punkten i F sett fr˚
an y definierar ett hyperplan som g˚
ar genom a
och har F p˚
a ena sidan, och som allts˚
a¨
ar st¨odjande till F . Beviset f¨
or sats 4.2 ¨ar
allts˚
a redan gjort i beviset f¨
or sats 3.2.
5. Extremalpunkter
Extremalpunkterna ¨
ar konvexitetsteorins primtal. Vi p˚
aminner om att primtalen ˚
a
ena sidan ¨
ar tillr¨
ackligt m˚
anga f¨
or att varje heltal skall vara en produkt av primtal,
˚
a andra sidan kan de inte sj¨
alva s¨onderl¨
aggas som en produkt av heltal annat ¨
an p˚
a
ett trivialt s¨att (p = p · 1 = 1 · p = (−p) · (−1) = (−1) · (−p)). I konvexitetsteorin
motsvaras produkten av de konvexa line¨
arkombinationerna, s˚
a att alla punkter p˚
a
segmentet [a, b] framst¨
alls med hj¨
alp av a och b, n¨
amligen som x = (1 − t)a + tb. En
framst¨
allning betraktas som trivial om x = a eller x = b. Detta intr¨
affar om t = 0
eller t = 1, men ocks˚
a om a = b. Det som motsvarar ett primtal ¨
ar allts˚
a en punkt
som inte kan framst¨
allas p˚
a ett icke-trivialt s¨att. Denna analogi leder oss till f¨
oljande
definition:
Definition 5.1. L˚
at en konvex m¨
angd X vara given. D˚
a kallas en punkt x f¨
or
extremalpunkt till X om x ∈ X och x inte kan framst¨
allas p˚
a ett icke-trivialt s¨
att
med hj¨
alp av punkter i X, dvs. om ekvationen x = (1−t)a+tb kan g¨
alla med a, b ∈ X
och 0 6 t 6 1 endast d˚
a x = a eller x = b. Vi skall skriva E(X) f¨
or m¨
angden av alla
extremalpunkter i X.
10
Vi ser genast att ¨
oppna konvexa m¨angder saknar extremalpunkter om dimensionen ¨
ar
positiv. Men ¨
aven slutna halvrum i dimensioner h¨
ogre ¨
an 1 saknar extremalpunkter.
Det ¨
ar d¨
arf¨
or naturligt att endast studera slutna begr¨
ansade m¨
angder. Och d˚
a visar
det sig att extremalpunkterna ¨
ar tillr¨
ackligt m˚
anga f¨
or att kunna framst¨
alla hela
m¨
angden. Att varje heltal ¨
ar en produkt av primtal motsvaras allts˚
a av f¨
oljande sats.
Sats 5.2. L˚
at K vara en konvex kompakt. D˚
a¨
ar konvexa h¨
oljet av E(K) lika med
K.
Bevis. Eftersom E(K) ⊂ K och K ¨
ar konvex s˚
a¨
ar det klart att cvx E(K) ⊂ K. Vi
g¨
or nu induktion ¨
over dimensionen f¨
or att visa att cvx E(K) ⊃ K. F¨
or n = 0 eller
n = 1 ¨
ar det klart att satsen ¨
ar sann. Om x ¨
ar en godtycklig punkt i K s˚
a drar
vi en r¨
at linje genom x och tr¨
affar p˚
a tv˚
a punkter x0 och x1 som ligger p˚
a randen
av K. (De kan sammanfalla; det g¨
or inget.) Eftersom x ∈ [x0 , x1 ] s˚
a r¨
acker det att
visa att x0 , x1 ∈ cvx E(K). Genom x0 g˚
ar ett separerande hyperplan H enligt sats
3.3. Och induktionsantagandet s¨
ager att H ∩ K ¨
ar en konvex kompakt som ¨
ar det
konvexa h¨
oljet av sina extremalpunkter, ty den ligger ju i H som har l¨
agre dimension.
Problemet ¨
ar allts˚
a att identifiera extremalpunkterna i H ∩ K.
Jag p˚
ast˚
ar att E(H ∩ K) ⊂ H ∩ E(K). (I sj¨
alva verket g¨
aller likhet, men vi
beh¨
over inte detta h¨
ar.) L˚
at oss ta en punkt y som ¨
ar extremal i H ∩ K. Vi skall visa
att den d˚
a ¨ar extremal ocks˚
a i K. Om y ligger p˚
a ett segment [a, b] ⊂ K s˚
a f¨
oljer att
a och b m˚
aste ligga p˚
a samma sida om H. De kan d¨
arf¨
or bara framst¨
alla punkten y
p˚
a ett icke-trivialt s¨
att om de b˚
ada ligger i H. Men eftersom y ¨
ar extremal i H ∩ K
s˚
a finns ingen s˚
adan icke-trivial framst¨
allning. Det inneb¨
ar att y ¨
ar extremal i K.
Nu vet vi att E(H ∩ K) ⊂ H ∩ E(K), och att x0 ligger i det konvexa h¨
oljet av
E(H ∩K). Allts˚
a ligger x0 i det konvexa h¨
oljet av E(K). Detsamma g¨
aller f¨
or x1 , och
allts˚
a ocks˚
a f¨
or varje punkt p˚
a segmentet [x0 , x1 ] som ju inneh˚
aller den godtyckligt
givna punkten x ∈ K.
6. Carath´eodorys sats
Vi skall nu ˚
aterv¨
anda till den fr˚
aga som l¨
amnades ¨
oppen i diskussionen f¨
ore sats 2.2,
n¨
amligen hur m˚
anga punkter i X vi beh¨
over f¨
or att bilda det konvexa h¨
oljet av X.
Svaret ¨
ar att antalet N beror p˚
a dimensionen hos rummet, och att det i Rn alltid
r¨
acker med n + 1 punkter. Resultatet ¨
ar allts˚
a denna sats:
Sats 6.1. (Carath´eodorys sats.) Om X ¨
ar en m¨
angd i Rn s˚
a har varje punkt a i det
konvexa h¨
oljet av X en framst¨
allning
a=
n+1
X
λj xj
j=1
d¨
ar xj ∈ X, 0 6 λj 6 1 och
P
λj = 1.
Bevis. Vi g¨
or induktion ¨
over dimensionen, och skall utnyttja existensen av separerande hyperplan. P˚
ast˚
aendet ¨
ar s¨akert sant i R0 = {0} (och l¨
att att visa ocks˚
ai
1
n−1
R ). Antag att det ¨
ar sant i R
. Om a ¨
ar en godtycklig punkt i cvx X s˚
a vet vi
enligt sats 2.1 att det finns en framst¨
allning
a=
N
X
1
11
λj xj
av ¨
onskad form utom att talet N kanske ¨
ar f¨
or stort. L˚
at Y vara den ¨
andliga m¨
angden
{x1 , ..., xN }. Tydligen g¨
aller att a ∈ cvx Y = K. Tag en punkt y ∈ Y . Om
y = a ¨
ar vi f¨
ardiga; om inte s˚
a drar vi ut en linje fr˚
an y genom a och ut mot
o¨
andligheten. Eftersom K ¨
ar kompakt (sats 2.2) m˚
aste denna linje inneh˚
alla n˚
agon
punkt z ∈ ∂K p˚
a andra sidan om a, s˚
a att a ∈ [y, z]. Eftersom z ¨
ar en randpunkt i
K s˚
a finns enligt sats 3.3 ett hyperplan H genom z med m¨
angden K p˚
a ena sidan.
Nu ¨
ar H ∩ cvx Y = cvx(H ∩ Y ), ty om en punkt kan framst¨
allas som en konvex
line¨
arkombination av punkter i Y , allts˚
a p˚
a ena sidan om H, s˚
a m˚
aste alla de punkter
som faktiskt anv¨
ands ligga i H. Det inneb¨
ar att z ∈ cvx(H ∩ Y ), och som H ∩ Y
ar en m¨angd i rummet H av dimension n − 1, finns enligt induktionsantagandet en
¨
framst¨
allning av z som konvex line¨
arkombination av n punkter i Y , s¨
ag y1 , ..., yn .
Slutligen ligger genom konstruktionen a p˚
a segmentet [y, z], s˚
a de n + 1 punkterna
y1 , ..., yn och y r¨
acker f¨
or att framst¨
alla a.
Sats 6.2. Om K ¨
ar kompakt i Rn s˚
a¨
ar ¨
aven cvx K kompakt.
Bevis. Vi noterade redan f¨
ore sats 2.2 att m¨angden
KN =
X
N
λj xj ; λj > 0,
j=1
X
λj = 1 och xj ∈ K
¨r kompakt eftersom den ¨
a
ar bilden av en kompakt m¨
angd under en kontinuerlig
avbildning. Nu vet vi att cvx K = Kn+1 .
7. Den utvidgade reella axeln
N¨
ar man sysslar med reellv¨
arda funktioner g¨
or man ofta operationer som leder utanf¨
or
de reella talen, t. ex. supremumbildningar. D¨
arf¨
or leds man till att betrakta ocks˚
a
+∞ och −∞ som till˚
atna v¨
arden. Om man bara har en av o¨
andligheterna s˚
a brukar
detta inte vara s˚
a sv˚
art, men om b¨
agge f¨
orekommer s˚
a f˚
ar man finna sig i att summan
(+∞) + (−∞) inte ¨
ar v¨
aldefinierad, och detta leder till att man m˚
aste g¨
ora undantag
i vissa utsagor, undantag som ¨
ar sv˚
ara att komma ih˚
ag. Det har d¨
arf¨
or ett visst
intresse att skapa konventioner som g¨
or det bekv¨
amt att handskas med undantagen.
En s˚
adan konvention ¨
ar inf¨
orandet av den ¨
ovre och undre additionen.
Den utvidgade reella axeln betecknas [−∞, +∞] och best˚
ar av alla reella tal
och tv˚
a nya element −∞ och +∞. Den ordnas genom f¨
orskriften att −∞ < x < +∞
f¨
or alla x ∈ R. D¨
arf¨
or blir supremum och infimum v¨
aldefinierade operationer, och vi
har bl. a.
sup f (x) = −∞,
inf f (x) = +∞
x∈Ø
x∈Ø
f¨
or alla funktioner f : X → [−∞, +∞], s˚
aledes ¨
aven om till exempel f ¨
ar identiskt
+∞.
Man kallar [−∞, +∞] f¨
or en tv˚
apunktskompaktifiering av R eftersom den ¨ar
kompakt (varje punktf¨
oljd har en hopningspunkt) och uppst˚
ar genom till¨
agg av tv˚
a
punkter. (Det finns ocks˚
a en enpunktskompaktifiering av R, n¨
amligen R ∪ {∞}, som
uppst˚
ar genom till¨
agg av en enda ny punkt, ∞. Den kan inte ordnas; man kan s¨
aga
att den uppkommer ur [−∞, +∞] genom hopslagning av +∞ och −∞.)
Den ¨
ovre additionen definieras som den utvidgning av den vanliga additionen
d¨
ar +∞ alltid vinner ¨
over −∞, dvs. i fall av tvekan skall man v¨
alja +∞. Det inneb¨
ar
12
att
·
a + b = lim sup x + y ∈ [−∞, +∞] ,
2
(a, b) ∈ [−∞, +∞] .
(x,y)→(a,b)
(x,y)∈R2
P˚
a motsvarande s¨att definierar vi den undre additionen medelst limes inferior
·
·
or a + b om
och f˚
ar f¨
orst˚
as a + b = −((−a) + (−b)). Slutligen skriver vi a + b f¨
·
·
a + b = a + b. Vi finner d˚
a att ingenting ¨
andrats f¨
or de reella talen, att (+∞) +
·
·
(+∞) = +∞ och att (−∞) + (−∞) = −∞. Vidare ¨
ar (+∞) + (−∞) = +∞ medan
(+∞) + (−∞) = −∞. De tv˚
a sista formlerna ¨
ar allts˚
a de enda d¨
ar plustecken med
·
prick m˚
aste f¨
orekomma.
·
N˚
agra regler f¨
or att hantera + och + ¨
ar dessa: vi har a 6 b om och endast om
·
·
a + (−b) 6 0, att a < b om och endast om a + (−b) < 0. Vidare g¨
aller
·
·
·
(7.1)
inf (a + f (x)) = a + inf f (x)
x∈X
x∈X
och
(7.2)
sup (a + f (x)) = a + sup f (x)
·
· x∈X
x∈X
utan undantag. (Beviset av dessa formler best˚
ar av en kontroll i fallen a = +∞,
a = −∞, X = Ø.) F¨
or infimum i kombination med den undre additionen och
supremum i kombination med den ¨
ovre additionen ¨
ar reglerna inte alls lika enkla,
och f¨
or ¨ovrigt n¨
astan om¨
ojliga att komma ih˚
ag.
8. Konvexa funktioner
Definitionen av en konvex m¨
angd ¨
ar ju mycket enkel: om a, b ∈ A s˚
a ligger hela
segmentet [a, b] i A. Vi skall definiera begreppet konvex funktion s˚
a att det blir lika
enkelt. D¨
arf¨
or vill vi till en funktion associera en m¨
angd som ¨
ar konvex precis n¨
ar
funktionen ¨
ar konvex.
Definition 8.1. Om f : X → [−∞, +∞] ¨
ar en given funktion p˚
a en godtycklig m¨
angd
X s˚
a¨
ar dess epigraf m¨
angden
epi f = {(x, t) ∈ X × R; t > f (x)}.
Definition 8.2. Om f : X → [−∞, +∞] ¨
ar en given funktion definierad i en m¨
angd
n
n+1
X i R s˚
a kallar vi den konvex precis n¨
ar dess epigraf ¨
ar en konvex m¨
angd (i R
).
n
Om vi utvidgar f till en funktion definierad p˚
a hela R genom att s¨
atta g(x) = f (x)
d˚
a x ∈ X och g(x) = +∞ d˚
a x ∈ Rn \ X s˚
a ser vi att f och g ¨
ar konvexa samtidigt:
de har samma epigraf. D¨
arf¨
or kan vi alltid anta att konvexa funktioner ¨
ar definierade
i hela rummet.
Man ser att konstanterna +∞ och −∞ ¨
ar konvexa, ty deras epigrafer ¨
ar Ø
n+1
respektive hela R
. Vidare ser man att max(f1 , ..., fm ) ¨
ar konvex om f1 , ..., fm
ar konvexa: det svarar mot att den f¨
¨
orstn¨
amnda funktionens epigraf ¨
ar snittet av
det konvexa m¨angderna epi fj . F¨
or att till exempel visa att summan av konvexa
funktioner ¨
ar konvex ¨
ar det emellertid bra att ha en olikhet att testa, den som s¨
ager
att grafen h¨anger under kordan.
13
Proposition 8.3. En funktion f : Rn → [−∞, +∞] ¨
ar konvex om och endast om
·
f ((1 − t)x0 + tx1 ) 6 (1 − t)f (x0 ) + tf (x1 )
(8.1)
f¨
or alla x0 , x1 ∈ Rn och alla tal t med 0 < t < 1.
Om ett av v¨
ardena f (x0 ) och f (x1 ) ¨
ar +∞ s˚
a inneb¨
ar olikheten inget krav alls. Men
om t. ex. f (x0 ) = −∞ och f (x1 ) < +∞ s˚
a s¨
ager olikheten att f ((1−t)x0 +tx1 ) = −∞
f¨
or alla t med 0 < t < 1. Olikheten (8.1) inneb¨
ar naturligtvis i allm¨
anhet starka
restriktioner p˚
a funktionsv¨
ardena. Men i vissa situationer ¨
ar friheten mycket stor.
L˚
at till exempel g vara en helt godtycklig funktion p˚
a enhetssf¨
aren. D˚
a kan vi utvidga
den till en konvex funktion f genom att s¨atta f (x) = g(x) d˚
a |x| = 1, f (x) = +∞
d˚
a |x| > 1 och f (x) = −∞ (eller lika med konstanten inf g) d˚
a |x| < 1. P˚
a sf¨
aren
finns allts˚
a inga som helst villkor som funktionsv¨
ardena m˚
aste uppfylla. Speciellt
beh¨
over konvexa funktioner inte vara kontinuerliga. Om vi d¨
aremot tar en kub, s˚
a
m˚
aste restriktionen av en konvex funktion vara konvex i varje sidoyta till kuben.
Proposition 8.4. Om f, g: Rn → [−∞, +∞] ¨
ar tv˚
a konvexa funktioner s˚
a¨
ar ¨
aven
·
f + g konvex.
D¨
aremot beh¨over inte f + g vara konvex ¨
aven om f och g ¨
ar det.
·
Definition 8.5. Om f, g: Rn → [−∞, +∞] ¨
ar tv˚
a konvexa funktioner s˚
a definierar
vi deras infimalfaltning som
·
f u
t g(x) = inf n f (y) + g(x − y) ,
x ∈ Rn .
y∈R
Den vanliga faltningen definieras av
Z
f ∗ g(x) =
f (y)g(x − y)dy,
x ∈ Rn .
Rn
Infimalfaltningen har flera egenskaper som ¨
ar desamma som – eller analoga med –
den vanliga faltningens. I b˚
ada fallen ¨
ar summan av argumenten f¨
or f och g lika med
−f
−g
argumentet f¨
or faltningen. Ofta kan man j¨
amf¨
ora e ∗ e med exp(−(f u
t g)):
Z
(exp(−f ) ∗ exp(−g))(x) =
exp(−f (y) − g(x − y))dy
Rn
≈ sup exp(−f (y) − g(x − y)) = (exp(−(f u
t g))(x).
y
Approximationen
R
≈ sup ¨
ar ibland f¨
orv˚
anande god.
Proposition 8.6. Infimalfaltningen ¨
ar kommutativ och associativ.
·
Bevis. Kommutativiteten f¨
oljer av att + ¨
ar kommutativ. F¨
or associativiteten
beh¨
ovs r¨
akneregeln (7.1):
·
·
(f u
t g) u
t h(x) = inf inf [f (z) + g(y − z)] + h(x − y)
z
y
·
·
= inf inf f (z) + g(y − z) + h(x − y)
y z
·
·
= inf f (z) + inf [g(y − z) + h(x − y)] = f u
t (g u
t h)(x).
z
y
14
Infimalfaltningen ¨
ar en generalisering av vektoradditionen (Minkowskiadditionen) av m¨
angder. Vi har n¨
amligen
iX u
t iY = iX+Y
d¨
ar iX betecknar indikatorfunktionen f¨
or en m¨
angd X; den definieras av att
iX (x) = 0 om x ∈ X och iX (x) = +∞ annars. Ett annat samband med vektoradditionen – och som kan anv¨
andas f¨
or att definiera infimalfaltningen – f˚
as om vi
definierar den strikta epigrafen som
epis f = {(x, t) ∈ X × R; t > f (x)},
allts˚
a med strikt olikhet. D˚
a g¨
aller helt enkelt
epis (f u
t g) = epis (f ) + epis (g)
med vektoraddition i Rn+1 . Denna ekvation leder till en geometrisk tolkning av
infimalfaltningen. Rita figurer!
Exempel. Funktionen i{0} ¨
ar identitet under infimalfaltningen: f u
t i{0} = f f¨
or alla
funktioner f .
Exempel. Om g ¨
ar en affin funktion s˚
a g¨
aller f u
t g = g + C f¨
or en konstant C =
Cf,g ∈ [−∞, +∞] (vilken?).
Exempel. S¨
att gk (x) = k|x|, x ∈ Rn , d¨
ar k ¨
ar en positiv konstant, och studera
infimalfaltningen fk = f u
t gk . Vi antar f¨
or enkelhets skull att f ¨
ar begr¨
ansad. Man
kan l¨
att visa att fk ¨
ar Lipschitzkontinuerlig med konstant k, dvs. att
|fk (x) − fk (y)| 6 k|x − y|,
x, y ∈ Rn ,
genom att anv¨
anda att gk har denna egenskap. Det g¨
or att den goda kontinuitetsegenskapen ¨arvs av faltningen f u
t gk trots att f inte beh¨
over ha den. Vidare g¨
aller
att fk 6 f och att fk % f d˚
a k → +∞ om f ¨
ar kontinuerlig (i sj¨
alva verket
beh¨
over f bara vara ned˚
at halvkontinuerlig; f¨
or definitionen av detta begrepp se
sats 9.6). Vi f˚
ar allts˚
a en bekv¨
am metod att approximera s˚
adana funktioner med
Lipschitzkontinuerliga.
Exempel. Med en fysikaliskt inspirerat spr˚
ak kan vi l˚
ata en partikel med l¨
age λj och
spridning σj representeras av funktionen
1
fj (x) =
(x − λj )2 ,
x ∈ Rn .
2σj
D˚
a ger till exempel en direkt utr¨
akning att f1 u
t f2 = f3 d¨
ar λ3 = λ1 + λ2 och
σ3 = σ1 + σ2 , dvs. l¨
age och spridning adderas. Fallet σ1 = 0 svarar mot f1 = i{λ1 } ,
dvs. en skarp partikel. Detta b¨
or j¨amf¨
oras med den vanliga faltningen av funktionerna
gj = (2πσj )−n/2 e−fj
som ocks˚
a kan f˚
a representera partiklar. D˚
a g¨
aller n¨
amligen att g1 ∗ g2 = g3 med
samma relationer f¨
or l¨
age och spridning som f¨orut. Den j¨
amf¨
orelse mellan u
t och ∗
som vi gjorde tidigare blir nu helt precis: den approximativa likheten
exp(−f1 ) ∗ exp(−f2 ) ≈ exp(−(f1 u
t f2 )) = exp(−f3 )
blir den exakta likheten g1 ∗ g2 = g3 tack vare faktorerna (2πσj )−n/2 . Fallet σ1 = 0
svarar h¨
ar mot Diracm˚
attet δλ1 i punkten λ1 , ˚
aterigen en skarp partikel. Faltningen
g1 ∗ g2 kan ber¨
aknas med Fouriertransformationen, liksom faltningen f1 u
t f2 kan
ber¨
aknas med Fencheltransformationen som vi skall inf¨
ora i n¨
asta avsnitt.
15
Proposition 8.7. En funktion f : Rn → [−∞, +∞] ¨
ar konvex om och endast om
fs u
t ft > fs+t f¨
or alla s, t > 0, d¨
ar fs (x) = sf (x/s) f¨
or x ∈ Rn och s > 0.
Vi kan notera att olikheten fs u
t ft 6 fs+t alltid g¨
aller. De konvexa funktionerna ¨
ar
allts˚
a de som l¨
oser funktionalekvationen fs u
t ft = fs+t .
Bevis. Om f ¨
ar konvex s˚
a g¨
aller
x − y
y
·
·
fs (y) + ft (x − y) = sf (y/s) + tf ((x − y)/t) > (s + t)f
+
= fs+t (x).
s+t
s+t
Om vi nu l˚
ater y variera s˚
a f¨
oljer att fs u
t ft > fs+t . Omv¨
ant, antag att denna olikhet
g¨
aller. D˚
a f¨
oljer med beteckningen xt = (1 − t)x0 + tx1 att
·
f (xt ) = f1 (xt ) 6 f1−t u
t ft (xt ) 6 f1−t (y) + ft (xt − y)
f¨
or alla y. Nu kan vi v¨
alja y = (1 − t)x0 :
·
·
f (xt ) 6 f1−t ((1 − t)x0 ) + ft (xt − (1 − t)x0 ) = (1 − t)f (x0 ) + tf (x1 ),
vilket betyder att f ¨
ar konvex.
Sats 8.8. Om f och g ¨
ar konvexa s˚
a¨
ar ¨
aven h = f u
t g det.
Bevis. Man ser att (f u
t g)s = fs u
t gs . Allts˚
a kan vi r¨
akna p˚
a:
hs u
t ht = (f u
t g)s u
t (f u
t g)t = (fs u
t gs ) u
t (ft u
t gt )
= (fs u
t ft ) u
t (gs u
t gt ) > fs+t u
t gs+t = (f u
t g)s+t = hs+t .
H¨
ar har vi anv¨
ant associativitet och kommutativitet hos infimalfaltningen (proposition 8.6). Vi ser att satsen f¨
oljer av karakt¨
ariseringen i proposition 8.7.
9. Fencheltransformationen
Alla affina funktioner x 7→ ξ·x+c ¨ar konvexa. De ¨
ar de enklaste konvexa funktionerna
och det ¨
ar naturligt att fr˚
aga sig om andra konvexa funktioner kan framst¨
allas med
¨
hj¨
alp av dem. Andliga
suprema av affina funktioner har ju stor betydelse i line¨ar
programmering – en polyeder ¨
ar en subniv˚
am¨
angd till en s˚
adan funktion – och i
konvex optimering blir det lika viktigt att studera icke n¨
odv¨
andigtvis ¨
andliga suprema
av affina funktioner.
Vi fr˚
agar allts˚
a om vi kan hitta en familj A av affina funktioner, dvs. av par
(ξ, c), s˚
adan att
f (x) = sup (ξ · x + c)
(ξ,c)∈A
f¨
or denna familj. Tydligen ¨
ar d˚
a ξ · x + c 6 f (x) f¨
or alla x ∈ Rn och alla (ξ, c) ∈ A,
dvs. c 6 f (x) − ξ · x, varav
c 6 inf n (f (x) − ξ · x),
x∈R
(ξ, c) ∈ A.
Man har inget intresse att ta c mindre ¨
an detta infimum, ty s˚
adana c konkurrerar
ju inte effektivt i supremumbildningen. Vi kan allts˚
a inskr¨
anka oss till att ta c lika
med infimum. Detta inneb¨
ar som vi strax skall se att de enda intressanta affina
minoranterna till f ¨
ar de som har formen f u
t ξ f¨
or n˚
agon line¨
ar funktion ξ. Av vissa
sk¨
al som blir uppenbara om ett ¨
ogonblick ¨
ar det praktiskt att i st¨
allet betrakta −c.
Allts˚
a inf¨
or vi f¨
oljande definition.
16
Definition 9.1. Om f : Rn → [−∞, +∞] ¨
ar en godtycklig funktion p˚
a Rn s˚
a kallas
fe(ξ) = sup ξ · x − f (x) ,
(9.1)
x∈Rn
ξ ∈ Rn ,
f¨
or Fencheltransformen av f .
Ett annat namn f¨
or fe ¨
ar Legendretransformen eller den till f konjugerade
konvexa funktionen.
Funktionen x 7→ f u
t ξ(x) = ξ · x − fe(ξ) ¨
ar affin, minorerar f och ¨
ar den st¨
orsta
affina minorant till f vars line¨
ara del ¨
ar ξ. (H¨
ar betecknar ξ b˚
ade en vektor och den
line¨
ara funktionen x 7→ ξ · x.) Den geometriska tolkningen av transformen ¨
ar denna.
Fixera ξ och betrakta alla affina funktioner x 7→ ξ · x + c som minorerar f . Tag den
st¨
orsta, dvs. tryck upp grafen s˚
a l˚
angt det g˚
ar utan att komma ovanf¨
or n˚
agon punkt
i grafen av f . D˚
a¨
ar fe(ξ) = −c, dvs. transformens v¨
arde ¨
ar minus ordinatan i origo
f¨
or hyperplanet. Rita figurer!
Vi noterar att i (9.1) spelar punkter d¨
ar f (x) = +∞ ingen roll: de kan aldrig
bidra till supremum. Man definierar den effektiva definitionsm¨
angden till f
som
dom f = {x ∈ Rn ; f (x) < +∞},
(9.2)
och ser att
fe(ξ) = sup ξ · x − f (x)
(9.3)
x∈M
f¨
or varje m¨angd M s˚
adan att dom f ⊂ M ⊂ Rn .
Med c = −fe(ξ) blir supremum av alla affina minoranter till f precis
(9.4)
sup ξ · x − fe(ξ) = sup (f u
t ξ)(x),
ξ∈Rn
ξ∈Rn
x ∈ Rn .
Nu kan vi g¨
ora en intressant observation: supremumbildningen ¨
ar precis Fenchel
e
transformen av fe. Allts˚
a kan vi skriva v¨
ansterledet i (9.4) som fe e = fe. Fr˚
agan
huruvida f ¨
ar ett supremum av affina funktioner ¨
ar allts˚
a ekvivalent med fr˚
agan
e
huruvida fe = f . Vi skall snart besvara den, men l˚
at oss f¨
orst notera n˚
agra enkla
egenskaper hos transformationen.
Proposition 9.2. Om f, g: Rn → [−∞, +∞] ¨
ar tv˚
a funktioner p˚
a Rn med f 6 g s˚
a
e
ar fe och ge konvexa och fe > ge. Vidare ¨
¨
ar fe supremum av alla affina minoranter till
f:
e
fe(x) = sup (f u
t ξ)(x),
x ∈ Rn ;
ξ∈Rn
e
e
e
speciellt ¨
ar fe konvex och fe 6 f . Slutligen ¨
ar den tredje transformen fe e = f eee
alltid lika med fe.
17
Notera att fe aldrig antar v¨
ardet −∞ utom d˚
a fe = −∞ identiskt; d˚
a ¨
ar f = +∞
e
oljer av att
identiskt. Olikheten fe 6 f f¨
(9.5)
·
ξ · x 6 f (x) + fe(ξ),
x ∈ Rn ,
ξ ∈ Rn ,
som brukar kallas Fenchels olikhet.
Vi skall genom n˚
agra exempel visa hur man kan ber¨
akna Fencheltransformer.
Exempel. Om f (x) = ax2 + bx + c f¨
or x ∈ R med a > 0 och b och c reella, s˚
a kan vi
e
ber¨
akna f med differentialkalkyl. Vi har n¨
amligen
fe(ξ) = sup [ξx − ax2 − bx − c],
ξ ∈ R,
x∈R
och det ¨
ar klart att uttrycket som vi skall ta supremum av a¨r en kontinuerlig funktion
av x som g˚
ar mot −∞ d˚
a x → ±∞, vilket g¨
or att supremum antas i n˚
agon punkt,
och denna punkt kan hittas genom att vi s¨
atter derivatan lika med noll. Derivatan
ar ξ − 2ax − b, och har ett enda nollst¨
¨
alle, n¨
amligen x = (ξ − b)/2a. Nu s¨atter vi in
detta v¨
arde p˚
a x i uttrycket och f˚
ar
2
ξ−b
(ξ − b)
ξ−b
−a
−b
−c
fe(ξ) = ξx − ax2 − bx − c = ξ
2
2a
4a
2a
ξ2
bξ
b2
(ξ − b)2
=
−
+
−c=
− c.
4a 2a 4a
4a
S˚
a fe ¨
ar ocks˚
a ett andragradspolynom. Vi kan fr˚
an dess uttryck gissa n˚
agra egenskaper
hos transformationen som ocks˚
a¨
ar l¨
atta att verifiera allm¨
ant.
Om g(x) = f (x) + c s˚
a¨
ar ge(ξ) = fe(ξ) − c, dvs. om vi adderar en reell konstant
till f s˚
a g˚
ar den igenom och kommer ut med motsatt tecken. Detta ¨
ar naturligtvis
sant i alla dimensioner.
Om g(x) = f (x)+α·x s˚
a¨
ar ge(ξ) = fe(ξ−α), dvs. om vi adderar en line¨
ar funktion
till f s˚
a kommer transformen att translateras med en vektor vars komponenter ¨
ar
precis den line¨
ara funktionens koefficienter. Detta visas genom en l¨
att r¨
akning:
ge(ξ) = sup[ξ · x − g(x)] = sup[ξ · x − f (x) − α · x]
x
x
= sup[(ξ − α) · x − f (x)] = fe(ξ − α).
x
Om ˚
a andra sidan g(x) = f (x − a), s˚
a blir ge(ξ) = fe(ξ) + ξ · a, dvs. om vi
translaterar en funktion s˚
a motsvarar det addition av en line¨
ar funktion till dess
transform.
Om vi multiplicerar en funktion med en positiv konstant, dvs. om g(x) = af (x)
med a > 0, s˚
a blir transformen ge(ξ) = afe(ξ/a). Detta visas ocks˚
a med en enkel
r¨
akning:
ge(ξ) = sup[ξ · x − af (x)] = a sup[(ξ/a) · x − f (x)] = afe(ξ/a).
x
x
18
Genom att anv¨
anda dessa r¨
akneregler (addition av konstant, addition av line¨
ar
funktion och multiplikation med positiv konstant) s˚
a ser vi att om vi k¨
anner transformen av f (x) = x2 /2, x ∈ R, (den ¨
ar fe(ξ) = ξ 2 /2, allts˚
a samma funktion), s˚
a kan
2
2
e
vi sluta att f (x) = ax + bx + c har transformen f (x) = (ξ − b) /4a − c.
Exempel. Om vi l˚
ater
f (x) =
|x|1+p
,
1+p
x ∈ R,
f¨
or en positiv konstant p, s˚
a blir
f (ξ) =
|ξ|1+1/p
,
1 + 1/p
ξ ∈ R.
Ocks˚
a detta kan l¨
att ber¨aknas med differentialkalkyl d˚
a ξ 6= 0, och f¨
or ξ = 0 ¨
ar det
n
sj¨
alvklart. Man kan visa att samma formel g¨
aller ¨
aven i R .
Exempel. Differentialkalkylen ¨
ar inte alltid till hj¨
alp. Om f (x) = |x|, x ∈ R, s˚
a blir
e
e
f (ξ) = 0 d˚
a |x| 6 1 och f (ξ) = +∞ d˚
a |x| > 1. Detta inses genom att man tittar
p˚
a uttrycket ξx − |x|, och konstaterar att det ¨
ar obegr¨
ansat upp˚
at d˚
a |ξ| > 1, medan
det ¨
ar begr¨
ansat upp˚
at d˚
a |ξ| 6 1, med supremum lika med 0. Allts˚
a¨
ar fe = i[−1,1] ,
indikatorfunktionen f¨
or intervallet [−1, 1]. Om vi tar f som indikatorfunktionen f¨
or
e
ett intervall [a, b], s˚
a ser vi att f (ξ) blir aξ f¨
or ξ > 0 och bξ f¨
or ξ 6 0. Om intervallet
e
ar just [−1, 1] s˚
¨
a blir f (ξ) = |ξ|.
Exempel. Om f (x) = |x| + x2 /2, x ∈ R, s˚
a f˚
ar vi anv¨
anda en kombination av
resonemanget i det sista exemplet och differentialkalkyl. Om n¨
amligen |ξ| 6 1 s˚
a
e
ser man precis som i f¨
orra exemplet att f (ξ) = 0. Men om |ξ| > 1 s˚
a kan vi s¨
oka
maximum av uttrycket ξx − |x| − x2 /2 med differentialkalkyl. Derivatan ¨
ar f¨
or x > 0
lika med ξ − 1 − x och har ett unikt nollst¨
alle x = ξ − 1 > 0 om vi antar att ξ > 1.
1
2
Detta ger v¨
ardet ξx − x − x /2 = 2 (ξ − 1)2 . Av symmetrisk¨al blir fe(−ξ) = fe(ξ),
s˚
a vi beh¨
over inte titta speciellt p˚
a ξ < −1 utan kan sammanfatta resultatet av
2
1
e
unders¨
okningen i formeln f (ξ) = 2 (|ξ| − 1)+ , ξ ∈ R. B˚
ade f och fe ¨
ar skarvade
andragradspolynom, men skarvningen g˚
ar till p˚
a olika s¨
att.
3
Exempel. Om f (x) = x s˚
a blir fe(ξ) = +∞ f¨
or alla ξ. H¨
ar finns inga affina minoranter.
Exempel. Om f (x) = ex , x ∈ R, s˚
a kan vi r¨
akna ut fe med differentialkalkyl f¨
or ξ > 0
medan vi kan resonera mera direkt d˚
a ξ 6 0. Vi finner att


 ξ log ξ − ξ,
fe(ξ) = 0,


+∞,
ξ > 0;
ξ = 0;
ξ < 0.
Stirlings formel visar allts˚
a att fe(ξ) ≈ log(ξ!) d˚
a ξ 0:
eξx
= ξ ξ e−ξ ≈ (2πξ)−1/2 ξ!,
ex
e
x∈R
exp fe(ξ) = sup
19
ξ > 0.
Liknande approximativa likheter vi f˚
a genom att approximera supremum med en
integral:
Z
Z +∞
eξx
ξx−ex
e
exp f (ξ) = sup ex ≈
e
dx =
tξ−1 e−t dt = (ξ − 1)!,
ξ > 0,
e
x∈R
R
0
eller
exp fe(ξ) = sup tξ e−t ≈
t>0
+∞
Z
tξ e−t dt = ξ!,
ξ > 0.
0
e
Inversionsformeln (se nedan sats 10.1) ger att fe = f och d¨
armed
ex
e
∞
X ekx
x
eξx
e
= exp f (x) = exp fe(x) = sup exp(ξx − fe(ξ)) = sup ξ −ξ ≈
= ee .
k!
ξ∈R
ξ>0 ξ e
k=0
Det enda som ¨
ar f¨
orv˚
anande h¨
ar ¨
ar att approximationen faktiskt ¨
ar en exakt likhet.
Finns det n˚
agon f¨
orklaring?
Exempel. S¨
att f (x) = 12 x21 + 13 x32 f¨
or x ∈ R2 , x2 > 0; f (x) = +∞ f¨
or x2 < 0. D˚
a
3/2
ar fe(ξ) = 12 ξ12 + 23 ξ2 d˚
¨
a ξ2 > 0, och fe(ξ) = 12 ξ12 d˚
a ξ2 < 0. F¨
or ξ2 > 0 kan vi
finna detta med differentialkalkyl, ty gradienten
av
uttrycket
ξ
·
x
− 12 x21 − 13 x32 ¨ar
√
ξ − (x1 , x22 ) som har ett enda nollst¨
alle x = (ξ1 , ξ2 ) d˚
a ξ2 > 0, x2 > 0. Detta v¨
arde
√
1 2
1 2
1 3
1 3/2
1 2
2 3/2
2
ger insatt i uttrycket ξ · x − 2 x1 − 3 x2 = ξ1 + ξ2 ξ2 − 2 ξ1 − 3 ξ2 = 2 ξ1 + 3 ξ2 . Om
d¨
aremot ξ2 6 0 s˚
a ser vi att uttryckets supremum antas d˚
a x2 = 0, och det handlar
d˚
a om den redan v¨
alk¨
anda Fencheltransformen av 21 x21 .
P
Exempel. Om f (x) = 12
xj ajk xk d¨
ar A = (ajk ) ¨
ar en reell symmetrisk och positivt
definit matris och x = (x1 , ..., xn )T en kolonnvektor, s˚
aledes med matrismultiplikation
f (x) = 21 xT Ax,
x ∈ Rn ,
s˚
a blir
fe(ξ) = 12 ξA−1 ξ T ,
(D˚
a n = 1 f˚
ar vi speciellt f (x) =
semidefinit s˚
a f˚
ar man i st¨allet
1
ξBξ T
fe(ξ) = 2
+∞
ξ = (ξ1 , ..., ξn ).
1
2
2 ax ,
fe(ξ) =
1 2
2 ξ /a.)
Om A bara ¨
ar positivt
d˚
a ξ tillh¨
or radrummet till A
annars,
d¨
ar B ¨
ar en symmetrisk kvasiinvers till A, dvs. ABA = A. Detta kan ocks˚
a formuleras
s˚
a h¨
ar:
f (x)
d˚
a ξ = xT A f¨
or n˚
agot x ∈ Rn ,
e
f (ξ) =
+∞
om ξ inte ¨
ar av formen xT A.
Beviset ¨
ar denna r¨
akning:
1
1
1
fe(ξ) = fe(xT A) = sup(xT Ay − y T Ay) = sup xT Ax − (x − y)T A(x − y)
2
2
2
y
y
= sup f (x) − f (x − y) = f (x) − inf f (x − y) = f (x)
y
y
d¨
ar den sista olikheten f¨
oljer av att f (x − y) > 0 och antar v¨
ardet 0 d˚
a y = x. Vi ser
e
allts˚
a att problemet att ber¨
akna f ¨
ar ekvivalent med problemet att ber¨
akna inversen
till en symmetrisk matris i detta fall.
20
Proposition 9.3. F¨
or alla funktioner f, g: Rn → [−∞, +∞] g¨
aller
(f u
t g)e = fe+ ge.
·
Bevis. En l¨
att r¨
akning tack vare r¨
akneregeln (7.2).
·
Notera att vi har undre addition i proposition 9.3. Vi vet att fe+ ge ¨
ar konvex.
·
Det visar sig nu att fe+ ge = fe+ ge utom d˚
a fe+ ge ¨
ar konstant.
·
·
Propositionerna 9.2 och 9.3 ger tillsammans en kedja av olikheter:
(9.6)
e
e 6 fe u
(f + g)e 6 fe+ ge
e e = fe t
u ge e
t ge.
·
·
(Till¨
ampa proposition 9.3 p˚
a fe och ge.) I spelteorin vill man g¨
arna ha likhet hela
v¨
agen h¨
ar, dvs. man vill ha regeln
(9.7)
(f + g)e = fe u
t ge
·
som ¨
ar dual till proposition 9.3. Den g¨
aller inte alltid, men vi kan notera f¨
oljande
resultat:
e
Corollarium 9.4. Om fe = f och ge
e = g s˚
a g¨
aller
e
(f + g)e = (fe u
t ge)e.
·
Det kan mycket v¨
al vara strikt olikhet p˚
a den sista platsen i (9.6) ¨
aven under antagandena i detta corollarium:
Exempel. Definiera tv˚
a funktioner f, g: R2 → [−∞, +∞] genom f¨
oreskrifterna
0
x1 = 0
f (x) =
+∞
annars;
0
x1 = 1
g(x) =
+∞
annars.
D˚
a blir fe(ξ) = 0 d˚
a ξ2 = 0 och +∞ annars, medan ge(ξ) = ξ1 d˚
a ξ2 = 0 och +∞
e
annars. Detta g¨
or att f + g = +∞ identiskt, medan f u
t ge(ξ) antar v¨
ardet −∞ d˚
a
·
e = −∞ identiskt, medan fe u
ξ2 = 0. D¨
arf¨
or blir (f + g)e = (fe u
t ge)e
t ge(ξ) = +∞ d˚
a
·
ξ2 6= 0. Det betyder att (9.7) inte g¨
aller.
Exempel. Andra exempel kan man konstruera med hj¨
alp av indikatorfunktionen s˚
a
e
h¨
ar: l˚
at f = iX och ge = iY (d˚
a ¨
ar X och Y automatiskt slutna och konvexa).
e=i
e
D˚
a¨
ar f u
t ge = iX+Y och man kan visa (se sats 10.1 nedan) att (fe u
t ge)e
X+Y ,
indikatorfunktionen f¨
or det slutna h¨
oljet av X + Y . Nu kan vi ta X och Y slutna och
konvexa men s˚
adana att deras vektorsumma inte ¨
ar sluten. Ett standardexempel p˚
a
detta ¨
ar
X = {x ∈ R2 ; x2 > 0, x1 x2 > 1},
21
Y = {x ∈ R2 ; x2 = 0},
X + Y = {x ∈ R2 ; x2 > 0},
X + Y = {x ∈ R2 ; x2 > 0}.
e
D˚
a blir fe u
t ge 6= fe u
t ge e.
Exempel. Om
1
fj (x) =
(x − λj )2 ,
x ∈ Rn ,
2σj
s˚
a blir
σj 2
fej (ξ) =
ξ + λj · ξ,
2
ξ ∈ Rn ,
och fe1 + fe2 = fe3 , d¨
ar λ3 = λ1 + λ2 , σ3 = σ1 + σ2 . Allts˚
a g¨
aller
(f1 u
t f2 )e = fe1 + fe2 = fe3
e = (fe1 + fe2 )e = fe
e3 . Vi har redan sett att f1 u
varav f¨
oljer att (f1 u
t f2 )e
t f2 = f3
i ett tidigare exempel. Man kan ¨aven visa direkt att f1 u
t f2 ¨ar kontinuerlig, vilket
e = f3 (sats 10.1 nedan).
tillsammans med konvexiteten ger att f1 u
t f2 = (f1 u
t f2 )e
J¨
amf¨
or med Fourier- eller Laplacetransformen av gj = (2πσj )−n/2 e−fj . Detta illustrerar analogin mellan ˚
a ena sidan infimalfaltningen och Fencheltransformationen, ˚
a
andra sidan faltningen och Fourier- eller Laplacetransformationen. Vi kan frig¨
ora
oss fr˚
an den speciella formen hos f . L˚
at fj (x) = σj f ((x − λj )/σj ) representera en
partikel med l¨
age λj och spridning σj , men d¨
ar f nu ¨
ar en allm¨
an funktion. D˚
a f˚
ar
man att
fej (ξ) = σj fe(ξ) + λj · ξ,
s˚
a att vi ˚
aterigen f˚
ar fe1 + fe2 = fe3 med samma relationer mellan l¨
age och spridning
e
som f¨
orut, f¨
orutsatt endast att f antar n˚
agot annat v¨
arde ¨
an 0 och ±∞ (s˚
a att σj
och λj ¨
ar best¨amda av fj ). Om f ¨
ar reellv¨
ard och konvex s˚
a g¨
aller att f1 u
t f2 = f3
(j¨
amf¨
or proposition 8.7).
Vi konstaterade efter proposition 8.3 att en konvex funktion inte beh¨
over ha
n˚
agon som helst kontinuitetsegenskap. Emellertid var exemplet s˚
adant att f antog
v¨
ardet +∞ i n¨
arheten av diskontinuitetspunkterna. Detta var ingen slump: vi skall
se att konvexa funktioner ¨
ar kontinuerliga i det inre av dom f (se (9.2)).
Sats 9.5. L˚
at f : Rn → [−∞, +∞] vara konvex och l˚
at Ω = (dom f )◦ vara det inre
av den m¨
angd d¨
ar f (x) < +∞. D˚
a ¨
ar f antingen konstant lika med −∞ i Ω eller
en kontinuerlig reellv¨
ard funktion i Ω.
Bevis. Man konstaterar f¨
orst att om f inte ¨
ar konstant −∞ i Ω s˚
a m˚
aste f vara reellv¨
ard d¨
ar (se diskussionen efter proposition 8.3). Vi skall g¨
ora ett induktionsbevis.
Satsen ¨
ar s¨akert sann om dimensionen ¨
ar lika med noll. Vi antar att vi visat den
f¨
or n − 1 och skall anv¨
anda olikheten (8.1) p˚
a tv˚
a s¨att f¨
or att g˚
a upp ett steg i
0
0
n−1
dimension. Vi skriver variablerna som x = (x , xn ) d¨
ar x ∈ R
(d˚
a n = 1 skall vi
0
helt bortse fr˚
an x ). Antag att 0 ∈ Ω. Vi har f¨
or n˚
agot tillr¨
ackligt litet positivt ε att
f (0, ε) < +∞ och
f (x) 6 (1 − λ)f (y 0 , 0) + λf (0, ε)
om y 0 v¨
aljes s˚
a att x blir en konvex line¨
arkombination av (y 0 , 0) och (0, ε):
x = (1 − λ)(y 0 , 0) + λ(0, ε).
22
P˚
a samma s¨att g¨
aller
f (z 0 , 0) 6 (1 − µ)f (x) + µf (0, −ε)
om
(z 0 , 0) = (1 − µ)x + µ(0, −ε).
H¨
ar blir λ = xn /ε best¨amd av xn och ε, liksom µ. Vi s¨
atter ihop olikheterna s˚
a h¨
ar:
µ
x0
f ((1 − µ)x0 , 0)
−
f (0, −ε) 6 f (x) 6 (1 − λ)f
, 0) + λf (0, ε).
1−µ
1−µ
1−λ
Detta g¨
aller f¨
or 0 6 xn < ε; en liknande olikhet g¨
aller f¨
or −ε < xn 6 0. Enligt
0
induktionsantagandet ¨
ar f (x , 0) en kontinuerlig funktion av de n − 1 variablerna
x0 = (x1 , ..., xn−1 ), och vi kan konstatera att f (x) ligger inkl¨
amd mellan tv˚
a uttryck
som beror kontinuerligt p˚
a x och har gr¨
ansv¨
ardet f (0) d˚
a x → 0, ty λ, µ → 0 d˚
a
xn → 0. D¨
arf¨
or ¨
ar f kontinuerlig i origo, vilket visar satsen.
P˚
a randen av Ω kan en konvex funktion vara diskontinuerlig. Det visar sig att
en viss form av halvkontinuitet ¨
ar viktig:
Sats 9.6. F¨
or en godtycklig funktion f : Rn → [−∞, +∞] ¨
ar f¨
oljande egenskaper
ekvivalenta:
1. f ¨
ar ned˚
at halvkontinuerlig, dvs. lim inf y→x f (y) = f (x) f¨
or alla x ∈ Rn .
2. epi f ¨
ar en sluten m¨
angd i Rn+1 .
3. F¨
or varje reellt a ¨
ar subniv˚
am¨
angden {x ∈ Rn ; f (x) 6 a} sluten.
Bevis. Om 1 g¨
aller och (xj , tj ) ¨
ar en f¨
oljd i epi f som konvergerar mot (x, t) s˚
a ser
vi att
t = lim inf tj > lim inf f (xj ) > lim inf f (y) = f (x),
y→x
j→+∞
vilket betyder att (x, t) ∈ epi f . Allts˚
a¨
ar epi f sluten; vi har visat egenskapen 2.
Vi kan l¨
agga in subniv˚
am¨angden i punkt 3 p˚
a h¨
ojden a i Rn+1 och f˚
ar
{x ∈ Rn ; f (x) 6 a} × {a} = epi f ∩ {(x, t) ∈ Rn+1 ; t = a}.
Om nu epi f ¨
ar sluten s˚
a¨
ar den sista m¨
angden h¨
ar snittet av tv˚
a slutna m¨
angder.
Allts˚
a implicerar 2 egenskapen 3.
Om slutligen 3 g¨
aller s˚
a ser vi att om a < f (x) s˚
a¨
ar a < f (y) f¨
or alla y n¨
ara x,
varf¨
or
lim inf f (y) > a.
y→x
H¨
arav f¨
oljer att lim inf y→x f (y) > f (x); den motsatta olikheten g¨
aller alltid. Allts˚
a
g¨
aller egenskapen 1.
10. Dualitet
e
Vi skall nu studera n¨
ar fe = f . Som vi konstaterat i b¨
orjan av avsnitt 9 ¨
ar detta
e
detsamma som att fr˚
aga huruvida f ¨
ar ett supremum av affina funktioner, ty fe ¨ar
genom sin definition ett supremum av affina funktioner. Svaret ges av:
23
Sats 10.1. (Inversionsformeln f¨
or Fencheltransformationen.) L˚
at f vara en funktion
e
n
p˚
a R med v¨
arden i [−∞, +∞]. D˚
a g¨
aller att fe = f om och endast om f har f¨
oljande
tre egenskaper:
A. f ¨
ar konvex;
B. f ¨
ar ned˚
at halvkontinuerlig;
C. Om f antar v¨
ardet −∞ s˚
a¨
ar f lika med −∞ identiskt.
Namnet inversionsformel kommer av att en funktion som uppfyller f¨
oruts¨
attningarna
kan ˚
atervinnas fr˚
an sin Fencheltransform; transformationen ¨
ar sin egen invers:
e
f (x) = fe(x) = sup(ξ · x − fe(ξ)),
x ∈ Rn .
ξ
Bevis. Vi konstaterar f¨
orst att varje Fencheltransform m˚
aste ha de tre egenskaperna.
Exempelvis ¨
ar varje Fencheltransform ett supremum av affina, allts˚
a kontinuerliga,
funktioner, och ett godtyckligt supremum av ned˚
at halvkontinuerliga funktioner ¨ar
ned˚
at halvkontinuerligt. Speciellt ser vi att f m˚
aste ha egenskaperna A, B, C om
e
e
f = f.
Vi skall nu bevisa omv¨
andningen. Den bygger p˚
a existensen av separerande
hyperplan (sats 3.2) som ger sats 3.7 d¨
ar varje sluten konvex m¨angd framst¨
alls som ett
snitt av slutna halvrum. L˚
at allts˚
a f vara en konvex funktion med sluten epigraf. Om
f antar v¨ardet −∞ s˚
a g¨
aller resultatet, ty (−∞)e = +∞ och (+∞)e = −∞. D¨
arf¨
or
kan vi nu anta att −∞ < f 6 +∞. Vidare g¨
aller satsen om f ¨
ar +∞ identiskt. L˚
at
oss ta en godtycklig punkt (x0 , t0 ) utanf¨
or epigrafen, dvs. med f (x0 ) > t0 . Eftersom
epigrafen ¨
ar sluten finns det enligt sats 3.2 ett hyperplan i Rn+1 som separerar epi f
och (x0 , t0 ) strikt. Ett hyperplan i Rn+1 har ekvationen
ξ · x + bt = c
f¨
or n˚
agot val av ξ ∈ Rn och b ∈ R, och ett halvrum ¨
ar antingen epigrafen till en
affin funktion (d˚
a b < 0) eller vertikalt (b = 0), eller slutligen hypografen till en
affin funktion (b > 0). Den sistn¨
amnda typen av halvrum kan endast inneh˚
alla den
tomma epigrafen, och f¨
orekommer s˚
aledes endast d˚
a f ¨
ar +∞ identiskt; d˚
a g¨
aller
satsen som vi redan konstaterat. Problemet ¨
ar att visa att de vertikala halvrummen,
som verkligen kan f¨
orekomma, inte p˚
averkar snittet.
Att hyperplanet ¨
ar strikt separerande inneb¨
ar att det finns ett tal ε s˚
adant att
ξ · x + bt 6 c < c + ε 6 ξ · x0 + bt0
f¨
or alla (x, t) ∈ epi f . Om det finns n˚
agon punkt d¨
ar f (x) < +∞ (och om detta inte
ar sant ¨
¨
ar f identiskt plus o¨
andligheten och resultatet g¨
aller), s˚
a ser vi att vi m˚
aste
ha b 6 0 (l˚
at t > f (x) och g˚
a mot plus o¨
andligheten). Om nu b < 0 s˚
a¨
ar det l¨
att att
avsluta beviset: vi kan helt enkelt dividera med −b och f˚
ar
(−ξ/b) · x − f (x) 6 −c/b < −(c + ε)/b 6 (−ξ/b) · x0 − t0 .
Det ger att fe(−ξ/b) 6 (−ξ/b) · x0 − t0 och d¨
arf¨
or
e
fe(x0 ) > (−ξ/b) · x0 − fe(−ξ/b) > t0 .
24
e
Det inneb¨
ar att fe(x0 ) ¨
ar st¨orre ¨
an eller lika med varje t0 som ¨
ar mindre ¨
an f (x0 ),
e
dvs. att fe(x0 ) > f (x0 ). Speciellt ser vi att om f (x0 ) < +∞ s˚
a m˚
aste b < 0 och
det gjorda resonemanget g¨
aller. Men det kan h¨
anda att b = 0; det svarar mot att
hyperplanet i Rn+1 ¨
ar vertikalt: det ¨
ar d˚
a inte grafen av n˚
agon affin funktion p˚
a Rn .
I s˚
a fall m˚
aste f (x0 ) = +∞ och vi skall till¨
ampa ett speciellt knep f¨
or att vicka p˚
a
det vertikala hyperplanet. N¨
ar b = 0 vet vi att
ξ · x 6 c < c + ε 6 ξ · x0
f¨
or alla x s˚
adana att det finns ett t med (x, t) i epigrafen, dvs. f¨
or alla x med f (x) <
+∞. Det ger oss enligt definitionen av Fencheltransformen att
fe(θ + sξ) =
sup (θ · x + (sξ) · x − f (x)) 6 fe(θ) +
x∈dom f
sup (sξ) · x 6 fe(θ) + sc,
x∈dom f
f¨
or alla s > 0, ty i definitionen (9.1) av fe s˚
a¨
ar det klart att endast punkter x med
f (x) < +∞ beh¨
over anv¨
andas: se (9.3). Vi f˚
ar d¨
arf¨
or
e
(10.1) fe(x0 ) > (θ + sξ) · x0 − fe(θ + sξ) > (θ + sξ) · x0 − fe(θ) − sc > θ · x0 + sε − fe(θ).
H¨
ar v¨
aljer vi nu θ s˚
a att fe(θ) < +∞; detta ¨
ar m¨
ojligt som vi sett i den f¨
orsta delen
av beviset d¨
ar vi antog att f (x0 ) < +∞. Om vi nu l˚
ater s → +∞ i (10.1) s˚
a ser vi
e
att fe(x0 ) = +∞, det ¨
onskade resultatet.
e
Sats 10.2. Antag att fe = f och ge
e = g samt att fe u
t ge ¨
ar ned˚
at halvkontinuerlig och
ingenstans minus o¨
andligheten eller identiskt minus o¨
andligheten (detta ¨
ar fallet till
e
exempel om f u
t ge ¨
ar reellv¨
ard ¨
overallt). D˚
a g¨
aller att
(f + g)e = fe u
t ge,
·
och speciellt om vi tar v¨
ardet i origo
·
− inf (f (x) + g(x)) = inf (fe(ξ) + ge(−ξ)).
·
x
ξ
Bevis. Vi beh¨
over bara kombinera corollarium 9.4 med satserna 9.5 och 10.1.
11. St¨
odfunktionen
Med hj¨
alp av st¨
odfunktionen kan fr˚
agor om konvexa m¨
angder ¨
overf¨
oras till fr˚
agor om
homogena konvexa funktioner. Det visar sig att st¨
odfunktionen ¨
ar ett specialfall av
Fencheltransformen. Definitionen ¨
ar denna:
Definition 11.1. L˚
at X vara en godtycklig m¨
angd i Rn . D˚
a definierar vi dess
st¨
odfunktion HX genom
HX (ξ) = sup ξ · x,
ξ ∈ Rn .
x∈X
Det ¨
ar klart att om vi l˚
ater f = iX vara indikatorfunktionen till m¨
angden X (den
ar 0 i X och +∞ utanf¨
¨
or), s˚
a ¨
ar HX = fe. Allt som vi gjort i avsnitten 9 och 10
g¨
aller d¨
arf¨
or i denna speciella situation. Det har emellertid sitt intresse att g˚
a igenom
satserna d¨
ar f¨
or att se hur de blir. Vi konstaterar f¨
orst att iX uppfyller villkoren A,
B, C i sats 10.1 om och endast om X ¨
ar sluten och konvex.
25
Proposition 11.2. St¨
odfunktionen HX till en m¨
angd X ¨
ar ned˚
at halvkontinuerlig
och antar v¨
ardet −∞ endast d˚
a X = Ø. Om X 6= Ø s˚
a g¨
aller HX (0) = 0 och HX
ar en positivt homogen konvex funktion. Om X ¨
¨
ar begr¨
ansad och inte tom s˚
a¨
ar HX
reellv¨
ard och d¨
armed kontinuerlig ¨
overallt.
Bevis. Det som ¨
ar nytt i f¨
orh˚
allande till vad vi redan vet om Fencheltransformer ¨
ar
homogeniteten. Den inneb¨
ar att HX (tξ) = tHX (ξ) f¨
or alla positiva tal t, och ¨
ar l¨
att
att visa. Man skriver bara
HX (tξ) = sup (tξ) · x = t sup ξ · x = tHX (ξ).
x∈X
x∈X
Sats 11.3. Om h: Rn → [−∞, +∞] ¨
ar en given positivt homogen konvex funktion
med h(0) = 0 s˚
a s¨
atter vi
(11.1)
X = {x ∈ Rn ; ξ · x 6 h(ξ) f¨
or alla ξ}.
D˚
a blir indikatorfunktionen f¨
or X lika med Fencheltransformen f¨
or h. Om h dessutom ¨
ar ned˚
at halvkontinuerlig s˚
a¨
ar st¨
odfunktionen f¨
or X lika med h.
Bevis. Om x ∈ X s˚
a g¨
aller ξ · x − h(ξ) 6 0 f¨
or alla ξ och allts˚
a blir e
h(x) 6 0; om vi
e
tar ξ = 0 s˚
a ser vi att vi m˚
aste ha h(x) = 0. Om ˚
a andra sidan x ∈
/ X s˚
a finns det
ett ξ s˚
adant att ξ · x − h(ξ) > 0, och om vi ers¨atter ξ med tξ och l˚
ater t g˚
a mot +∞,
s˚
a ser vi att vi m˚
aste ha e
h(x) = +∞, ty
e
h(x) > (tξ) · x − h(tξ) = t(ξ · x − h(ξ))
p˚
a grund av homogeniteten. Detta visar att e
h = iX .
Det sista p˚
ast˚
aendet ¨
ar helt enkelt inversionsformeln f¨
or Fencheltransformatioe
nen: vi har ju e
h = h under de angivna f¨
oruts¨
attningarna. D¨
armed ¨
ar satsen visad.
Vi har allts˚
a identifierat de m¨
angder vilkas indikatorfunktioner ¨
ar Fencheltransformer: det ¨
ar de slutna konvexa m¨
angderna. Likas˚
a de positivt homogena funktioner
som ¨
ar Fencheltransformer: det ¨
ar de ned˚
at halvkontinuerliga konvexa och positivt
homogena funktionerna med h(0) = 0, plus konstanten −∞. Fencheltransformationen blir i dessa fall operationen att ta st¨
odfunktionen av en m¨angd, och i andra
riktningen operationen (11.1).
Vi kan nu specialisera resultaten i avsnitten 9 och 10 till indikatorfunktioner
och homogena funktioner. Exempelvis s¨
ager proposition 9.3 specialiserad till f = iX
och g = iY att st¨
odfunktionen f¨
or en vektorsumma ¨
ar undre summan av vardera
m¨
angdens st¨
odfunktion:
HX+Y = HX + HY .
·
H¨
ar ¨
ar pricken under plustecknet bara n¨
odv¨
andig d˚
a en av m¨angderna ¨
ar tom: b¨
agge
leden blir d˚
a identiskt minus o¨
andligheten. I alla andra fall kan vi skriva ett vanligt
plustecken utan risk f¨
or missf¨orst˚
and.
Om f = iX och g = iY s˚
a¨
ar f + g = f + g = iX∩Y . Om X och Y ¨
ar slutna och
·
e
konvexa s˚
a s¨ager corollarium 9.4 allts˚
a att st¨odfunktionen f¨
or X ∩ Y ¨
ar (HX u
t HY )e.
26
Denna funktion kan beskrivas som den st¨
orsta ned˚
at halvkontinuerliga minoranten
till HX u
t HY om X ∩ Y 6= Ø, och ¨
ar konstanten −∞ om X ∩ Y ¨
ar tom.
12. Spelteori och line¨ar programmering
Vi skall nu visa att spelteorins huvudsats f¨
oljer fr˚
an den dualitetsteori som vi utvecklat. Vi h¨
anvisar till Borell & Lindahl f¨
or bakgrunden. L˚
at oss allts˚
a betrakta ett spel
med tv˚
a spelare och utbetalningsfunktion
X
F (x, y) =
xi aij yj
i,j
d¨
ar x ∈ X, y ∈ Y och X och Y ¨
ar simplex:
X = {x ∈ Rn ; xi > 0 och
X
xi = 1},
Y = {y ∈ Rm ; yj > 0 och
X
yj = 1}.
Sats 12.1. (Spelteorins huvudsats.) L˚
at A = (aij ) vara en given reell matris och l˚
at
X och Y vara de simplex som definierats ovan. D˚
a g¨
aller
(12.1)
inf sup F (x, y) = sup inf F (x, y),
x∈X y∈Y
y∈Y x∈X
och det finns en sadelpunkt (ˆ
x, yˆ) d¨
ar detta v¨
arde antas.
Bevis. Definiera en funktion f genom
X
X
xi aij = max(x · aj ),
f (x) = sup F (x, y) = sup
xi aij yj = max
y∈Y
j
j
y∈Y
d¨
ar aj = (a1j , ..., anj )T ¨
ar den j-te kolonnen i matrisen A. Funktionen f ¨
ar reellv¨
ard
och konvex som maximum av ¨
andligt m˚
anga line¨
ara funktioner. Vi kan r¨
akna ut dess
Fencheltransform: fe(ξ) = 0 d˚
a ξ ligger i det konvexa h¨
oljet av punkterna a1 , ..., am
e
och = +∞ utanf¨
or denna m¨
angd. Man ser ocks˚
a att fe = f . Vidare definierar vi g
som indikatorfunktionen f¨
or X, dvs. g ¨
ar noll i X och +∞ utanf¨
or. Vi kan r¨
akna ut
Fencheltransformen f¨
or g och finner att ge(ξ) = max ξj . Speciellt ¨
ar ge ¨
andlig ¨
overallt,
och d¨
armed ocks˚
a fe u
t ge. Vi kan verifiera att ge
e = g. Sats 10.2 s¨ager d˚
a att
inf (f (x) + g(x)) = − inf (fe(ξ) + ge(−ξ)).
(12.2)
x
ξ
Vi beh¨
over nu bara se efter vad denna likhet betyder. Tydligen ¨
ar
inf sup F (x, y) = inf f (x) = inf (f (x) + g(x)),
x∈X y∈Y
x∈Rn
x∈X
dvs. v¨
ansterledet i (12.2). H¨
ogerledet i (12.2) ¨
ar
− inf (fe(ξ) + ge(−ξ)) = − inf (e
g (−ξ); fe(ξ) = 0) = − inf (max(−ξj ); fe(ξ) = 0)
ξ
ξ
ξ
27
j
= sup(min ξj ; fe(ξ) = 0) = sup( inf x · ξ; fe(ξ) = 0).
j
ξ
ξ
x∈X
P
Villkoret att fe(ξ) = 0 betyder att ξ ¨
ar av formen
aij yj f¨
or n˚
agot y ∈ Y , s˚
a att
h¨
ogerledet i (12.2) blir
sup( inf x · ξ; fe(ξ) = 0) = sup inf
ξ
x∈X
y∈Y x∈X
X
xi aij yj = sup inf F (x, y).
y∈Y x∈X
Allts˚
a¨
ar h¨
ogerledet i (12.2) lika med h¨
ogerledet i (12.1), och vi ser att (12.1) ¨
ar ett
specialfall av sats 10.2. Detta visar att spelets v¨
arde ¨
ar detsamma ur b˚
ada spelarnas
synpunkt.
F¨or att hitta en sadelpunkt anv¨
ander vi kompakthet: det finns en punkt x
ˆ
s˚
adan att f (ˆ
x) = inf x f (x) och en punkt yˆ s˚
adan att h(ˆ
y ) = supy h(y), d¨
ar vi nu satt
h(y) = inf x F (x, y). Det f¨
oljer att
inf sup F (x, y) = inf f = f (ˆ
x),
x
y
x
medan
sup inf F (x, y) = sup h = h(ˆ
y ).
y
x
y
Vidare g¨
aller
F (ˆ
x, y) 6 sup F (ˆ
x, y) = f (ˆ
x)
y
och h(ˆ
y ) = inf F (x, yˆ) 6 F (x, yˆ).
x
Men (12.2) som vi just visat s¨ager ju att f (ˆ
x) = h(ˆ
y ); allts˚
a f¨
oljer att
F (ˆ
x, y) 6 f (ˆ
x) = h(ˆ
y ) 6 F (x, yˆ).
Genom att h¨
ar v¨
alja y = yˆ respektive x = x
ˆ s˚
a f˚
ar vi
F (ˆ
x, y) 6 F (ˆ
x, yˆ) = f (ˆ
x) = h(ˆ
y ) 6 F (x, yˆ)
f¨
or alla x ∈ X och alla y ∈ Y , vilket betyder att (ˆ
x, yˆ) ¨
ar en sadelpunkt.
Sats 12.2. (Dualitetssatsen i line¨
ar programmering.) Ett line¨
art programmeringsproblem
inf cx
och dess dual
sup bT y
Ax>b
AT y=cT
y>0
har samma v¨
arde utom i det fall att b¨
agge polyedrarna ¨
ar tomma.
Vi har h¨
ar tagit upp endast ett par av duala problem (p˚
a generell form respektive
kanonisk form). Se Borell & Lindahl sid. 32–33 f¨
or andra varianter.
P
Bevis. S¨
att fi (x) = 0 d˚
a j aij xj > bi , i = 1, ..., m, och fi (x) = +∞ annars. Det
betyder att fi ¨
ar indikatorfunktionen f¨
or ett halvrum, n¨
amligen det som definieras av
ai · x > bi , d¨
ar ai ¨
ar vektorn (ai1 , ..., ain ). Vi kan l¨
att r¨
akna ut dess Fencheltransform:
fei (ξ) = −tbi d˚
a ξ = −tai , f¨
or n˚
agot t > 0, och fei (ξ) = +∞ ¨
overallt utanf¨
or denna
28
str˚
ale. D˚
a blir f = f1 + · · · + fm indikatorfunktionen f¨
or polyedern P i det f¨
orsta
LP-problemet, och polyederns st¨odfunktion ¨
ar HP = fe. LP-problemets v¨
arde ¨
ar helt
enkelt v = −fe(−c) = −HP (−c).
Corollarium 9.4 (eller noga taget en generalisering av detta till flera termer)
s¨
ager att
e
HP = fe = (f1 + · · · + fm )e = (fe1 u
t ··· u
t fem )e.
Enligt definitionen av infimalfaltningen ¨
ar
X
X
(−yi bi );
(−yi ai ) = ξ och yi > 0 .
g(ξ) = fe1 u
t ··· u
t fem (ξ) = inf
y
D˚
a ξ = −c ¨ar detta tal precis minus v¨
ardet f¨
or det duala LP-problemet, allts˚
a
∗
v = −g(−c). Sammanfattningsvis har vi
v = −fe(−c) = −ge
e(−c) > −g(−c) = v ∗ .
(P˚
ast˚
aendet att v > v ∗ brukar kallas f¨
or den svaga dualitetsatsen och f¨
oljer allts˚
a
e
redan nu.) Vi ser att dualitetssatsen reducerats till fr˚
agan huruvida ge = g i punkten
ξ = −c. Vi vet att ge
e = fe = HP , varav f¨
oljer att ge = f = iP .
L˚
at K beteckna det koniskt konvexa h¨
oljet av vektorerna −ai , i = 1, ..., m.
Det ¨
ar en sluten konvex kon (sats 2.2) och uppenbarligen ¨
ar g = +∞ utanf¨
or K.
e
e
Om P inte ¨
ar tom s˚
a s¨
ager olikheten g > ge = f = HP > −∞ att g ingenstans
antar v¨
ardet −∞. Fr˚
agan om g = ge
e¨
ar d˚
a enbart en fr˚
aga om huruvida g ¨
ar ned˚
at
halvkontinuerlig. Av sats 9.5 ser vi att g ¨
ar kontinuerlig i det inre av K, s˚
a d¨
ar g¨
aller
s¨
akert ge
e(ξ) = g(ξ) (f¨
or ¨
ovrigt ¨
ar K lika med hela rummet om P ¨
ar begr¨
ansad). Hur
blir det p˚
a randen av K? H¨
ar kommer sats 2.2 till v˚
ar hj¨
alp. Betrakta n¨
amligen de
m vektorerna (−ai , −bi ) i Rn × R. Deras koniskt konvexa h¨
olje L ¨
ar enligt sats 2.2
slutet. Vi ser att g helt enkelt ¨
ar den undre begr¨
ansningen av denna kon. Vidare ¨
ar
K bilden av L under projektionen som gl¨
ommer den sista koordinaten. Det f¨
oljer att
g¨
ar kontinuerlig p˚
a K, och d¨
armed att ge
e = g.
Om d¨
aremot P ¨
ar tom s˚
a visar det sig att g = −∞ i K (men fortfarande +∞
e
utanf¨
or). D¨
arf¨
or m˚
aste ge vara −∞ identiskt, s˚
a ge
e = g i K men g > ge
e i komplementet.
∗
∗
Vi ser att v = v = +∞ om −c ∈ K, medan v = +∞ > v = −∞ om −c ∈
/ K, dvs.
d˚
a polyedern i det duala problemet ¨
ar tom. Detta ¨
ar undantagsfallet i satsen. F¨
or
att se att g P
blir −∞ i K s˚
a kanPman resonera s˚
a h¨
ar: om P ¨
ar tom s˚
a finns tal ti > 0
s˚
adana att
ti ai = 0 medan
ti bi > 0. Detta ger
g(ξ) 6
X
(−yi − sti )bi =
X
(−yi bi ) − s
X
ti bi → −∞
P
d˚
a s → +∞, f¨
orutsatt att ξ ∈ K s˚
a att det finns n˚
agon framst¨
allning ξ = (−yi ai ).
¨
Aven
dualitetssatsen i teorin f¨
or line¨
ar programmering ¨
ar allts˚
a en konsekvens
av dualiteten mellan addition och infimalfaltning.
Litteratur
Borell, Christer, & Lindahl, Lars-˚
Ake. 1979. Linj¨
ar och konvex optimering. Uppsala
universitet.
29
Kiselman, Christer O. 1986. Konvekseco en kompleksa analitiko unu-dimensia.
Uppsala University, Lecture Notes 1986:LN2.
Rockafellar, R. Tyrrell. 1970. Convex Analysis. Princeton University Press.
F¨
orfattarens adress: Uppsala universitet, Matematiska institutionen,
Thunbergsv¨
agen 3, 752 38 Uppsala.
Telefon: 018 - 18 32 16; 018 - 30 07 08.
Telefax: 018 - 18 32 01.
Datoradress: matck @ seudac21 . bitnet.
30