Den 17 juli 1991 Konvexa m¨angder och funktioner Christer Kiselman Inneh˚ all: 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. Inledning Konvexa h¨ oljet av en m¨ angd Separerande hyperplan St¨ odjande halvrum och st¨ odjande hyperplan Extremalpunkter Carath´eodorys sats Den utvidgade reella axeln Konvexa funktioner Fencheltransformationen Dualitet St¨ odfunktionen Spelteori och line¨ ar programmering Litteratur 1. Inledning Avsikten med dessa anteckningar ¨ ar att komplettera Lars-˚ Ake Lindahls och Christer Borells bok Linj¨ ar och konvex optimering vad g¨ aller konvexa m¨ angder och funktioner, speciellt betr¨ affande separationssatser och begreppet extremalpunkt. Separationssatserna leder till ett studium av dualitet i konvexitetsteorin, som uttrycks med hj¨ alp av Fencheltransformationen och st¨ odfunktionen. 2. Konvexa h¨ oljet av en m¨angd Tv˚ a punkter a och b i Rn definierar ett segment [a, b] = {(1 − t)a + tb; 0 6 t 6 1} ⊂ Rn . Detta ¨ ar en delm¨ angd av hela linjen {(1 − t)a + tb; t ∈ R}. Om a = b s˚ a blir b˚ ade n segmentet och linjen bara en punkt f¨ orst˚ as. En m¨angd A i R kallas konvex om den inneh˚ aller hela segmentet [a, b] s˚ a fort den inneh˚ aller a och b. En m¨ angd kallas f¨ or ett affint delrum om den med a och b inneh˚ aller hela linjen genom a och b. Vi kallar K ⊂ Rn f¨ or en kon om f¨ or det f¨ orsta 0 ∈ K, f¨ or det andra tx tillh¨ or K s˚ a fort x ∈ K och t ¨ ar ett positivt tal. En kon K blir d˚ a konvex precis n¨ ar den inneh˚ aller varje punkt sa + tb f¨ or alla a, b ∈ K och alla s, t > 0. Slutligen kallar vi A n f¨ or ett line¨ art delrum av R om det ¨ ar s˚ a att 0 ∈ A och A inneh˚ aller sa + tb f¨or varje a, b ∈ A och varje s, t ∈ R. Vi kan allts˚ a sammanfatta alla kraven under den gemensamma implikationen a, b ∈ A ⇒ sa + tb ∈ A, men med olika villkor p˚ a s, t: f¨ or konvexa m¨angder s > 0, t > 0 och s + t = 1; f¨ or affina delrum s, t ∈ R och s + t = 1; f¨ or koner s > 0, t = 0; f¨ or konvexa 1 koner s, t > 0; f¨ or line¨ ara rum s, t ∈ R. Dessutom har vi olika krav vad g¨ aller den tomma m¨ angden: tydligen ¨ ar Ø den minsta konvexa m¨angden och det minsta affina delrummet; medan {0} ¨ ar den minsta konen, den minsta konvexa konen och det minsta line¨ ara delrummet. (H¨ ar finns det naturligtvis ett visst godtycke: vi skulle kunna kr¨ava att en konvex m¨angd ¨ ar icke-tom; vi skulle kunna acceptera Ø som ett line¨ art delrum. Men det ¨ ar ¨ onskv¨ art att fastl¨ agga en viss konvention, och den vi gjort verkar att fungera bra.) Vi har nu implikationerna: konvex m¨angd ⇐ ⇑ kon ⇐ affint delrum ⇑ konvex kon ⇐ line¨ art delrum Snittet av en familj av konvexa m¨ angder ¨ ar konvext. Det ¨ ar l¨ att att se. Vi definierar det konvexa h¨ oljet av en godtycklig m¨angd X som snittet av alla konvexa m¨ angder som inneh˚ aller X. Det betecknas cvx X, allts˚ a \ cvx X = (A; A konvex och A ⊃ X). Det ¨ ar d˚ a klart att cvx X ¨ ar en konvex m¨angd, och dessutom den minsta konvexa m¨ angd som inneh˚ aller X. P˚ a samma s¨ att kan vi definiera h¨ oljen i flera andra fall. S˚ a fort vi har en familj F av m¨angder s˚ a kan vi ju s¨ atta \ (2.1) h(X) = (A; A ∈ F och A ⊃ X). Vi kallar h(X) f¨ or F-h¨ oljet av X. Det visar sig d˚ a att denna operation h alltid har f¨ oljande tre egenskaper: 1. X ⊂ h(X) (h ¨ ar st¨ orre ¨ an identiteten); 2. X ⊂ Y medf¨ or h(X) ⊂ h(Y ) (h ¨ ar v¨ axande); 3. h(h(X)) = h(X) (h ¨ ar idempotent). Vi kan definiera till exempel det affina h¨ oljet till X p˚ a detta s¨att: det ¨ ar det minsta affina delrum som inneh˚ aller X. P˚ a samma s¨att kan vi definiera det slutna h¨ oljet: d˚ a tar vi F som m¨ angden av alla slutna m¨ angder; det handlar h¨ ar om topologi och inte om geometri, men de tre egenskaperna hos h¨ oljesoperationen ¨ ar desamma. En intressant geometrisk h¨ oljesoperation f˚ ar man om man tar F som m¨ angden av alla slutna halvrum (se avsnitt 3). D˚ a blir h¨ oljet av en m¨ angd snittet av alla slutna halvrum som inneh˚ aller den. Vi skall visa att detta snitt ¨ ar det slutna konvexa h¨ oljet. S˚ aledes kan tv˚ a olika familjer F definiera samma operation. Beskrivningen av ett h¨ olje som ett o¨ andligt snitt ger enkelt vissa egenskaper hos operationen, men ¨ ar inte s¨arskilt geometrisk: vi ¨ onskar d¨ arf¨ or en mer anv¨ andbar representation. F¨ oljande sats ger en s˚ adan. Sats 2.1. L˚ at X vara en delm¨ angd av Rn . De olika h¨ oljena vi inf¨ ort kan beskrivas p˚ a f¨ oljande s¨ att med hj¨ alp av line¨ arkombinationer (2.2) N X λj xj j=1 2 d¨ ar λj ∈ R och xj ∈ X: 1. Det konvexa h¨ oljet ¨ ar lika med m¨ angden av alla line¨ arkombinationer (2.2) d¨ ar P N ¨ ar ett heltal > 1, λj > 0 och λj = 1. (S˚ adana line¨ arkombinationer kallas konvexa.) 2. P Det affina h¨ oljet ¨ ar motsvarande m¨ angd men med kravet N > 1, λj ∈ R och λj = 1. (De kallas affina line¨ arkombinationer.) 3. Det koniska h¨ oljet (konen som sp¨ anns av X) f˚ as om N > 0, λ1 > 0 och λj = 0 d˚ a j > 2. 4. Det koniskt konvexa h¨ oljet f˚ ar man om N > 0 och λj > 0. 5. Det line¨ ara h¨ oljet av X ¨ ar lika med m¨ angden av alla line¨ arkombinationer (2.2) d¨ ar N ¨ ar ett heltal > 0, λj ∈ R. Bevis. Notera f¨ orst skillnaden i kraven p˚ a N . Om vi alltid kr¨ aver att N skall vara minst 1, s˚ a blir h(Ø) = Ø; s˚ a har vi gjort f¨ or de affina och konvexa h¨ oljena. Men om vi d¨ aremot till˚ ater N = 0 i summan av alla line¨ arkombinationer (2.2) s˚ a kommer h(Ø) att bli {0}; detta g¨ aller f¨ or de koniska, koniskt konvexa och line¨ ara h¨ oljena. P0 P Anledningen ¨ ar att 1 = Ø = 0 kan bildas om vi till˚ ater N = 0, men inte om vi kr¨ aver N > 1 och X ¨ ar tom. Vi g¨ or endast beviset f¨ or det konvexa h¨ oljet; de andra fallen ¨ ar likadana (eller annu enklare). S¨ ¨ att A lika med m¨angden av alla konvexa line¨ arkombinationer av punkter i X. Tydligen omfattar A m¨ angden X: tag N = 1 och λ1 = 1. Vidare ¨ ar A konvex, ty om vi har tv˚ a punkter a och b i A s˚ a finns framst¨ allningar a= N X λj xj ; M X b= 1 µj yj 1 f¨ or n˚ agra punkter xj och yj i X. F¨ or att visa att A ¨ ar konvex skall vi visa att en punkt c = (1 − t)a + tb tillh¨ or A. Detta f¨ oljer av att vi kan skriva c = (1 − t)a + tb = N X (1 − t)λj xj + 1 M X tµj yj = 1 NX +M νj zj , 1 d¨ ar vi inf¨ ort zj = xj och νj = (1 − t)λj f¨ or j = 1, ..., N , medan zj = yj−N och νj = tµj−N f¨ or j = N + 1, ..., N + M . Man kontrollerar att X νj = (1 − t) X λj + t X µj = (1 − t) + t = 1. Det betyder att A ¨ ar konvex, och d¨ arf¨ or att A ⊃ cvx X. Omv¨ ant skall vi visa att A ⊂ cvx X. Det f¨ oljer om vi kan visa att varje konvex m¨ angd Y som omfattar X ocks˚ a omfattar A. Vi skall allts˚ a visa att varje konvex P line¨ arkombination λj xj tillh¨ or Y om xj ∈ X. F¨ or N = 1 ¨ ar det klart; f¨ or N = 2 ¨ar det definitionenP p˚ a konvexitet. Antag nu att N > 3 och att vi redan visat resultatet N −1 f¨ or N − 1. Om 1 λj 6= 0 s˚ a kan vi skriva N X 1 λj xj = N −1 X 1 λj xj + λN xN = −1 NX 1 3 λk −1 NX 1 λj PN −1 1 λk xj + λN xN = (1 − λN ) N −1 X µj xj + λN xN = (1 − λN )y + λN xN . 1 PN −1 P H¨ ar ¨ ar µj = 1 s˚ a y = µj xj ∈ Y enligt induktionsantagandet. Och s˚ a 1 till¨ ampar vi resultatet f¨ or N = 2 och f˚ ar att (1 − λN )y + λN xN ∈ Y . Om ˚ a andra PN −1 PN sidan 1 λj = 0 s˚ a¨ ar 1 λj xj = xN ∈ Y . Detta avslutar beviset. I beviset ser det ut som om talet N v¨ axer obegr¨ ansat: om a kan representeras med N punkter, och b med M , s˚ a kan den mellanliggande punkten c representeras med N + M punkter. Men kanske ¨ ar talet N + M on¨ odigt stort, kanske kan man reducera p˚ a n˚ agot s¨att. En intressant fr˚ aga ¨ ar d¨ arf¨ or om det g˚ ar att begr¨ansa antalet N . Fr˚ agan ¨ ar viktig bland annat av det sk¨alet att vi vill ha slutna konvexa m¨angder. L˚ at K vara en kompakt m¨ angd och fixera ett tal N . D˚ a¨ ar det klart att m¨ angden KN = X N λj xj ; λj > 0, j=1 X λj = 1 och xj ∈ K ¨r kompakt. Den ¨ a ar n¨ amligen bilden av n˚ agon kompakt m¨ angd under en kontinuerlig avbildning. Och det konvexa h¨ oljet av K ¨ ar ju som vi sett unionen av alla KN d˚ a N = 1, 2, 3, ... . En uppr¨ aknelig union av kompakter ¨ ar emellertid inte alltid kompakt. Det ¨ar d˚ a intressant att veta att f¨ oljden (KN ) ¨ ar station¨ ar, dvs. att det finns ett tal m s˚ adant att unionen ¨ ar lika med Km . I sj¨ alva verket kan man ta m = n + 1, d¨ ar n ar dimensionen i rummet. L˚ ¨ at oss emellertid redan nu notera att om X ¨ ar en ¨ andlig m¨angd s˚ a blir cvx X kompakt: d˚ a r¨ acker det att ta N lika med antalet element i X. Detta visar f¨ orsta delen av f¨ oljande sats. Sats 2.2. Det konvexa h¨ oljet av en ¨ andlig m¨ angd ¨ ar kompakt. Det koniskt konvexa h¨ oljet av en ¨ andlig m¨ angd ¨ ar slutet. Notera att det koniskt konvexa h¨ oljet av en kompakt m¨ angd inte s¨ akert ¨ ar slutet (exempel: ett klot med origo p˚ a randen). Bevis. Det ˚ aterst˚ ar att visa att det koniskt konvexa h¨ oljet av en ¨ andlig m¨ angd ¨ ar slutet. Vi g¨ or induktion ¨ over antalet element. Uppenbarligen ¨ ar resultatet sant d˚ a N = 0. Antag nu att resultatet ¨ ar sant f¨ or N − 1 element, och l˚ at K vara en konvex kon som genereras av N − 1 element. Tag ett element till, s¨ag a. D˚ a g¨ aller det att visa att m¨angden Ka av alla element av formen x + λa, d¨ ar x ∈ K och λ > 0, ¨ ar sluten. Antag d¨ arf¨ or att yj = xj + λj a → y. Vi skall d˚ a visa att y ∈ Ka . Om nu f¨ oljden av λj ¨ ar begr¨ ansad s˚ a finns det en konvergent delf¨ oljd, s¨ag λjk → λ, och man f˚ ar d˚ a att motsvarande delf¨ oljd av xj konvergerar, ty xjk = yjk − λjk a → y − λa = x, och x ∈ K eftersom xjk ∈ K och K ¨ ar sluten enligt induktionsantagandet. Allts˚ a g¨ aller att y = x + λa ∈ Ka . Men det kan intr¨ affa att f¨ oljden (λj ) ¨ ar obegr¨ ansad, och d˚ a skall vi visa att Ka ¨ ar sluten med ett helt annat resonemang. Antag allts˚ a att f¨ oljden (λj ) ¨ ar obegr¨ ansad. D˚ a finns det en delf¨ oljd (λjk ) som g˚ ar mot plus o¨ andligheten, och vi kan skriva K3 yj xjk = k − a → −a, λjk λjk 4 vilket visar att −a ∈ K. Det medf¨ or att Ka = K + Ra, dvs. vektorsumman av konen K och den r¨ ata linjen Ra. Nu kan vi anv¨ anda induktionsantagandet f¨ or att se att n n K + Ra ¨ ar sluten. L˚ at π: R → R vara en line¨ ar avbildning med nollrum π −1 (0) −1 exakt lika med Ra. D˚ a¨ ar K + Ra = π (π(K)). Vidare ¨ ar π(K) genererad av N − 1 −1 element, s˚ a den ¨ ar sluten, och K +Ra = π (π(K)) ¨ ar sluten som urbild av en sluten m¨ angd under en kontinuerlig avbildning. Detta visar satsen. 3. Separerande hyperplan Ett hyperplan ¨ ar ett affint delrum av codimension 1. Det betyder att det ges av en enda ekvation ξ · x = b, d¨ ar ξ inte ¨ ar noll. I koordinatform blir det H = {x ∈ Rn ; ξ1 x1 + · · · + ξn xn = b}, d¨ ar inte alla koefficienterna ξj ¨ ar noll. Codimensionen ¨ ar den komplement¨ ara dimenn sionen, dvs. den ¨ ar lika med dim R − dim H = n − (n − 1) = 1. Ett hyperplan delar alltid in rummet Rn i tv˚ a halvrum : D+ = {x ∈ Rn ; ξ · x > b} och D− = {x ∈ Rn ; ξ · x 6 b}. Deras snitt D+ ∩ D− ¨ ar f¨ orst˚ as lika med hyperplanet H. Vidare ¨ ar r¨ anderna ∂D+ = − + + ◦ ∂D = H. Det inre av D (betecknat (D ) ) definieras av den strikta olikheten ξ · x > b. Om vi vill vara mer precisa kallar vi D+ f¨ or ett slutet halvrum och dess inre (D+ )◦ f¨or ett ¨oppet halvrum. Vi har ∂(D+ )◦ = ∂(D− )◦ = H och (D+ )◦ ∩(D− )◦ = Ø. Ett hyperplan best¨ammer inte sin ekvation entydigt. Om vi i st¨ allet anv¨ ander + − ekvationen (−ξ)·x = −b s˚ a byter D och D plats, ty tecknet definieras ju med hj¨ alp av ξ. S˚ a H best¨ammer inte vilket av halvrummen som skall vara D+ . Nedanst˚ aende definition inneh˚ aller en s˚ adan teckenkomplikation, men denna skapar knappast n˚ agra problem. Definition 3.1. L˚ at tv˚ a m¨ angder X och Y vara givna i Rn , och l˚ at H beteckna ett hyperplan med ekvationen ξ · x = b. Man s¨ ager att H separerar X och Y om det g¨ aller att ξ·x6b6ξ·y f¨ or alla x ∈ X, y ∈ Y. Vi s¨ ager att H separerar X och Y strikt om det g¨ aller att ξ·x<b<ξ·y f¨ or alla x ∈ X, y ∈ Y. Vi kan slutligen s¨ aga (med ett mer tillf¨ alligt uttryckss¨ att) att H separerar X och Y mycket strikt om det finns tv˚ a tal b1 och b2 s˚ adana att ξ · x 6 b 1 < b < b2 6 ξ · y f¨ or alla x ∈ X, y ∈ Y. Separation betyder allts˚ a att X och Y ligger i varsitt halvrum, varvid vi arbetar med slutna halvrum f¨ or vanlig icke-strikt separation, och med ¨ oppna halvrum f¨ or den strikta separationen. Om Y = {y} best˚ ar av bara en punkt s¨ager vi f¨ orst˚ as att H separerar X och y om H separerar X och {y}. Detta specialfall ¨ ar i sj¨ alva verket ekvivalent med 5 det allm¨ anna. Beteckna med Hb hyperplanet som definieras av ξ · x = b. Man ser l¨ att att Hb separerar X och Y f¨ or n˚ agot tal b om och endast om H0 separerar X − Y = {x − y; x ∈ X & y ∈ Y } och origo. F¨ or den strikta separationen blir det en aning annorlunda: om Hb separerar X och Y strikt, s˚ a f˚ ar vi bara att H0 separerar X − Y och origo (icke-strikt). Och om H0 separerar X − Y och origo strikt s˚ a separerar Hb m¨ angderna X och Y mycket strikt f¨ or n˚ agot b. Det verkar kanske litet irriterande, men skillnaden mellan mycket strikt och strikt f¨ orsvinner ofta. Om den ena m¨ angden ¨ ar kompakt s˚ a¨ ar det helt enkelt ingen skillnad. Vi ¨ar intresserade av att hitta m˚ anga hyperplan – tillr¨ ackligt m˚ anga f¨ or att visa att varje sluten konvex m¨angd ¨ ar ett snitt av slutna halvrum (sats 3.7), och tillr¨ ackligt m˚ anga f¨ or att visa att varje konvex kompakt ¨ ar det konvexa h¨ oljet av sina extremalpunkter (avsnitt 5). I konvexitetsteorin finns det tv˚ a viktiga separationssatser: Sats 3.2. Om F ¨ ar en sluten konvex m¨ angd i Rn och y ∈ / F , s˚ a finns det ett hyperplan som separerar F och y mycket strikt. Sats 3.3. Om A ¨ ar en konvex m¨ angd i Rn och y ∈ / A, s˚ a finns det ett hyperplan som separerar A och y. Detsamma g¨ aller om y ∈ ∂A. Av dessa tv˚ a satser s˚ a f¨ oljer genast separationssatser f¨ or tv˚ a m¨ angder: Sats 3.4. Om F och K ¨ ar tv˚ a disjunkta slutna konvexa m¨ angder i Rn och K dessutom ¨ ar begr¨ ansad, s˚ a finns det ett hyperplan som separerar F och K mycket strikt. Sats 3.4 f¨ oljer av sats 3.2 genom att vi kan separera F − K och origo strikt. H¨ ar ser man n¨ amligen att F − K ¨ ar en sluten konvex m¨angd som inte inneh˚ aller origo. Sats 3.5. Om X och Y ¨ ar tv˚ a disjunkta konvexa m¨ angder i Rn s˚ a finns det ett hyperplan som separerar X och Y . Sats 3.5 f¨oljer av sats 3.3 genom att man bildar A = X − Y som ¨ ar en konvex m¨ angd som inte inneh˚ aller origo. Farkas’ lemma i den form som det har hos Borell & Lindahl s. 17 ¨ ar ett specialfall av den f¨ orsta separationssatsen. Den slutna m¨ angden F ¨ ar d¨ ar en konvex kon som genereras av en ¨ andlig m¨angd. Explicit har vi: Sats 3.6. L˚ at A vara en ¨ andlig m¨ angd i Rn och l˚ at y ∈ Rn . D˚ a g¨ aller att y inte tillh¨ or det koniskt konvexa h¨ oljet av A om och endast om det finns en line¨ arform ξ s˚ adan att ξ(a) > 0 f¨ or varje a ∈ A och ξ(y) < 0. Bevis. Vi till¨ ampar sats 3.2 p˚ a det koniskt konvexa h¨ oljet F av A; vi vet tack vare sats 2.2 att F ¨ ar slutet. Vi f˚ ar ξ(y) < b < ξ(λa) f¨ or varje a ∈ A och varje λ > 0. Om vi l˚ ater λ g˚ a mot noll s˚ a ser vi att b 6 0 och att allts˚ a ξ(y) < 0; om vi l˚ ater λ g˚ a mot +∞ s˚ a ser vi att ξ(a) > 0. Detta visar satsen. Den geometriska betydelsen av sats 3.6 ¨ ar att det koniskt konvexa h¨ oljet F av en ¨ andlig m¨angd A kan beskrivas med hj¨ alp av halvrum. L˚ at n¨ amligen Dξ = {x ∈ Rn ; ξ(x) > 0} vara det halvrum som definieras av en line¨ arform ξ 6= 0. D˚ a s¨ ager sats 3.6 att y ∈ /F om och endast om det finns ett ξ s˚ adant att Dξ ⊃ A och y ∈ / Dξ . Ekvivalent med 6 detta ¨ar att F ¨ ar snittet av alla Dξ med Dξ ⊃ A, dvs. att det koniskt konvexa h¨ oljet av en ¨ andlig m¨ angd ¨ ar snittet av alla halvrum som inneh˚ aller m¨ angden och har origo p˚ a randen; j¨ amf¨ or sats 3.7 nedan. (Ett oberoende bevis av Farkas’ lemma – som hos Borell & Lindahl – ger direkt att det koniskt konvexa h¨ oljet ¨ ar slutet; med uppl¨ aggningen h¨ ar b¨ or man f¨ orst visa detta, vilket vi gjort i sats 2.2, f¨ or att sedan till¨ ampa sats 3.2. V¨ agen h¨ ar blir d¨ armed n˚ agot l¨ angre; ˚ a andra sidan har vi redan fr˚ an b¨ orjan f˚ att en allm¨ annare sats.) En annan form av Farkas’ lemma ¨ ar denna: ekvationssystemet n X ajk xk = bj , j = 1, ..., m, k=1 P har en osning med xk > 0 om och endast om uj bj > 0 f¨ or alla vektorer (u1 , ..., um ) Pl¨ med uj ajk > 0 f¨ or k = 1, ..., n. I den ena riktningen ¨ ar detta ju l¨ att att visa: om det finns en l¨osning x med den angivna egenskapen s˚ a blir X X X XX u j bj = uj ajk xk = uj ajk xk > 0 j k k j P s˚ a fort uj ajk > 0. F¨ or att bevisa den andra riktingen skall vi anta att det inte finns n˚ agon l¨ osning x med den angivna egenskapen och till¨ ampa sats 3.6. a P Titta p˚ konen F i Rm som best˚ ar av alla vektorer y = (y1 , ..., ym ) med yj = ajk xk f¨or n˚ agot x ∈ Rn med xj > 0. M¨ angden F ¨ ar allts˚ a det koniskt konvexa h¨ oljet av punkterna ak = (a1k , ..., amk ) ∈ Rm , k = 1, ..., n, och kan f¨ or ¨ ovrigt ocks˚ a beskrivas som bilden i Rm av den positiva konen i Rn under den line¨ ara avbildning som definieras av matrisen (ajk ). Antagandet att det inte finns en l¨ osning x med angiven positivitetsegenskap betyder just att b inte liggerPi konen F . Enligt sats 3.6 finns det d˚ a en line¨ arform ξ s˚ adan or alla xk > 0. Nu P att ξ(b) < 0 och ξ( ajk xk ) > 0 f¨ m˚ aste ξ ha formen ξ(y) = u y f¨ o r n˚ agot val av u . Slutligen konstaterar vi att j j jP P uj ajk xk > 0 f¨ or alla xk > 0 ¨ ar ekvivalent med att uj ajk > 0 f¨ or alla k. Detta avslutar beviset av p˚ ast˚ aendet. Vi kan omformulera denna variant av Farkas’ lemma som f¨ oljer. Vi betraktar de tv˚ a systemen (S) n X ajk xk = bj , j = 1, ..., m, xk > 0, k = 1, ..., n. k=1 och ∗ (S ) m X uj ajk > 0, k = 1, ..., n, j=1 j=1 I matrisform kan vi skriva (S) m X Ax = b x>0 7 uj bj < 0. och ∗ (S ) AT u > 0 bT u < 0. (Vi anv¨ ander h¨ ar ¨ ovre index T f¨ or att beteckna transponering.) Det vi visat betyder d˚ a att systemet (S) ¨ ar l¨ osbart om och endast om (S∗ ) ¨ ar ol¨ osbart. Hos Borell & Lindahl finns en hel serie av liknande p˚ ast˚ aenden, med strukturen att ett visst system av likheter och olikheter ¨ ar l¨ osbart precis d˚ a ett annat system, kallat det duala, ¨ ar ol¨ osbart. Systemet (S) best˚ ar av m likheter och n icke-strikta olikheter och definierar en sluten polyeder P i Rn , medan (S∗ ) best˚ ar av n icke-strikta olikheter och en enda ∗ strikt olikhet och definierar en polyeder P i Rm . Och resultatet s¨ager att precis en av polyedrarna ¨ ar tom. En viktig konsekvens av separationssatserna ¨ ar att vi nu f˚ att en ny beskrivning av det slutna konvexa h¨ oljet ¨ aven av en o¨ andlig m¨angd: Sats 3.7. Om X ¨ ar en godtycklig m¨ angd i Rn s˚ a¨ ar dess slutna konvexa h¨ olje cvx X lika med snittet av alla slutna halvrum som inneh˚ aller X. (Speciellt ¨ ar slutna konvexa m¨ angder lika med detta snitt.) Bevis. Snittet av alla slutna halvrum ¨ ar en sluten konvex m¨ angd, s˚ a det m˚ aste inneh˚ alla F = cvx X. Omv¨ ant, om x ∈ / F s˚ a finns enligt sats 3.2 ett slutet halvrum D som inneh˚ aller F men inte x. D¨ arf¨ or blir snittet lika med F . Man kan s¨ aga att sats 3.7 beskriver det slutna konvexa h¨ oljet utifr˚ an, medan sats 2.1 beskriver det konvexa h¨ oljet inifr˚ an. Vi skall nu bevisa separationssatserna. Bevis f¨ or sats 3.2. Vi kan √ anta att x = 0 (translatera) och att F 6= Ø. Studera funktionen ϕ(x) = |x| = x · x p˚ a F och dess infimum d = inf(ϕ(x); x ∈ F ). Det ¨ ar tydligt att 0 < d < +∞: den f¨ orsta olikheten f¨ or att F ¨ ar sluten och inte inneh˚ aller origo; den andra f¨ or att F ¨ ar icke-tom. Vi vet att en kontinuerlig funktion – och ϕ ¨ ar kontinuerlig – antar sitt infimum p˚ a en sluten begr¨ansad m¨ angd. Nu ¨ar F inte s¨akert begr¨ ansad, men det ¨ ar inte farligt i detta fall. Vi kan n¨ amligen bilda K = {x ∈ F ; |x| 6 2d}, som ¨ ar kompakt, och d˚ a antar ϕ sitt infimum p˚ a K. Men detta infimum m˚ aste vara detsamma som infimum p˚ a F : v¨ ardena i F \K kan inte t¨ avla med dem i K. L˚ at allts˚ a a vara en punkt i F s˚ adan att ϕ(a) = d. (I sj¨ alva verket ¨ ar a unik, men det beh¨ ovs inte nu.) Denna punkt definierar ett hyperplan H genom ekvationen a · x = b = a · a och ett slutet halvrum D genom olikheten a · x > a · a. Med andra ord ¨ ar H helt enkelt det plan som ¨ ar ortogonalt mot siktlinjen [0, a] fr˚ an origo mot den n¨ armaste punkten i F och som g˚ ar genom denna punkt. Vi p˚ ast˚ ar nu att b 6 a · x f¨ or alla x ∈ F . Det betyder att 0=a·0<c<b6a·x 8 f¨ or varje x ∈ F och varje tal c med 0 < c < b, s˚ a att varje hyperplan a · x = c med ett s˚ adant c ¨ ar strikt separerande. Vi skall allts˚ a bevisa att F ligger i halvrummet D. Tag en godtycklig punkt x ∈ F . D˚ a vet vi att hela segmentet [a, x] ligger i F , eftersom F ¨ ar konvex. En punkt (1 − t)a + tx p˚ a detta segment m˚ aste ha avst˚ andet minst d till origo enligt definitionen av d. Det betyder att d2 = |a|2 = ϕ(a)2 6 ϕ((1 − t)a + tx)2 = ((1 − t)a + tx) · ((1 − t)a + tx) = (1 − t)2 |a|2 + 2(1 − t)ta · x + t2 |x|2 . Studera funktionen f (t) = ϕ((1 − t)a + tx)2 . Den m˚ aste ha icke-negativ derivata i 0 origo, ty om f (0) < 0 s˚ a f¨ oljer att f (t) < f (0) f¨ or sm˚ a positiva t, vilket allts˚ a inte ar m¨ ¨ ojligt. Men nu kan vi l¨ att r¨ akna ut dess derivata: f 0 (t) = 2(1 − t)(−1)|a|2 + 2(−1)ta · x + 2(1 − t)a · x + 2t|x|2 . S¨ att in t = 0: det ger 0 6 f 0 (0) = −2|a|2 + 2a · x. Allts˚ a g¨ aller a · x > |a|2 , vilket ¨ar precis vad vi ¨ onskade. Kanske blir det l¨ attare om man g¨ or ett mots¨ agelsebevis: om man antar att det a blir f (t) < f (0) f¨ or sm˚ a positiva t. Rita en figur! finns ett x ∈ F med a · x < |a|2 s˚ Bevis av sats 3.3. Vi kan f¨ orst˚ as anta att y = 0. V¨ alj en uppr¨ aknelig t¨ at m¨ angd {xj } i A, och l˚ at Am vara det konvexa h¨ oljet av den ¨ andliga m¨angden {x1 , ..., xm }. Eftersom Am ¨ ar sluten (sats 2.2) och inte inneh˚ aller origo, s˚ a kan vi till¨ ampa sats 3.2 och f˚ ar ett separerande hyperplan med ekvationen ξm · x = cm som separerar Am och origo (strikt). Motsvarande plan genom origo, med ekvationen ξm · x = 0, ¨ ar d˚ a separerande i alla fall. Vad h¨ ander nu n¨ ar m → +∞? Om vi v¨ aljer ξm som den n¨ armaste punkten i Am s˚ a kan ju mycket v¨ al ξm g˚ a mot noll och det ¨ ar inte bra. L˚ at oss d¨ arf¨ or normalisera s˚ a att |ξm | = 1. D˚ a ligger allts˚ a ξm p˚ a enhetsf¨ aren S, som ¨ar en v¨ alk¨ and kompakt m¨angd, och vi vet att n˚ agon delf¨ oljd av (ξm ) konvergerar. L˚ at ξ vara ett gr¨ ansv¨ arde. Vi kan nu hoppas att hyperplanet H = {x; ξ · x = 0} kommer att separera A fr˚ an origo, dvs. att A ligger p˚ a ena sidan. Vi kan v¨ alja tecknen s˚ a att Am ligger i halvrummet Dm = {x; ξm · x > 0}, och skall d˚ a visa att ξ · x > 0 f¨ or alla x ∈ A. Antag att detta ¨ ar fel, allts˚ a att det finns x ∈ A s˚ a att ξ · x < 0. D˚ a finns punkter xk godtyckligt n¨ ara x och likas˚ a ξm godtyckligt n¨ ara ξ. D¨ arf¨ or g¨aller ocks˚ a ξm · xk < 0 f¨ or l¨ ampliga index m och k, och aven f¨ ¨ or n˚ agra s˚ adana med m > k, vilket mots¨ager konstruktionen att xk ligger i halvrummet Dm d˚ a m > k. Om nu y ∈ ∂A s˚ a finns det punkter yk som inte ligger i A och s˚ a att yk → y. Om vi tar halvrum Dk som separerar yk fr˚ an A s˚ a kan vi som i resonemanget nyss hitta en delf¨ oljd av s˚ adana halvrum som konvergerar mot ett halvrum D som inneh˚ aller A och har y p˚ a randen. 4. St¨ odjande halvrum och st¨ odjande hyperplan 9 Definition 4.1. L˚ at A vara en konvex m¨ angd i Rn . Ett slutet halvrum D s¨ ages vara st¨ odjande till A om A ing˚ ar i D och det finns en gemensam randpunkt i A och D. Ett hyperplan H s¨ ages vara st¨ odjande till A om ett av de tv˚ a slutna halvrummen som definieras av H ¨ ar st¨ odjande till A. Ett st¨ odjande hyperplan karakt¨ ariseras allts˚ a av att m¨ angden A ligger p˚ a ena sidan av H och att H inneh˚ aller n˚ agon randpunkt till A. Om vi tar ett hyperplan H som har A p˚ a ena sidan, s¨ ag att ξ · a > b f¨ or alla a ∈ A, och H inte ¨ ar st¨odjande, s˚ a kan det h¨ anda att n˚ agot hyperplan ξ · x = b + ε ¨ ar st¨ odjande (konstanten b var helt enkelt f¨ or liten). Men det kan ocks˚ a h¨ anda att inget av halvrummen ξ · x > b + ε med ε > 0 inneh˚ aller A. D˚ a finns det helt enkelt inget st¨ odjande hyperplan med normal ξ. Ett exempel p˚ a detta ¨ ar A lika med m¨ angden 2 av alla x ∈ R med x1 > 0 och x1 x2 > 1. D˚ a¨ ar linjen x2 = 0 ett hyperplan som inte ar st¨ ¨ odjande, men det finns inte heller n˚ agot parallellt hyperplan som ¨ ar st¨ odjande. Ett slutet halvrum som inneh˚ aller en given konvex m¨ angd beh¨ over allts˚ a inte g˚ a att parallellf¨ orflytta s˚ a att det blir st¨ odjande. Det blir d¨ armed intressant att fr˚ aga om man i sats 3.7 kan n¨ oja sig med att ta st¨ odjande halvrum. Att svaret ¨ ar jakande trots det nyss framlagda exemplet f¨ oljer av det arbete vi redan lagt ned f¨ or att visa sats 3.2. Vi formulerar satsen s˚ a: Sats 4.2. L˚ at F vara en sluten konvex m¨ angd. D˚ a ¨ ar F lika med snittet av alla st¨ odjande halvrum till F . Bevis. Det ¨ ar klart att snittet av alla st¨ odjande halvrum inneh˚ aller F . L˚ at nu y ∈ / F. Enligt sats 3.2 finns det ett hyperplan som separerar F och y strikt. Ett s˚ adant hyperplan beh¨ over som vi sett inte vara st¨odjande, och kanske g˚ ar det inte heller att parallellf¨ orskjuta det s˚ a att det blir st¨odjande. Men om vi tittar p˚ a beviset av sats 3.2 s˚ a ser vi att vi gjort n˚ agonting b¨ attre. Den punkt a i F som vi hittade och som ar den n¨ ¨ armaste punkten i F sett fr˚ an y definierar ett hyperplan som g˚ ar genom a och har F p˚ a ena sidan, och som allts˚ a¨ ar st¨odjande till F . Beviset f¨ or sats 4.2 ¨ar allts˚ a redan gjort i beviset f¨ or sats 3.2. 5. Extremalpunkter Extremalpunkterna ¨ ar konvexitetsteorins primtal. Vi p˚ aminner om att primtalen ˚ a ena sidan ¨ ar tillr¨ ackligt m˚ anga f¨ or att varje heltal skall vara en produkt av primtal, ˚ a andra sidan kan de inte sj¨ alva s¨onderl¨ aggas som en produkt av heltal annat ¨ an p˚ a ett trivialt s¨att (p = p · 1 = 1 · p = (−p) · (−1) = (−1) · (−p)). I konvexitetsteorin motsvaras produkten av de konvexa line¨ arkombinationerna, s˚ a att alla punkter p˚ a segmentet [a, b] framst¨ alls med hj¨ alp av a och b, n¨ amligen som x = (1 − t)a + tb. En framst¨ allning betraktas som trivial om x = a eller x = b. Detta intr¨ affar om t = 0 eller t = 1, men ocks˚ a om a = b. Det som motsvarar ett primtal ¨ ar allts˚ a en punkt som inte kan framst¨ allas p˚ a ett icke-trivialt s¨att. Denna analogi leder oss till f¨ oljande definition: Definition 5.1. L˚ at en konvex m¨ angd X vara given. D˚ a kallas en punkt x f¨ or extremalpunkt till X om x ∈ X och x inte kan framst¨ allas p˚ a ett icke-trivialt s¨ att med hj¨ alp av punkter i X, dvs. om ekvationen x = (1−t)a+tb kan g¨ alla med a, b ∈ X och 0 6 t 6 1 endast d˚ a x = a eller x = b. Vi skall skriva E(X) f¨ or m¨ angden av alla extremalpunkter i X. 10 Vi ser genast att ¨ oppna konvexa m¨angder saknar extremalpunkter om dimensionen ¨ ar positiv. Men ¨ aven slutna halvrum i dimensioner h¨ ogre ¨ an 1 saknar extremalpunkter. Det ¨ ar d¨ arf¨ or naturligt att endast studera slutna begr¨ ansade m¨ angder. Och d˚ a visar det sig att extremalpunkterna ¨ ar tillr¨ ackligt m˚ anga f¨ or att kunna framst¨ alla hela m¨ angden. Att varje heltal ¨ ar en produkt av primtal motsvaras allts˚ a av f¨ oljande sats. Sats 5.2. L˚ at K vara en konvex kompakt. D˚ a¨ ar konvexa h¨ oljet av E(K) lika med K. Bevis. Eftersom E(K) ⊂ K och K ¨ ar konvex s˚ a¨ ar det klart att cvx E(K) ⊂ K. Vi g¨ or nu induktion ¨ over dimensionen f¨ or att visa att cvx E(K) ⊃ K. F¨ or n = 0 eller n = 1 ¨ ar det klart att satsen ¨ ar sann. Om x ¨ ar en godtycklig punkt i K s˚ a drar vi en r¨ at linje genom x och tr¨ affar p˚ a tv˚ a punkter x0 och x1 som ligger p˚ a randen av K. (De kan sammanfalla; det g¨ or inget.) Eftersom x ∈ [x0 , x1 ] s˚ a r¨ acker det att visa att x0 , x1 ∈ cvx E(K). Genom x0 g˚ ar ett separerande hyperplan H enligt sats 3.3. Och induktionsantagandet s¨ ager att H ∩ K ¨ ar en konvex kompakt som ¨ ar det konvexa h¨ oljet av sina extremalpunkter, ty den ligger ju i H som har l¨ agre dimension. Problemet ¨ ar allts˚ a att identifiera extremalpunkterna i H ∩ K. Jag p˚ ast˚ ar att E(H ∩ K) ⊂ H ∩ E(K). (I sj¨ alva verket g¨ aller likhet, men vi beh¨ over inte detta h¨ ar.) L˚ at oss ta en punkt y som ¨ ar extremal i H ∩ K. Vi skall visa att den d˚ a ¨ar extremal ocks˚ a i K. Om y ligger p˚ a ett segment [a, b] ⊂ K s˚ a f¨ oljer att a och b m˚ aste ligga p˚ a samma sida om H. De kan d¨ arf¨ or bara framst¨ alla punkten y p˚ a ett icke-trivialt s¨ att om de b˚ ada ligger i H. Men eftersom y ¨ ar extremal i H ∩ K s˚ a finns ingen s˚ adan icke-trivial framst¨ allning. Det inneb¨ ar att y ¨ ar extremal i K. Nu vet vi att E(H ∩ K) ⊂ H ∩ E(K), och att x0 ligger i det konvexa h¨ oljet av E(H ∩K). Allts˚ a ligger x0 i det konvexa h¨ oljet av E(K). Detsamma g¨ aller f¨ or x1 , och allts˚ a ocks˚ a f¨ or varje punkt p˚ a segmentet [x0 , x1 ] som ju inneh˚ aller den godtyckligt givna punkten x ∈ K. 6. Carath´eodorys sats Vi skall nu ˚ aterv¨ anda till den fr˚ aga som l¨ amnades ¨ oppen i diskussionen f¨ ore sats 2.2, n¨ amligen hur m˚ anga punkter i X vi beh¨ over f¨ or att bilda det konvexa h¨ oljet av X. Svaret ¨ ar att antalet N beror p˚ a dimensionen hos rummet, och att det i Rn alltid r¨ acker med n + 1 punkter. Resultatet ¨ ar allts˚ a denna sats: Sats 6.1. (Carath´eodorys sats.) Om X ¨ ar en m¨ angd i Rn s˚ a har varje punkt a i det konvexa h¨ oljet av X en framst¨ allning a= n+1 X λj xj j=1 d¨ ar xj ∈ X, 0 6 λj 6 1 och P λj = 1. Bevis. Vi g¨ or induktion ¨ over dimensionen, och skall utnyttja existensen av separerande hyperplan. P˚ ast˚ aendet ¨ ar s¨akert sant i R0 = {0} (och l¨ att att visa ocks˚ ai 1 n−1 R ). Antag att det ¨ ar sant i R . Om a ¨ ar en godtycklig punkt i cvx X s˚ a vet vi enligt sats 2.1 att det finns en framst¨ allning a= N X 1 11 λj xj av ¨ onskad form utom att talet N kanske ¨ ar f¨ or stort. L˚ at Y vara den ¨ andliga m¨ angden {x1 , ..., xN }. Tydligen g¨ aller att a ∈ cvx Y = K. Tag en punkt y ∈ Y . Om y = a ¨ ar vi f¨ ardiga; om inte s˚ a drar vi ut en linje fr˚ an y genom a och ut mot o¨ andligheten. Eftersom K ¨ ar kompakt (sats 2.2) m˚ aste denna linje inneh˚ alla n˚ agon punkt z ∈ ∂K p˚ a andra sidan om a, s˚ a att a ∈ [y, z]. Eftersom z ¨ ar en randpunkt i K s˚ a finns enligt sats 3.3 ett hyperplan H genom z med m¨ angden K p˚ a ena sidan. Nu ¨ ar H ∩ cvx Y = cvx(H ∩ Y ), ty om en punkt kan framst¨ allas som en konvex line¨ arkombination av punkter i Y , allts˚ a p˚ a ena sidan om H, s˚ a m˚ aste alla de punkter som faktiskt anv¨ ands ligga i H. Det inneb¨ ar att z ∈ cvx(H ∩ Y ), och som H ∩ Y ar en m¨angd i rummet H av dimension n − 1, finns enligt induktionsantagandet en ¨ framst¨ allning av z som konvex line¨ arkombination av n punkter i Y , s¨ ag y1 , ..., yn . Slutligen ligger genom konstruktionen a p˚ a segmentet [y, z], s˚ a de n + 1 punkterna y1 , ..., yn och y r¨ acker f¨ or att framst¨ alla a. Sats 6.2. Om K ¨ ar kompakt i Rn s˚ a¨ ar ¨ aven cvx K kompakt. Bevis. Vi noterade redan f¨ ore sats 2.2 att m¨angden KN = X N λj xj ; λj > 0, j=1 X λj = 1 och xj ∈ K ¨r kompakt eftersom den ¨ a ar bilden av en kompakt m¨ angd under en kontinuerlig avbildning. Nu vet vi att cvx K = Kn+1 . 7. Den utvidgade reella axeln N¨ ar man sysslar med reellv¨ arda funktioner g¨ or man ofta operationer som leder utanf¨ or de reella talen, t. ex. supremumbildningar. D¨ arf¨ or leds man till att betrakta ocks˚ a +∞ och −∞ som till˚ atna v¨ arden. Om man bara har en av o¨ andligheterna s˚ a brukar detta inte vara s˚ a sv˚ art, men om b¨ agge f¨ orekommer s˚ a f˚ ar man finna sig i att summan (+∞) + (−∞) inte ¨ ar v¨ aldefinierad, och detta leder till att man m˚ aste g¨ ora undantag i vissa utsagor, undantag som ¨ ar sv˚ ara att komma ih˚ ag. Det har d¨ arf¨ or ett visst intresse att skapa konventioner som g¨ or det bekv¨ amt att handskas med undantagen. En s˚ adan konvention ¨ ar inf¨ orandet av den ¨ ovre och undre additionen. Den utvidgade reella axeln betecknas [−∞, +∞] och best˚ ar av alla reella tal och tv˚ a nya element −∞ och +∞. Den ordnas genom f¨ orskriften att −∞ < x < +∞ f¨ or alla x ∈ R. D¨ arf¨ or blir supremum och infimum v¨ aldefinierade operationer, och vi har bl. a. sup f (x) = −∞, inf f (x) = +∞ x∈Ø x∈Ø f¨ or alla funktioner f : X → [−∞, +∞], s˚ aledes ¨ aven om till exempel f ¨ ar identiskt +∞. Man kallar [−∞, +∞] f¨ or en tv˚ apunktskompaktifiering av R eftersom den ¨ar kompakt (varje punktf¨ oljd har en hopningspunkt) och uppst˚ ar genom till¨ agg av tv˚ a punkter. (Det finns ocks˚ a en enpunktskompaktifiering av R, n¨ amligen R ∪ {∞}, som uppst˚ ar genom till¨ agg av en enda ny punkt, ∞. Den kan inte ordnas; man kan s¨ aga att den uppkommer ur [−∞, +∞] genom hopslagning av +∞ och −∞.) Den ¨ ovre additionen definieras som den utvidgning av den vanliga additionen d¨ ar +∞ alltid vinner ¨ over −∞, dvs. i fall av tvekan skall man v¨ alja +∞. Det inneb¨ ar 12 att · a + b = lim sup x + y ∈ [−∞, +∞] , 2 (a, b) ∈ [−∞, +∞] . (x,y)→(a,b) (x,y)∈R2 P˚ a motsvarande s¨att definierar vi den undre additionen medelst limes inferior · · or a + b om och f˚ ar f¨ orst˚ as a + b = −((−a) + (−b)). Slutligen skriver vi a + b f¨ · · a + b = a + b. Vi finner d˚ a att ingenting ¨ andrats f¨ or de reella talen, att (+∞) + · · (+∞) = +∞ och att (−∞) + (−∞) = −∞. Vidare ¨ ar (+∞) + (−∞) = +∞ medan (+∞) + (−∞) = −∞. De tv˚ a sista formlerna ¨ ar allts˚ a de enda d¨ ar plustecken med · prick m˚ aste f¨ orekomma. · N˚ agra regler f¨ or att hantera + och + ¨ ar dessa: vi har a 6 b om och endast om · · a + (−b) 6 0, att a < b om och endast om a + (−b) < 0. Vidare g¨ aller · · · (7.1) inf (a + f (x)) = a + inf f (x) x∈X x∈X och (7.2) sup (a + f (x)) = a + sup f (x) · · x∈X x∈X utan undantag. (Beviset av dessa formler best˚ ar av en kontroll i fallen a = +∞, a = −∞, X = Ø.) F¨ or infimum i kombination med den undre additionen och supremum i kombination med den ¨ ovre additionen ¨ ar reglerna inte alls lika enkla, och f¨ or ¨ovrigt n¨ astan om¨ ojliga att komma ih˚ ag. 8. Konvexa funktioner Definitionen av en konvex m¨ angd ¨ ar ju mycket enkel: om a, b ∈ A s˚ a ligger hela segmentet [a, b] i A. Vi skall definiera begreppet konvex funktion s˚ a att det blir lika enkelt. D¨ arf¨ or vill vi till en funktion associera en m¨ angd som ¨ ar konvex precis n¨ ar funktionen ¨ ar konvex. Definition 8.1. Om f : X → [−∞, +∞] ¨ ar en given funktion p˚ a en godtycklig m¨ angd X s˚ a¨ ar dess epigraf m¨ angden epi f = {(x, t) ∈ X × R; t > f (x)}. Definition 8.2. Om f : X → [−∞, +∞] ¨ ar en given funktion definierad i en m¨ angd n n+1 X i R s˚ a kallar vi den konvex precis n¨ ar dess epigraf ¨ ar en konvex m¨ angd (i R ). n Om vi utvidgar f till en funktion definierad p˚ a hela R genom att s¨ atta g(x) = f (x) d˚ a x ∈ X och g(x) = +∞ d˚ a x ∈ Rn \ X s˚ a ser vi att f och g ¨ ar konvexa samtidigt: de har samma epigraf. D¨ arf¨ or kan vi alltid anta att konvexa funktioner ¨ ar definierade i hela rummet. Man ser att konstanterna +∞ och −∞ ¨ ar konvexa, ty deras epigrafer ¨ ar Ø n+1 respektive hela R . Vidare ser man att max(f1 , ..., fm ) ¨ ar konvex om f1 , ..., fm ar konvexa: det svarar mot att den f¨ ¨ orstn¨ amnda funktionens epigraf ¨ ar snittet av det konvexa m¨angderna epi fj . F¨ or att till exempel visa att summan av konvexa funktioner ¨ ar konvex ¨ ar det emellertid bra att ha en olikhet att testa, den som s¨ ager att grafen h¨anger under kordan. 13 Proposition 8.3. En funktion f : Rn → [−∞, +∞] ¨ ar konvex om och endast om · f ((1 − t)x0 + tx1 ) 6 (1 − t)f (x0 ) + tf (x1 ) (8.1) f¨ or alla x0 , x1 ∈ Rn och alla tal t med 0 < t < 1. Om ett av v¨ ardena f (x0 ) och f (x1 ) ¨ ar +∞ s˚ a inneb¨ ar olikheten inget krav alls. Men om t. ex. f (x0 ) = −∞ och f (x1 ) < +∞ s˚ a s¨ ager olikheten att f ((1−t)x0 +tx1 ) = −∞ f¨ or alla t med 0 < t < 1. Olikheten (8.1) inneb¨ ar naturligtvis i allm¨ anhet starka restriktioner p˚ a funktionsv¨ ardena. Men i vissa situationer ¨ ar friheten mycket stor. L˚ at till exempel g vara en helt godtycklig funktion p˚ a enhetssf¨ aren. D˚ a kan vi utvidga den till en konvex funktion f genom att s¨atta f (x) = g(x) d˚ a |x| = 1, f (x) = +∞ d˚ a |x| > 1 och f (x) = −∞ (eller lika med konstanten inf g) d˚ a |x| < 1. P˚ a sf¨ aren finns allts˚ a inga som helst villkor som funktionsv¨ ardena m˚ aste uppfylla. Speciellt beh¨ over konvexa funktioner inte vara kontinuerliga. Om vi d¨ aremot tar en kub, s˚ a m˚ aste restriktionen av en konvex funktion vara konvex i varje sidoyta till kuben. Proposition 8.4. Om f, g: Rn → [−∞, +∞] ¨ ar tv˚ a konvexa funktioner s˚ a¨ ar ¨ aven · f + g konvex. D¨ aremot beh¨over inte f + g vara konvex ¨ aven om f och g ¨ ar det. · Definition 8.5. Om f, g: Rn → [−∞, +∞] ¨ ar tv˚ a konvexa funktioner s˚ a definierar vi deras infimalfaltning som · f u t g(x) = inf n f (y) + g(x − y) , x ∈ Rn . y∈R Den vanliga faltningen definieras av Z f ∗ g(x) = f (y)g(x − y)dy, x ∈ Rn . Rn Infimalfaltningen har flera egenskaper som ¨ ar desamma som – eller analoga med – den vanliga faltningens. I b˚ ada fallen ¨ ar summan av argumenten f¨ or f och g lika med −f −g argumentet f¨ or faltningen. Ofta kan man j¨ amf¨ ora e ∗ e med exp(−(f u t g)): Z (exp(−f ) ∗ exp(−g))(x) = exp(−f (y) − g(x − y))dy Rn ≈ sup exp(−f (y) − g(x − y)) = (exp(−(f u t g))(x). y Approximationen R ≈ sup ¨ ar ibland f¨ orv˚ anande god. Proposition 8.6. Infimalfaltningen ¨ ar kommutativ och associativ. · Bevis. Kommutativiteten f¨ oljer av att + ¨ ar kommutativ. F¨ or associativiteten beh¨ ovs r¨ akneregeln (7.1): · · (f u t g) u t h(x) = inf inf [f (z) + g(y − z)] + h(x − y) z y · · = inf inf f (z) + g(y − z) + h(x − y) y z · · = inf f (z) + inf [g(y − z) + h(x − y)] = f u t (g u t h)(x). z y 14 Infimalfaltningen ¨ ar en generalisering av vektoradditionen (Minkowskiadditionen) av m¨ angder. Vi har n¨ amligen iX u t iY = iX+Y d¨ ar iX betecknar indikatorfunktionen f¨ or en m¨ angd X; den definieras av att iX (x) = 0 om x ∈ X och iX (x) = +∞ annars. Ett annat samband med vektoradditionen – och som kan anv¨ andas f¨ or att definiera infimalfaltningen – f˚ as om vi definierar den strikta epigrafen som epis f = {(x, t) ∈ X × R; t > f (x)}, allts˚ a med strikt olikhet. D˚ a g¨ aller helt enkelt epis (f u t g) = epis (f ) + epis (g) med vektoraddition i Rn+1 . Denna ekvation leder till en geometrisk tolkning av infimalfaltningen. Rita figurer! Exempel. Funktionen i{0} ¨ ar identitet under infimalfaltningen: f u t i{0} = f f¨ or alla funktioner f . Exempel. Om g ¨ ar en affin funktion s˚ a g¨ aller f u t g = g + C f¨ or en konstant C = Cf,g ∈ [−∞, +∞] (vilken?). Exempel. S¨ att gk (x) = k|x|, x ∈ Rn , d¨ ar k ¨ ar en positiv konstant, och studera infimalfaltningen fk = f u t gk . Vi antar f¨ or enkelhets skull att f ¨ ar begr¨ ansad. Man kan l¨ att visa att fk ¨ ar Lipschitzkontinuerlig med konstant k, dvs. att |fk (x) − fk (y)| 6 k|x − y|, x, y ∈ Rn , genom att anv¨ anda att gk har denna egenskap. Det g¨ or att den goda kontinuitetsegenskapen ¨arvs av faltningen f u t gk trots att f inte beh¨ over ha den. Vidare g¨ aller att fk 6 f och att fk % f d˚ a k → +∞ om f ¨ ar kontinuerlig (i sj¨ alva verket beh¨ over f bara vara ned˚ at halvkontinuerlig; f¨ or definitionen av detta begrepp se sats 9.6). Vi f˚ ar allts˚ a en bekv¨ am metod att approximera s˚ adana funktioner med Lipschitzkontinuerliga. Exempel. Med en fysikaliskt inspirerat spr˚ ak kan vi l˚ ata en partikel med l¨ age λj och spridning σj representeras av funktionen 1 fj (x) = (x − λj )2 , x ∈ Rn . 2σj D˚ a ger till exempel en direkt utr¨ akning att f1 u t f2 = f3 d¨ ar λ3 = λ1 + λ2 och σ3 = σ1 + σ2 , dvs. l¨ age och spridning adderas. Fallet σ1 = 0 svarar mot f1 = i{λ1 } , dvs. en skarp partikel. Detta b¨ or j¨amf¨ oras med den vanliga faltningen av funktionerna gj = (2πσj )−n/2 e−fj som ocks˚ a kan f˚ a representera partiklar. D˚ a g¨ aller n¨ amligen att g1 ∗ g2 = g3 med samma relationer f¨ or l¨ age och spridning som f¨orut. Den j¨ amf¨ orelse mellan u t och ∗ som vi gjorde tidigare blir nu helt precis: den approximativa likheten exp(−f1 ) ∗ exp(−f2 ) ≈ exp(−(f1 u t f2 )) = exp(−f3 ) blir den exakta likheten g1 ∗ g2 = g3 tack vare faktorerna (2πσj )−n/2 . Fallet σ1 = 0 svarar h¨ ar mot Diracm˚ attet δλ1 i punkten λ1 , ˚ aterigen en skarp partikel. Faltningen g1 ∗ g2 kan ber¨ aknas med Fouriertransformationen, liksom faltningen f1 u t f2 kan ber¨ aknas med Fencheltransformationen som vi skall inf¨ ora i n¨ asta avsnitt. 15 Proposition 8.7. En funktion f : Rn → [−∞, +∞] ¨ ar konvex om och endast om fs u t ft > fs+t f¨ or alla s, t > 0, d¨ ar fs (x) = sf (x/s) f¨ or x ∈ Rn och s > 0. Vi kan notera att olikheten fs u t ft 6 fs+t alltid g¨ aller. De konvexa funktionerna ¨ ar allts˚ a de som l¨ oser funktionalekvationen fs u t ft = fs+t . Bevis. Om f ¨ ar konvex s˚ a g¨ aller x − y y · · fs (y) + ft (x − y) = sf (y/s) + tf ((x − y)/t) > (s + t)f + = fs+t (x). s+t s+t Om vi nu l˚ ater y variera s˚ a f¨ oljer att fs u t ft > fs+t . Omv¨ ant, antag att denna olikhet g¨ aller. D˚ a f¨ oljer med beteckningen xt = (1 − t)x0 + tx1 att · f (xt ) = f1 (xt ) 6 f1−t u t ft (xt ) 6 f1−t (y) + ft (xt − y) f¨ or alla y. Nu kan vi v¨ alja y = (1 − t)x0 : · · f (xt ) 6 f1−t ((1 − t)x0 ) + ft (xt − (1 − t)x0 ) = (1 − t)f (x0 ) + tf (x1 ), vilket betyder att f ¨ ar konvex. Sats 8.8. Om f och g ¨ ar konvexa s˚ a¨ ar ¨ aven h = f u t g det. Bevis. Man ser att (f u t g)s = fs u t gs . Allts˚ a kan vi r¨ akna p˚ a: hs u t ht = (f u t g)s u t (f u t g)t = (fs u t gs ) u t (ft u t gt ) = (fs u t ft ) u t (gs u t gt ) > fs+t u t gs+t = (f u t g)s+t = hs+t . H¨ ar har vi anv¨ ant associativitet och kommutativitet hos infimalfaltningen (proposition 8.6). Vi ser att satsen f¨ oljer av karakt¨ ariseringen i proposition 8.7. 9. Fencheltransformationen Alla affina funktioner x 7→ ξ·x+c ¨ar konvexa. De ¨ ar de enklaste konvexa funktionerna och det ¨ ar naturligt att fr˚ aga sig om andra konvexa funktioner kan framst¨ allas med ¨ hj¨ alp av dem. Andliga suprema av affina funktioner har ju stor betydelse i line¨ar programmering – en polyeder ¨ ar en subniv˚ am¨ angd till en s˚ adan funktion – och i konvex optimering blir det lika viktigt att studera icke n¨ odv¨ andigtvis ¨ andliga suprema av affina funktioner. Vi fr˚ agar allts˚ a om vi kan hitta en familj A av affina funktioner, dvs. av par (ξ, c), s˚ adan att f (x) = sup (ξ · x + c) (ξ,c)∈A f¨ or denna familj. Tydligen ¨ ar d˚ a ξ · x + c 6 f (x) f¨ or alla x ∈ Rn och alla (ξ, c) ∈ A, dvs. c 6 f (x) − ξ · x, varav c 6 inf n (f (x) − ξ · x), x∈R (ξ, c) ∈ A. Man har inget intresse att ta c mindre ¨ an detta infimum, ty s˚ adana c konkurrerar ju inte effektivt i supremumbildningen. Vi kan allts˚ a inskr¨ anka oss till att ta c lika med infimum. Detta inneb¨ ar som vi strax skall se att de enda intressanta affina minoranterna till f ¨ ar de som har formen f u t ξ f¨ or n˚ agon line¨ ar funktion ξ. Av vissa sk¨ al som blir uppenbara om ett ¨ ogonblick ¨ ar det praktiskt att i st¨ allet betrakta −c. Allts˚ a inf¨ or vi f¨ oljande definition. 16 Definition 9.1. Om f : Rn → [−∞, +∞] ¨ ar en godtycklig funktion p˚ a Rn s˚ a kallas fe(ξ) = sup ξ · x − f (x) , (9.1) x∈Rn ξ ∈ Rn , f¨ or Fencheltransformen av f . Ett annat namn f¨ or fe ¨ ar Legendretransformen eller den till f konjugerade konvexa funktionen. Funktionen x 7→ f u t ξ(x) = ξ · x − fe(ξ) ¨ ar affin, minorerar f och ¨ ar den st¨ orsta affina minorant till f vars line¨ ara del ¨ ar ξ. (H¨ ar betecknar ξ b˚ ade en vektor och den line¨ ara funktionen x 7→ ξ · x.) Den geometriska tolkningen av transformen ¨ ar denna. Fixera ξ och betrakta alla affina funktioner x 7→ ξ · x + c som minorerar f . Tag den st¨ orsta, dvs. tryck upp grafen s˚ a l˚ angt det g˚ ar utan att komma ovanf¨ or n˚ agon punkt i grafen av f . D˚ a¨ ar fe(ξ) = −c, dvs. transformens v¨ arde ¨ ar minus ordinatan i origo f¨ or hyperplanet. Rita figurer! Vi noterar att i (9.1) spelar punkter d¨ ar f (x) = +∞ ingen roll: de kan aldrig bidra till supremum. Man definierar den effektiva definitionsm¨ angden till f som dom f = {x ∈ Rn ; f (x) < +∞}, (9.2) och ser att fe(ξ) = sup ξ · x − f (x) (9.3) x∈M f¨ or varje m¨angd M s˚ adan att dom f ⊂ M ⊂ Rn . Med c = −fe(ξ) blir supremum av alla affina minoranter till f precis (9.4) sup ξ · x − fe(ξ) = sup (f u t ξ)(x), ξ∈Rn ξ∈Rn x ∈ Rn . Nu kan vi g¨ ora en intressant observation: supremumbildningen ¨ ar precis Fenchel e transformen av fe. Allts˚ a kan vi skriva v¨ ansterledet i (9.4) som fe e = fe. Fr˚ agan huruvida f ¨ ar ett supremum av affina funktioner ¨ ar allts˚ a ekvivalent med fr˚ agan e huruvida fe = f . Vi skall snart besvara den, men l˚ at oss f¨ orst notera n˚ agra enkla egenskaper hos transformationen. Proposition 9.2. Om f, g: Rn → [−∞, +∞] ¨ ar tv˚ a funktioner p˚ a Rn med f 6 g s˚ a e ar fe och ge konvexa och fe > ge. Vidare ¨ ¨ ar fe supremum av alla affina minoranter till f: e fe(x) = sup (f u t ξ)(x), x ∈ Rn ; ξ∈Rn e e e speciellt ¨ ar fe konvex och fe 6 f . Slutligen ¨ ar den tredje transformen fe e = f eee alltid lika med fe. 17 Notera att fe aldrig antar v¨ ardet −∞ utom d˚ a fe = −∞ identiskt; d˚ a ¨ ar f = +∞ e oljer av att identiskt. Olikheten fe 6 f f¨ (9.5) · ξ · x 6 f (x) + fe(ξ), x ∈ Rn , ξ ∈ Rn , som brukar kallas Fenchels olikhet. Vi skall genom n˚ agra exempel visa hur man kan ber¨ akna Fencheltransformer. Exempel. Om f (x) = ax2 + bx + c f¨ or x ∈ R med a > 0 och b och c reella, s˚ a kan vi e ber¨ akna f med differentialkalkyl. Vi har n¨ amligen fe(ξ) = sup [ξx − ax2 − bx − c], ξ ∈ R, x∈R och det ¨ ar klart att uttrycket som vi skall ta supremum av a¨r en kontinuerlig funktion av x som g˚ ar mot −∞ d˚ a x → ±∞, vilket g¨ or att supremum antas i n˚ agon punkt, och denna punkt kan hittas genom att vi s¨ atter derivatan lika med noll. Derivatan ar ξ − 2ax − b, och har ett enda nollst¨ ¨ alle, n¨ amligen x = (ξ − b)/2a. Nu s¨atter vi in detta v¨ arde p˚ a x i uttrycket och f˚ ar 2 ξ−b (ξ − b) ξ−b −a −b −c fe(ξ) = ξx − ax2 − bx − c = ξ 2 2a 4a 2a ξ2 bξ b2 (ξ − b)2 = − + −c= − c. 4a 2a 4a 4a S˚ a fe ¨ ar ocks˚ a ett andragradspolynom. Vi kan fr˚ an dess uttryck gissa n˚ agra egenskaper hos transformationen som ocks˚ a¨ ar l¨ atta att verifiera allm¨ ant. Om g(x) = f (x) + c s˚ a¨ ar ge(ξ) = fe(ξ) − c, dvs. om vi adderar en reell konstant till f s˚ a g˚ ar den igenom och kommer ut med motsatt tecken. Detta ¨ ar naturligtvis sant i alla dimensioner. Om g(x) = f (x)+α·x s˚ a¨ ar ge(ξ) = fe(ξ−α), dvs. om vi adderar en line¨ ar funktion till f s˚ a kommer transformen att translateras med en vektor vars komponenter ¨ ar precis den line¨ ara funktionens koefficienter. Detta visas genom en l¨ att r¨ akning: ge(ξ) = sup[ξ · x − g(x)] = sup[ξ · x − f (x) − α · x] x x = sup[(ξ − α) · x − f (x)] = fe(ξ − α). x Om ˚ a andra sidan g(x) = f (x − a), s˚ a blir ge(ξ) = fe(ξ) + ξ · a, dvs. om vi translaterar en funktion s˚ a motsvarar det addition av en line¨ ar funktion till dess transform. Om vi multiplicerar en funktion med en positiv konstant, dvs. om g(x) = af (x) med a > 0, s˚ a blir transformen ge(ξ) = afe(ξ/a). Detta visas ocks˚ a med en enkel r¨ akning: ge(ξ) = sup[ξ · x − af (x)] = a sup[(ξ/a) · x − f (x)] = afe(ξ/a). x x 18 Genom att anv¨ anda dessa r¨ akneregler (addition av konstant, addition av line¨ ar funktion och multiplikation med positiv konstant) s˚ a ser vi att om vi k¨ anner transformen av f (x) = x2 /2, x ∈ R, (den ¨ ar fe(ξ) = ξ 2 /2, allts˚ a samma funktion), s˚ a kan 2 2 e vi sluta att f (x) = ax + bx + c har transformen f (x) = (ξ − b) /4a − c. Exempel. Om vi l˚ ater f (x) = |x|1+p , 1+p x ∈ R, f¨ or en positiv konstant p, s˚ a blir f (ξ) = |ξ|1+1/p , 1 + 1/p ξ ∈ R. Ocks˚ a detta kan l¨ att ber¨aknas med differentialkalkyl d˚ a ξ 6= 0, och f¨ or ξ = 0 ¨ ar det n sj¨ alvklart. Man kan visa att samma formel g¨ aller ¨ aven i R . Exempel. Differentialkalkylen ¨ ar inte alltid till hj¨ alp. Om f (x) = |x|, x ∈ R, s˚ a blir e e f (ξ) = 0 d˚ a |x| 6 1 och f (ξ) = +∞ d˚ a |x| > 1. Detta inses genom att man tittar p˚ a uttrycket ξx − |x|, och konstaterar att det ¨ ar obegr¨ ansat upp˚ at d˚ a |ξ| > 1, medan det ¨ ar begr¨ ansat upp˚ at d˚ a |ξ| 6 1, med supremum lika med 0. Allts˚ a¨ ar fe = i[−1,1] , indikatorfunktionen f¨ or intervallet [−1, 1]. Om vi tar f som indikatorfunktionen f¨ or e ett intervall [a, b], s˚ a ser vi att f (ξ) blir aξ f¨ or ξ > 0 och bξ f¨ or ξ 6 0. Om intervallet e ar just [−1, 1] s˚ ¨ a blir f (ξ) = |ξ|. Exempel. Om f (x) = |x| + x2 /2, x ∈ R, s˚ a f˚ ar vi anv¨ anda en kombination av resonemanget i det sista exemplet och differentialkalkyl. Om n¨ amligen |ξ| 6 1 s˚ a e ser man precis som i f¨ orra exemplet att f (ξ) = 0. Men om |ξ| > 1 s˚ a kan vi s¨ oka maximum av uttrycket ξx − |x| − x2 /2 med differentialkalkyl. Derivatan ¨ ar f¨ or x > 0 lika med ξ − 1 − x och har ett unikt nollst¨ alle x = ξ − 1 > 0 om vi antar att ξ > 1. 1 2 Detta ger v¨ ardet ξx − x − x /2 = 2 (ξ − 1)2 . Av symmetrisk¨al blir fe(−ξ) = fe(ξ), s˚ a vi beh¨ over inte titta speciellt p˚ a ξ < −1 utan kan sammanfatta resultatet av 2 1 e unders¨ okningen i formeln f (ξ) = 2 (|ξ| − 1)+ , ξ ∈ R. B˚ ade f och fe ¨ ar skarvade andragradspolynom, men skarvningen g˚ ar till p˚ a olika s¨ att. 3 Exempel. Om f (x) = x s˚ a blir fe(ξ) = +∞ f¨ or alla ξ. H¨ ar finns inga affina minoranter. Exempel. Om f (x) = ex , x ∈ R, s˚ a kan vi r¨ akna ut fe med differentialkalkyl f¨ or ξ > 0 medan vi kan resonera mera direkt d˚ a ξ 6 0. Vi finner att ξ log ξ − ξ, fe(ξ) = 0, +∞, ξ > 0; ξ = 0; ξ < 0. Stirlings formel visar allts˚ a att fe(ξ) ≈ log(ξ!) d˚ a ξ 0: eξx = ξ ξ e−ξ ≈ (2πξ)−1/2 ξ!, ex e x∈R exp fe(ξ) = sup 19 ξ > 0. Liknande approximativa likheter vi f˚ a genom att approximera supremum med en integral: Z Z +∞ eξx ξx−ex e exp f (ξ) = sup ex ≈ e dx = tξ−1 e−t dt = (ξ − 1)!, ξ > 0, e x∈R R 0 eller exp fe(ξ) = sup tξ e−t ≈ t>0 +∞ Z tξ e−t dt = ξ!, ξ > 0. 0 e Inversionsformeln (se nedan sats 10.1) ger att fe = f och d¨ armed ex e ∞ X ekx x eξx e = exp f (x) = exp fe(x) = sup exp(ξx − fe(ξ)) = sup ξ −ξ ≈ = ee . k! ξ∈R ξ>0 ξ e k=0 Det enda som ¨ ar f¨ orv˚ anande h¨ ar ¨ ar att approximationen faktiskt ¨ ar en exakt likhet. Finns det n˚ agon f¨ orklaring? Exempel. S¨ att f (x) = 12 x21 + 13 x32 f¨ or x ∈ R2 , x2 > 0; f (x) = +∞ f¨ or x2 < 0. D˚ a 3/2 ar fe(ξ) = 12 ξ12 + 23 ξ2 d˚ ¨ a ξ2 > 0, och fe(ξ) = 12 ξ12 d˚ a ξ2 < 0. F¨ or ξ2 > 0 kan vi finna detta med differentialkalkyl, ty gradienten av uttrycket ξ · x − 12 x21 − 13 x32 ¨ar √ ξ − (x1 , x22 ) som har ett enda nollst¨ alle x = (ξ1 , ξ2 ) d˚ a ξ2 > 0, x2 > 0. Detta v¨ arde √ 1 2 1 2 1 3 1 3/2 1 2 2 3/2 2 ger insatt i uttrycket ξ · x − 2 x1 − 3 x2 = ξ1 + ξ2 ξ2 − 2 ξ1 − 3 ξ2 = 2 ξ1 + 3 ξ2 . Om d¨ aremot ξ2 6 0 s˚ a ser vi att uttryckets supremum antas d˚ a x2 = 0, och det handlar d˚ a om den redan v¨ alk¨ anda Fencheltransformen av 21 x21 . P Exempel. Om f (x) = 12 xj ajk xk d¨ ar A = (ajk ) ¨ ar en reell symmetrisk och positivt definit matris och x = (x1 , ..., xn )T en kolonnvektor, s˚ aledes med matrismultiplikation f (x) = 21 xT Ax, x ∈ Rn , s˚ a blir fe(ξ) = 12 ξA−1 ξ T , (D˚ a n = 1 f˚ ar vi speciellt f (x) = semidefinit s˚ a f˚ ar man i st¨allet 1 ξBξ T fe(ξ) = 2 +∞ ξ = (ξ1 , ..., ξn ). 1 2 2 ax , fe(ξ) = 1 2 2 ξ /a.) Om A bara ¨ ar positivt d˚ a ξ tillh¨ or radrummet till A annars, d¨ ar B ¨ ar en symmetrisk kvasiinvers till A, dvs. ABA = A. Detta kan ocks˚ a formuleras s˚ a h¨ ar: f (x) d˚ a ξ = xT A f¨ or n˚ agot x ∈ Rn , e f (ξ) = +∞ om ξ inte ¨ ar av formen xT A. Beviset ¨ ar denna r¨ akning: 1 1 1 fe(ξ) = fe(xT A) = sup(xT Ay − y T Ay) = sup xT Ax − (x − y)T A(x − y) 2 2 2 y y = sup f (x) − f (x − y) = f (x) − inf f (x − y) = f (x) y y d¨ ar den sista olikheten f¨ oljer av att f (x − y) > 0 och antar v¨ ardet 0 d˚ a y = x. Vi ser e allts˚ a att problemet att ber¨ akna f ¨ ar ekvivalent med problemet att ber¨ akna inversen till en symmetrisk matris i detta fall. 20 Proposition 9.3. F¨ or alla funktioner f, g: Rn → [−∞, +∞] g¨ aller (f u t g)e = fe+ ge. · Bevis. En l¨ att r¨ akning tack vare r¨ akneregeln (7.2). · Notera att vi har undre addition i proposition 9.3. Vi vet att fe+ ge ¨ ar konvex. · Det visar sig nu att fe+ ge = fe+ ge utom d˚ a fe+ ge ¨ ar konstant. · · Propositionerna 9.2 och 9.3 ger tillsammans en kedja av olikheter: (9.6) e e 6 fe u (f + g)e 6 fe+ ge e e = fe t u ge e t ge. · · (Till¨ ampa proposition 9.3 p˚ a fe och ge.) I spelteorin vill man g¨ arna ha likhet hela v¨ agen h¨ ar, dvs. man vill ha regeln (9.7) (f + g)e = fe u t ge · som ¨ ar dual till proposition 9.3. Den g¨ aller inte alltid, men vi kan notera f¨ oljande resultat: e Corollarium 9.4. Om fe = f och ge e = g s˚ a g¨ aller e (f + g)e = (fe u t ge)e. · Det kan mycket v¨ al vara strikt olikhet p˚ a den sista platsen i (9.6) ¨ aven under antagandena i detta corollarium: Exempel. Definiera tv˚ a funktioner f, g: R2 → [−∞, +∞] genom f¨ oreskrifterna 0 x1 = 0 f (x) = +∞ annars; 0 x1 = 1 g(x) = +∞ annars. D˚ a blir fe(ξ) = 0 d˚ a ξ2 = 0 och +∞ annars, medan ge(ξ) = ξ1 d˚ a ξ2 = 0 och +∞ e annars. Detta g¨ or att f + g = +∞ identiskt, medan f u t ge(ξ) antar v¨ ardet −∞ d˚ a · e = −∞ identiskt, medan fe u ξ2 = 0. D¨ arf¨ or blir (f + g)e = (fe u t ge)e t ge(ξ) = +∞ d˚ a · ξ2 6= 0. Det betyder att (9.7) inte g¨ aller. Exempel. Andra exempel kan man konstruera med hj¨ alp av indikatorfunktionen s˚ a e h¨ ar: l˚ at f = iX och ge = iY (d˚ a ¨ ar X och Y automatiskt slutna och konvexa). e=i e D˚ a¨ ar f u t ge = iX+Y och man kan visa (se sats 10.1 nedan) att (fe u t ge)e X+Y , indikatorfunktionen f¨ or det slutna h¨ oljet av X + Y . Nu kan vi ta X och Y slutna och konvexa men s˚ adana att deras vektorsumma inte ¨ ar sluten. Ett standardexempel p˚ a detta ¨ ar X = {x ∈ R2 ; x2 > 0, x1 x2 > 1}, 21 Y = {x ∈ R2 ; x2 = 0}, X + Y = {x ∈ R2 ; x2 > 0}, X + Y = {x ∈ R2 ; x2 > 0}. e D˚ a blir fe u t ge 6= fe u t ge e. Exempel. Om 1 fj (x) = (x − λj )2 , x ∈ Rn , 2σj s˚ a blir σj 2 fej (ξ) = ξ + λj · ξ, 2 ξ ∈ Rn , och fe1 + fe2 = fe3 , d¨ ar λ3 = λ1 + λ2 , σ3 = σ1 + σ2 . Allts˚ a g¨ aller (f1 u t f2 )e = fe1 + fe2 = fe3 e = (fe1 + fe2 )e = fe e3 . Vi har redan sett att f1 u varav f¨ oljer att (f1 u t f2 )e t f2 = f3 i ett tidigare exempel. Man kan ¨aven visa direkt att f1 u t f2 ¨ar kontinuerlig, vilket e = f3 (sats 10.1 nedan). tillsammans med konvexiteten ger att f1 u t f2 = (f1 u t f2 )e J¨ amf¨ or med Fourier- eller Laplacetransformen av gj = (2πσj )−n/2 e−fj . Detta illustrerar analogin mellan ˚ a ena sidan infimalfaltningen och Fencheltransformationen, ˚ a andra sidan faltningen och Fourier- eller Laplacetransformationen. Vi kan frig¨ ora oss fr˚ an den speciella formen hos f . L˚ at fj (x) = σj f ((x − λj )/σj ) representera en partikel med l¨ age λj och spridning σj , men d¨ ar f nu ¨ ar en allm¨ an funktion. D˚ a f˚ ar man att fej (ξ) = σj fe(ξ) + λj · ξ, s˚ a att vi ˚ aterigen f˚ ar fe1 + fe2 = fe3 med samma relationer mellan l¨ age och spridning e som f¨ orut, f¨ orutsatt endast att f antar n˚ agot annat v¨ arde ¨ an 0 och ±∞ (s˚ a att σj och λj ¨ ar best¨amda av fj ). Om f ¨ ar reellv¨ ard och konvex s˚ a g¨ aller att f1 u t f2 = f3 (j¨ amf¨ or proposition 8.7). Vi konstaterade efter proposition 8.3 att en konvex funktion inte beh¨ over ha n˚ agon som helst kontinuitetsegenskap. Emellertid var exemplet s˚ adant att f antog v¨ ardet +∞ i n¨ arheten av diskontinuitetspunkterna. Detta var ingen slump: vi skall se att konvexa funktioner ¨ ar kontinuerliga i det inre av dom f (se (9.2)). Sats 9.5. L˚ at f : Rn → [−∞, +∞] vara konvex och l˚ at Ω = (dom f )◦ vara det inre av den m¨ angd d¨ ar f (x) < +∞. D˚ a ¨ ar f antingen konstant lika med −∞ i Ω eller en kontinuerlig reellv¨ ard funktion i Ω. Bevis. Man konstaterar f¨ orst att om f inte ¨ ar konstant −∞ i Ω s˚ a m˚ aste f vara reellv¨ ard d¨ ar (se diskussionen efter proposition 8.3). Vi skall g¨ ora ett induktionsbevis. Satsen ¨ ar s¨akert sann om dimensionen ¨ ar lika med noll. Vi antar att vi visat den f¨ or n − 1 och skall anv¨ anda olikheten (8.1) p˚ a tv˚ a s¨att f¨ or att g˚ a upp ett steg i 0 0 n−1 dimension. Vi skriver variablerna som x = (x , xn ) d¨ ar x ∈ R (d˚ a n = 1 skall vi 0 helt bortse fr˚ an x ). Antag att 0 ∈ Ω. Vi har f¨ or n˚ agot tillr¨ ackligt litet positivt ε att f (0, ε) < +∞ och f (x) 6 (1 − λ)f (y 0 , 0) + λf (0, ε) om y 0 v¨ aljes s˚ a att x blir en konvex line¨ arkombination av (y 0 , 0) och (0, ε): x = (1 − λ)(y 0 , 0) + λ(0, ε). 22 P˚ a samma s¨att g¨ aller f (z 0 , 0) 6 (1 − µ)f (x) + µf (0, −ε) om (z 0 , 0) = (1 − µ)x + µ(0, −ε). H¨ ar blir λ = xn /ε best¨amd av xn och ε, liksom µ. Vi s¨ atter ihop olikheterna s˚ a h¨ ar: µ x0 f ((1 − µ)x0 , 0) − f (0, −ε) 6 f (x) 6 (1 − λ)f , 0) + λf (0, ε). 1−µ 1−µ 1−λ Detta g¨ aller f¨ or 0 6 xn < ε; en liknande olikhet g¨ aller f¨ or −ε < xn 6 0. Enligt 0 induktionsantagandet ¨ ar f (x , 0) en kontinuerlig funktion av de n − 1 variablerna x0 = (x1 , ..., xn−1 ), och vi kan konstatera att f (x) ligger inkl¨ amd mellan tv˚ a uttryck som beror kontinuerligt p˚ a x och har gr¨ ansv¨ ardet f (0) d˚ a x → 0, ty λ, µ → 0 d˚ a xn → 0. D¨ arf¨ or ¨ ar f kontinuerlig i origo, vilket visar satsen. P˚ a randen av Ω kan en konvex funktion vara diskontinuerlig. Det visar sig att en viss form av halvkontinuitet ¨ ar viktig: Sats 9.6. F¨ or en godtycklig funktion f : Rn → [−∞, +∞] ¨ ar f¨ oljande egenskaper ekvivalenta: 1. f ¨ ar ned˚ at halvkontinuerlig, dvs. lim inf y→x f (y) = f (x) f¨ or alla x ∈ Rn . 2. epi f ¨ ar en sluten m¨ angd i Rn+1 . 3. F¨ or varje reellt a ¨ ar subniv˚ am¨ angden {x ∈ Rn ; f (x) 6 a} sluten. Bevis. Om 1 g¨ aller och (xj , tj ) ¨ ar en f¨ oljd i epi f som konvergerar mot (x, t) s˚ a ser vi att t = lim inf tj > lim inf f (xj ) > lim inf f (y) = f (x), y→x j→+∞ vilket betyder att (x, t) ∈ epi f . Allts˚ a¨ ar epi f sluten; vi har visat egenskapen 2. Vi kan l¨ agga in subniv˚ am¨angden i punkt 3 p˚ a h¨ ojden a i Rn+1 och f˚ ar {x ∈ Rn ; f (x) 6 a} × {a} = epi f ∩ {(x, t) ∈ Rn+1 ; t = a}. Om nu epi f ¨ ar sluten s˚ a¨ ar den sista m¨ angden h¨ ar snittet av tv˚ a slutna m¨ angder. Allts˚ a implicerar 2 egenskapen 3. Om slutligen 3 g¨ aller s˚ a ser vi att om a < f (x) s˚ a¨ ar a < f (y) f¨ or alla y n¨ ara x, varf¨ or lim inf f (y) > a. y→x H¨ arav f¨ oljer att lim inf y→x f (y) > f (x); den motsatta olikheten g¨ aller alltid. Allts˚ a g¨ aller egenskapen 1. 10. Dualitet e Vi skall nu studera n¨ ar fe = f . Som vi konstaterat i b¨ orjan av avsnitt 9 ¨ ar detta e detsamma som att fr˚ aga huruvida f ¨ ar ett supremum av affina funktioner, ty fe ¨ar genom sin definition ett supremum av affina funktioner. Svaret ges av: 23 Sats 10.1. (Inversionsformeln f¨ or Fencheltransformationen.) L˚ at f vara en funktion e n p˚ a R med v¨ arden i [−∞, +∞]. D˚ a g¨ aller att fe = f om och endast om f har f¨ oljande tre egenskaper: A. f ¨ ar konvex; B. f ¨ ar ned˚ at halvkontinuerlig; C. Om f antar v¨ ardet −∞ s˚ a¨ ar f lika med −∞ identiskt. Namnet inversionsformel kommer av att en funktion som uppfyller f¨ oruts¨ attningarna kan ˚ atervinnas fr˚ an sin Fencheltransform; transformationen ¨ ar sin egen invers: e f (x) = fe(x) = sup(ξ · x − fe(ξ)), x ∈ Rn . ξ Bevis. Vi konstaterar f¨ orst att varje Fencheltransform m˚ aste ha de tre egenskaperna. Exempelvis ¨ ar varje Fencheltransform ett supremum av affina, allts˚ a kontinuerliga, funktioner, och ett godtyckligt supremum av ned˚ at halvkontinuerliga funktioner ¨ar ned˚ at halvkontinuerligt. Speciellt ser vi att f m˚ aste ha egenskaperna A, B, C om e e f = f. Vi skall nu bevisa omv¨ andningen. Den bygger p˚ a existensen av separerande hyperplan (sats 3.2) som ger sats 3.7 d¨ ar varje sluten konvex m¨angd framst¨ alls som ett snitt av slutna halvrum. L˚ at allts˚ a f vara en konvex funktion med sluten epigraf. Om f antar v¨ardet −∞ s˚ a g¨ aller resultatet, ty (−∞)e = +∞ och (+∞)e = −∞. D¨ arf¨ or kan vi nu anta att −∞ < f 6 +∞. Vidare g¨ aller satsen om f ¨ ar +∞ identiskt. L˚ at oss ta en godtycklig punkt (x0 , t0 ) utanf¨ or epigrafen, dvs. med f (x0 ) > t0 . Eftersom epigrafen ¨ ar sluten finns det enligt sats 3.2 ett hyperplan i Rn+1 som separerar epi f och (x0 , t0 ) strikt. Ett hyperplan i Rn+1 har ekvationen ξ · x + bt = c f¨ or n˚ agot val av ξ ∈ Rn och b ∈ R, och ett halvrum ¨ ar antingen epigrafen till en affin funktion (d˚ a b < 0) eller vertikalt (b = 0), eller slutligen hypografen till en affin funktion (b > 0). Den sistn¨ amnda typen av halvrum kan endast inneh˚ alla den tomma epigrafen, och f¨ orekommer s˚ aledes endast d˚ a f ¨ ar +∞ identiskt; d˚ a g¨ aller satsen som vi redan konstaterat. Problemet ¨ ar att visa att de vertikala halvrummen, som verkligen kan f¨ orekomma, inte p˚ averkar snittet. Att hyperplanet ¨ ar strikt separerande inneb¨ ar att det finns ett tal ε s˚ adant att ξ · x + bt 6 c < c + ε 6 ξ · x0 + bt0 f¨ or alla (x, t) ∈ epi f . Om det finns n˚ agon punkt d¨ ar f (x) < +∞ (och om detta inte ar sant ¨ ¨ ar f identiskt plus o¨ andligheten och resultatet g¨ aller), s˚ a ser vi att vi m˚ aste ha b 6 0 (l˚ at t > f (x) och g˚ a mot plus o¨ andligheten). Om nu b < 0 s˚ a¨ ar det l¨ att att avsluta beviset: vi kan helt enkelt dividera med −b och f˚ ar (−ξ/b) · x − f (x) 6 −c/b < −(c + ε)/b 6 (−ξ/b) · x0 − t0 . Det ger att fe(−ξ/b) 6 (−ξ/b) · x0 − t0 och d¨ arf¨ or e fe(x0 ) > (−ξ/b) · x0 − fe(−ξ/b) > t0 . 24 e Det inneb¨ ar att fe(x0 ) ¨ ar st¨orre ¨ an eller lika med varje t0 som ¨ ar mindre ¨ an f (x0 ), e dvs. att fe(x0 ) > f (x0 ). Speciellt ser vi att om f (x0 ) < +∞ s˚ a m˚ aste b < 0 och det gjorda resonemanget g¨ aller. Men det kan h¨ anda att b = 0; det svarar mot att hyperplanet i Rn+1 ¨ ar vertikalt: det ¨ ar d˚ a inte grafen av n˚ agon affin funktion p˚ a Rn . I s˚ a fall m˚ aste f (x0 ) = +∞ och vi skall till¨ ampa ett speciellt knep f¨ or att vicka p˚ a det vertikala hyperplanet. N¨ ar b = 0 vet vi att ξ · x 6 c < c + ε 6 ξ · x0 f¨ or alla x s˚ adana att det finns ett t med (x, t) i epigrafen, dvs. f¨ or alla x med f (x) < +∞. Det ger oss enligt definitionen av Fencheltransformen att fe(θ + sξ) = sup (θ · x + (sξ) · x − f (x)) 6 fe(θ) + x∈dom f sup (sξ) · x 6 fe(θ) + sc, x∈dom f f¨ or alla s > 0, ty i definitionen (9.1) av fe s˚ a¨ ar det klart att endast punkter x med f (x) < +∞ beh¨ over anv¨ andas: se (9.3). Vi f˚ ar d¨ arf¨ or e (10.1) fe(x0 ) > (θ + sξ) · x0 − fe(θ + sξ) > (θ + sξ) · x0 − fe(θ) − sc > θ · x0 + sε − fe(θ). H¨ ar v¨ aljer vi nu θ s˚ a att fe(θ) < +∞; detta ¨ ar m¨ ojligt som vi sett i den f¨ orsta delen av beviset d¨ ar vi antog att f (x0 ) < +∞. Om vi nu l˚ ater s → +∞ i (10.1) s˚ a ser vi e att fe(x0 ) = +∞, det ¨ onskade resultatet. e Sats 10.2. Antag att fe = f och ge e = g samt att fe u t ge ¨ ar ned˚ at halvkontinuerlig och ingenstans minus o¨ andligheten eller identiskt minus o¨ andligheten (detta ¨ ar fallet till e exempel om f u t ge ¨ ar reellv¨ ard ¨ overallt). D˚ a g¨ aller att (f + g)e = fe u t ge, · och speciellt om vi tar v¨ ardet i origo · − inf (f (x) + g(x)) = inf (fe(ξ) + ge(−ξ)). · x ξ Bevis. Vi beh¨ over bara kombinera corollarium 9.4 med satserna 9.5 och 10.1. 11. St¨ odfunktionen Med hj¨ alp av st¨ odfunktionen kan fr˚ agor om konvexa m¨ angder ¨ overf¨ oras till fr˚ agor om homogena konvexa funktioner. Det visar sig att st¨ odfunktionen ¨ ar ett specialfall av Fencheltransformen. Definitionen ¨ ar denna: Definition 11.1. L˚ at X vara en godtycklig m¨ angd i Rn . D˚ a definierar vi dess st¨ odfunktion HX genom HX (ξ) = sup ξ · x, ξ ∈ Rn . x∈X Det ¨ ar klart att om vi l˚ ater f = iX vara indikatorfunktionen till m¨ angden X (den ar 0 i X och +∞ utanf¨ ¨ or), s˚ a ¨ ar HX = fe. Allt som vi gjort i avsnitten 9 och 10 g¨ aller d¨ arf¨ or i denna speciella situation. Det har emellertid sitt intresse att g˚ a igenom satserna d¨ ar f¨ or att se hur de blir. Vi konstaterar f¨ orst att iX uppfyller villkoren A, B, C i sats 10.1 om och endast om X ¨ ar sluten och konvex. 25 Proposition 11.2. St¨ odfunktionen HX till en m¨ angd X ¨ ar ned˚ at halvkontinuerlig och antar v¨ ardet −∞ endast d˚ a X = Ø. Om X 6= Ø s˚ a g¨ aller HX (0) = 0 och HX ar en positivt homogen konvex funktion. Om X ¨ ¨ ar begr¨ ansad och inte tom s˚ a¨ ar HX reellv¨ ard och d¨ armed kontinuerlig ¨ overallt. Bevis. Det som ¨ ar nytt i f¨ orh˚ allande till vad vi redan vet om Fencheltransformer ¨ ar homogeniteten. Den inneb¨ ar att HX (tξ) = tHX (ξ) f¨ or alla positiva tal t, och ¨ ar l¨ att att visa. Man skriver bara HX (tξ) = sup (tξ) · x = t sup ξ · x = tHX (ξ). x∈X x∈X Sats 11.3. Om h: Rn → [−∞, +∞] ¨ ar en given positivt homogen konvex funktion med h(0) = 0 s˚ a s¨ atter vi (11.1) X = {x ∈ Rn ; ξ · x 6 h(ξ) f¨ or alla ξ}. D˚ a blir indikatorfunktionen f¨ or X lika med Fencheltransformen f¨ or h. Om h dessutom ¨ ar ned˚ at halvkontinuerlig s˚ a¨ ar st¨ odfunktionen f¨ or X lika med h. Bevis. Om x ∈ X s˚ a g¨ aller ξ · x − h(ξ) 6 0 f¨ or alla ξ och allts˚ a blir e h(x) 6 0; om vi e tar ξ = 0 s˚ a ser vi att vi m˚ aste ha h(x) = 0. Om ˚ a andra sidan x ∈ / X s˚ a finns det ett ξ s˚ adant att ξ · x − h(ξ) > 0, och om vi ers¨atter ξ med tξ och l˚ ater t g˚ a mot +∞, s˚ a ser vi att vi m˚ aste ha e h(x) = +∞, ty e h(x) > (tξ) · x − h(tξ) = t(ξ · x − h(ξ)) p˚ a grund av homogeniteten. Detta visar att e h = iX . Det sista p˚ ast˚ aendet ¨ ar helt enkelt inversionsformeln f¨ or Fencheltransformatioe nen: vi har ju e h = h under de angivna f¨ oruts¨ attningarna. D¨ armed ¨ ar satsen visad. Vi har allts˚ a identifierat de m¨ angder vilkas indikatorfunktioner ¨ ar Fencheltransformer: det ¨ ar de slutna konvexa m¨ angderna. Likas˚ a de positivt homogena funktioner som ¨ ar Fencheltransformer: det ¨ ar de ned˚ at halvkontinuerliga konvexa och positivt homogena funktionerna med h(0) = 0, plus konstanten −∞. Fencheltransformationen blir i dessa fall operationen att ta st¨ odfunktionen av en m¨angd, och i andra riktningen operationen (11.1). Vi kan nu specialisera resultaten i avsnitten 9 och 10 till indikatorfunktioner och homogena funktioner. Exempelvis s¨ ager proposition 9.3 specialiserad till f = iX och g = iY att st¨ odfunktionen f¨ or en vektorsumma ¨ ar undre summan av vardera m¨ angdens st¨ odfunktion: HX+Y = HX + HY . · H¨ ar ¨ ar pricken under plustecknet bara n¨ odv¨ andig d˚ a en av m¨angderna ¨ ar tom: b¨ agge leden blir d˚ a identiskt minus o¨ andligheten. I alla andra fall kan vi skriva ett vanligt plustecken utan risk f¨ or missf¨orst˚ and. Om f = iX och g = iY s˚ a¨ ar f + g = f + g = iX∩Y . Om X och Y ¨ ar slutna och · e konvexa s˚ a s¨ager corollarium 9.4 allts˚ a att st¨odfunktionen f¨ or X ∩ Y ¨ ar (HX u t HY )e. 26 Denna funktion kan beskrivas som den st¨ orsta ned˚ at halvkontinuerliga minoranten till HX u t HY om X ∩ Y 6= Ø, och ¨ ar konstanten −∞ om X ∩ Y ¨ ar tom. 12. Spelteori och line¨ar programmering Vi skall nu visa att spelteorins huvudsats f¨ oljer fr˚ an den dualitetsteori som vi utvecklat. Vi h¨ anvisar till Borell & Lindahl f¨ or bakgrunden. L˚ at oss allts˚ a betrakta ett spel med tv˚ a spelare och utbetalningsfunktion X F (x, y) = xi aij yj i,j d¨ ar x ∈ X, y ∈ Y och X och Y ¨ ar simplex: X = {x ∈ Rn ; xi > 0 och X xi = 1}, Y = {y ∈ Rm ; yj > 0 och X yj = 1}. Sats 12.1. (Spelteorins huvudsats.) L˚ at A = (aij ) vara en given reell matris och l˚ at X och Y vara de simplex som definierats ovan. D˚ a g¨ aller (12.1) inf sup F (x, y) = sup inf F (x, y), x∈X y∈Y y∈Y x∈X och det finns en sadelpunkt (ˆ x, yˆ) d¨ ar detta v¨ arde antas. Bevis. Definiera en funktion f genom X X xi aij = max(x · aj ), f (x) = sup F (x, y) = sup xi aij yj = max y∈Y j j y∈Y d¨ ar aj = (a1j , ..., anj )T ¨ ar den j-te kolonnen i matrisen A. Funktionen f ¨ ar reellv¨ ard och konvex som maximum av ¨ andligt m˚ anga line¨ ara funktioner. Vi kan r¨ akna ut dess Fencheltransform: fe(ξ) = 0 d˚ a ξ ligger i det konvexa h¨ oljet av punkterna a1 , ..., am e och = +∞ utanf¨ or denna m¨ angd. Man ser ocks˚ a att fe = f . Vidare definierar vi g som indikatorfunktionen f¨ or X, dvs. g ¨ ar noll i X och +∞ utanf¨ or. Vi kan r¨ akna ut Fencheltransformen f¨ or g och finner att ge(ξ) = max ξj . Speciellt ¨ ar ge ¨ andlig ¨ overallt, och d¨ armed ocks˚ a fe u t ge. Vi kan verifiera att ge e = g. Sats 10.2 s¨ager d˚ a att inf (f (x) + g(x)) = − inf (fe(ξ) + ge(−ξ)). (12.2) x ξ Vi beh¨ over nu bara se efter vad denna likhet betyder. Tydligen ¨ ar inf sup F (x, y) = inf f (x) = inf (f (x) + g(x)), x∈X y∈Y x∈Rn x∈X dvs. v¨ ansterledet i (12.2). H¨ ogerledet i (12.2) ¨ ar − inf (fe(ξ) + ge(−ξ)) = − inf (e g (−ξ); fe(ξ) = 0) = − inf (max(−ξj ); fe(ξ) = 0) ξ ξ ξ 27 j = sup(min ξj ; fe(ξ) = 0) = sup( inf x · ξ; fe(ξ) = 0). j ξ ξ x∈X P Villkoret att fe(ξ) = 0 betyder att ξ ¨ ar av formen aij yj f¨ or n˚ agot y ∈ Y , s˚ a att h¨ ogerledet i (12.2) blir sup( inf x · ξ; fe(ξ) = 0) = sup inf ξ x∈X y∈Y x∈X X xi aij yj = sup inf F (x, y). y∈Y x∈X Allts˚ a¨ ar h¨ ogerledet i (12.2) lika med h¨ ogerledet i (12.1), och vi ser att (12.1) ¨ ar ett specialfall av sats 10.2. Detta visar att spelets v¨ arde ¨ ar detsamma ur b˚ ada spelarnas synpunkt. F¨or att hitta en sadelpunkt anv¨ ander vi kompakthet: det finns en punkt x ˆ s˚ adan att f (ˆ x) = inf x f (x) och en punkt yˆ s˚ adan att h(ˆ y ) = supy h(y), d¨ ar vi nu satt h(y) = inf x F (x, y). Det f¨ oljer att inf sup F (x, y) = inf f = f (ˆ x), x y x medan sup inf F (x, y) = sup h = h(ˆ y ). y x y Vidare g¨ aller F (ˆ x, y) 6 sup F (ˆ x, y) = f (ˆ x) y och h(ˆ y ) = inf F (x, yˆ) 6 F (x, yˆ). x Men (12.2) som vi just visat s¨ager ju att f (ˆ x) = h(ˆ y ); allts˚ a f¨ oljer att F (ˆ x, y) 6 f (ˆ x) = h(ˆ y ) 6 F (x, yˆ). Genom att h¨ ar v¨ alja y = yˆ respektive x = x ˆ s˚ a f˚ ar vi F (ˆ x, y) 6 F (ˆ x, yˆ) = f (ˆ x) = h(ˆ y ) 6 F (x, yˆ) f¨ or alla x ∈ X och alla y ∈ Y , vilket betyder att (ˆ x, yˆ) ¨ ar en sadelpunkt. Sats 12.2. (Dualitetssatsen i line¨ ar programmering.) Ett line¨ art programmeringsproblem inf cx och dess dual sup bT y Ax>b AT y=cT y>0 har samma v¨ arde utom i det fall att b¨ agge polyedrarna ¨ ar tomma. Vi har h¨ ar tagit upp endast ett par av duala problem (p˚ a generell form respektive kanonisk form). Se Borell & Lindahl sid. 32–33 f¨ or andra varianter. P Bevis. S¨ att fi (x) = 0 d˚ a j aij xj > bi , i = 1, ..., m, och fi (x) = +∞ annars. Det betyder att fi ¨ ar indikatorfunktionen f¨ or ett halvrum, n¨ amligen det som definieras av ai · x > bi , d¨ ar ai ¨ ar vektorn (ai1 , ..., ain ). Vi kan l¨ att r¨ akna ut dess Fencheltransform: fei (ξ) = −tbi d˚ a ξ = −tai , f¨ or n˚ agot t > 0, och fei (ξ) = +∞ ¨ overallt utanf¨ or denna 28 str˚ ale. D˚ a blir f = f1 + · · · + fm indikatorfunktionen f¨ or polyedern P i det f¨ orsta LP-problemet, och polyederns st¨odfunktion ¨ ar HP = fe. LP-problemets v¨ arde ¨ ar helt enkelt v = −fe(−c) = −HP (−c). Corollarium 9.4 (eller noga taget en generalisering av detta till flera termer) s¨ ager att e HP = fe = (f1 + · · · + fm )e = (fe1 u t ··· u t fem )e. Enligt definitionen av infimalfaltningen ¨ ar X X (−yi bi ); (−yi ai ) = ξ och yi > 0 . g(ξ) = fe1 u t ··· u t fem (ξ) = inf y D˚ a ξ = −c ¨ar detta tal precis minus v¨ ardet f¨ or det duala LP-problemet, allts˚ a ∗ v = −g(−c). Sammanfattningsvis har vi v = −fe(−c) = −ge e(−c) > −g(−c) = v ∗ . (P˚ ast˚ aendet att v > v ∗ brukar kallas f¨ or den svaga dualitetsatsen och f¨ oljer allts˚ a e redan nu.) Vi ser att dualitetssatsen reducerats till fr˚ agan huruvida ge = g i punkten ξ = −c. Vi vet att ge e = fe = HP , varav f¨ oljer att ge = f = iP . L˚ at K beteckna det koniskt konvexa h¨ oljet av vektorerna −ai , i = 1, ..., m. Det ¨ ar en sluten konvex kon (sats 2.2) och uppenbarligen ¨ ar g = +∞ utanf¨ or K. e e Om P inte ¨ ar tom s˚ a s¨ ager olikheten g > ge = f = HP > −∞ att g ingenstans antar v¨ ardet −∞. Fr˚ agan om g = ge e¨ ar d˚ a enbart en fr˚ aga om huruvida g ¨ ar ned˚ at halvkontinuerlig. Av sats 9.5 ser vi att g ¨ ar kontinuerlig i det inre av K, s˚ a d¨ ar g¨ aller s¨ akert ge e(ξ) = g(ξ) (f¨ or ¨ ovrigt ¨ ar K lika med hela rummet om P ¨ ar begr¨ ansad). Hur blir det p˚ a randen av K? H¨ ar kommer sats 2.2 till v˚ ar hj¨ alp. Betrakta n¨ amligen de m vektorerna (−ai , −bi ) i Rn × R. Deras koniskt konvexa h¨ olje L ¨ ar enligt sats 2.2 slutet. Vi ser att g helt enkelt ¨ ar den undre begr¨ ansningen av denna kon. Vidare ¨ ar K bilden av L under projektionen som gl¨ ommer den sista koordinaten. Det f¨ oljer att g¨ ar kontinuerlig p˚ a K, och d¨ armed att ge e = g. Om d¨ aremot P ¨ ar tom s˚ a visar det sig att g = −∞ i K (men fortfarande +∞ e utanf¨ or). D¨ arf¨ or m˚ aste ge vara −∞ identiskt, s˚ a ge e = g i K men g > ge e i komplementet. ∗ ∗ Vi ser att v = v = +∞ om −c ∈ K, medan v = +∞ > v = −∞ om −c ∈ / K, dvs. d˚ a polyedern i det duala problemet ¨ ar tom. Detta ¨ ar undantagsfallet i satsen. F¨ or att se att g P blir −∞ i K s˚ a kanPman resonera s˚ a h¨ ar: om P ¨ ar tom s˚ a finns tal ti > 0 s˚ adana att ti ai = 0 medan ti bi > 0. Detta ger g(ξ) 6 X (−yi − sti )bi = X (−yi bi ) − s X ti bi → −∞ P d˚ a s → +∞, f¨ orutsatt att ξ ∈ K s˚ a att det finns n˚ agon framst¨ allning ξ = (−yi ai ). ¨ Aven dualitetssatsen i teorin f¨ or line¨ ar programmering ¨ ar allts˚ a en konsekvens av dualiteten mellan addition och infimalfaltning. Litteratur Borell, Christer, & Lindahl, Lars-˚ Ake. 1979. Linj¨ ar och konvex optimering. Uppsala universitet. 29 Kiselman, Christer O. 1986. Konvekseco en kompleksa analitiko unu-dimensia. Uppsala University, Lecture Notes 1986:LN2. Rockafellar, R. Tyrrell. 1970. Convex Analysis. Princeton University Press. F¨ orfattarens adress: Uppsala universitet, Matematiska institutionen, Thunbergsv¨ agen 3, 752 38 Uppsala. Telefon: 018 - 18 32 16; 018 - 30 07 08. Telefax: 018 - 18 32 01. Datoradress: matck @ seudac21 . bitnet. 30
© Copyright 2024