Tropisk geometri og firlegemeproblemet Tropical geometry and the four body problem Henrik Lunding Nielsen 20081795 1. december 2014 Vejleder: Niels Lauritzen Projektvejleder: Anders Nedergaard Jensen Institut for matematiske fag, Aarhus Universitet Resumé Vi vil forsøge at vise endeligheden af relative ækvilibria i firlegemeproblemet. Vores fremgangsmåde minder meget om [6], men vi benytter i stedet sproget fra polyhedral- og tropisk geometri. For at vise endeligheden skal det vises, at hver af en række polyhedralkegler snittet med den tropiske varietet for et ideal et tomt. Dette ideal er frembragt af polynomier som vi får fra AlbouyChenciners og Dziobeks ligninger. Vi viser dette for alle kegler undtagen to. Først beskrives centrale konfigurationer og relative ækvilibria præcist. Herefter udleder vi Albouy-Chenciners ligninger og ser sammenhængen mellem disse og centrale konfigurationer. Senere beskrives teori fra polyhedralog tropisk geometri, som til sidst bruges til at vise endeligheden af relative ækvilibria under antagelsen at de to ovennævnte kegler snittet med den tropiske varietet er tomt. Abstract We try to show the finiteness of relative equilibria in the four body problem. Our approach is remnicant to [6] but we use theory from polyhedral- and tropical geometry instead. To get the finiteness we must show that each of a number of polyhedral cones intersected with a tropical variety of a certain ideal is empty. This ideal is generated by polynomials we get from AlbouyChenciners and Dziobeks equations. We show this for alle cones except two. First we give a precise description of central configurations and relative equilibria. Then we derive the Albouy-Chenciner equations, and see their connection with central configurations. We will describe some theory from polyhedral- and tropical geometry, and use it to show the finiteness of relative equilibria under the assumption that each of the two special cones mentioned above intersected with the tropical variety is empty. ii Tak til Jeg vil gerne give en stor tak til Anders Nedergaard Jensen for al hans hjælp gennem dette forløb. Gennem de mange timer han har afsat har han tålmodigt, og altid i godt humør, afklaret en masse svært stof for mig. Min kæreste Maria Storgaard Hjorth skal også have tak for at læse korrektur, komme med forslag og ikke mindst for hendes forståelse, da arbejdet med dette speciale til tider har fyldt meget. iii Indhold 1 Konfigurationer 1.1 Centrale konfigurationer . . 1.2 Relative ækvilibria . . . . . 1.3 Homotetisk kollaps . . . . . 1.4 Ækvivalente konfigurationer 1.5 Overordnet strategi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Albouy-Chenciners ligninger 2.1 Ω er veldefineret . . . . . . . . . . . . . 2.2 Ω-billedmængden . . . . . . . . . . . . 2.3 Ω er injektiv . . . . . . . . . . . . . . . 2.4 Skalering af normerede konfigurationer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 3 6 8 9 . . . . 11 12 14 18 23 3 Flere betingelser 28 3.1 Cayley-Menger determinanter . . . . . . . . . . . . . . . . . . 28 3.2 Dziobeks ligninger . . . . . . . . . . . . . . . . . . . . . . . . 33 4 Initielle termer, -idealer og kvotientidealer 4.1 Initielle termer, -forme og -idealer . . . . . . 4.2 Nogle resultater fra polyhedral geometri . . 4.3 Tropisk geometri . . . . . . . . . . . . . . . 4.4 Kvotientidealer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 35 39 43 52 5 Undersøgelse af den tropiske varietet 5.1 Symmetri for polynomier uden masser . . 5.2 Symmetri for polynomier med masser . . . 5.3 Tjek at led ikke forsvinder . . . . . . . . . 5.4 Den tropiske prevarietet for frembringerne < . . . . . . . . . . . . . . . . 5.5 Kegler i H−L 5.6 Kegler i HL< . . . . . . . . . . . . . . . . . 5.7 De svære kegler . . . . . . . . . . . . . . . 5.8 Sammenligning af tropiske prevarieteter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 54 57 59 59 60 62 62 63 6 Litteratur . . . . . . . . 66 iv A Appendix: Liste over egne bidrag 67 B Appendix: Diverse software B.1 Sæt variabler udenfor parentes . . . . . . . . . . . . . . . . . . B.2 Find initielle former . . . . . . . . . . . . . . . . . . . . . . . . B.3 Script til Singular . . . . . . . . . . . . . . . . . . . . . . . . . 68 68 68 69 C Appendix: Gfan’s beregning af prevarietet 70 v 1 Konfigurationer I klassisk mekanik kan n-legemeproblemet beskrives som følgende opgave: Lad der være givet et Newtoniansk system med n punktmasser med bestemte masser, koordinater og starthastigheder. Beskriv punktmassernes fremtidige bevægelser. Alle punktmasser påvirker hinanden indbyrdes, så problemet bliver hurtigt mere kompliceret når n stiger. Vi vil se nærmere på en type af systemer, som giver simple løsninger til ovennævnte problem. For fire givne masser ønsker vi at vise, at der kun findes endeligt mange af disse systemer (med n = 4), op til translation, rotation og skalering. I kapitel 1.1 og 1.2, som er baseret på Marshal Hamptons og Richard Moeckels artikel [6], vil vi bl.a. definere disse systemer, som kaldes relative ækvilibria, og vise nogle sammenhænge. Når disse er på plads vil vi i afsnit 1.5 skitsere hvordan vi vil bruge Albouy-Chenciners ligninger samt tropisk geometri til at finde frem til ovennævnte endelighed. Appendix A indeholder en liste over resultater og sætninger indeholdt i dette speciale, som ikke er hentet fra litteraturen. Disse er i stedet vist af undertegnede. 1.1 Centrale konfigurationer Lad os starte med en definition: Lad der være givet n punktmasser arrangeret i Rd med positive masser m1 , ..., mn og koordinater x1 , ..., xn (vi bruger fede variabler til at repræsentere søjlevektorer). Disse kalder vi en konfiguration, og skriver den kort (X, M) hvor1 : m1 m2 X = x1 x2 . . . xn ∈ Matd×n (R), M = .. ∈ Rn>0 . mn Vi benytter rij for afstanden mellem punkter, rij = kxi − xj k for i, j ∈ {1, ..., n}. Følgende er den overordnede type af konfigurationer vi vil beskæftige os med: 1 Her er R>0 = {z ∈ R : z > 0}. 1 Definition 1.1. Lad (X, M) i Rd være en konfiguration med n punktmasser. Dette kaldes en central konfiguration hvis der findes et λ > 0 og et c ∈ Rd sådan at: X mj (xj − xi ) , i = 1, 2, ..., n (1) −λ(xi − c) = 3 r ij 1≤j≤n j6=i Vi kalder λ for den centrale konfigurations kvadrerede vinkelhastighed og c for dens centrum. For dem der har læst [6] bemærkes at λ i denne definition er anderledes med et fortegn. For et system af punktmasser i bevægelse er det at være en central konfiguration en instantiel egenskab: Systemets punkter kan være en central konfiguration til et tidspunkt, og ikke være det det næste. Det kan derfor virke underligt at kalde λ for den kvadrerede vinkelhastighed, men proposition 1.4 vil forsvare dette navn. Hvis vi for i = 1, ..., n multiplicerer i’te ligning i (1) med mi og til sidst summer alle sammen får vi: X X mi mj (xj − xi ) −λmi (xi − c) = 3 rij 1≤i≤n 1≤j,i≤n j6=i P P Det ses at højresiden evaluerer til 0, dvs. 0 = i mi (xi − c) = i mi xi − P P mx ( i mi )c, så vi får at c = i m i i hvis vi skriver m = m1 + ... + mn for den totale masse. Så en ækvivalent definition for at være en central konfiguration med kvadreret vinkelhastighed λ er: P X mj (xj − xi ) j mj xj , i = 1, 2, ..., n (2) −λ xi − = 3 m r ij j6=i Eksempel 1.2. Betragt kanterne i et kvadrat: x1 = (−1, 0), x2 = (0, 1), x3 = (1, 0), x4 = (0, −1) Giv alle disse punkter massen m = 1. Vi tjekker nu at dette er en central konfiguration med λ = 41 + √12 og c = (0, 0). Vi ser at (1) gælder for i = 1: x2 − x 1 x3 − x 1 x 4 − x1 (1, 1) (2, 0) (1, −1) + √ 3 = √ + + √ √ 3 + 3 2 8 2 2 2 2 2 2 1 1 = ... = − + √ x1 4 2 Pga. symmetri gælder det samme for i = 2, 3, 4, så de fire punktmasser er en central konfiguration. 2 1.2 Relative ækvilibria I dette afsnit bruger vi x ∈ Rd til at repræsentere punkter og y : R → Rd til at repræsentere bevægelse gennem tiden. Men lad os allerførst opskrive Newtons tyngdelov, som punktmasserne aflyder under deres bevægelse: mi y ¨i = X mi mj (yj − yi ) , 3 rij 1≤j≤n i = 1, 2, ..., n (3) j6=i (Vi har valgt et enhedssæt så gravitationskonstanten bliver 1). Det bemærkes at rij her ses som afbildninger, rij (t) = kyi (t) − yj (t)k. Definition 1.3. For n ≥ 2 lad y1 , ..., yn : R → R2 med masser m1 , ..., mn > 0 være en løsning til (3) på hele R. Disse kalder vi et relativt ækvilibrium hvis der findes et α ∈ R og et c ∈ R2 sådan at: yi (t) = Qαt (yi (0) − c) + c for alle t og i = 1, ..., n (4) Her er Qαt ∈ SO(2) rotationsmatricen der roterer αt mod uret. α kaldes vinkelhastigheden og c kaldes centrum for det relative ækvilibrium. For simpelheds skyld antages i følgende proposition at alle centre er i origo, c = 0. Propositionen fortæller os at et relativt ækvilibrium til tiden t = 0 udgør en central konfiguration, og at begreberne ‘centrum’ og ‘vinkelhastighed’ i de to definitioner stemmer overens. Proposition 1.4. Lad (X, M) være en konfiguration i R2 bestående af punktmasserne (x1 , m1 ), (x2 , m2 ), ..., (xn , mn ), n ≥ 2. Hvis to af følgende punkter er opfyldt, er alle punkterne opfyldt: 1. (x1 , m1 ), ..., (xn , mn ) er en central konfiguration med kvadreret vinkelhastighed λ > 0. 2. Der findes y1 , ..., yn : R → R2 som (sammen med massserne m1 , ..., mn ) er et relativt ækvilibrium med centrum 0 og vinkelhastighed α 6= 0, som opfylder yi (0) = xi for alle i. 3. λ = α2 Lad os bruge dette i et eksempel inden vi beviser det. 3 Eksempel 1.5. Vi så i eksempel 1.2 at x1 = (−1, 0), x2 = (0, 1), x3 = (1, 0), x4 = (0, −1) hver med massen 1 udgør en central konfiguration med kvadreret vinkelhastighed λ = 41 + √12 . √ √ Når vi lader α ∈ { λ, − λ} ved vi punkt 1 og 3 i forrige proposition. Vi ved derfor punkt 2, dvs. der findes et relativt ækvilibrium med fire punktmasser, yi : R → R2 , sådan at disse til tiden t = 0 ligger ligesom den centrale konfiguration, dvs. yi (0) = xi for i = 1, 2, 3, 4. Vi ser også at der√ kun findes to relative ækvilibria med √ denne egenskab - en med vinkelhastighed λ og en med vinkelhastighed − λ. Hvis der√fandtes √ et tredje relativt ækvilibrium ville den have en vinkelhastighed α ∈ / { λ, − λ}. Vi ville så have opfyldt punkt 1 og 2 i propositionen, og så ville punkt 3 give en modstrid. Vi bemærker at α 6= 0 i propositionens andet punkt slet ikke er nogen begrænsning: Hvis der fandtes et relativt ækvilibrium med α = 0 ville alle dens punkter yi stå stille pr. (4). Dette betyder at ingen af dens punkter har en acceleration, y ¨1 = y ¨2 = ... = y ¨n = 0. Modstriden kommer nu af at vi vha. 2 (3) finder et punkt yi med y ¨i 6= 0. Bevis. Vi viser nu at punkt 1 og 2 medfører punkt 3, så antag at punkt 3 ikke er opfyldt, dvs. α2 6= λ, og vælg i så xi ikke ligger i origo (denne må eksistere da vi ellers har to punkter oven i hinanden). Da masserne er positive får vi: −mi α2 Qαt xi 6= −mi λQαt xi ∀t ∈ R Vi benytter nu lemma 1.6. På venstresiden bruger vi (5) og på højresiden (7). Vi får: X mi mj (yj (t) − yi (t)) mi y ¨i (t) 6= kyi (t) − yj (t)k3 1≤j≤n j6=i Så (3) er ikke opfyldt. Men dette giver modstriden, da (3) skal være opfyldt for alle relative ækvilibria. Vi viser nu at punkt 1 og 3 medfører punkt 2. For alle i vælger vi yi (t) = Qαt xi hvorfra det følger at yi (0) = xi og at (4) holder. Implikationen følger nu ved at vise at (3) også holder. Punkt 3 giver at −mi α2 Qαt xi = −mi λQαt xi . 2 Vælg k så der findes to punktmasser med forskellig k-koordinat (denne må eksistere, ellers ville alle n punkter ligge oveni hinanden). Vælg i så yi har den laveste k-koordinat blandt alle y1 , ..., yn . Så vil leddene (yj −yi ) alle have ikke-negativ k-koordinat, og heraf vil mindst én være positiv. Da alle masserne er positive bliver summens k-koordinat positiv, dvs. y ¨i 6= 0. 4 Vi bruger så igen lemma 1.6, (5) på venstresiden og (7) på højresiden og får: mi y ¨i (t) = X mi mj (yj (t) − yi (t)) kyi (t) − yj k3 1≤j≤n ∀i j6=i Dette viser (3). Antag nu punkt 2 og 3 og lad os vise punkt 1. Vi ved så at (3) holder for det relative ækvilibrium: X mi mj (yj (t) − yi (t)) ∀i mi y ¨i (t) = kyi (t) − yj (t)k3 1≤j≤n j6=i Vi bruger endnu engang lemma 1.6. Ved at bruge (5) på venstresiden og (6) på højresiden får vi: −mi α2 Qαt xi = X mi mj Qαt (xj − xi ) kxi − xj k3 1≤j≤n ∀i j6=i Med punkt 3 ved vi at α2 kan erstattes med λ. Hvis vi samtidig multiplicerer med m1i Q−1 αt på hver side får vi: −λxi = X mj (xj − xi ) kxi − xj k3 1≤j≤n ∀i j6=i Vi har hermed vist (1), så vi har vist punkt 1. Lemma 1.6. Lad (x1 , m1 ), ..., (xn , mn ) være en konfiguration og lad y1 , ..., yn : R → R2 opfylde (4) for et α og c = 0 (de behøver ikke opfylde (3)). Antag også at yi (0) = xi for alle i. Så gælder for i = 1, ..., n: mi y ¨i (t) = −mi α2 Qαt xi X mi mj (yj (t) − yi (t)) X mi mj Qαt (xj − xi ) = kxi − xj k3 kyi (t) − yj (t)k3 1≤j≤n 1≤j≤n (5) (6) j6=i j6=i Hvis desuden (x1 , m1 ), ..., (xn , mn ) er en central konfiguration med kvadreret vinkelhastighed λ > 0 (og centrum 0), så gælder også at: −mi λQαt xi = X mi mj (yj (t) − yi (t)) kyi (t) − yj (t)k3 1≤j≤n j6=i 5 (7) Bevis. Ved at skrive (4) ud og bruge yi (0) = xi får vi for i = 1, ..., n: cos(αt) − sin(αt) yi (t) = Qαt yi (0) = xi sin(αt) cos(αt) Vi differentierer og får: − sin(αt) y˙ i (t) = α cos(αt) − cos(αt) y ¨i (t) = α2 − sin(αt) 2 cos(αt) = −α sin(αt) − cos(αt) x − sin(αt) i sin(αt) x − cos(αt) i − sin(αt) xi = −α2 Qαt xi cos(αt) Vi multiplicerer med mi på hver side og får (5). For alle i = 1, ..., n og t ∈ R får vi (pr. antagelser) at Qαt xi = Qαt yi (0) = yi (t), og da3 kxi − xj k = kQαt (xi − xj )k = kyi (t) − yj (t)k må (6) gælde. Hvis (x1 , m1 ), ..., (xn , mn ) er en central konfiguration ved vi også at (1) holder. For t ∈ R ganger vi Qαt mi på denne ligning: −mi λQαt xi = X mi mj Qαt (xj − xi ) kxi − xj k3 1≤j≤n ∀i j6=i Vi bruger (6) på dette og får (7). 1.3 Homotetisk kollaps Udover relative ækvilibria er det også værd at kigge på homotetisk kollaps af systemer for at få større indsigt. Ved et homotetisk kollaps starter punktmasserne med starthastighed 0 og bevæger sig mod massemidtpunktet, hvor de alle støder sammen til tiden s. Dette afsnit er baseret på [3]. Definition 1.7. Lad der være givet et system af punktmasser y1 , ..., yn : R → Rd med masser m1 , ..., mn > 0. Hvis der findes et s ∈ R og en afbildning γ : [0, s[ → R sådan at følgende er opfyldt, så siger vi at systemet kollapser homotetisk (med starthastighed 0): • γ(0) ˙ = 0 og limt→s γ(t) = 0. • yi (t) = γ(t)yi (0) + (1 − γ(t))c for alle i = 1, ..., n og t ∈ [0, s[. 3 Qαt er en ortogonalmatrix og ændrer derfor ikke på længden af vektoren (xi − xj ) 6 • y1 , ..., yn er løsning til (3) på [0, s[. Hvis i stedet γ(0) ˙ < 0, ville systemet stadig kollapse i punktet c, og ligeså hvis γ(0) ˙ kun er lidt større end 0. Definitionen kan således udvides lidt, men i denne sammenhæng er den tilstrækkelig. Hvis γ(0) ˙ er for stor er det dog ikke sikkert at systemet trækker sig sammen igen - det vil i stedet altid udvide sig (i så fald har vi ikke et homotetisk kollaps, men vi har stadig en homotetisk bevægelse). Der gælder at hvis man ‘slipper’ en central konfiguration med starthastigheder 0, så vil punkterne kollapse homotetisk. For at se dette så lad først (x1 , m1 ), ..., (xn , mn ) være den pågældende centrale konfiguration med centrum c og kvadreret vinkelhastighed λ og betragt differentialligningen: γ¨ (t) = −λ (γ(t))2 Lad γ være løsningen med startbetingelser γ(0) = 1 og γ(0) ˙ = 0 (så længe γ er positiv vil γ¨ være negativ og dermed ‘accelerere’ γ mod 0). Lad nu yi : [0, s[→ Rd ved yi (t) = γ(t)xi + (1 − γ(t))c. Dette system er til t = 0 netop den centrale konfiguration, og den har starthastighed 0 for alle dens punkter. Ved at bruge (1) kan vi for t ∈ [0, s[ skrive: −λ (xi − c) (γ(t))2 1 X mj (xj − xi ) = (γ(t))2 j6=i (rij )3 y ¨i (t) = γ¨ (t)(xi − c) = = X mj (γ(t)xj − γ(t)xi ) (γ(t)rij )3 j6=i = X mj (γ(t)xj + (1 − γ(t))c − γ(t)xi − (1 − γ(t))c) (γ(t)rij )3 j6=i = X mj (yj (t) − yi (t)) j6=i (γ(t)rij )3 Her er rij = kxi − xj k. Til alle t ∈ [0, s[ har vi: γ(t)rij = kγ(t)xi − γ(t)xj k = kyi (t) − yj (t)k så punktmasserne (y1 , m1 ), ..., (yn , mn ) opfylder (3) på [0, s[. Vi har nu vist punkterne i definitionen, så hvis en central konfiguration ‘slippes’ med starthastigheder 0 vil punktmasserne kollapse homotetisk. 7 1.4 Ækvivalente konfigurationer I dette afsnit lader vi L = (1, 1, ..., 1) være rækkevektoren bestående af d 1taller. Vi indfører nu en ækvivalensrelation på mængden af konfigurationer. Vi siger at (X, M) ∼ (Y, M) hvis der findes en ortogonal matrix Q ∈ O(d) og et u ∈ Rd så xi = Qyi + u for alle i = 1, 2, ..., n. Vi ser at dette faktisk er en ækvivalensrelation da den er: • Refleksiv: For alle konfigurationer (X, M) skal (X, M) ∼ (X, M). Vælg blot Q som identitetsmatricen og u = 0. • Symmetrisk: Hvis (X, M) ∼ (Y, M) så skal (Y, M) ∼ (X, M). Vi har at X = QY + uL. Hvis vi kan finde Q0 og u0 så Y = Q0 X + u0 L, så gælder (Y, M) ∼ (X, M). Vi vælger Q0 = QT og u0 = −QT u: Q0 X + u0 L = QT (QY + uL) − QT uL = QT QY + QT uL − QT uL = Y QT Q = 1 da Q er ortogonal. • Transitiv: Hvis (X, M) ∼ (Y, M) og (Y, M) ∼ (Z, M) så skal (X, M) ∼ (Z, M). Vi kan skrive X = QY + uL og Y = Q0 Z + u0 L. Så må: X = QY + uL = Q(Q0 Z + u0 L) + uL = QQ0 Z + (Qu0 + u)L Et produkt af ortogonale matricer er igen en ortogonal matrix, så (X, M) ∼ (Z, M). Vi har altså at hvis to konfigurationer relaterer med translation, rotationer og/eller spejlninger, så er de ækvivalente. Ækvivalensklassen der indeholder alle ækvivalente konfigurationer til (X, M) skriver vi som [X, M]. Sent i kapitel 2 laver vi nogle større ækvivalensklasser, [X, M]≡ . Her er konfigurationer der er forskellige med en skalering også ækvivalente. Vi kommer til at se at hvis (X, M) er en central konfiguration og (X 0 , M) ∈ [X, M]≡ , så er (X 0 , M) også en central konfiguration. Og hver centrale konfiguration giver via proposition 1.4 to relative ækvilibria, ligesom i eksempel 1.5 - en hvor punktmasserne drejer mod uret og en hvor de drejer med uret. Således giver [X, M]≡ uendeligt mange relative ækvilibria. Og alle dem der drejer med uret er til t = 0 relateret med en translation, rotation og/eller skalering, og ligeså for alle der drejer mod uret. Så hvis vi anser alle disse for at være ’ens’, giver en hel ækvivalensklasse [X, M] kun to relative ækvilibria. Dvs. hvis vi kan vise at der kun findes endeligt mange ækvivalensklasser [X, M]≡ af centrale konfigurationer, så findes der kun endeligt mange relative ækvilibria. 8 1.5 Overordnet strategi Istedet for at tælle relative ækvilibria, kan vi tælle ækvivalensklasser af centrale konfigurationer. Lad os kalde mængden af disse klasser for C 0 . I næste kapitel vil vi finde en injektiv afbildning Ω0 : C 0 → W , hvor W er løsningsmængden til de normerede Albouy-Chenciner-ligninger. Dette vil fortælle os at kardinaliteten af C 0 er mindre end den af W . Herefter kan vi prøve at vise at |W | er endelig, for så er |C 0 | også. Hver af Albouy-Chenciners normerede ligning kan udtrykkes på formen f (r) = 0, som vil være opfyldt for løsninger r ∈ W . Det viser sig at disse udtryk kan multipliceres med andre passende udtryk for at lave dem til polynomier: f1 , ..., fm ∈ R[rij : 1 ≤ i < j ≤ n] Disse kalder vi Albouy-Chenciners (normerede) polynomier. Vi får at et r ∈ W er rod i alle disse polynomier. Dette er ækvivalent med at r er rod i f for alle f i idealet hf1 , f2 , ..., fm i. Definition 1.8. For et legeme k lad I ⊂ k[x1 , x2 , ..., xp ] være et ideal. Så kaldes V (I) for varieteten til I og er givet ved: V (I) = {a ∈ k p : f (x) = 0 ∀ f ∈ I} Vi kan nu udtrykke os således: Hvis r ∈ W så er r ∈ V (I), dvs. W ⊂ V (I). Hvis man kan vise at V (I) er endelig vil W således også være endelig. Vi kunne i teorien finde en Gröbnerbasis for I hvilket ville være en stor hjælp til at finde V (I), men dette tager for lang tid til at være muligt i praksis. Vi er dog kun interreseret i at vise at V (I) er endelig, så vi kan i stedet bruge en anden metode, der bygger på polyhedral- og tropisk geometri som beskrives i kapitel 4. Selve metoden præsenteres i kapitel 5. Definition 4.22 beskriver tropiske hyperflader og (pre)varieteter præcist, men vi giver nu en løs forklaring af hvad det er, for at se hvordan vi vil bruge dem: For et polynomie g ∈ I betragtes hvilke eksponenter de forskellige led har. Hvis f.eks. g = 3x3 y + xy + 1 så findes et led med x-eksponent 3 og y-eksponent 1. Derfor tegner vi punktet (3, 1) ind i et koordinatsystem. På samme måde tegnes punkterne (1, 1) og (0, 0) ind. Vi forbinder punkterne og får polynomiets såkaldte Newtonpolytop, N P (g) (se figur 1 til venstre). Hvert hjørne i denne trekant repræsenterer et led i g. Vi kan nu snakke om hvilke led der er ’længst’ i en bestemt retning. F.eks. har punktet (3, 1) størst x-koordinat af de tre, og (3, 1) er også længst i retningen af vektoren (1, 1) (dvs. (3, 1)·(1, 1) > u·(1, 1) for u = (0, 0), (1, 1)). Men i nogle retninger findes der to punkter, som er lige store, f.eks. i retningen af (0, 1). Disse retninger giver den tropiske hyperflade for g (figur 1 til højre), som vi kort skriver T (g). 9 Figur 1: En Newtonpolytop med tilhørende tropiske hyperflade For to polynomier g1 , g2 kan vi snitte deres (tropiske) hyperflader sammen, og hvis u ∈ T (g1 )∩T (g2 ) findes der i hvert af de to Newtonpolytoper N P (g1 ) og N P (g2 ) mindst to hjørner som er ‘længst i retning’ af u. Lad os igen betragte frembringerne f1 , ..., fm i idealet I hvis varietet vi vil vise er endelig. Vi har: \ T (f1 ) ∩ ... ∩ T (fm ) ⊃ T (f ) f ∈I Et snit af endeligt mange hyperflader som på venstresiden kalder vi en tropisk prevarietet, og snittet til højre kaldes den tropiske varietet til I. Vi vil vise at nogle bestemte delmængder af venstresiden - nogle såkaldte polyhedralkegler (se definition 4.11) - ikke er indeholdt i højresiden, for så er højresiden blot {0} hvorefter proposition 4.36 giver at V (I) ∩ C∗p er endelig (når n = 4 er der seks variabler, dvs. p = 6). Lad os tage et skridt tilbage: Vi ved at to punktmasser ikke kan ligge oveni hinanden i et relativt ækvilibrium. Dvs. rij 6= 0 for i 6= j. Derfor leder vi kun efter ikke-0 rødder, dvs. vi er netop kun ude efter at vise at V (I) ∩ C∗p er endelig. Det skal siges at denne metode ikke er sikker: Vi vil faktisk se at det ikke lykkedes at vise at to særlige kegler fra venstresiden ikke er indeholdt i højresiden. I et forsøg på at reparere dette kan vi prøve at begrænse hvilke konfigurationer vi kigger på. Disse begrænsninger kommer ved at kræve at flere betingelser skal holde for konfigurationerne (f.eks. kan kræves at enhver konfiguration skal ligge i et plan). Disse ekstra betingelser skal kunne skrives som polynomiumsligninger som ovenstående, og tilføjes så som frembringere til idealet. Kapitel 3 indeholder nogle eksempler på nogle flere betingelser (polynomier) man kunne inkludere, men disse hjælper desværre ikke på ovennævnte to kegler. 10 2 Albouy-Chenciners ligninger I dette kapitel arbejder vi videre med [6]. Indtil kapitel 2.3 vil vi kun kigge på centrale konfigurationer hvis kvadrerede vinkelhastighed er lig dens totale masse (dvs. λ = m1 + m2 + ... + mn i (1)). Vi vil fremover blot beskrive disse centrale konfigurationer som normerede konfigurationer. Vi minder om ækvivalensklasserne på formen [X, M] og [X, M]≡ som blev introduceret i kapitel 1.4. Vi vil se at hvis (X, M) er en normeret konfiguration så er alle (X 0 , M) ∈ [X, M] det også. Derefter finder vi en injektiv afbildning Ω som sender disse klasser af normerede konfigurationer ind i løsninger til de normerede Albouy-Chenciner-ligninger. I afsnit 2.4 laver vi en ny afbildning Ω0 baseret på Ω. Vi viser at denne sender ≡-klasser af centrale konfigurationer (på formen [X, M]≡ ) ind i løsninger til ovennævnte ligninger, og at den stadig er injektiv. Gennem kapitlet har vi defineret rækkevektoren L = (1, 1, ..., 1) ∈ Rn , og når vi betragter en konfiguration (X, M) med n punktmasser lader4 vi m := m1 + ... + mn = LM være den totale masse for konfigurationen. For konfigurationen indfører vi også matricerne S, A, B ∈ Matn×n (R): ( 1 hvis i 6= j 3 − 1 rij Sij = 0 hvis i = j hvis i 6= j Pmi Sij Aij = (8) − k6=j mk Skj hvis i = j 1 2 Bij = − rij 2 Med disse givet kan vi nu give et mere detaljeret overblik over, hvad der skal ske frem til kapitel 2.4: • Lemma 2.3 fortæller os at C defineret således giver mening: C = {[X, M] | (X, M) er en normeret konfiguration} (9) Dvs. hvis (X, M) er en normeret konfiguration, så er ethvert (X 0 , M) ∈ [X, M] også. • Vi definerer afbildningen Ω : C → Matn×n (R) r11 r12 r13 r21 r22 r23 Ω : [X, M] 7→ r = .. . rn1 rn2 rn3 4 Vi indfører nye variable ved kolon-lig (:=). 11 ved: . . . r1n . . . r2n .. . . . . rnn hvor rij = kxi − xj k = rji . At denne afbildning er veldefineret følger af lemma 2.1 (efter vi har brugt lemma 2.3 til at vise at C er veldefineret). • I kapitel 2.2 ser vi at matricer r fra Ω’s billedmængde opfylder AlbouyChenciners normerede usymmetriske ligninger. Disse ligninger er givet ved: n X 2 2 2 mk Sik (rjk − rik − rij )=0 1 ≤ i, j ≤ n (10) k=1 Her er Sik givet som i (8) (det er Sik der gør ligningerne normeret. Ved λ når i 6= k. Men de generelle (unormerede) ligninger ville Sik = r13 − m ij da vi kun ser på normerede konfigurationer er λ = m). • Propositionen fra kapitel 2.3 fortæller at Ω er injektiv. Efter dette ved vi at kardinaliteten af C er mindre end kardinaliteten af løsningsmængden til (10). Når vi kommer til kapitel 2.4 vil vi først beskrive relationen ≡ præcist, og vise at dette er en ækvivalensrelation. Herefter vises, at hvis (X, M) er en central konfiguration, så er ethvert (X 0 , M) ∈ [X, M]≡ også. Efter dette findes den injektive afbildning Ω0 som blev beskrevet først i kapitel 1.5. Dette bygger på ovenstående fire punkter, så lad os først vise disse. 2.1 Ω er veldefineret Lemma 2.1. Lad (Y, M), (Z, M) ∈ [X, M]. Så gælder at de indbyrdes afstande mellem punktmasserne er de samme, altså: kyi − yj k = kzi − zj k for alle 1 ≤ i, j ≤ n Bevis. Lad 1 ≤ i, j ≤ n være vilkårlige. Vi har (Y, M) ∼ (Z, M) og kan dermed skrive zi = Qyi + u og zj = Qyj + u for nogle Q ∈ O(d), u ∈ Rd . Så gælder: kzi − zj k = k(Qyi + u) − (Qyj + u)k = kQ(yi − yj )k = kyi − yj k Sidste lighed følger af at Q er en ortogonal matrix og derfor afstandsbevarende: kQ(yi − yj )k2 = (Q(yi − yj ))T Q(yi − yj ) T T = (yi − yj ) (Q Q)(yi − yj ) = (yi − yj )T (yi − yj ) = kyi − yj k2 12 (11) Lemma 2.2. Lad (X, M) være en konfiguration hvor A og S er givet som i (8). Følgende er ækvivalent: • (X, M) er en normeret konfiguration. P • j6=i mj Sij (xj − xi ) = 0 for alle i = 1, 2, ..., n. • XA = 0. Bevis. Fra (2) ved vi at (X, M) er en normeret konfiguration hvis og kun hvis: P X mj (xj − xi ) j mj xj −m xi − = , i = 1, 2, ..., n (12) 3 m rij j6=i Vi vil nu substituere venstresiden med følgende: P P P j m j xj j mj xi j mj xj −m xi − − = −m m m m X X =− mj xi + mj xj j = X j mj (xj − xi ) j6=i herved bliver (12) til følgende, efter lidt omskrivning: X 1 mj − 1 (xj − xi ) = 0, i = 1, 2, ..., n 3 rij j6=i (13) Det ses at (12) er ækvivalent med (13) og dette viser at de første to punkter er ækvivalente. Vi viser nu at andet punkt er ækvivalent med XA = 0. Dette ser vi er opfyldt da venstresiderne i de n ligninger i punkt 2 hver er lig en søjle i XA. Lad os f.eks. regne på søjle i i XA: X (XA)i = xj Aji + xi Aii j6=i = X xj mj Sji − xi j6=i = X X j6=i mj Sij (xj − xi ) j6=i Vi huskede her at Sij = Sji . 13 mj Sji Lemma 2.3. Antag (X1 , M) ∼ (X2 , M). Hvis (X1 , M) er en normeret konfiguration, så er (X2 , M) også. Bevis. Vi kan skrive X2 = QX1 + uL for et Q ∈ O(d) og et u ∈ Rd . Lad A være matricen der svarer til (X1 , M) som i (8). Dette A afhænger kun af masserne, samt de indbyrdes afstande - men disse er de samme for (X1 , M) og (X2 , M) (se lemma 2.1), så A svarer også til (X2 , M). Ifølge forrige lemma ved vi at X1 A = 0 og skal vise X2 A = 0: X2 A = (QX1 + uL)A = Q(X1 A) + u(LA) = 0 + 0 = 0 LA = 0 fordi summen af indgangene i enhver kolonne i A er 0. Vi har nu vist at C givet som i (9) giver mening, og at Ω : C → Matn×n (R) er veldefineret. 2.2 Ω-billedmængden Vi viser i dette afsnit at Ω sender elementer i C over i løsninger til AlbouyChenciners normerede usymmetriske ligninger, (14). Lad først P være de vektorer, hvis koordinater summer til 0: P = {u ∈ Rn | u1 + ... + un = 0}. Lemma 2.4. Lad (X, M) være en konfiguration, hvor A og B er givet som i (8). Så gælder for alle v ∈ P at vT X T XA = vT BA. Bevis. Skriv G := X T X og lad v ∈ P være givet. Tag et vilkårligt k = 1, ..., n og lad ek ∈ Rn være vektoren med alle indgange 0, undtagen den k’te som er 1. Lad så z = Aek . Hver af A’s kolonner summer til 0, så z ∈ P . Vi kan herunder se, at der kan lægges et vilkårligt pi ∈ R til alle indgange i G’s i’te række og søjle, og vT Gz forbliver uændret: 0 0 ... 0 .. .. . . 0 . . . 0 pi 0 . . . 0 0 0 0 .. .. z vT G + pi pi . . . pi + ... . . 0 0 0 0 . . . 0 p 0 . . . 0 i . . .. .. 0 0 ... 0 .. . P 0 P T T T z p = v Gz + v 1≤j≤n j i + . . . 0 1≤j≤n vj pi 0 . . . z = v Gz 0 .. . 14 De to summer gav 0 da v, z ∈ P . Ved at bruge dette for alle p1 p1 . . . p 1 p1 p 2 . . . p2 p2 . . . p2 p1 p2 . . . vT Gz = vT G + .. .. + .. . . . pn pn . . . pn p1 p 2 . . . i fås: pn pn .. z . pn Vi vælger pi = − 12 kxi k2 . Ovenstående ligning er samme som vT Gz = vT Bz da der gælder: 1 1 Bij = − kxi − xj k2 = − (xi − xj )T (xi − xj ) 2 2 1 T = − (xi xi + xTj xj − 2xTi xj ) 2 1 1 1 1 = xTi xj − xTi xi − xTj xj = Gij − kxi k2 − kxj k2 2 2 2 2 Så vi har vist at vT GAek = vT BAek for alle k = 1, ..., n, dvs. vT X T XA = vT GA = vT BA. P mi Lemma 2.5. Lad (X, M) være en konfiguration med i m xi = 0 (dvs. massemidtpunktet er i origo), og lad A og B være givet som i (8). Så gælder at XA = 0 hvis og kun hvis vT BA = 0 for alle v ∈ P . Bevis. Hvis XA = 0 gælder vT X T XA = 0 for alle v ∈ P , og så giver forrige lemma at vT BA = 0. Antag at vT BA = 0 for alle v ∈ P . Fra forrige lemma ved vi: 0 = vT X T XA for alle v ∈ P være de ‘normerede masser’. Lad så i ∈ Da m 6= 0 kan vi lade MN := M m {1, ..., Pn}m vilkårligt og lad v = ei − MN . Det ses at Lv = Lei − LMN = 1 − j mj = 0 dvs. v ∈ P og vi kan skrive: 0 = vT X T XA = ei T X T XA − MN T X T XA = ei T X T XA P T mj Sidste lighed følger af at MN T X T = (XMN )T = x = 0T . Da j j m dette gælder for alle i må X T XA = 0. Lad nu z = Aei for en basisvektor ei ∈ Rn . Da X T Xz = 0 må Xz ligge i nulrummet til X T . Underrumshovedsætningen (sætning 5.2.1 i [11]) giver dermed at Xz ligger i det ortogonale komplement til X’s kolonnerum. Det er klart at Xz også ligger i X’s kolonnerum. Snittet af et rum og dens ortogonale komplement er {0}, så Xz = 0. Vi har vist at XAei = 0 for alle i, dvs. XA = 0. 15 Vi kan nu endelig opskrive: Proposition 2.6. Lad (X, M) være en konfiguration og lad r ∈ Matn×n (R) så r beskriver punktmassernes indbyrdes afstande, rij = kxi − xj k. Så gælder at (X, M) er en normeret konfiguration hvis og kun hvis r er løsning til Albouy-Chenciners normerede usymmetriske ligninger: X 2 2 2 mk Sik rjk − rik − rij = 0, 1 ≤ i, j ≤ n, i 6= j (14) k 1 3 rik Sik = −1 0 hvis i 6= k hvis i = k Bevis. Lad MN = M være de ‘normerede masser’ så XMN er massemidtm punktet for (X, M). Vi viser først propositionen i tilfældet XMN = 0. Lad eij = ei − ej . Vi vil vise følgende store biimplikation: (X, M) er en normeret konfiguration ⇔ XA = 0 ⇔ vT BA = 0 for alle v ∈ P ⇔ eTij BAei = 0 for alle i, j ∈ {1, 2, ..., n} ⇔ (14) er opfyldt Lemma 2.2 giver os første implikation og anden implikation følger af lemma 2.5 da XMN = 0. Lad os nu vise tredje implikation. ⇒ er klart opfyldt (vælg blot v = eij ), så lad os antage højresiden og vise ⇐. Lad først vP= (v1 , ..., vn )T ∈ P og derefter i ∈ {1, 2, ..., n} vilkårligt. Så er vi = − j6=i vj og vi kan skrive: v= X vj ej + vi ei = j6=i X vj ej − X vj ei = j6=i j6=i j6=i X vj eji = X −vj eij j6=i Dette giver os følgende: !T vT BAei = X −vi eij BAei j6=i ! = X −vi eij T BAei = j6=i X j6=i Da i ∈ {1, ..., n} var vilkårlig må vT BA = 0. 16 −vi eij T BAei = 0 Nedenstående viser 2eij T BAei = med sidste implikation. P 2 2 2 m S r − r − r , og giver derk ik ij jk ik k 2eTij BAei = 2eTi BAei − 2eTj BAei = 2(BA)ii − 2(BA)ji X X 2 2 2 = mk Ski rii2 − rik − mk Ski rij − rjk k = X = X k 2 mk Ski −rik X + − 2 rik k 2 2 − rij mk Ski rjk k 2 mk Ski rjk 2 − rij k Her brugte vi undervejs følgende substitution: X Bik Akj + 2Bij Ajj 2(BA)ij = 2 k6=j ! X 1 X 1 2 2 =2 (mk Skj ) + 2 − rij − mk Skj − rik 2 2 k6=j k6=j X X 2 2 = rij mk Skj − rik mk Skj k6=j = X k6=j X 2 2 2 2 mk Skj rij − rik mk Skj rij = − rik k6=j k Lad nu (X, M) være en konfiguration så massemidtpunktet c = XMN 6= 0. Lad X0 = X − cL således at (X0 , M) er (X, M) ‘translateret til origo’. Disse er ækvivalent, (X, M) ∼ (X0 , M) og lemma 2.3 giver så, sammen med ovenstående, at: (X, M) er en normeret konfiguration ⇔ (X0 , M) er en normeret konfiguration ⇔ (14) er opfyldt når r ∈ Matn×n (R) er afstandsmatricen til (X0 , M) Lemma 2.1 giver at r svarende til de to konfigurationer er ens, så ovenstående r er også afstandsmatricen til (X, M). ⇒-retningen i ovenstående proposition fortæller os: Korollar 2.7. Ω sender elementer fra C over i løsninger til (14). 17 Ved at lægge den (i, j)’te og (j, i)’te ligning fra (14) sammen får vi AlbouyChenciners normerede symmetriske ligninger: X 2 2 2 2 2 2 ) =0 (15) − rij − rjk ) + Sjk (rik − rij − rik mk Sik (rjk k Vi ser at der er n(n − 1) usymmetriske, og 2.3 n(n−1) 2 symmetriske ligninger. Ω er injektiv Lad (X, M) og (Y, M) være normerede konfigurationer sådan at Ω[X, M] = Ω[Y, M], dvs. kxi −xj k = kyi −yj k for alle 1 ≤ i, j ≤ n. Følgende proposition giver at (X, M) og (Y, M) er ækvivalente, dvs. Ω er injektiv. Proposition 2.8. Lad x0 , ..., xN , y0 , ..., yN ∈ Rd . Antag at kxi − xj k = kyi − yj k for alle 0 ≤ i, j ≤ N . Så findes en ortogonal matrix G ∈ O(d) og et u ∈ Rd sådan at Gxi + u = yi for alle 0 ≤ i ≤ N . Lad os beskrive ideen til beviset for denne proposition: Translationen er ikke svær at tage højde for, så lad os antage at x0 = 0 = y0 (og så må kxi k = kyi k for alle i). Vi laver QR-faktoriseringer så (x1 , ..., xN ) = QX R (i virkeligheden skal vi her have at x1 , ..., xN er lineært uafhængige. Dette tager vi højde for i beviset) og tilsvarende (y1 , ..., yN ) = QY S. QX og QY har ortonormale søjler, og så følger det at: kri k = ksi k, kri − rj k = ksi − sj k Dette, kombineret med at R og S er øvre triangulære matricer med positiv diagonal, er nøglen til at vise at R = S. I beviset foregår dette ved induktion. Herefter følger at G(x1 , ..., xN ) = (y1 , ..., yN ) for en ortogonal matrix G. Hvis læseren tror på propositionen, kan beviset (der er langt og ikke særlig pænt) inklusiv de to lemmaer, springes over. Bevis. Vi viser først propositionen i tilfældet x0 = y0 = 0. I de sidste linjer i beviset udvides dette til alle x0 og y0 . Uanset hvilket G der vælges gælder Gx0 = 0 = y0 , så vi skal vælge u = 0 og kan fremover se bort fra x0 og y0 . Der gælder nu følgende: kxi k = kyi k kxi − xj k = kyi − yj k 1 ≤ i, j ≤ N (16) Vi vil finde en orthogonal matrix G så Gxi = yi for i = 1, ..., N . Lad n være dimensionen af rummet udspændt af x1 , ..., xN og antag at x1 , ..., xn er lineært uafhængige (senere undersøges tilfældet hvor x1 , ..., xn 18 ikke er lineært uafhængige). Lad så n0 være det største tal sådan at y1 , ..., yn0 er lineært uafhængige. Pr. sætning 5.6.2 i [11] kan vi finde matricer med ortonormale søjler QX ∈ Matd×n (R), QY ∈ Matd×n0 (R) samt øvre triangulære matricer med positive indgange i diagonalen, R ∈ Matn×n (R), S ∈ Matn0 ×n0 (R) sådan at (x1 , ..., xn ) = QX R og (y1 , ..., yn0 ) = QY S. Søjlerne i R skrives som r1 , ..., rn og S’s søjler som s1 , ..., sn0 . For k ∈ {n + 1, ..., N P } kan xk skrives med Pnsom en linearkombination Pn n nogle faktorer akj : xk = j=1 akj xj = j=1 akj (QX rj ) = QX Pj=1 akj rj . For k ∈ {n + 1, ..., N } giver det derfor mening at definere rk = nj=1 akj rj for så er xk = QX rk for alle k ∈ {1, ..., N }. For k ∈ {n0 + 1, ..., N } kan vi definere sk på samme måde og få: xk = QX rk , yk = QY sk for k = 1, ..., N (17) Vi lader ˜ri være ri hvor der nederst er tilføjet 0’er til dimensionen er max(n, n0 ), og ligeledes med ˜si . Herved kan vi snakke om deres differens og sum, ligesom at de kan være ens. Herunder ses et overblik over de næste trin i beviset. 1. QTX QX og QTY QY er identitetsmatricer og for k ∈ {1, ..., N } gælder: krk k = ksk k, krk − ri k = ksk − si k for i = 1, ..., min(n, n0 ) 2. ˜r1 = ˜s1 , ..., ˜rmin(n,n0 ) = ˜smin(n,n0 ) . 3. n = n0 . 4. QY QTX er en ortogonal matrix og QY QTX xi = yi for i = 1, ..., N . Når fjerde punkt er vist har vi fundet den ortogonale matrix G = QY QTX ∈ Matd×d (R) vi ledte efter. Punkt 1: Lad os skrive QX ’s søjler som q1 , ..., qn . Da disse er ortonormale gælder at qTi qj = 0 når i 6= j og at qTi qi = 1, dvs. QTX QX er en identitetsmatrix. Det samme kan vises for QTY QY . Lad k ∈ {1, ..., N } og i ∈ 1, ..., min(n, n0 ). Vi kan regne ligesom vi gjorde i (11) og få: krk k = kQX rk k, krk − ri k = kQX (rk − ri )k, kQY sk k = ksk k kQY (sk − si )k = ksk − si k Ved at kombinere dette med nedenstående får vi resultatet til punkt 1. kQX rk k = kxk k = kyk k = kQY sk k kQX rk − QX ri k = kxk − xi k = kyk − yi k = kQY sk − QY si k 19 Punkt 2: Vi benytter os af induktion i k. Hypotesen er at ˜r1 = ˜s1 , ..., ˜rk−1 = ˜sk−1 . Dette er klart opfyldt for k = 1 da der ikke er noget at vise. Antag nu ˜r1 = ˜s1 , ..., ˜rk−1 = ˜sk−1 for et k = 1, ..., min(n, n0 ) og lad os vise at ˜rk = ˜sk . Vi har at: • For i = 1, ..., k − 1 gælder at ˜ri ’s indgange i + 1, ..., max(n, n0 ) alle er nul og at indgang i er forskellig fra nul (da R er øvre triangulær og har positiv diagonal). • k˜rk k = krk k = ksk k = k˜sk k (midterste lighed får vi fra punkt 1) • For i = 1, ..., k − 1 har vi: k˜rk − ˜ri k = krk − ri k = ksk − si k = k˜sk − ˜si k = k˜sk − ˜ri k Sidste punkt følger af punkt 1 samt induktionsantagelsen. Disse tre punkter er netop antagelserne i lemma 2.9 (med a = ˜rk , b = ˜sk og c1 = ˜r1 , ..., ck−1 = ˜rk−1 ). I ˜rk og ˜sk er indgangene k + 1, ..., max(n, n0 ) allesammen 0 (da R og S er øvre triangulære) så lemmaet fortæller at ˜rk = ˜sk op til k’te indgangs fortegn. Men da R og S har positiv diagonal er disse to indgange begge positive. Så vi har ˜rk = ˜sk og induktionsskridtet er taget. Punkt 3: Antag med henblik på modstrid at n < n0 . Så er ˜si = si for alle i og vi har: • For i = 1, ..., n gælder at si ’s indgange i + 1, ..., n0 allesammen er nul og at indgang i ikke er nul. • k˜rn+1 k = krn+1 k = ksn+1 k (igen fra punkt 1) • For i = 1, ..., n gælder (fra punkt 2 ved vi si = ˜ri ): k˜rn+1 − si k = k˜rn+1 − ˜ri k = krn+1 − ri k = ksn+1 − si k Dette er antagelserne i lemma 2.9 (med k = n + 1, a = ˜rn+1 , b = sn+1 og c1 = s1 , ..., cn = sn ). Dermed ved vi, at (n + 1)’te indgang i ˜rn+1 og sn+1 er ens op til fortegn. rn+1 er en linearkombination af r1 , ..., rn og disse har kun n indgange. Dvs. indgang (n + 1) i ˜rn+1 er 0. Men da S har positiv diagonal er (n + 1)’te indgang i sn+1 ikke 0 som er modstrid. På samme måde vil antagelsen n > n0 føre til modstrid. Vi får således at n = n0 , og vi behøver dermed ikke længere at bruge tilde over vektorerne. Punkt 4: Da både QY og QX er d × n matricer kan vi gange QY med T QX . Det ses nu at QY QTX er en ortogonal matrix da: (QY QTX )T (QY QTX ) = QX QTY QY QTX = QX QTX = 1 20 Her blev brugt at QTX QX og QTY QY er identitetsmatricer som vist i punkt 1. Punkt 2 fortæller at ri = si for i = 1, ..., n, dvs: QY QTX xi = QY QTX QX ri = QY si = yi i = 1, ..., n Lad t = n + 1, ..., N og lad os vise at QY QTX xt = yt . Vi har nu: • For i = 1, ..., n − 1 gælder at ri ’s indgange i + 1, ..., n allesammen er nul og at indgang i er forskellig fra nul. • krt k = kst k og krt − ri k = kst − ri k for alle i = 1, 2, ..., n − 1 Lemma 2.9 (med k = n, a = rt , b = st og c1 = r1 , ..., cn−1 = rn−1 ) giver nu andet punkt herunder: • Indgang n i rn er forskellig fra nul og indgang n i rn−1 er nul. • For i = 1, ..., n − 1 er den i’te indgang i rt og st den samme. • krt − rn k = kst − rn k og krt − rn−1 k = kst − rn−1 k Alle disse punkter er opfyldt, og vi kan derfor bruge lemma 2.10 (med i = n, a = rt , b = st , c = rn , c0 = rn−1 ). Fra dette fås at n’te indgang også stemmer overens, dvs. rt = st . Dette betyder at: QY QTX xt = QY QTX QX rt = QY st = yt Vi er nu færdig med punkt 4. Antag nu at x1 , ..., xn er lineært afhængige. Vi gentager i så fald følgende procedure for nogle 1 ≤ i, j ≤ N indtil x1 , ..., xn er lineært uafhængige: Byt om på xi og xj , og byt samtidig om på yi og yj Efter denne ombytning gælder (16) stadig. Nu kan der findes G så Gxi = yi for alle i. Herefter byttes tilbage indtil vi har det oprindelige system, og Gxi = yi gælder stadig. Vi mangler at se på tilfældet hvor x0 = 0 = y0 ikke gælder. Her gælder for 1 ≤ i, j ≤ N at kxi − x0 k = kyi − y0 k og at: k(xi − x0 ) − (xj − x0 )k = kxi − xj k = kyi − yj k = k(yi − y0 ) − (yj − y0 )k Dvs. (16) gælder for punkterne (xi −x0 ), (yi −y0 ), i = 1, ..., N så vi kan bruge hvad vi allerede har vist til at finde G ∈ O(d) så G(xi − x0 ) = yi − y0 for alle i. Dette betyder at yi = G(xi − x0 ) + y0 = Gxi + (y0 − Gx0 ). Så vi beholder G og vælger u = y0 − Gx0 hvorved Gxi + u = yi for i = 0, 1, ..., N . 21 Lemma 2.9. Lad k ≤ m og a, b, c1 , c2 , ..., ck−1 ∈ Rm som kan skrives: a = (a1 , a2 , ..., am )T , b = (b1 , b2 , ..., bm )T ci = (ci1 , ci2 , ..., cii , 0, ..., 0)T i = 1, ..., k − 1 Antag at vi for i = 1, 2, ..., k − 1 har cii 6= 0 og at ka − ci k = kb − ci k samt at kak = kbk. Så gælder at a1 = b1 , ..., ak−1 = bk−1 og at |ak | = |bk |. Bevis. Vi bruger induktion i a’s og b’s indgange. Induktionshypotesen er at a1 = b1 , a2 = b2 , ..., ai−1 = bi−1 . I induktionsstarten skal det vises at a1 = b1 , men dette følger af lemma 2.10 med c = c1 og c0 = 0 (for så er ka − ck = kb − ck og ka − c0 k = kak = kbk = kb − c0 k opfyldt) Til induktionsskridtet antages for et i = 1, ..., k − 1 at a1 = b1 , a2 = b2 , ..., ai−1 = bi−1 , og vi skal vise ai = bi . Men dette følger af lemma 2.10 med c = ci og c0 = ci−1 . Induktionen stopper når vi har vist at a1 = b1 , a2 = b2 , ..., ak−1 = bk−1 . Vi betragter igen ligningen kak2 = kbk2 . Denne fortæller at: k X i=1 a2i = k X b2i = i=1 k−1 X a2i + b2k i=1 Hvilket giver a2k = b2k , dvs. |ak | = |bk |. Lemma 2.10. Lad i ∈ N og a, b, c, c0 ∈ Rm sådan at vi kan skrive: a = (a1 , a2 , ..., am )T , c = (c1 , c2 , ..., ci , 0, ..., 0)T , b = (b1 , b2 , ..., bm )T c0 = (c01 , c02 , ..., c0i−1 , 0, ..., 0)T Antag at ci 6= 0 og at de (i − 1) første indgange i a og b er ens, dvs. a1 = b1 , ..., ai−1 = bi−1 . Hvis ka − ck = kb − ck og ka − c0 k = kb − c0 k er ai = bi . Bevis. Vi trækker ka − c0 k2 = kb − c0 k2 fra ka − ck2 = kb − ck2 og får: ka − ck2 − ka − c0 k2 = kb − ck2 − kb − c0 k2 22 Vi regner først på venstresiden: ka − ck2 − ka − c0 k2 = i X 2 (aj − cj ) + j=1 = i X ! a2j − j=i+1 (aj − cj )2 − j=1 = m X i−1 X j=1 j=i (aj − c0j )2 − a2i 2 2 (aj − cj ) + (ai − ci ) − j=1 = ! j=1 i−1 X i−1 X i−1 m X X 0 2 (aj − cj ) + a2j i−1 X (aj − c0j )2 − a2i j=1 (aj − cj )2 − (aj − c0j )2 + a2i + c2i − 2ai ci − a2i j=1 = i−1 X (aj − cj )2 − (aj − c0j )2 − 2ai ci + c2i j=1 Med de samme udregninger fås på højresiden: kb − ck2 − kb − c0 k2 = i−1 X (bj − cj )2 − (bj − c0j )2 − 2bi ci + c2i j=1 = i−1 X (aj − cj )2 − (aj − c0j )2 − 2bi ci + c2i j=1 I den nye ligning vi får ved at substituere venstre- og højresiden vil summationerne forsvinde. Vi får således at −2ai ci + c2i = −2bi ci + c2i , og da ci 6= 0 må ai = bi . 2.4 Skalering af normerede konfigurationer Vi vil nu udvide ækvivalens-begrebet: Lad (X, M) og (Y, M) være vilkårlige konfigurationer. Disse er ≡-ækivalente, (X, M) ≡ (Y, M), hvis der findes en ortogonal matrix G ∈ Rd , en skalar γ ∈ R\{0} og en vektor u ∈ Rd sådan at xi = γGyi + u for alle i = 1, 2, ..., n. Vi ser at dette er en ækvivalensrelation: • ≡ er refleksiv. Dette er klart - vælg blot u = 0, G = 1 og γ = 1. 23 • ≡ er symmetrisk. Antag (X, M) ≡ (Y, M). Vi har X = γGY + uL. Vi vælger γ 0 = γ −1 , G0 = GT og u0 = − γ1 GT u: 1 T 1 G (γGY + uL) − GT uL γ γ 1 1 = GT GY + GT uL − GT uL = Y γ γ γ 0 G0 X + u0 L = Det vil sige at (Y, M) ≡ (X, M) • ≡ er transitiv. Antag at (X, M) ≡ (Y, M) og (Y, M) ≡ (Z, M), dvs. vi kan skrive X = γGY + uL og Y = γ 0 G0 Z + u0 L. X = γGY + uL = γG(γ 0 G0 Z + u0 L) + uL = γγ 0 GG0 Z + (γGu0 + u)L G0 G er en ortogonal matrix, så (X, M) ≡ (Z, M). Vi vil udvide Ω til at sende fra disse ækvivalensklasser i stedet. Men først vises følgende lemmaer: Lemma 2.11. Lad (X, M) være en central konfiguration med kvadreret vinkelhastighed λ og k ∈ R. Så er (kX, M) en central konfiguration med kvadreret vinkelhastighed kλ3 . Bevis. For i = 1, ..., n kan vi skrive følgende (anden lighed følger af (1)): X mj (kxj − kxi ) 1 X mj (xj − xi ) = 3 (krij )3 k 2 j6=i rij j6=i 1 (−λ(xi − c)) k2 λ = − 3 (kxi − kc) k = Når xi ’erne bliver skaleret med k bliver rij ’erne det også. Vi ser at (kX, M) er en central konfiguration med kvadreret vinkelhastighed kλ3 og centrum kc. Lemma 2.12. Lad (X, M), (Y, M) ∈ [Z, M]≡ og skriv Y = γGX + uL for nogle γ ∈ R, G ∈ O(d), u ∈ Rd . Hvis (X, M) er en central konfiguration med kvadreret vinkelhastighed λ så er (Y, M) en central konfiguration med kvadreret vinkelhastighed γλ3 . 24 λ 1/3 Bevis. Lad k = m . Forrige lemma fortæller at (kX, M) er en central λ konfiguration med kvadreret vinkelhastighed kλ3 = λ/m = m, dvs. (kX, M) er en normeret konfiguration. Fra lemma 2.3 ved vi at vi får en ny normeret konfiguration ved at gange G på og lægge γk u til: (kGX + γk uL, M). Vi multiplicerer med k 0 = γk og ser, igen med forrige lemma, at (γGX + uL, M) er en central konfiguration med kvadreret vinkelhastighed: 3 k λ/m λ 0−3 mk = m =m 3 = 3 γ γ γ Dette lemma fortæller at C 0 givet ved følgende er veldefineret: C 0 = {[X, M]≡ | (X, M) er en central konfiguration} Dette skal være definitionsmængden for Ω’s udvidelse. Vi vil nu definere en afbildning T som tager elementer fra denne mængde: # " 1 /3 λ X, M T : [X, M]≡ 7→ (18) m ∼ Her er λ den kvadrerede vinkelhastighed for et (X, M) ∈ [X, M]≡ . Lemma 2.13. T er veldefineret og sender over i definitionsmængden for Ω. T er desuden injektiv. Bevis. Lad (X, M), (Y, M) være centrale konfigurationer så (X, M) ≡ (Y, M), det vil sige at der findes γ ∈ R\{0}, G ∈ O(d), u ∈ Rd sådan at: Y = γGX + uL Skriv (X, M) og (Y, M)’s kvadrerede vinkelhastigheder som λX hhv. λY . T giver anledning til følgende: 0 X = λX m 1/3 0 X, Y = λY m 1/3 Y (19) Vi skal vise at (X 0 , M) ∼ (Y 0 , M), dvs. at der findes G0 ∈ O(d) og u0 ∈ Rd 25 så Y 0 = G0 X 0 + u0 L. Fra forrige lemma ved vi at λY = 0 Y = λY m λX , γ3 dvs: 1/3 Y 1/3 λX = (γGX + uL) mγ 3 1/3 1/3 λX λX = GX + uL m mγ 3 1/3 λX 0 = GX + uL mγ 3 Så T er veldefineret. Vi har at (X, M) ≡ (X 0 , M). Sammen med (19) forklarer lemma 2.12 så, at (X 0 , M) har en kvadreret vinkelhastighed på: λX λX = λX = m 1/3 3 /m λX m Dermed er (X 0 , M) en normeret konfiguration, dvs. T sender over i definitionsmængden for Ω. Vi mangler at vise at T er injektiv. Lad (X, M) og (Y, M) være to (nye) centrale konfigurationer med kvadreret vinkelhastighed λX og λY . Antag at T [X, M]≡ = T [Y, M]≡ . Vi skal vise at (X, M) ≡ (Y, M). 1/3 1/3 Vælg X 0 = λmX X og Y 0 = λmY Y . Så gælder to ting: 1. (X, M) ≡ (X 0 , M) og (Y, M) ≡ (Y 0 , M) 2. [X 0 , M]∼ = T [X, M]≡ = T [Y, M]≡ = [Y 0 , M]∼ Anden lighed i punkt to er vores antagelse mens første og tredje lighed skyldes (18). Punkt to fortæller således at (X 0 , M) ∼ (Y 0 , M), og sammen med punkt et giver dette at (X, M) ≡ (Y, M). Vi kan nu definere en udvidelse Ω0 til Ω: Proposition 2.14. Definer Ω0 : C 0 → Matn×n (R) ved: Ω0 [X, M]≡ = ΩT [X, M]≡ Ω0 er veldefineret og sender ≡-ækvivalensklasser af centrale konfigurationer over i løsninger til Albouy-Chenciners normerede usymmetriske ligninger (14). Ω0 er desuden injektiv. 26 Bevis. Pr. lemma 2.13 er T veldefineret og sender over i definitionsmængden for Ω. Ω er også veldefineret og dermed er Ω0 det også. T er injektiv (lemma 2.13) ligesom Ω er det (afsnit 2.3). Da en sammensætning af injektive afbildninger er injektiv må Ω0 også være injektiv. Dette proposition fortæller os, at løsningsmængden til Albouy-Chenciners normerede ligninger (14) har en kardinalitet større end mængden af ≡-klasser af centrale konfigurationer. 27 3 Flere betingelser Det er interresant at Albouy-Chenciners ligninger er uafhængige af dimensionen af rummet som den centrale konfiguration udspænder. Hvis d ∈ N er givet, og vi vil begrænse os til konfigurationer som ligger i et d-dimensionelt rum, kan vi kræve at afstandene rij er rødder i nogle bestemte polynomier. Disse polynomier fås fra de såkaldte Cayley-Menger-determinanter. Pr. korollar 3.4 (og teksten herefter) er disse 0 hvis og kun hvis konfigurationen ligger i et d-dimensionelt rum. Disse polynomier kan tilføjes som ekstra frembringere til idealet som blev beskrevet i kapitel 1.5. Dermed bliver varieteten V (I) og den tropiske prevarietet mindre. Vi vil nu se nærmere på Cayley-Menger determinanter, og bagefter vil vi i kapitel 3.2 kort nævne Dziobeks ligninger som giver ekstra frembringere til idealet i tilfældet med n = 4 punktmasser. 3.1 Cayley-Menger determinanter Dette afsnit er inspireret af [7] og [10]. Givet et d vil vi gerne kræve at en konfiguration med punkter x00 , x01 , ..., x0r ∈ Rm ligger i et d-dimensionelt affint underrum. Dette er opfyldt hvis og kun hvis x0 , ..., xr ligger i et ddimensionelt underrum hvor xi = x0i − x00 , i = 0, 1, ..., r (hele konfigurationen bliver altså translateret med −x00 ). Vi kan svare på om dette er tilfældet når vi har afgjort om der findes (d + 1) lineært uafhængige vektorer blandt x1 , ..., xr . I dette afsnit gives en metode til at afgøre sidstnævnte, og metoden kræver kun alle de indbyrdes afstande blandt x0 , ..., xr kendes. Disse er de samme som de oprindelige afstande: kxi − xj k = k(x0i − x00 ) − (x0j − x00 )k = kx0i − x0j k For r ≤ d findes selvfølgelig ikke (d + 1) lineært uafhængige vektorer blandt x1 , ..., xr . Hvis r = d + 1 vil proposition 3.3 give svaret, og det efterfølgende korollar giver svaret for r ≥ d + 1. Definition 3.1. Lad x0 = 0, x1 , ..., xn ∈ Rm sådan at x1 , ..., xn er lineært uafhængige. Disse danner et n-simplex som er snittet af alle konvekse mængder der indeholder x0 , ..., xn : \ S S ⊂ Rm konveks mængde {x0 ,...,xn }⊂S Vi har f.eks. at et 1-simplex er et linjestykke, et 2-simplex en trekant, et 3-simplex en tetraeder og så videre. Normalt kræves ikke at x0 = 0, men disse specielle simplexer er tilstrækkelige for os. 28 Antag fortsat at x1 , ..., xn er lineært uafhængige. For k = 1, ..., n − 1 lader vi pk være5 projektionen af xk+1 ned på span(x1 , ..., xk ). Lad så h1 = kx1 k og hk = kxk − pk−1 k for k = 2, ..., n være højden fra xk til rummet udspændt af x1 , ..., xk−1 . Hypervolumet Vk af k-simplexet dannet af x0 , ..., xk er: ( Vk = R hk h=0 Vk−1 h1 k−1 h hk hvis k = 1 dh = hk V k k−1 hvis k ≥ 2 Ved at bruge dette flere gange får vi: 1 hn hn−1 · · · h1 n! Vn = (20) Dette bruger vi til at vise følgende: Lemma 3.2. Lad x0 = 0, x1 , x2 , ..., xm ∈ Rm , og lad: x 0 x1 · · · A= 1 1 ··· xm 1 Så er x1 , ..., xm lineært uafhængige hvis og kun hvis |A| = 6 0, og i så fald vil 2 hypervolumet af m-simplexet dannet af x0 , ..., xm opfylde Vm2 = |A| m! Bevis. Determinanten ændres ikke af at trække en søjle fra en anden søjle. Dette forklarer første lighed herunder: x x · · · |A|2 = 0 1 1 0 ··· 2 xm x1 x2 · · · = 0 2 xm (21) Lad os overbevise os om sidste lighed. Determinant i midten kan skrives vha. dens kofaktorer (m + 1, i), i = 1, ..., m + 1 ved: 1 · Kofaktorm+1,1 + m+1 X 0 · Kofaktorm+1,i = Kofaktorm+1,1 i=2 = (−1)(m+1)+1 |x1 , ..., xm | = (−1)m |x1 , ..., xm | 5 Mere præcist: Vælg p1 , ..., pn−1 som i sætning 5.6.1 i [11]. 29 Kvadreres dette fås sidste lighed. Implikationen er nu klar: x1 , ..., xm er lineært uafhængige hvis og kun hvis matricen til højre i (21) er invertibel, som er ækvivalent med |A| = 6 0. Antag nu at x1 , ..., xm er lineært uafhængige. Så giver sætning 5.6.2 i [11] en faktorisering, (x1 , ..., xm ) = QR hvor Q ∈ O(m) er en ortogonal matrix og R er en øvre triangulær matrix med positiv diagonal. Da |Q| = ±1 får vi: |A|2 = |x1 , ..., xm |2 = |QR|2 = |R|2 = (R11 R22 · · · Rmm )2 Det ses fra sætning 5.6.2 og 5.6.1 i [11] at R’s indgange i diagonalen er R11 = kx1 k og Rkk = kxk − pk−1 k for k = 2, ..., n. Dette er netop højderne, dvs. Rkk = hk , så vi får at |A|2 = (R11 R22 · · · Rmm )2 = (h1 h2 · · · hm )2 . Nu følger ligheden ved at kvadrere (20) og substitutere ind. Proposition 3.3. Lad x0 = 0, x1 , x2 , ..., xm ∈ Rm (Cayley-Menger) determinant: 0 kx0 − x1 k2 kx0 − x2 k2 kx1 − x0 k2 0 kx1 − x2 k2 kx2 − x0 k2 kx2 − x1 k2 0 |M | = .. .. . . kxm − x0 k2 kxm − x1 k2 kxm − x2 k2 1 1 1 og lad |M | være følgende kx0 − xm k2 1 kx1 − xm k2 1 kx2 − xm k2 1 .. .. . . 0 1 ··· 1 0 ··· ··· Så er x1 , ..., xm lineært uafhængige hvis og kun hvis |M | = 6 0, og i så fald vil hypervolumet af m-simplexet dannet af x0 , ..., xm opfylde: Vm2 (−1)m−1 |M | = 2m (m!)2 Bevis. I det følgende lader vi 0 = (0, 0, ..., 0)T ∈ Rm+1 , 1 = (1, 1, ..., 1)T ∈ Rm+1 og e = (0, ..., 0, 1)T ∈ Rm+1 . Desuden lader vi A være givet som i lemma 3.2 og lader: x0 x1 · · · B = A − e1T = 0 0 ··· xm 0 Vi ser at 1(eT B) = 0 = (B T e)1T så vi får: AT A = (B + e1T )T (B + e1T ) = B T B + B T e1T + 1eT B + 1eT e1T = B T B + 11T 30 (22) Lad os betragte matricen B T B+11T . Hvis vi tilføjer søjlen 1 til højre, rækken 0T nedenunder og et 1-tal nederst til højre får vi følgende blokmatrix: T B B + 11T 1 0T 1 Determinanten af denne kan skrives vha. dens kofaktorer (m + 2, i), i = 1, ..., m + 2, ligesom vi gjorde i beviset for lemma 3.2. Vi får herved at determinanten af ovenstående matrix også er determinanten af B T B + 11T . Dermed fås: T B B + 11T 1 2 T T T |A| = |A A| = |B B + 11 | = 0T 1 Lad os multiplicere sidste række med −1 (hvorved determinanten skifter fortegn), og trække sidste søjle fra alle andre søjler: T B B + 11T 1 B T B 1 2 = −|A| = 0T −1 1T −1 Hvis vi skriver sidste determinant ud med dens (m + 2, i)’te kofaktorer ser vi, at kofaktor (m + 2, m + 2) er |B T B| = |B|2 = 0 (pr. (22) er B er singulær). Dvs. elementet −1 er ligegyldigt for determinanten og kan erstattes med 0: T B B 1 2 −|A| = T 1 0 Nu multiplicerer vi de første (m + 1) rækker med −2. Alle 1’ere i sidste søjle bliver herved erstattet af −2. Herefter multipliceres sidste søjle med − 21 sådan at den indeholder 1’ere igen. Herved skaleres determinanten med (−2)m+1 (− 12 ) = (−2)m : −2B T B 1 m 2 −(−2) |A| = 1T 0 Ved at dele med −(−2)m , og skrive matricen helt ud får vi: −2xT x0 −2xT x1 −2xT x2 · · · −2xT xm 0 0 0 0 −2xT x0 −2xT x1 −2xT x2 · · · −2xT xm 1 1 1 1 T T T T −2x x −2x x −2x x · · · −2x −1 2 0 2 1 2 2 2 xm 2 |A| = . . . . .. .. .. .. (−2)m −2xTm x0 −2xTm x1 −2xTm x2 · · · −2xTm xm 1 1 1 ··· 1 31 1 1 1 .. . 1 0 For i = 0, ..., m lægger vi nu xTi xi gange sidste søjle til (i + 1)’te søjle, og ligeledes lægges xTi xi gange sidste række til (i + 1)’te række (dette ændrer ikke på determinanten). Herved bliver indgang (i + 1, j + 1), 0 ≤ i, j ≤ m, i ovenstående matrix til xTi xi −2xTi xj +xTj xj = (xi −xj )T (xi −xj ) = kxi −xj k2 . Alle andre indgange forbliver uændrede: kx0 − x0 k2 kx0 − x1 k2 · · · kx0 − xm k 1 kx1 − x0 k2 kx1 − x1 k2 · · · kx1 − xm k 1 −1 . . . . 2 . . . . |A| = . . . . m (−2) kxm − x0 k2 kxm − x1 k2 · · · kxm − xm k2 1 1 1 ··· 1 0 Vi ser at diagonalen kun indeholder 0’ere, så matricen her er M -matricen fra propositionen. Nu følger implikationen af forrige lemma: x1 , ..., xm er lineært uafhængige hvis og kun hvis |A| 6= 0 hvilket er ækvivalent med |M | 6= 0. Hvis x1 , ..., xm er lineært uafhængige giver forrige lemma at hypervolumet af m-simplexet dannet af x0 , ..., xm opfylder første lighed herunder: Vm2 = −|M | (−1)m−1 |M | |A|2 = = (m!)2 (m!)2 (−2)m 2m (m!)2 Når vi vil afgøre om x0 , ..., xr ligger i et d-dimensionelt hyperplan kan vi bruge følgende6 : Korollar 3.4. Lad x1 , x2 , ..., xr ∈ Rd+1 . Følgende er ækvivalent: • Der findes d + 1 lineært uafhængige vektorer blandt x1 , x2 , ..., xr . • Der findes en delmængde med d+1 punkter, {y1 , ..., yd+1 } ⊂ {x1 , ..., xr }, så Cayley-Menger determinanten til y0 = 0, y1 , ..., yd+1 ikke er 0. Bevis. x1 , ..., xr indeholder d+1 lineært uafhængige vektorer hvis og kun hvis der findes en mængde med d+1 vektorer, {y1 , ..., yd+1 } ⊂ {x1 , ..., xr }, som er lineært uafhængige. Propositionen giver at y1 , ..., yd+1 er lineært uafhængige hvis og kun hvis Cayley-Menger determinanten til y0 = 0, y1 , ..., yd+1 er forskellig fra 0. Dette korollar holder også hvis x1 , ..., xr ∈ Rm når m > d + 1. Punkterne y1 , ..., yd+1 findes altid i et (d + 1)-dimensionelt underrum. 6 32 Hvordan bruges dette korollar? Lad os sige at vi er givet alle indbyrdes afstande mellem x00 , x01 , ..., x0r . Denne konfiguration ligger i et d-dimensionelt affint underrum hvis og kun hvis konfigurationen, translateret med −x00 ligger i et d-dimensionelt underrum. Lad xi = x0i − x00 , i = 0, 1, ..., r beskrive de translaterede punkter. Lad y0 = x0 = 0 og udtag de (d + 1) andre yi ’er blandt {x1 , ..., xr }, lad os skrive y1 = xa1 , y2 = xa2 , ..., yd+1 = xad+1 . Vi kan beregne Cayley-Menger determinanten til disse punkter da der gælder kyi − yj k = kxai − xaj k = k(x0ai − x00 ) − (x0aj − x00 )k = kx0ai − x0aj k. Hvis Cayley-Menger determinanten ikke er 0 ved vi at x0 , ..., xr ikke ligger i et d-dimensionelt rum. Hvis derimod vi får at Cayley-Menger determinanten er 0, uanset hvordan vi udtager punkterne y1 , ..., yd+1 , så må x0 , x1 , ..., xr ligge i et d-dimensionelt rum. Lad os til sidst se nærmere på tilfældet r = 3. Vi er givet afstandene mellem fire punkter, x0 , x1 , x2 , x3 . Hvis vi kalder afstandene mellem punkterne for rij , 0 ≤ i < j ≤ 3 skal vi teste om følgende determinant er 0: 2 2 2 1 r03 r02 0 r01 2 2 2 r01 1 r13 0 r12 2 2 2 r02 r12 0 r 1 23 2 2 2 r03 r13 r23 0 1 1 1 1 1 0 Er den det, så findes de fire punkter i et affint plan (da der kun er én måde man kan udtage 3 punkter fra {x1 , x2 , x3 }). 3.2 Dziobeks ligninger I dette afsnit vil vi kort introducere Dziobeks ligninger. Disse giver os ekstra betingelser for centrale konfigurationer i et plan med fire punktmasser. En konfiguration med n punktmasser er kolineær hvis alle punktmasserne findes på samme linje. Vi ved fra [5] at der findes n!2 klasser af kolineær centrale konfiguration med n punktmasser - en for hver ordning af punktmasserne (så længe vi ikke medtæller π-rotationer af konfigurationer der allerede er talt). Så der findes 12 klasser når n = 4. Lad x1 , x2 , x3 , x4 være punkter i en central konfiguration som ligger i et plan, dvs. alle vektorer xi − xj ligger i et todimensionelt rum. Vi kender til endeligheden af de kolineære klasser, så lad os antage at x1 , x2 , x3 , x4 ikke er kolineære så vektorerne xi − xj , 1 ≤ i < j ≤ 4 netop udspænder et todimensionelt rum. Under disse antagelser gælder Dziobek’s ligninger: S12 S34 = S14 S32 = S14 S23 = S13 S24 For en udledning af disse ligninger henvises til [6]. 33 (23) 4 Initielle termer, -idealer og kvotientidealer I dette kapitel starter vi med at introducere totalordninger og termordninger. Dette er guided af kapitel 1.3 og 1.4 i [1]. Vi minder os om at en totalordning er en relation over en mængde S, hvor der for alle a, b, c ∈ S gælder: 1. Antisymmetri: a b ∧ b a ⇒ a = b 2. Transitivitet: a b ∧ b c ⇒ a c 3. Totalitet: a b ∨ b a Med a ≺ b menes a b ∧ a 6= b. Det er ikke så svært at vise følgende: En endelig mængde S med totalordning har et unikt største element, dvs. ∃v ∈ S ∀u ∈ S\{v} : u ≺ v (24) Vi skriver de koefficientfrie monomier7 i en polynomiumsring C[x1 , · · · , xn ] som xu hvor u ∈ Nn er en eksponentvektor (her er 0 ∈ N). F.eks. er x(2,3,0,1) = x21 x32 x4 . En relation over eksponentvektorerne (Nn ) er en termordning hvis det udover at være en total ordning opfylder følgende for alle u, v, w ∈ Nn : 4. Invariant under addition: u v ⇒ u + w v + w 5. 0 ∈ Nn er mindst: 0 u Udfra en termordning og en eksponentvektor a ∈ Nn kan vi definere en anden relation a på Nn ved: u a v ⇔ a · u < a · v ∨ (a · u = a · v ∧ u v) (25) Så der gælder u a v ⇒ a · u ≤ a · v. Dette skal vi bruge til at se at a er en termordning: 1. Antisymmetri: Antag u a v og v a u. Der må da gælde at a·u = a·v. Ved at bruge dette sammen med (25) fås u v og v u, så pr. antisymmetri for må u = v. 2. Transitivitet: Antag u a v og v a w. Hvis a·u < a·v eller a·v < a·w, så må a · u < a · w, dvs u a w. Hvis derimod a · u = a · v = a · w får vi at u v og v w, dvs. u w (pr. ’s transitivitet) så u a w. 3. Totalitet: Der gælder altid at a · u < a · v ∨ a · u > a · v ∨ (a · u = a · v ∧ u v) ∨ (a · u = a · v ∧ v u) pga. ’s totalitet. Dette er pr. (25) ækvivalent med u a v ∨ v a u. 7 Et monomie er et polynomie med ét led. 34 4. Invariant under addition: Antag at u a v. Hvis a · u < a · v må a · (u + w) = a · u + a · w < a · v + a · w = a · (v + w), og så må u + w a v + w. Hvis derimod a · u = a · v må u v, og da er invariant under addition må u + w v + w hvoraf det følger at u + w a v + w (da a · (u + w) = a · (v + w)). 5. 0 er mindst: Hvis 0 < a · u er 0 a u. Hvis 0 = a · u bruger vi at 0 er mindst for , dvs. 0 u og så får vi 0 a u. Prikproduktet a · u kan ikke være negativt da a, u ∈ Nn . Vi husker at støtten til et polynomie er eksponentvektorerne til polynomiets led. F.eks. gælder for følgende polynomie i C[x1 , x2 , x3 ] at: supp(3x31 x2 + 7x2 x63 + x3 + 5) = {(3, 1, 0), (0, 1, 6), (0, 0, 1), (0, 0, 0)} 4.1 Initielle termer, -forme og -idealer Definition 4.1. Lad være en termordning (f.eks. som givet i (25)). For et P f = u∈supp(f ) cu xu ∈ C[x1 , · · · , xn ] findes der pr. (24) en unik største eksponentvektor v ∈ supp(f ). Derfor kan vi definere den initielle term, in (f ) som: in (f ) := cv xv hvor u v ∀u ∈ supp(f ) (26) For et ideal i en polynomiumsring, I ⊂ C[x1 , · · · , xn ], definerer vi det -initielle ideal ved: in (I) := hin (f ) | f ∈ Ii (27) Til næste definition indfører vi for a ∈ Rn a-graden af f ∈ C[x1 , · · · , xn ]: dega (f ) := max{a · u | u ∈ supp(f )} (28) Eksempel 4.2. Lad f = x2 + 5x2 y − 2y 2 + 1 ∈ C[x, y]. Hvis a = (1, 1) er: dega (f ) = max{a · (2, 0), a · (2, 1), a · (0, 2), a · (0, 0)} = 3 Ligeledes er deg(0,2) (f ) = 4 og deg(−1,−1) (f ) = 0. P u Definition 4.3. Lad a ∈ Rn . For f = ∈ C[x1 , · · · , xn ] u∈supp(f ) cu x defineres den a-initielle form, ina (f ) som summen af de led, cu xu , med størst a-grad: X ina (f ) := cu x u (29) u∈supp(f ) a·u=dega (f ) Som før kan vi definere det a-initielle ideal for et ideal I ⊂ C[x1 , · · · , xn ]: ina (I) := hina (f ) | f ∈ Ii 35 Et monomie cxu siger vi er a-større end et andet monomie dxv hvis a · u > a · v. For u ∈ Rn indfører vi nu: • (hyper)planer ved Hu= = {a ∈ Rn : a · u = 0}. • åbne halvplaner ved Hu< = {a ∈ Rn : a · u < 0}. • lukkede halvplaner ved Hu≤ = {a ∈ Rn : a · u ≤ 0}. Lemma 4.4. Lad f ∈ C[x1 , · · · , xn ]\{0}. Så er følgende en åben mængde: {a ∈ Rn : ina (f ) er et monomie} Bevis. Denne mængde indeholder alle de a der gør f ’s første led a-størst forenet med de a som gør f ’s andet led a-størst osv: {a ∈ Rn : ina (f ) er et monomie} [ = {a ∈ Rn : a · u > a · v for alle v ∈ supp(f )\{u}} u∈supp(f ) Det er nok at vise at én vilkårlig mængde fra denne forening er åben, så lad u ∈ supp(f ). Vi har: {a ∈ Rn : a · u > a · v for alle v ∈ supp(f )\{u}} \ = {a ∈ Rn : a · u > a · v} v∈supp(f )\{u} Et tomt snit er hele Rn , som er åben, så vi antager at snittet ikke er tomt. Da supp(f ) er endelig er det nok at vise at én vilkårlig mængde fra dette snit < er åben, så lad v ∈ supp(f )\{u}. Hv−u er åben, og så bringer følgende os i mål: < {a ∈ Rn : a · u > a · v} = {a ∈ Rn : 0 > a · (v − u)} = Hv−u Følgende er en lidt ændret udgave af definition 1.6.9 i [1]. Definition 4.5. Lad I ⊂ C[x1 , ..., xn ] være et ideal og en termordning. Vi kalder monomierne xu ∈ / in (I) for standard monomierne mht. I og . Standardmonomiernes eksponentvektorer betegnes: std (I) = {u ∈ Nn : xu ∈ / in (I)} 36 Til det næste eksempel skal vi have defineret Gröbnerbaser. En Gröbnerbasis mht. et ideal I og en termordning er en endelig mængde {g1 , ..., gk } ⊂ I så hin (g1 ), ..., in (gk )i = in (I). Gröbnerbaser er nyttige fordi de gør det nemt at afgøre om et polynomie er indeholdt i idealet, se korollar 1.6.11 i [1]. Eksempel 4.6. Betragt følgende ideal: I = hx2 y − 2xy − y 2 + 3y, x3 − 2x2 − xy + 3xi Det kan vises8 at de to frembringerne er en Gröbnerbasis for I, dvs. in (I) = hx2 y, x3 i. Standardmonomierne er således x2 , xy a , y a hvor a ∈ N. Vi kan tegne std (I) som et trappediagram (se figur 2 til venstre). Figur 2: Eksempler på kassediagrammer Vi kan også tegne et trappediagram i tre dimensioner. For et ideal J hvor in (J) = hx3 y, y 3 x, y 5 , xz 2 i illustrerer højre trappediagram i figur 2 idealet std (J). Diagrammet kan ses på to måder. For et korrekt indtryk skal de lyse flader ses som pegende opad. Alt herfra og indtil kapitel 4.2 går ud på at vise korollar 4.10. Med dette korollar er det muligt at finde generatorerne for initielle idealer ina (I), som vi kommer til at bruge meget i de næste afsnit. Vi har kun vist at a er en termordning for a ∈ Nn . Dette gælder dog også for a ∈ Rn hvis vi ikke kræver femte punkt opfyldt: at 0 er mindst. Definition 4.1 giver stadig mening for disse ‘anderledes’ termordninger. 8 Se theorem 1.7.2 i [1] og brug den lexiografiske ordning. 37 Lemma 4.7. Tag et vilkårligt polynomie og monomie f, αxv ∈ C[x1 , ..., xn ] og a ∈ Rn . Så gælder at ina (αxv f ) = αxv ina (f ) P Bevis. Skriv f = u∈supp(f ) cu xu . Så gælder: X X xv ina (f ) = xv cu x u = cu xu+v u∈supp(f ) a·u=dega (f ) u∈supp(f ) a·u=dega (f ) Vi ser at a · u = dega (f ) hvis og kun hvis a · (u + v) = dega (f ) + a · v. Det kan nemt tjekkes at dega (f ) + a · v = dega (xv f ) så vi får: X xv ina (f ) = cu xu+v u∈supp(f ) a·(u+v)=dega (xv f ) P Dette er netop ina (xv f ) fordi xv f = u∈supp(f ) cu xu+v . Ved at arbejde lidt mere med definitionen kan vi også få skalaren med: αxv ina (f ) = ina (αxv f ). Følgende proposition og korollar er guidet af proposition 1.8 og korollar 1.9 i [2]. Lemma 4.8. Lad I ⊂ C[x1 , ..., xn ] være et ideal, en termordning, a ∈ Rn og f ∈ ina (I). Så findes g ∈ I så in (f ) = in (ina (g)). Bevis. Hvis f = 0 er in (f ) = in (ina (0)) så antag at f 6= 0. Vi kan skrive f = s1 ina (g1 ) + ... + sn ina (gn ) for nogle s1 , ..., sn ∈ C[x1 , ..., xn ] og g1 , ..., gn ∈ I. Vi kan antage at si ’erne er monomier ved at tillade hver frembringer ina (gi ) at optræde flere gange i summen. Lemma 4.7 giver nu at: sk ina (gk ) = ina (sk gk ) k = 1, 2, ..., n Da sk gk ∈ I kunne vi fra starten lige så godt have valgt gi ’erne således. Så vi kan antage at f = ina (g1 ) + ... + ina (gn ). Lad d = dega (in (f )) og omnavngiv g1 , ..., gn så dega (gi ) = d for i = 1, ..., p og dega (gi ) 6= d for i = p + 1, ..., n. For i ≤ p har ethvert led i ina (gi ) nu a-grad d, og for i > p findes intet led i ina (gi ) som har a-grad d. Dvs: in (f ) = in (ina (g1 ) + ... + ina (gn )) = in (ina (g1 ) + ... + ina (gp )) (30) Da ina (g1 ), ..., ina (gp ) kun indeholder led af a-grad d må ina (g1 + ... + gp ) = ina (g1 ) + ... + ina (gp ) (leddene af a-grad d i g1 + ... + gn går ikke ud, for i så fald ville ina (g1 ), ..., ina (gp ) = 0 og så medfører (30) at in (f ) = 0, og vi antog at f 6= 0). Vi har nu at: in (f ) = in (ina (g1 ) + ... + ina (gp )) = in (ina (g1 + ... + gp )) 38 Proposition 4.9. Lad I ⊂ C[x1 , ..., xn ] være et ideal, en termordning og a ∈ Rn . Så gælder in (ina (I)) = ina (I). Bevis. Første skridt er at vise (31) for et vilkårligt f ∈ I. I f findes et led cv xv så in (ina (f )) = cv xv . Vi vil vise at ina (f ) = cv xv , så pr. (26) skal følgende vises: v ∈ supp(f ) ∧ v a u ∀u ∈ supp(f ) Vi har at v ∈ supp(in (ina (f ))) ⊂ supp(ina (f )) ⊂ supp(f ), så lad u ∈ supp(f ) vilkårligt og lad os vise at v a u. v ∈ supp(ina (f )) så pr. (29) må a · v = dega (f ), dvs. a · v ≥ a · u. Hvis der gælder skarp ulighed giver (25) at v a u. Hvis der gælder lighed får vi a · u = a · v = dega (f ), dvs. u, v ∈ supp(ina (f )). Da in (ina (f )) = cv xv giver (26) at v u, dvs. v a u. Nu er følgende vist: in (ina (f )) = ina (f ) for alle f ∈ I (31) Vi vil nu vise at ina (I)’s frembringere ligger i in (ina (I)) og omvendt. Så tag en frembringer fra ina (I) som skrives ina (f ) for et f ∈ I. Vi har ina (f ) ∈ ina (I) og dermed in (ina (f )) ∈ in (ina (I)). Pr. (31) gælder så at ina (f ) ∈ in (ina (I)). Tag nu omvendt en frembringer fra in (ina (I)) og skriv den in (f ) for et f ∈ ina (I). Lemma 4.8 giver så at in (f ) = in (ina (g)) = ina (g) ∈ ina (I) for et g ∈ I. Korollar 4.10. Lad G være en Gröbner basis for I mht a . Så er G0 = {ina (g) | g ∈ G} en Gröbner basis for ina (I) mht. . Bevis. Tag et vilkårligt ina (g) ∈ G0 . Da g ∈ I må ina (g) ∈ ina (I). Dvs. G0 ⊂ ina (I). Nu giver forrige proposition første lighed herunder, og det at G er en Gröbner basis for I anden lighed: in (ina (I)) = ina (I) = hina (g) | g ∈ Gi = hin (ina (g)) | g ∈ Gi = hin (g 0 ) | g 0 ∈ G0 i 4.2 Nogle resultater fra polyhedral geometri Inden vi kan snakke om tropisk geometri skal vi introducere lidt teori fra polyhedral geometri. Meget i dette kapitel er blot gentagelser af dele af teorien i kapitel 3 i [1]. Undtagelser er eksempel 4.12 samt lemma 4.14. 39 Definition 4.11. En delmængde P ⊂ Rn er en polyhedralkegle hvis der findes b1 , ..., bk ∈ Rn sådan at: k \ P = Hb≤i i=1 Dimensionen af en kegle er dimensionen af det mindste underrum der indeholder den. Det relativt indre9 af en d-dimensionel polyhedralkegle P betegnes P 0 og er mængden af de punkter x ∈ P hvorom der findes en d-dimensionel kugle helt indeholdt i P . Vi kan lade disse bi ’er være rækker i en matrix B og så vil snittet ovenover være lig10 {x ∈ Rn : Bx ≤ 0}. 0 1 0 Eksempel 4.12. Lad A = 1 0 0 ∈ R1×3 og B = 0 −1 0 ∈ R3×3 . 0 0 1 3 3 Lad så P ⊂ R være givet ved P = {x ∈ R : Ax = 0 ∧ Bx ≤ 0}. Betingelsen 1 0 0 1 0 0 x = 0 er ækvivalent med x ≤ 0, så P kan også skrives: −1 0 0 1 0 0 −1 0 0 3 1 0 x ≤ 0 P = x∈R : 0 0 −1 0 0 0 1 Dvs. P er en polyhedralkegle. Med samme argumentation ses at: 1 0 0 n P = x∈R : x=0∧ 0 0 1 x≤0 0 1 0 = Der gælder ikke at P ⊂ H(0,0,1) , så vi kan ikke tilføje 0 0 1 som række til 1 0 0 . 0 1 0 Dette eksempel demonstrerer at to matricer A og B også kan angive en polyhedralkegle. Enhver polyhedralkegle kan angives således da vi tillader at A kan være en tom matrix. Følgende er lemma 4.5.3 fra [1]. 9 For en mere præcis definition af det relativt indre af en kegle, se kapitel 4.5 i [1]. For to vektorer u = (u1 , ..., un ) og v = (v1 , ..., vn ) mener vi med u ≤ v at ui ≤ vi for alle i = 1, ..., n. Tilsvarende mener vi for < og =. 10 40 0 Lemma 4.13. Lad A ∈ Rd ×n og B ∈ Rd×n og betragt polyhedralkeglen: P = {x ∈ Rn : Ax = 0 ∧ Bx ≤ 0} Lad A0 være matricen der indeholder alle rækker fra A samt rækkerne bi fra B som opfylder P ⊂ Hb=i . Lad så B 0 indeholde de resterende rækker fra B. Så gælder at P 0 = {x ∈ Rn : A0 x = 0 ∧ B 0 x < 0} Ved brug af dette lemma viser vi: Lemma 4.14. Lad P, Q ⊂ Rn være to polyhedralkegler så P 0 ∩ Q0 6= ∅. Så gælder at P 0 ∩ Q0 = (P ∩ Q)0 . Vi bemærker, at det giver mening at snakke om det relativt indre til P ∩Q fordi P ∩ Q er en polyhedralkegle (dette følger af definitionen). 0 Bevis. P kan beskrives med matricer A ∈ Rd ×n og B ∈ Rd×n og tilsvarende for Q med matricer C og D: P = {x ∈ Rn : Ax = 0 ∧ Bx ≤ 0} Q = {x ∈ Rn : Cx = 0 ∧ Dx ≤ 0} (32) Lad bi være en række fra B som opfylder P ⊂ Hb=i . Så kan vi tilføje bi som række i A og (32) holder stadig. Herefter kan bi fjernes fra B og (32) holder stadig. Vi kan gentage dette og derfor antage at ingen række bi i B opfylder P ⊂ Hb=i og ligeledes at ingen række di i D opfylder Q ⊂ Hd=i . Med notationen i lemma 4.13 gælder altså A0 = A, B 0 = B, C 0 = C og D0 = D, dvs: P 0 = {x ∈ Rn : Ax = 0 ∧ Bx < 0} Q0 = {x ∈ Rn : Cx = 0 ∧ Dx < 0} A B 0 0 n Lad nu p ∈ P ∩ Q = x ∈ R : x=0∧ x < 0 . Denne mængC D de skal vi vise er det relativt indre til P ∩ Q. Med (32) ses det at keglen P ∩ Q kan skrives: A B n P ∩Q= x∈R : x=0∧ x≤0 C D B Pr. lemma 4.13 mangler vi kun at vise at ingen række r i opfylder D P ∩ Q ⊂ Hr= . Vi valgte p sådan at p · r < 0 for alle rækker r heri, men dette betyder at p ∈ / Hr= for alle rækker r. Da der også gælder p ∈ P ∩ Q kan der ikke gælde P ∩ Q ⊂ Hr= . 41 De to næste definitioner er også fra kapitel 3 i [1]: Definition 4.15. Lad P være en polyhedralkegle og a ∈ Rn sådan at mængden {a · x | x ∈ P } har et maksimum m. Sidefladen af P mht. a defineres ved: facea (P ) := {x ∈ P | x · a = m} Mængden af sideflader til en kegle P skriver vi F (P ). Der gælder at enhver sideflade til en polyhedralkegle selv er en polyhedralkegle (se side 33 i [1]). Følgende er proposition 4.5.2 i [1]. S Proposition 4.16. For en polyhedralkegle P gælder at P = Q∈F (P ) Q0 og at denne forening er disjunkt. Definition 4.17. En polyhedralvifte Σ er en mængde indeholdene polyhedralkegler hvor følgende er opfyldt: • For enhver kegle P ∈ Σ gælder at enhver sideflade Q ∈ F (P ) findes i viften: Q ∈ Σ. • For hver to kegler P, P 0 ∈ Σ så P ∩ P 0 6= ∅ gælder at P ∩ P 0 er en sideflade i P : P ∩ P 0 ∈ F (P ). S Støtten af en polyhedralvifte er supp(Σ) = P ∈Σ P . For et f ∈ C[x1 , ..., xn ] og v ∈ Rn lader vi: Cv = {w ∈ Rn : inw (f ) = inv (f )} (33) Lad u1 , ..., uk ∈ supp(f ) være de v-største eksponentvektorer i supp(f ), dvs: u1 · v = u2 · v = ... = uk · v > u · v ∀u ∈ supp(f )\{u1 , ..., uk } Elementerne i Cv er de w som opfylder: u1 · w = u2 · w = ... = uk · w > u · w ∀u ∈ supp(f )\{u1 , ..., uk } De w som opfylder dette, hvor den skarpe ulighed > er ændret til ≥, er11 netop mængden Cv . Så Cv er et snit af lukkede halvplaner og derfor en 0 polyhedralkegle. Det ses også vha. lemma 4.13 at Cv = Cv . Lad G≥0 = {Cu : u ∈ Rn≥0 } som er en mænge af polyhedralkegler. Vi sætter så Gfan(f ) = {Q ∈ F (P ) : P ∈ G≥0 } til at være mængden af alle sideflader i G≥0 . Det vises i kapitel 4 i [1] at Gfan(f ) er en polyhedralvifte. Denne argumentation kan også bruges til at vise at G(f ) := {Cu : u ∈ Rn } er en polyhedralvifte: 11 se lemma 3.4.6 i [1] 42 Proposition 4.18. Lad f ∈ C[x1 , ..., xn ] vilkårligt. Så gælder at enhver Cu 0 er en polyhedralkegle, at Cu = Cu og at følgende er en polyhedralvifte: G(f ) = Cu : u ∈ Rn Fra to polyhedralvifter kan vi få en ny. Følgende definition og proposition findes også i kapitel 3.4 i [1]: Definition 4.19. Forfiningen af to polyhedralvifter Σ1 og Σ2 defineres til at være: Σ1 ∧ Σ2 = {P1 ∩ P2 | P1 ∈ Σ1 , P2 ∈ Σ2 , P1 ∩ P2 6= ∅} Det ses på denne definition at forfiningen er kommutativ: Σ1 ∧ Σ2 = Σ2 ∧ Σ1 . Ligeledes kan tjekkes at forfiningen er transitiv: Σ1 ∧ (Σ2 ∧ Σ3 ) = (Σ1 ∧ Σ2 ) ∧ Σ3 så vi kan skrive Σ1 ∧ Σ2 ∧ Σ3 uden parenteser. Proposition 4.20. For to polyhedralvifter Σ1 og Σ2 i Rn gælder at Σ1 ∧ Σ2 er en polyhedralvifte, og at supp(Σ1 ∧ Σ2 ) = supp(Σ1 ) ∩ supp(Σ2 ). Til sidst i dette afsnit præsenteres følgende proposition som giver en anden måde at se polyhedralkegler på. De to implikationer kommer fra theorem 3.1.10 og korollar 3.2.5 i [1]: Proposition 4.21. En delmængde P ⊂ Rn er en polyhedralkegle hvis og kun hvis der findes v1 , ..., vk ∈ Rn sådan at: P = cone(v1 , ..., vk ) := {a1 v1 + ... + ak vk | a1 , ..., ak ∈ R≥0 } 4.3 Tropisk geometri Definition 4.22. For et polynomie f ∈ C[x1 , ..., xm ]\{0} vil vi nu definere den tropiske hyperflade, T (f ), ved: T (f ) := {a ∈ Rm : ina (f ) er ikke et monomie} Et snit af endeligt mange hyperflader, T (f1 )∩T (f2 )∩...∩T (fn ), kaldes for en tropisk prevarietet. Endeligt definerer vi, for et ideal I ⊂ C[x1 , ..., xm ], den tropiske varietet ved: \ T (I) = T (f ) f ∈I\{0} 43 ±1 ±1 Et Laurentpolynomie f ∈ C[x±1 1 , x2 , ..., xn ] er et polynomie hvor man tillader at eksponenterne kan være negative. Meget af det foregående gælder også for disse: Vi definerer supporten samt a-graden af f ligesom vi gjorde det for polynomier i C[x1 , ..., xn ]. Definition 4.3 giver stadig mening selvom ±1 ±1 f ∈ C[x±1 1 , x2 , ..., xn ], og vi kan derfor også skrive ina (f ). Ovenstående definition giver altså også mening for Laurentpolynomier. At snitte de tropiske hyperflader for frembringerne til idealet I vil ikke give T (I), som følgende eksempel viser: Eksempel 4.23. Hvis I = hx + y + 1, x + yi ⊂ C[x, y], så ligger 1 ∈ I, dvs. T (I) = ∅. Men snittet af hyperfladerne af frembringerne er: T (x + y) ∩ T (x + y + 1) = {k(1, 1) : k ∈ R≥0 } Lemma 4.24. Lad f ∈ C[x1 , ..., xm ]\{0} og lad G = G(f ) være polyhedralviften fra proposition 4.18 og sæt: Σf = {P ∈ G : P ⊂ T (f )} (34) Så er Σf en polyhedralvifte og der gælder: • For alle P ∈ Σf og a, b ∈ P 0 gælder ina (f ) = inb (f ). • T (f ) = supp(Σf ) Bevis. Vi viser først at Σf er en polyhedralvifte. Ethvert P ∈ Σf findes også i G så Σf består af polyhedralkegler. Vi mangler at vise de to punkter i definition 4.17: • Lad P ∈ Σf og Q ∈ F (P ). Da G er en polyhedralvifte må Q ∈ G. Der gælder også at Q ⊂ P ⊂ T (f ) så Q ∈ Σf . • Lad P, P 0 ∈ Σf så P ∩ P 0 = 6 ∅. Da de også findes i G, som er en polyhedralvifte, gælder at P ∩ P 0 ∈ F (P ). Så Σf er en polyhedralvifte. Lad os vise første punkt i lemmaet. Ethvert P ∈ Σf er netop en kegle på formen Cu i G (se proposition 4.18). Det relativt indre af denne er blot Cu og dermed gælder for alle a, b ∈ P 0 = Cu at ina (f ) = inu (f ) = inb (f ). Lad os vise andet punkt. ⊃-inklusionen er nem: Lad u ∈ supp(Σf ), dvs. u ∈ P for et P ∈ Σf . Dette P opfylder P ⊂ T (f ). Lad nu u ∈ T (f ). Ethvert v ∈ Rm som opfylder inu (f ) = inv (f ) må også findes i T (f ) (pr. definition af tropiske hyperflader), dvs: {v ∈ Rm : inu (f ) = inv (f )} ⊂ T (f ) 44 Lad os tage aflukningen: {v ∈ Rm : inu (f ) = inv (f )} ⊂ T (f ) Med notationen fra proposition 4.18 ser vi, at venstresiden kan skrives som Cu . Fra definitionen ses at T (f ) er Rm (som er både åben og lukket) fratrukket mængden {a ∈ Rm : ina (f ) er et monomie} som er åben pr. lemma 4.4. Det følger at T (f ) må være lukket, dvs. Cu ⊂ T (f ) = T (f ). Da vi også har Cu ∈ G må Cu ∈ Σf , og så er det klart at u ∈ Cu ⊂ supp(Σf ). Proposition 4.25. Lad f1 , ..., fn ∈ C[x1 , ..., xm ]\{0}. Lad så Σf1 , ..., Σfn være polyhedralvifterne (34) og sæt: Σ = Σf1 ∧ Σf2 ∧ ... ∧ Σfn Så er Σ en polyhedralvifte og der gælder: • T (f1 ) ∩ T (f2 ) ∩ ... ∩ T (fn ) = supp(Σ) • For alle P ∈ Σ og a, b ∈ P 0 gælder: ina (fi ) = inb (fi ) for alle i = 1, ..., n Bevis. Ved at bruge proposition 4.20 (n − 1) gange fås at Σ er en polyhedralvifte. Vi får også at: supp(Σ) = supp(Σf1 ∧ Σf2 ∧ Σf3 ∧ ... ∧ Σfn ) = supp(Σf1 ) ∩ supp(Σf2 ∧ Σf3 ∧ ... ∧ Σfn ) = ... = supp(Σf1 ) ∩ supp(Σf2 ) ∩ ... ∩ supp(Σfn ) = T (f1 ) ∩ T (f2 ) ∩ ... ∩ T (fn ) Sidste lighed følger her af lemma 4.24. Vi mangler kun at vise andet punkt, så lad P ∈ Σ og a, b ∈ P 0 . Lad herefter i ∈ {1, ..., n} vilkårligt. Når vi har vist ina (fi ) = inb (fi ) er beviset slut. ∧ er associativ og kommuterer, så vi kan skrive: ! n ^ ^ Σ = Σf1 ∧ ... ∧ Σfn = Σfj = Σfi ∧ Σ fj j=1 j6=i V Definition 4.19 fortæller at der findes P1 ∈ Σfi og P2 ∈ j6=i Σfj sådan at P = P1 ∩ P2 . Da a ∈ P1 kan vi pr. proposition 4.16 finde en kegle Q1 ∈ F (P1 ) 45 så a ∈ Q01 . På samme måde findes Q2 ∈ F (P2 ) så a ∈ Q02 . Så a ∈ Q01 ∩ Q02 , og så får vi med lemma 4.14: a ∈ Q01 ∩ Q02 = (Q1 ∩ Q2 )0 (35) V Det er nu klart at Q1 ∩ Q2 6= ∅, og da Q1 ∈ Σfi og Q2 ∈ j6=i Σfj (se første punkt i definition 4.17) må Q1 ∩ Q2 ∈ Σ. a ligger i både P og Q1 ∩ Q2 og så giver punkt 2 i definition 4.17 at P ∩ (Q1 ∩ Q2 ) ∈ F (P ), men da Q1 ∩ Q2 ⊂ P1 ∩ P2 = P betyder dette, at Q1 ∩ Q2 ∈ F (P ). Antag nu med henblik på modstrid at P 6= Q1 ∩ Q2 . Pr. proposition 4.16 er foreningen af de relative indrer af P ’s sideflader disjunkt. I denne forening indgår både P 0 og (Q1 ∩Q2 )0 . Men vi har at a ∈ P 0 og samtidig a ∈ (Q1 ∩Q2 )0 pr. (35), så foreningen er ikke disjunkt, hvilket giver modstriden. Vi har nu at a, b ∈ P 0 = (Q1 ∩ Q2 )0 = Q01 ∩ Q02 ⊂ Q01 . Da Q1 ∈ Σfi får vi med lemma 4.24 at ina (fi ) = inb (fi ) Følgende er et særtilfælde af korollar 3.2.13 i [8]: Korollar 4.26. Lad π : Rn → R være projektionen af første koordinat ned ±1 ±1 på R og lad I ⊂ C[x±1 1 , ..., xn ] være et ideal. Så findes et ideal J ⊂ C[x1 ] så T (J) = π(T (I)). Ved at bruge ovenstående viser vi nu følgende: Proposition 4.27. Lad I ⊂ C[x1 , ..., xn ] være et ideal og L = (1, 1, ..., 1)T ∈ < Zn . Hvis T (I) ∩ H−L = ∅ så gælder T (I) ∩ HL< = ∅ Bevis. I dette bevis bruger vi følgende notation: For f ∈ C[x1 , ..., xn ] og en n × n matrix B lader vi f B betegne f , hvor enhver eksponentvektor u er erstattet med Bu: X X Hvis f = cu xu så er f B = cu xBu u∈supp(f ) u∈supp(f ) Lad nu A være identitetsmatricen hvor første søjles nuller er erstattet med −1: 1 0 0 ... 0 1 0 0 ... 0 −1 1 0 1 1 0 0 0 1 0 1 −1 0 0 A = −1 0 1 , A = .. . .. .. . .. . . −1 0 0 1 1 0 0 1 Vi vil se nærmere på idealet I A := hf A : f ∈ Ii frembragt i Laurent±1 polynomiumsringen C[x±1 1 , ..., xn ]. Lad os få et overblik over beviset: 46 1. Vi vil vise at T (I A ) ikke indeholder punkter med positiv førstekoordinat. 2. Vi antager med henblik på modstrid at T (I)∩HL< 6= ∅ og viser at T (I A ) indeholder punkter med negativ førstekoordinat. 3. Vi bruger korollar 4.26 på T (I A ) og får en modstrid. Punkt 1: Lad w = (w1 , ..., wn ) ∈ T (I A ) og f ∈ I\{0} vilkårligt. Så gælder at f A ∈ I A , dvs. inw (f A ) har mindst to led. Lemma 4.28(3) giver os nu sidste lighed herunder: inw (f A ) = in(A−1 )T (AT w) (f A ) = (inAT w (f ))A Derfor må inAT w (f ) have mindst to led og derfor må AT w ∈ T (f ). Da f < var vilkårlig må AT w ∈ T (I) og så giver antagelsen at AT w ∈ / H−L hvilket T betyder at −L · A w ≥ 0, dvs: 0 ≥ L · AT w = L · (w1 − w2 − w3 − ... − wn , w2 , w3 , ..., wn )T = w1 Vi ser, at der ikke findes noget punkt i T (IA ) som har positiv førstekoordinat. Punkt 2: Antag at vi kan finde et w ∈ T (I)∩HL< . Det er tilstrækkeligt at vise at (A−1 )T w ∈ T (I A ) da førstekoordinaten i (A−1 )T w er w1 +w2 +...+wn (som er negativ da w ∈ HL< ). Så for vilkårlig g ∈ I A \{0} skal vi vise (A−1 )T w ∈ T (g). Vi kan skrive ±1 g = a1 f1A + ... + an fnA for nogle f1 , ..., fn ∈ I og a1 , ..., an ∈ C[x±1 1 , ..., xn ]. For ethvert v ∈ Zn kan vi faktorisere g ved: g = x−v (b1 f1A + ... + bn fnA ) hvor bi = xv ai , i = 1, ..., n (36) Vi vælger v så stor at ingen af polynomierne b1 , ..., bn har negative eksponentvektorer, dvs. b1 , ..., bn ∈ C[x1 , ..., xn ]. Da A−1 heller ikke har negative −1 indgange får vi for alle i = 1, ..., n at bA ∈ C[x1 , ..., xn ], og så får vi at i −1 A−1 f := bA f + ... + b f ∈ I. 1 n 1 n −1 A For alle i gælder (bA ) = bi , så vi kan omskrive (36): i −1 A A A−1 A A g = x−v (bA ) f + ... + (b ) f 1 1 n n −1 −1 A = x−v (b1A f1 + ... + bA n fn ) = x−v f A Anden lighed gælder pr. lemma 4.28(1). Vi ved at inw (f ) har mindst to led (da w ∈ T (f )) og derfor har (inw (f ))A også. Lemma 4.28(3) giver så at in(A−1 )T w (f A ) også har mindst to led. 47 Vi kan udvide lemma 4.7 så det også gælder for Laurentpolynomier, og så får vi in(A−1 )T w (g) = in(A−1 )T w (x−v f A ) = x−v in(A−1 )T w (f A ). Dvs. der er mindst to led i in(A−1 )T w (g) hvilket betyder at (A−1 )T w ∈ T (g). Punkt 3: Vi bruger nu korollar 4.26 til at få et ideal J, så T (J) netop er T (IA ) projiceret ned på første-aksen. Dvs. der gælder T (J) ∩ R>0 = ∅ og T (J) ∩ R<0 6= ∅. Vi deler nu op i tre tilfælde, der alle leder til modstrid: T • Hvis J = {0} er f ∈J\{0} T (f ) et tomt snit, dvs. T (J) = R. • Hvis derimod J indeholder et monomie f , så vil intet v ∈ R opfylde v ∈ T (f ), dvs. T (J) = ∅. • Endelig, hvis J ikke indeholder et monomie, og ikke er {0}, så vil ethvert f ∈ J have to led. Vi får at 0 ∈ T (f ), men i f vil der ikke være to led som er lige α-store for α 6= 0, dvs. α ∈ / T (f ). Så der gælder T (J) = {0}. Vi konkluderer at antagelsen T (I) ∩ HL< 6= ∅ var forkert. Lemma 4.28. Lad A ∈ Zn×n være en invertibel matrix med heltallige indA ±1 gange. For et polynomie f ∈ C[x±1 1 , ..., xn ] lader vi f betegne f hvor enhver eksponentvektor u er erstattet af Au. ±1 • For f, g ∈ C[x±1 1 , ..., xn ] gælder: og (f g)A = f A g A (f + g)A = f A + g A • For a ∈ Rn gælder at dega (f ) = deg(A−1 )T a (f A ). • For a ∈ Rn gælder at (ina (f ))A = in(A−1 )T a (f A ). P P Bevis. Vi skriver f = u∈supp(f ) cu xu og g = v∈supp(g) dv xv og får: (f g)A = X cu x u u∈supp(f ) dv x v v∈supp(g) A X = u∈supp(f ) v∈supp(g) = A X cu dv xu+v = X u∈supp(f ) v∈supp(g) X cu xAu u∈supp(f ) X v∈supp(g) 48 cu dv xAu xAv dv xAv = f A g A En lignende udregning kan laves for at vise (f + g)A = f A + g A . Lad os vise andet punkt, så lad a ∈ Rn . For ethvert u ∈ supp(f ) har vi at: T a · u = aT A−1 Au = (A−1 )T a Au = (A−1 )T a · Au (37) Så vi kan omskrive dega (f ): dega (f ) = max{a · u : u ∈ supp(f )} = max{(A−1 )T a · Au : u ∈ supp(f )} = deg(A−1 )T a (f A ) Sidste lighed følger af at supp(f A ) = {Au : u ∈ supp(f )}. Lad os vise sidste punkt. Vi kan skrive f på følgende måde: X X f= cu x u + cu x u u∈supp(f ) a·u=dega (f ) u∈supp(f ) a·u<dega (f ) Vi kan således skrive f A på følgende måde: X X fA = cu xAu + u∈supp(f ) a·u=dega (f ) u∈supp(f ) a·u<dega (f ) X = cu xAu cu xAu + u∈supp(f ) (A−1 )T a·Au =deg(A−1 )T a (f A ) X cu xAu u∈supp(f ) (A−1 )T a·Au <deg(A−1 )T a (f A ) Sidste lighed gælder fordi a · u = dega (f ) hvis og kun hvis (A−1 )T a · Au = deg(A−1 )T a (f A ) og ligeledes for < (dette gælder pr. andet punkt og (37)). Definition 4.3 fortæller nu at in(A−1 )T a (f A ) er første sum herover: X in(A−1 )T a (f A ) = cu xAu u∈supp(f ) (A−1 )T a·Au =deg(A−1 )T a (f A ) Herpå bruger vi igen andet punkt og (37), efterfulgt af første punkt, og får: A in(A−1 )T a (f A ) = X u∈supp(f ) a·u=dega (f ) cu xAu = 49 X u∈supp(f ) a·u=dega (f ) A cu x u = (ina (f )) Vi skal også bruge Struktursætningen for tropiske varieteter, se sætning 3.3.6 i [8]: Sætning 4.29. For et ideal I ⊂ C[x1 , x2 , ..., xn ] gælder: dim(T (I)) = dim(V (I) ∩ C∗n ) I tilfældet I ⊂ R[x1 , ..., xn ] gælder således dim(T (I)) = dim(V (I) ∩ R∗n ). Dimensions-begrebet som her bliver brugt bygger på teori, der ville kræve afskillige afsnit at beskrive. Derfor vil vi ikke give en generel definition af dim(X) for X ⊂ Cn . Lad os istedet retfærdiggøre vores brug med et eksempel: Eksempel 4.30. I figur 3 er varieteten af de tre idealer hyi, hy −x2 −1i, hy − 2, x − 2i ⊂ R[x, y] tegnet ind. Figur 3: varietet til idealet i eksempel 4.30 Uden meget arbejde kan det vises at foreningen af disse netop er varieteten af idealet I = hy(y − x2 − 1)(y − 2), y(y − x2 − 1)(x − 2)i. Med softwaren Singular finder vi nu følgende kvotientideal: (I : (xy)∞ ) = h(y − x2 − 1)(y − 2), (y − x2 − 1)(x − 2)i Varieteten af dette er netop ovenstående figur fratrukket linjen på x-aksen. Således er V (I : (xy)∞ ) næsten lig V (I) ∩ R∗2 . Eneste forskel er at punktet (0, 1) er indeholdt i førstnævnte men ikke i sidstnævnte. Det virker rimeligt at: dim(V (I) ∩ R∗2 ) = dim(V (I : (xy)∞ )) (38) Lad e1 = (1, 0, ..., 0), e2 = (0, 1, 0, ..., 0), ... en = (0, ..., 0, 1). Vi definerer et koordinat-underrum af Nn ligesom på side 446 i [4], dvs. en mængde der kan skrives: {a1 ei1 + ... + ar eir : aj ∈ N, 1 ≤ j ≤ r} 50 og vi siger at sådan et koordinat-underrum har dimension r. Vi vil som sagt ikke give en generel definition af dim(X), men i tilfældet hvor X er varieteten af et ideal, er dimensionen givet ved nedenstående (se proposition 2(ii), side 447 i [4]). Vi tager derfor dette som en ækvivalent definition. Definition 4.31. givet ved følgende: n max d Lad I ⊂ C[x1 , x2 , ..., xn ] være et ideal. Så er dim(V (I)) d er dimensionen af et koordinat-underrum som er indeholdt i std (I) o (dim(V (I)) er uafhængig af valg af termordning , som ses i ovennævnte proposition fra [4].) Med struktursætningen (sætning 4.29) og ovenstående eksempel motiveres følgende sætning: Sætning 4.32. For et ideal I ⊂ C[x1 , x2 , ..., xn ] gælder: dim(T (I)) = dim(V (I : (x1 · · · xn )∞ )) Følgende er Dicksons lemma, se lemma 1.2.4 i [1]: Lemma 4.33. Lad I være et ideal frembragt af (evt. uendeligt mange) monomier. Så findes et endeligt sæt af monomier som frembringer I. F.eks. kan et ideal være frembragt af de uendeligt mange monomier xa , a ≥ 2. I så fald er idealet også frembragt af det ene monomie x2 . Proposition 4.34. Lad I ⊂ C[x1 , ..., xn ] være et ideal. Hvis std (I) er uendelig stor så er dim(V (I)) > 0. Bevis. in (I) er frembragt af monomier. Pr. Dicksons lemma kan vi kalde frembringernes eksponentvektorer for u1 , ..., uk . Lad os skrive ui = (ui1 , ui2 , ..., uin ) for i = 1, ..., k og sæt: m = max(u11 , ..., u1n , u21 , ..., u2n , ..., uk1 , ..., ukn ) Således bliver m større eller lig enhver indgang i enhver eksponentvektor ui . Der findes kun endeligt mange eksponentvektorer hvor alle indgange er mindre end m. Så da std (I) er uendeligt stor må der heri være en eksponentvektor v med en indgang i som er mindst m. Lad ei være eksponentvektoren med alle indgange 0, undtagen indgang i som er 1. Da v ∈ std (I) får vi for alle a ∈ {0, 1, ..., m} at xai ∈ / in (I) a v (ellers ville xi |x ∈ in (I)) dvs. der gælder aei ∈ std (I). Lad os vise at 51 dette også gælder for a ∈ N med a > m, så antag omvendt at aei ∈ / std (I) dvs. xai ∈ in (I). Da xai ∈ in (I) og xm / in (I) må der være en frembringer xuj som deler i ∈ m a xi men ikke xi , dvs. uj ’s i’te indgang kan findes i mængden {m + 1, m + 2, ..., a} (og alle andre indgange vil være 0). Men dette modstrider med at m er større end enhver indgang i uj . Vi har vist at aei ∈ std (I) for alle a ∈ N, så der findes et koordinatunderrum af std (I) som har dimension 1. Pr. definition 4.31 er dim(V (I)) så mindst 1. Følgende er et korollar til Hilbert’s Nulstellensats, se korollar 1.8.6 i [1]. Korollar 4.35. Lad I ⊂ C[x1 , x2 , ..., xn ] være et ideal og en termordning. Så gælder at: |V (I)| < ∞ ⇔ | std (I)| < ∞ Vi kan nu vise følgende proposition, hvis vi accepterer at dimensionen af en endelig mængde (eller blot {0}) er 0: Proposition 4.36. Lad I ⊂ C[x1 , ..., xn ] være et ideal. Hvis T (I) ⊂ {0} så gælder at |V (I) ∩ C∗n | < ∞. Bevis. Da T (I) ⊂ {0} er T (I)’s dimensionen 0. Sætning 4.32 fortæller så, at dim(V (I : (x1 · · · xn )∞ )) = 0. Proposition 4.34 giver nu (ved kontraponering) at | std (I : (x1 · · · xn )∞ )| < ∞ (for en termordning ), hvorefter korollar 4.35 viser at |V (I : (x1 · · · xn )∞ )| < ∞. Vi får nu at |V (I) ∩ C∗n | < ∞ hvis vi kan vise at V (I) ∩ C∗n ⊂ V (I : (x1 · · · xn )∞ ). Vi lader u ∈ V (I) ∩ C∗n og skal vise at u ∈ V (I : (x1 · · · xn )∞ ). Dvs. for et vilkårligt f ∈ (I : (x1 · · · xn )∞ ) skal vi vise at f (u) = 0. Pr. definition gælder at (x1 · · · xn )r f ∈ I for et stort nok r ∈ N. Og da u ∈ V (I) gælder: 0 = ((x1 · · · xn )r f ) (u) = (u1 · · · un )r (f (u)) Da u ∈ C∗n må (u1 · · · un )r 6= 0, dvs. vi må have f (u) = 0. 4.4 Kvotientidealer Følgende definition er fra kapitel 12 i [2]: Definition 4.37. For et f ∈ C[x1 , ..., xn ] og et ideal I ⊂ C[x1 , ..., xn ] kalder vi følgende mængder for kvotientidealer: (I : f ) := {g ∈ C[x1 , ..., xn ] | f g ∈ I} (I : f ∞ ) := {g ∈ C[x1 , ..., xn ] | f r g ∈ I for et r ∈ N} 52 Det ses nemt, at disse mængder er idealer. For hvilket som helst α ∈ C[x1 , ..., xn ] har vi: g ∈ (I : f ∞ ) ⇒ f r g ∈ I for et r ∈ N ⇒ f r (αg) ∈ I ⇒ αg ∈ (I : f ∞ ) g1 , g2 ∈ (I : f ∞ ) ⇒ f r1 g1 , f r2 g2 ∈ I for nogle r1 , r2 ∈ N ⇒ f max(r1 ,r2 ) (g1 + g2 ) ∈ I ⇒ g1 + g2 ∈ (I : f ∞ ) Det samme kan vises for (I : f ), som blot er tilfældet r = r1 = r2 = 1. Proposition 4.38. Lad I ⊂ C[x1 , ..., xn ] være et ideal og M ∈ C[x1 , ..., xn ] et monomie. Følgende er ækvivalent: 1. I indeholder et monomie. 2. (I : M ∞ ) indeholder et monomie. 3. (I : (x1 x2 · · · xn )∞ ) = h1i. ∞ ∞ Desuden gælder at (I : (x1 x2 · · · xn )∞ ) = (· · · ((I : x∞ 1 ) : x2 ) · · · : xn ) Bevis. 1 ⇒ 2: For et monomie m ∈ I har vi M r m ∈ I for et hvilket som helst r ∈ N, så m ∈ (I : M ∞ ). 2 ⇒ 3: For et monomie m ∈ (I : M ∞ ) må M r m ∈ I for et r. For et stort nok k ∈ N må vi nu have at M r m deler (x1 · · · xn )k , dvs (x1 · · · xn )k ∈ I så vi får 1 ∈ (I : (x1 · · · xn )∞ ). 3 ⇒ 1: Siden 1 ∈ (I : (x1 · · · xn )∞ ) må (x1 · · · xn )r ∈ I for et r ∈ N. Vi indser at (I : (f g)∞ ) = ((I : f ∞ ) : g ∞ ): h ∈ (I : (f g)∞ ) ⇒ f r g r h ∈ I for et r ⇒ g r h ∈ (I : f ∞ ) ⇒ h ∈ ((I : f ∞ ) : g ∞ ) Og: h ∈ ((I : f ∞ ) : g ∞ ) ⇒ g r h ∈ (I : f ∞ ) for et r ⇒ f s g r h ∈ I for et s ⇒ (f g)max(r,s) h ∈ I ⇒ h ∈ (I : (f g)∞ ) Ved at bruge dette flere gange får vi: (I : (f1 · · · fk )∞ ) = ((I : f1∞ ) : (f2 · · · fn )∞ ) = · · · = (· · · ((I : f1∞ ) : f2 ) · · · : fk∞ ) 53 5 Undersøgelse af den tropiske varietet Lad f1 , ..., f6 være Albouy-Chenciners normerede symmetriske polynomier, f7 , ..., f18 Albouy-Chenciners normerede usymmetriske polynomier (begge i tilfældet n = 4) og f19 , f20 , f21 Dziobek’s polynomier. Hvis vi er givet konkrete masser for konfigurationerne kan vi se f1 , ..., f21 ∈ R[r12 , r13 , r14 , r23 , r24 , r34 ]. Lad I være idealet frembragt af f1 , ..., f21 og lad Σ være polyhedralviften i R6 som beskrevet i proposition 4.25. Dette proposition giver sammen med proposition 4.16 at: [ [ [ T (I) ⊂ T (f1 ) ∩ ... ∩ T (f21 ) = supp(Σ) = P = Q0 = P0 P ∈Σ P ∈Σ Q∈F (P ) P ∈Σ Så hvis vi kan vise, at enhver åben kegle i Σ\{{0}} ikke er indeholdt i T (I), fås at T (I) ⊂ {0}. Herefter kan vi bruge proposition 4.36 som nævnt i kapitel 1.5. Vi vil desværre indse at det ikke lykkedes at vise dette for to af keglerne. Ved at benytte teori om Puisseux-rækker lykkedes dette dog i [6]. Denne teori er ikke taget med i dette speciale da det ville blive for omfattende. I det følgende skriver vi AC-ligninger/polynomier som forkortelse for de normerede Albouy-Chenciner ligninger/polynomier. 5.1 Symmetri for polynomier uden masser Til resten af dette kapitel indfører vi følgende notation: Vi lader Sm være den symmetriske gruppe for m elementer. En permutation σ ∈ Sm skrives ved et produkt af cykler, og en cykel ved τ = (x1 x2 · · · xi ). Sidstnævnte betyder at τ (x1 ) = x2 , ..., τ (xi−1 ) = xi , τ (xi ) = x1 . Eksempelvis vil en permutationen (12)(23) først bytte om på 2 og 3, og herefter om på 1 og 2. For et polynomie f ∈ R[r12 , r13 , r14 , r24 , r24 , r34 ] og en permutation σ ∈ S4 skriver vi også fσ , med hvilket vi mener f hvor ethvert indice i er erstattet med σ(i). F.eks. er (r14 )σ = r24 hvis σ er cyklen (12). Dziobeks ligninger (23) kan omskrives til: 3 3 3 3 f = r12 r14 r23 r34 (S12 S34 − S14 S23 ) = 0 3 3 3 3 g = r12 r13 r24 r34 (S12 S34 − S13 S24 ) = 0 3 3 3 3 h = r13 r14 r23 r24 (S14 S23 − S13 S24 ) = 0 Vi ser at f , g og h er polynomier (vi husker at Sij = r13 − 1 for i 6= j), og det ij er disse vi kalder Dziobeks polynomier. Løsningerne til Dziobeks ligninger altså er rødderne til Dziobeks polynomier (som ligger i R∗6 ). At byttes om 54 på indice 1 og 2 i f forvandler dette polynomie til g, dvs. f(12) = g. Ligeså tjekkes at g(12) = f og h(12) = −h. Derfor gælder op til fortegn at {f, g, h} = {f(12) , g(12) , h(12) }. Vi finder at dette også gælder for permutationen (1234): Note 5.1. For Dziobeks polynomier, f, g, h, gælder for τ = (12), (1234) at {f, g, h} = {fτ , gτ , hτ } op til fortegn. De masseløse AC-ligninger er blot de almindelige AC-ligninger, hvor enhver masse mi er sat til 1. For i, j ∈ {1, ..., n}, i 6= j ser den (i, j)’te usymmetriske, masseløse AC-ligning således ud: X 2 2 2 Sik (rjk − rik − rij )=0 (39) k Vi ganger ligesom før en passende faktor på for at få det (i, j)’te polynomie: Y X 3 2 2 2 rij rik Sik (rjk − rik − rij ) (40) k∈{i,j} / k Vi vil nu bruge τ = (12), (1234) på indicerne og se, at disse polynomier forbliver uændrede op til rækkefølge. At bruge τ på k-indicerne i summationen svarer blot til at summere i en Q 3 anden rækkefølge. At bruge τ på de resterende k-indicer ændrer k∈{i,j} rik / Q Q 3 3 riτ til k∈{i,j} k∈{τ / (i),τ (j)} rik . Så at bruge τ på alle indicer / (k) som er lig ændrer udtrykket til: Y X rτ (i)τ (j) rτ3(i)k Sτ (i)k (rτ2(j)k − rτ2(i)k − rτ2(i)τ (j) ) k∈{τ / (i),τ (j)} k Ved at sammenligne med (40) ses, at dette netop er det (τ (i), τ (j))’te polynomie. Vi ser at nedenstående afbildning er bijektiv12 : W 3 (i, j) 7→ (τ (i), τ (j)) ∈ W = {(i, j) : 1 ≤ i, j ≤ 4, i 6= j} Derfor må de tolv produkter fra (40) stadig være de samme (op til rækkefølge) efter τ er brugt på deres indicer. Note 5.2. For AC’s usymmetriske masseløse polynomier, g1 , g2 , ..., g12 , gælder for τ = (12), (1234) at {g1 , ..., g12 } = {g1τ , ..., g12τ }. Hvis i 6= i0 gælder τ (i) 6= τ (i0 ) og tilsvarende for j, hvilket giver injektiviteten. Surjektiviteten følger af, at ethvert (i, j) ∈ W kan skrives (τ (τ −1 (i)), τ (τ −1 (j)). 12 55 Vi lader i resten af dette afsnit g1 , ..., g21 være AC’s masseløse, usymmetriske og symmetriske polynomier samt Dziobeks polynomier. Det kan vises at note 5.2 også holder for AC’s masseløse, symmetriske polynomier (op til fortegn). Med alle disse resultater fås: Note 5.3. For τ = (12), (1234) er {g1 , ..., g21 } = {g1τ , ..., g21τ } op til fortegn. Vi indfører lidt mere notation: For en permutation σ ∈ S6 og en vektor u = (u1 , u2 , ..., u6 ) ∈ R6 skriver vi σ(u) = (uσ−1 (1) , uσ−1 (2) , ..., uσ−1 (6) ). For g ∈ R[r12 , ..., r34 ] skriver vi deruover g σ med hvilket vi mener g hvor enhver eksponentvektor u er erstattet af σ(u). Denne notationen er faktisk præcis den samme som i proposition 4.27 hvis σ ses som en permutationsmatrix. Eksempel 5.4. Med en eksponentvektor u = (u1 , ..., u6 ) ∈ N6 kan vi beskrive et koefficient-frit monomie i R[r12 , r13 , r14 , r23 , r24 , r34 ] ved: u1 u2 u3 u4 u5 u6 (r12 , r13 , r14 , r23 , r24 , r34 )u = r12 r13 r14 r23 r24 r34 Når vi bruger permutationen σ1 = (1463)(25) på u får vi: (r12 , r13 , r14 , r23 , r24 , r34 )σ1 (u) = (r12 , r13 , r14 , r23 , r24 , r34 )(u3 ,u5 ,u6 ,u1 ,u2 ,u4 ) u1 u2 u3 u4 u5 u6 = r23 r24 r12 r34 r13 r14 u1 u2 u3 u4 u5 u6 = (r12 r13 r14 r23 r24 r34 )(1234) Dvs. for et polynomie g ∈ R[r12 , r13 , r14 , r23 , r24 , r34 ] gælder g σ1 = g(1234) . Hvis 2 2 + r13 . Lad nu σ2 = (24)(35). Så får vi: + r24 må g σ1 = r23 r34 f.eks. g = r12 r23 (r12 , r13 , r14 , r23 , r24 , r34 )σ2 (u) = (r12 , r13 , r14 , r23 , r24 , r34 )(u1 ,u4 ,u5 ,u2 ,u3 ,u6 ) u1 u2 u3 u4 u5 u6 = r12 r23 r24 r13 r14 r34 u1 u2 u3 u4 u5 u6 = (r12 r13 r14 r23 r24 r34 )(12) Dvs. for et polynomie g ∈ R[r12 , r13 , r14 , r23 , r24 , r34 ] gælder g σ2 = g(12) . Med dette eksempel fås: σ Note 5.5. For σ = (1463)(25), (24)(35) gælder at {g1 , ..., g21 } = {g1σ , ..., g21 } op til fortegn. Lad σ1 , ..., σp ∈ {(1463)(25), (24)(35)}. Ved at vælge a1 , ..., a21 ∈ {1, −1} σ σ passende kan vi få {g1 , ..., g21 } = {a1 g1 p , ..., a21 g21p } til at gælde med fortegn. Vi kan bruge permutationen σp−1 på alle polynomier og få: σ σ σ σ {g1 p−1 , ..., g21p−1 } = {(a1 g1 p )σp−1 , ..., (a21 g21p )σp−1 } 56 σ σ σ σ Dvs. der gælder {g1 , ..., g21 } = {g1 p−1 , ..., g21p−1 } = {(g1 p )σp−1 , ..., (g21p )σp−1 } op til fortegn. Ved at bruge dette trick flere gange får vi, at følgende gælder op til fortegn: {g1 , ..., g21 } = {((· · · (gaσp ) · · · )σ2 )σ1 : a = 1, 2, ..., 21} I stedet for først at permutere ga ’s eksponentvektorer med σtp , så med σtp−1 , osv. til σt1 , kan vi permutere dem én gang for alle med σt1 σt2 · · · σtp , dvs. σt σt ···σt σt ((· · · (ga p ) · · · )σt2 )σt1 = ga 1 2 p . Lad Q være permutationsgruppen13 frembragt af (1463)(25) og (24)(35). Vi har vist følgende: σ Note 5.6. For σ ∈ Q gælder {g1 , ..., g21 } = {g1σ , ..., g21 } op til fortegn. Resten af dette afsnit går ud på at vise følgende: Note 5.7. Lad r ∈ R6 . For alle σ ∈ Q gælder at: r ∈ T (g1 ) ∩ ... ∩ T (g21 ) ⇔ σ(r) ∈ T (g1 ) ∩ ... ∩ T (g21 ) Hvis vi kan vise ⇒-implikationen følger ⇐-implikationen nemt: Antag at σ(r) ∈ T (g1 ) ∩ ... ∩ T (g21 ) og sæt r0 = σ(r) ∈ R6 og σ 0 = σ −1 . Så giver ⇒-implikationen at T (g1 ) ∩ ... ∩ T (g21 ) 3 σ 0 (r0 ) = σ −1 (σ(r)) = r. Lad nu r ∈ R6 og σ ∈ Q. Pr. note 5.6 gælder følgende: T (g1 ) ∩ ... ∩ T (gn ) = T (g1σ ) ∩ ... ∩ T (gnσ ) (41) Så vi behøver kun at vise at σ(r) ∈ T (g1σ ) ∩ ... ∩ T (gnσ ). Lad i ∈ {1, ..., 21} være vilkårlig. Så gælder r ∈ T (gi ), dvs. der findes mindst to led i inr (gi ), og dermed også i (inr (gi ))σ . Ved at se σ som en permutationsmatrix fås fra lemma 4.28(3) at in(σ−1 )T r (giσ ) indeholder mindst to led. Da σ er ortogonal (som en permutationsmatrix jo er) får vi in(σ−1 )T r (giσ ) = inσr (giσ ), dvs. σ(r) ∈ T (giσ ). Dette var for et vilkårligt i, så σ(r) ∈ T (g1σ ) ∩ ... ∩ T (gnσ ). 5.2 Symmetri for polynomier med masser Lad os skrive de symmetriske AC-polynomier ved f1 , ..., f6 og de usymmetriske AC-polynomier ved f7 , ..., f18 . Skriv også Dziobeks polynomier ved f19 , f20 , f21 . I disse polynomier er masserne også variabler, så polynomierne findes i R[r12 , r13 , r14 , r23 , r24 , r34 , m1 , m2 , m3 , m4 ]. Med argumentationen fra forrige afsnit kan det vises, at der op til fortegn gælder: {f1 , ..., f21 } = {f1τ , ..., f21τ } 13 for τ = (1234), (12) En permutationsgruppe er blot en undergruppe af den symmetriske gruppe. 57 I stedet for at bytte om på tallene 1, 2, 3, 4 kan vi permutere eksponentvektorerne ligesom i sidste afsnit. Vi vil bruge σ1 og σ2 (fra sidste afsnit), men ønsker at de også bytter om på masserne. Vores løsning er at introducere to nye permutationer, σ ˜1 og σ ˜2 : σ ˜1 = (σ1 )(7, 8, 9, 10) = (1, 4, 6, 3)(2, 5)(7, 8, 9, 10) σ ˜2 = (σ2 )(7, 8) = (2, 4)(3, 5)(7, 8) Så nu er fk(1234) = fkσ˜1 og fk(12) = fkσ˜2 , k = 1, ..., 21. Så gælder, op til fortegn: σ ˜i {f1 , ..., f21 } = {f1σ˜i , ..., f21 } i = 1, 2 (42) For vilkårligt σ ∈ Q, som skrives σ = σtp · · · σt1 , t1 , ..., tp ∈ {1, 2}, lader vi σ ˜=σ ˜tp · · · σ ˜t1 . Ved at bruge (42) flere gange fås følgende (op til fortegn): σ ˜ {f1 , ..., f21 } = {f1σ˜ , ..., f21 } ∀σ ∈ Q (43) Lad I = hf1 , ..., f21 i. Når vi betragter T (I), er det når masserne er givet (ellers ville T (I) ligge i R10 ), så idealet I skal ses frembragt i R[r12 , ..., r34 ]. Følgende lemma er ret specifikt og udtaler sig kun om dette ideal I: Lemma 5.8. Lad σ ∈ Q og a ∈ R6 . For f ∈ ina (I) gælder at f σ˜ ∈ inσ(a) (I). Bevis. Lad α være et produkt af cyklerne (7, 8, 9, 10) og (7, 8) så vi får σ ˜= σ ˜ σ ˜ σ ˜ ασ. Vi viserP først at I = I hvor I := {h : h ∈ I}. Et h ∈ I kan ifølge (43) σ ˜ skrives h = 21 i=1 ai fi hvor a1 , ..., a21 ∈ R[r12 , ..., r34 ]. Pr. lemma 4.28(1) må: !α !σ˜ 21 21 21 X X X −1 h= ai (fiσ )α = ai fiσ = aσi fi i=1 i=1 i=1 σ ˜ Så iP I σ˜ skrives hσ˜ for et h = P21h ∈ I . Omvendt kan et vilkårligt polynomie 21 σ σ ˜ σ ˜ i=1 ai fi ∈ I vha. (43). i=1 ai fi ∈ I, og så følger på samme måde at h = Vi kan skrive f = s1 ina (g1 )+...+sn ina (gn ) for nogle s1 , ..., sn ∈ R[r12 , ..., r34 ] og g1 , ..., gn ∈ I. Lemma 4.28(1) og (3) giver nu anden og trejde lighed: f σ = (s1 ina (g1 ) + ... + sn ina (gn ))σ = sσ1 ina (g1 )σ + ... + sσn ina (gn )σ = sσ1 inσa (g1σ ) + ... + sσn inσa (gnσ ) Vi manger at bytte om på masserne. Først fjernes alle de led si inσa (giσ ), i = 1, ..., n hvor en ombytning af masserne vil få inσa (giσ ) til at forsvinde. For de resterende led gælder (inσa (giσ ))α = inσa ((giσ )α ). Dvs: σ ˜ f σ˜ = sσ1 inσa (g1σ˜ ) + ... + sσm inσa (gm ) Da alle inσa (gkσ˜ ), k = 1, ..., m er frembringere i inσa (I σ˜ ) må f σ˜ ∈ inσa (I σ˜ ), og da I = I σ˜ er beviset slut. 58 5.3 Tjek at led ikke forsvinder Gfan er et stykke software der kan beregne tropiske variteter med mere. Ved at give programmet argumenterne _nbody -N 4 --masses fås de usymmetriske AC-polynomier. Medtager vi også argumentet --symmetric fås i stedet de symmetriske polynomier. Ligeledes vil gfan med argumentet --dziobek give Dziobeks polynomier. Lad f1 , f2 , ..., f21 være ACs symmetriske og usymmetriske polynomier samt Dziobeks polynomier, ligesom i sidste afsnit. Vi får14 følgende udtryk for f1 : 3 3 3 3 3 5 3 2 3 3 3 f1 = − 2(m2 + m1 )r13 r14 r23 r24 + m3 r12 r14 r23 r24 − m3 r12 r13 r14 r23 r24 3 3 5 3 3 2 3 3 2 3 3 r14 r23 r24 r14 r23 r24 − m3 r12 r13 + m4 r12 r13 r23 r24 − m4 r12 r13 3 3 3 2 3 5 3 5 3 3 3 3 3 3 − m4 r12 r13 r14 r23 r24 + m4 r12 r13 r14 r23 + m3 r12 r13 r14 r24 − m3 r12 r14 r23 r24 3 3 3 3 3 3 3 3 3 3 3 3 − m4 r12 r13 r23 r24 − m3 r12 r13 r14 r24 − m4 r12 r13 r14 r23 3 3 3 3 3 + 2(m4 + m3 + m2 + m1 )r12 r13 r14 r23 r24 Så længe masserne er positive vil intet led herover forsvinde. Hvis vi er givet en konfiguration med konkrete masser m1 , ..., m4 , kan vi se f1 som et polynomie i R[r12 , ..., r34 ]. Og da T (f1 ) er ligeglad med koefficienterne (så længe de ikke er 0) må T (f1 ) = T (g1 ) hvor: 3 3 3 3 3 5 3 2 3 3 3 3 3 5 3 2 3 3 g1 = − 4r13 r14 r23 r24 + r12 r14 r23 r24 − r12 r13 r14 r23 r24 + r12 r13 r23 r24 − r12 r13 r14 r23 r24 3 3 2 3 3 3 3 2 3 5 3 5 3 3 3 3 3 3 − r12 r13 r14 r23 r24 − r12 r13 r14 r23 r24 + r12 r13 r14 r23 + r12 r13 r14 r24 − r12 r14 r23 r24 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 − r12 r13 r23 r24 − r12 r13 r14 r24 − r12 r13 r14 r23 + 8r12 r13 r14 r23 r24 Denne, og de 20 andre masseløse polynomier g2 , g3 , ..., g21 kan vi give til gfan der beregner en polyhedralvifte Σ som i proposition 4.25. Om denne polyhedralvifte Σ gælder altså: supp(Σ) = T (g1 ) ∩ T (g2 ) ∩ ... ∩ T (g21 ) = T (f1 ) ∩ T (f2 ) ∩ ... ∩ T (f21 ) 5.4 Den tropiske prevarietet for frembringerne gfan kan som sagt beregne en polyhedralvifte Σ, der opfylder punkterne i proposition 4.25 for polynomierne g1 , g2 , ..., g21 . Der findes en del symmetri i prevarieteten for disse polynomier, som vi så i kapitel 5.1’s note 5.7. Med de to frembringere for Q vil gfan også beregne banerne15 , som Q giver anledning til. Fra gfan’s output kan vi aflæse en kegle-repræsentant fra hver 14 Ved hjælp af software, se appendix B.1 En bane er en delmængde B ⊂ Σ og for hver to kegler i en bane, P, P 0 ∈ B, gælder, at P 0 = σ(P ) = {σ(x) : x ∈ P } for en permutation σ ∈ Q. 15 59 bane (se appendix C). Vi får den 0-dimensionelle kegle {0} samt følgende bane-repræsentanter (se proposition 4.21 for at opfriske hvad cone(·) er): cone(s0 ), cone(s1 ), cone(s5 ), cone(s8 ), cone(s20 ), cone(s23 ), cone(s27 ), cone(s31 ), cone(s35 ) cone(s0 , s1 ), cone(s1 , s8 ), cone(s1 , s27 ), cone(s8 , s27 ), cone(s27 , s31 ), cone(s5 , s35 ), cone(s20 , s35 ) cone(s1 , s8 , s27 ) Her er si ’erne strålerne givet ved: s0 s5 s20 s27 s35 = (−1, −1, −1, −1, −1, −1) = (0, 0, 1, 1, 0, 0) = (0, 1, 1, 1, 1, 0) = (−2, −2, 1, −2, 1, 1) = (0, 2, 3, 3, 2, 0) s1 s8 s23 s31 = (−1, −1, 0, −1, 0, 0) = (−2, −2, 0, −2, 1, 1) = (0, 0, 0, 1, 1, 1) = (0, 0, 1, 0, 1, 1) For hver keglerepræsentant P fra ovenstående liste vil vi prøve at vise, at det relativt indre af P snittet med T (I) er tomt. Herefter vil vi argumentere for, at der heller ikke findes et P 0 fra P -banen, sådan at (P 0 )0 snitter tomt med T (I). Lykkedes dette fjerner vi P fra ovenstående liste. Hvis alle kegler fra listen på denne måde bliver fjernet, har vi vist, at det relativt indre af enhver kegle P ∈ Σ\{{0}} snitter tomt med T (I). 5.5 < Kegler i H−L Vi lader L = (1, 1, 1, 1, 1, 1)T ∈ R6 og minder om det åbne halvplan defineret < af −L ved H−L = {x ∈ R6 : −L · x < 0}. Lad P være en kegle fra førnævnte < prevarietet som snitter ikke-tomt med H−L , dvs. en af følgende: cone(s5 ), cone(s20 ), cone(s23 ), cone(s31 ), cone(s35 ) cone(s27 , s31 ), cone(s5 , s35 ), cone(s20 , s35 ) Vi vil vise at P 0 ∩ T (I) = ∅. Dvs. for vilkårligt a ∈ P 0 skal det vises at ina (I) indeholder et monomie16 . Der gælder at ina (I) ⊃ hina (f1 ), ..., ina (f21 )i så vi kan i stedet vise at sidstnævnte ideal indeholder et monomie. Pr. proposition 4.25 er hina (f1 ), ..., ina (f21 )i uafhængig af hvilket a der vælges i P 0 , så det er nok at vise, at dette ideal indeholder et monomie for ét a ∈ P 0 . 16 For i så fald findes et h ∈ I så ina (h) er et monomie, og så er a ∈ / T (h) ⊃ T (I). 60 Lad os eksempelvis betragte keglen P = cone(s5 ) med repræsentanten a = (0, 0, 1, 1, 0, 0). Vi skal vise at J = hina (f1 ), ina (f2 ), ..., ina (f21 )i indeholder et monomie. Vi har at: 3 5 3 3 5 3 ina (f1 ) = m4 r12 r13 r14 r23 + m3 r12 r14 r23 r24 3 3 Lad p1 være det største monomie som deler alle led heri, dvs. p1 = r12 r14 r23 . Vi deler ina (f1 ) med p1 og kalder resultatet h1 : 2 3 3 2 r24 r14 + m3 r23 h1 := m4 r13 På samme måde fås17 h2 , h3 , ..., h21 . Vi får således et ideal K = hh1 , ..., h21 i. Lad nu p være et monomie så stort, at pi |p for alle i = 1, ..., 21. Så gælder for ethvert h ∈ K at ph ∈ J, så hvis K indeholder et monomie er der også et i J. Målet har nu ændret sig til at vise at K indeholder et monomie. Vi finder nu kvotientidealet (K : (r12 r13 r14 r23 r24 r34 )∞ ) med softwarepakken Singular. Kvotientidealet er simpelt nok til, at det kan snittes med delringen R[m1 , m2 , m3 , m4 ]. I dette tilfælde finder vi m2 m3 −m1 m4 i kvotientidealet. Dette er ikke godt, da dette kan være 0 for positive masser. Lad os i stedet regne på keglen cone(s35 ). Med samme fremgangsmåde som ovenover finder vi nu m1 + m2 i kvotientidealet, dvs. ina (I) indeholder (m1 + m2 )P for et monomie P . Da m1 + m2 6= 0 kan vi bruge lemma 5.8, dvs. der for alle σ ∈ Q gælder at (m1 +m2 )σ˜ P σ˜ ∈ inσ(a) (I). At bruge σ ˜ på (m1 +m2 ) svarer blot til at bytte om σ ˜ på nogle af masserne, så (m1 + m2 ) bliver aldrig nul. Når vi sætter konkrete masser ind bliver (m1 + m2 )σ˜ P σ˜ således til et monomie i R[r12 , ..., r34 ], og dermed indeholder inσ(a) (I) et monomie. Dette viser, at σ(a) ∈ / T (I) for alle 0 σ ∈ Q og a ∈ P , dvs. det indre til enhver kegle i banen for cone(s35 ) er ikke indeholdt i den tropiske varietet: (σ(P ))0 = σ(P 0 ) ∩ T (I) = ∅. Med undtagelse af keglerne cone(s5 ) og cone(s20 ) virker denne metode på alle keglerne fra listen. Vi ser lidt nærmere på cone(s5 ) og cone(s20 ) i kapitel 5.7. 17 Ved hjælp af software, se appendix B.2 61 5.6 Kegler i HL< Det antages i dette afsnit at vi har fået fjernet keglerne fra forrige afsnit, dvs. keglelisten er skåret ned til følgende: cone(s0 ), cone(s1 ), cone(s8 ), cone(s27 ) cone(s0 , s1 ), cone(s1 , s8 ), cone(s1 , s27 ), cone(s8 , s27 ), cone(s1 , s8 , s27 ) Ethvert relativt indre af disse kegler (samt ethvert relativt indre af keglerne < < fra deres baner) snitter tomt med H−L , hvilket betyder at T (I) ∩ H−L = ∅. < Proposition 4.27 fortæller nu at T (I) ∩ HL = ∅, hvilket fjerner ovenstående kegler. Vi får altså at T (I) ⊂ {0}, og så giver sætning 4.36 at V (I) kun indeholder endeligt mange punkter i R∗6 . 5.7 De svære kegler Metoden beskrevet i kapitel 5.5 virker på alle kegler(repræsentanter) der < snitter ikke-tomt med H−L med undtagelse af to: cone(s5 ) og cone(s20 ). For at metoden skal virke på cone(s5 ) skal der gælder at (m2 m3 −m1 m4 )σ 6= 0 for alle σ ∈ Q. Vi husker at disse permutation blot svarer til at benytte (1234) og (12) på indicerne, så vi skal have at: m1 m2 6= m3 m4 , m1 m3 6= m2 m4 , m1 m4 6= m2 m3 Det er dog værre med cone(s20 ). Singular tager flere minutter om at finde kvotientidealet, og det er ikke særlig pænt. Med polynomisk division kan det tjekkes at følgende element findes i kvotientidealet: (m1 + m2 )2 (m3 + m4 )2 (m31 + m32 )(m33 + m34 )R Dette R er givet ved: (m31 − m32 )2 (m33 − m34 )2 + 4m31 m32 (m33 − m34 )2 + 4m33 m34 (m31 − m32 )2 Et forsøg på at reparere dette er at begrænse os til at se på planare centrale konfigurationer, for så ved vi at en Cayley-Menger determinant skal være 0, og vi får et ekstra polynomie vi kan bruge i beregningerne. Det viser sig desværre at dette kun fjerner cone(s23 ). Denne kegle var ikke noget problem i forvejen, så dette bringer os ikke videre. Derimod kunne man håbe at de nu større initielle idealer ins5 (I) og ins20 (I) giver anledning til andre kvotientidealer. Skuffende finder vi dog, at kvotientidealet som ins5 (I) giver anledning til, snittet med R[m1 , m2 , m3 , m4 ], giver os samme ideal som før, hm2 m3 − m1 m4 i. Det samme gælder for ins20 (I). 62 5.8 Sammenligning af tropiske prevarieteter Artiklen [6] bruger Dziobeks- og Albouy-Chenciners symmetriske ligninger til at lave en tabel der forklarer retningen af hver stråle. For et a i hver af disse stråler vises at ina (I) indeholder et monomie, og ligeså for a i kegler udspændt af nogle af disse stråler. Så metoden vi har brugt minder meget om den i [6], selvom der her ikke bruges sproget fra tropisk geometri. Den tropiske prevarietet som der findes i [6] vil vi i dette afsnit kalde ‘prevarietet A’. Den tropiske prevarietet vi i dette kapitel har arbejdet med, hvor vi også har inkluderet de usymmetrisk Albouy-Chenciner polynomier, kalder vi ‘prevarietet B’. Prevarietet A indeholder én bane med tredimensionelle kegler. En repræsentant fra denne bane findes i rummet udspændt at de tre ortogonale vektorer (1, 1, 1, 1, 1, 1), (0, 0, −2, 0, 1, 1) og (−1, −1, 1, −1, 1, 1). Lad os kalde enhedsvektorerne i retning af disse for X, Y og Z. I figur 4 ses koordinatsystemet dannet af disse, hvis man forestiller sig Z pege vinkelret ud af papiret mod læseren. Figur 4: Et snit af en tredimensionel kegle fra prevarietet A Denne firkant (inkl. det skraverede område) har Z-koordinat 1, så man skal forestille sig denne svæve mellem papiret og læseren. Dette område er netop den tredimensionelle kegle snittet med planet {x ∈ span(X, Y, Z) : x · Z = 1}, så man kan forestille sig denne kegle som alle stråler der udspringer fra origo og snitter ikke-tomt med firkanten. Denne kegle har fire todimensionelle kegler som sideflader og fire stråler som kanter, og disse er alle indeholdt i prevarietet A. Betragt nu strålen som er repræsenteret ved punktet (−1, 0, 1). Denne og strålen i retning af −X udspænder sammen en anden kegle i prevarietet A, som også snitter ovenstående plan. Dette er indtegnet som halvlinjen ovenpå X-aksen til venstre for figuren. Da prevarietet B er snittet af flere hyperflader end prevarietet A, er det ingen overraskelse at denne prevarietet er en delmængde af prevarietet A. Prevarietet B har dog stadig en tredimensionel kegle, som udgøres af strålerne gennem det dobbelt-skraverede område i figur 5. Denne mindre kegle er netop 63 Figur 5: De tredimensionelle kegler fra prevarietet A og B cone(s1 , s8 , s27 ). Den lille trekants hjørner repræsenterer (fra venstre mod højre) s1 , s8 og s27 . Vi kan ikke tegne alle repræsentanter fra prevarieteterne ind i samme tredimensionelle koordinatsystem. Vi kan dog stadig vise grafisk hvilke stråler de forskellige kegler har som kanter, som det ses på figur 6 og 7. Ligesom før repræsenterer hvert punkt en stråle, hvert linjestykke en todimensionel kegle og arealet en tredimensionel kegle. Figur 6 illustrerer prevarietet A. Den nederste akse er cosinus til vinklen mellem den pågældende stråle og X, så keglerne som er repræsenteret på den < < højre side af skillelinjen ligger i H−X , og omvendt i HX for kegler på venstre side. Prevarietet B er en delmængde af prevarietet A, så vi kan markere denne herpå, se figur 7. Figur 6: Alle kegler fra prevarietet A Prevarietet B har (i forhold til prevarietet A) mistet to stråler, og fået en ny: s27 . Vi noterer antallet af repræsentanter fra hver prevarietet i tabel 1. < Tallet i parentes er antallet af kegler, som snitter ikke-tomt med H−X . 64 Figur 7: Alle kegler fra prevarietet A og B Stråler 2-dim. kegler 3-dim. kegler prevarietet A prevarietet B 10 (6) 9 (5) 9 (6) 7 (3) 1 (1) 1 (0) Tabel 1: Antallet af kegler i prevarietet A og B Hvis vi kun betragter planare centrale konfigurationer ved vi, at CayleyMenger determinanten skal være 0 for de seks afstande skal være 0, hvilket giver en ekstra ligning. Inkluderes denne forsvinder stråle s23 også fra prevarietet B. Men uanset hvad får vi altså ikke fjernet de svære stråler, s5 og s20 . 65 6 Litteratur [1] Anders Nedergaard Jensen: Lecture Notes: Algebra and Polyhedral Geometry, Maj 30, 2014. [2] Bernd Sturmfels: Grobner Bases and Convex Polytopes, American Mathematical Society, 1996. [3] http://www.scholarpedia.org/article/ Central_configurations#Self-Similar_Solutions [4] David Cox, John Little, Donal O’Shea: Ideals, Varieties, and Algorithms. An Introduction to Computational Algebraic Geometry and Commutative Algebra’, third edition, Springer 2007 [5] F. R. Moulton: The Straight Line Solutions of the Problem of n Bodies, Ann. of Math. 12 (1910) 1-17. [6] Marshall Hampton og Richard Moeckel: Finiteness of Relative Equilibria of the Four-Body Problem, December 17, 2004. [7] Kevin Brown: Simplex Volumes and the Cayley-Menger Determinant, http://www.mathpages.com/home/kmath664/kmath664.htm [8] Diane Maclagan og Bernd Sturmfels: Introduction to tropical geometry. Bog under forberedelse. [9] Richard Moeckel: On central configurations, Mathematische Zeitschrift, vol. 205 (1990) 499-517. [10] Igor Pak: Lectures on Discrete and Polyhedral Geometry, April 20 2010, 364-365 [11] Steven J. Leon Linear Algebra with applications, seventh edition, Pearson International Edition. 66 A Appendix: Liste over egne bidrag • Kapitel 1.1 og 1.2 er baseret på [6]. Mange ting er dog forsøgt opskrevet mere præcist, så beskrivelserne bliver lidt anderledes end i [6]. F.eks. beskrives relative ækvilibria ved yi (t) = Qαt (yi (0) − c) + c). • Proposition 1.4, lemma 1.6, eksempel 1.2 og 1.5. • Kapitel 1.3 og specielt definition 1.7 er udarbejdet ud fra hvad der står i [3] om homotetisk bevægelse. • Ligeså er i kapitel 1.4 (og 2.4) præciseret hvornår konfigurationer er ækvivalente. • Normerede konfigurationer og afbildningerne Ω og Ω0 i kapitel 2. • De fleste resultater fra kapitel 2.1 og 2.2 er taget fra [6], men opsat i lemmaer og en proposition, og rettet til så det passer i konteksten med ækvivalensrelationen ∼. • (⇐)-implikationen i lemma 2.5. • Kapitel 2.3 og 2.4 • Kapitel 3.1 er udarbejdet ud fra [7] og [10]. • Lemma 4.4 og lemma 4.7 • Beviserne til lemma 4.8, proposition 4.9 og korollar 4.10, men selve resultaterne var kendt fra [2]. • Eksempel 4.12 og lemma 4.14. • Lemma 4.24, proposition 4.25 og lemma 4.28. • Proposition 4.27, eksempel 4.30, proposition 4.34 og proposition 4.36 er udarbejdet med hjælp fra Anders Nedergaard Jensen. • Beviset til proposition 4.38, men resultatet var kendt fra [2]. • Kapitel 5.1 og 5.2 er udarbejdet efter samtaler med Anders Nedergaard Jensen. • Den overordnede fremgangsmåde i kapitel 5.4, 5.5 og kapitel 5.6 er fra [6], men med polyhedral- og tropisk geometri er resultaterne vist på en anden måde. • Softwaren, som beskrives i appendix B. 67 B Appendix: Diverse software De fleste af beregningerne i kapitel 5 er udført af programmerne gfan og Singular. Der er dog nogle beregninger som er klaret af programmer der er skrevet til formålet. På http://dansoy.dk/fourbody kan en mappe hentes som bl.a. indeholder softwaren der beskrives i dette kapitel. B.1 Sæt variabler udenfor parentes I kaptel 5.3 blev et program brugt til at sætte afstandene udenfor parenteser. Programmet får at vide hvad der er variabler (afstandene) og hvad der skal anses som konstanter (masserne). Hver input-streng bliver fortolket til et polynomie, men sidstnævnte bliver repræsenteret ved en afbildning α der sender variablernes eksponentvektorer u til andre afbildninger αu . Enhver afbildning på formen αu sender eksponentvektorer v for konstanterne til heltalskoefficienterne der passer til eksponentvektorerne u og v. Lad os se på et eksempel. Hvis programmet anser x1 og x2 som variable, a1, a2 og a3 som konstanter og får strengen 2*x1*a1+3*x1*a1*a3+4*x1*x2^2, så dannes en afbildning α med definitionsmængde {(1, 0), (1, 2)}. Betragt først α(1,0) som har definitonsmængde {(1, 0, 0), (1, 0, 1)}. Disse bliver sendt til deres respektive koefficienter, α(1,0) (1, 0, 0) = 2 og α(1,0) (1, 0, 1) = 3. Tilsvarende er definitionsmængden for α(1,2) blot {(0, 0, 0)} og der gælder α(1,2)) (0, 0, 0) = 4. Vi ser at 2*x1*a1+3*x1*a1*a3 kan omskrives til (2*a1+3*a1*a3)*x1. Hele denne parentes bliver beskrevet af α(1,0) . På samme måde gælder mere generelt at αu beskriver koefficienten foran variablerne der har eksponentvektor u. Så for hvert u fra α’s definitionsmængde printes koefficienten beskrevet af αu efterfulgt af variablerne med eksponentvektor u. Herefter tilføjes et ‘+’ og proceduren gentages for næste eksponentvektor u. Resultatet bliver et polynomie hvor alle afstande er sat udenfor parenteser. Tilhørende kode, makefile m.m. findes i /factorize i førnævnte mappe. B.2 Find initielle former I kapitel 5.5 blev der brugt et program til at finde initielle former for polynomier mht. en vektor u. Programmet gives vektoren u samt polynomierne som strenge. For hvert polynomie sker følgende: Først opbygges en afbildning α der sender polynomiets eksponentvektorer til deres koefficienter. Herefter gennemgås α’s definitionsmængde, for at finde polynomiets u-grad. Efter dette fjernes alle elementer fra denne definitionsmængde som ikke har denne u-grad. Resultatet 68 er at α nu repræsenterer det u-initielle polynomie. Er der givet et valgfrit argument, --reduce, bliver polynomiet herefter delt igennem med det største monomie som går op i alle led (herved bliver resultaterne ikke de initielle former af polynomierne, men resultatet er stadig nyttigt hvis vi ønsker at vise at det initielle ideal indeholder et monomie). Til sidst printes polynomiet som α repræsenterer ud, ved iterativt at printe α(u) ud efterfulgt af variablerne med eksponentvektor u. Tilhørende kode, makefile m.m. findes i /initialGen i førnævnte mappe. B.3 Script til Singular Singular bliver brugt mange gange til at finde et kvotientideal og snitte det med R[m1 , m2 , m3 , m4 ], og hver gang skal et maskineri op at køre: Udover at definere en ring skal et ideal bestemmes i hvilket frembringerne er forskellige fra gang til gang, samt mere. For mange af keglerne i prevarieteten blev denne proces automatiseret af et simpelt script. I konteksten af kapitel 5 får scriptet frembringere for et delvist mættet ideal som input. Scriptet danner nu følgende linjer, som den sender til Singular (frembringerne skal substitueres ind ved stjernerne): ring r=0,(m1,m2,m3,m4,r12,r13,r14,r23,r24,r34),dp; ideal i = *****; ideal i2 = sat(i,r12)[1]; ideal i3 = sat(i2,r13)[1]; ideal i4 = sat(i3,r14)[1]; ideal i5 = sat(i4,r23)[1]; ideal i6 = sat(i5,r24)[1]; ideal ie = sat(i6,r34)[1]; eliminate(ie,r12*r13*r14*r23*r24*r34); Vi kunne i teorien finde det simplere kvotientideal med kommandoen ideal ie = sat(i, r12*r13*r14*r23*r24*r34)[1], men kørselstiden for denne kommando viser sig at være væsenligt længere end den samlede kørselstiden for at finde seks kvotientidealer mht. de forskellige afstande, så vi bruger i stedet sat-kommandoen seks gange. Sidste kommando, eliminate snitter kvotientidealet med masseringen R[m1 , m2 , m3 , m4 ]. Scriptet hedder newSI og kan findes i den førnævnte mappe. 69 C Appendix: Gfan’s beregning af prevarietet gfan _tropicalintersection --symmetryPrinting giver et output som herunder hvis vi giver programmet følgende standard input: Dziobeks polynomier, Albouy-Chenciners symmetriske og usymmetriske polynomier samt de to frembringere til permutationsgruppen Q der giver anledning til polyhedralviftens baner. Disse beregninger kan nemt gentages på en computer ved at hente mappen fra http://dansoy.dk/fourbody, og køre scriptet beregn_prevarietet i mappen /beregninger/2_beregn_prevarietet. LP algorithm being used: "cddgmp". _application fan _version 2.2 _type SymmetricFan AMBIENT_DIM 6 DIM 3 LINEALITY_DIM 0 RAYS -1 -1 -1 -1 -1 -1 # 0 -1 -1 0 -1 0 0 # 1 -1 0 -1 0 -1 0 # 2 0 -1 -1 0 0 -1 # 3 0 0 0 -1 -1 -1 # 4 0 0 1 1 0 0 # 5 0 1 0 0 1 0 # 6 1 0 0 0 0 1 # 7 -2 -2 0 -2 1 1 # 8 -2 -2 1 -2 0 1 # 9 -2 -2 1 -2 1 0 # 10 -2 0 -2 1 -2 1 # 11 -2 1 -2 0 -2 1 # 12 -2 1 -2 1 -2 0 # 13 0 -2 -2 1 1 -2 # 14 70 0 1 1 -2 -2 -2 # 1 -2 -2 0 1 -2 # 1 -2 -2 1 0 -2 # 1 0 1 -2 -2 -2 # 1 1 0 -2 -2 -2 # 0 1 1 1 1 0 # 20 1 0 1 1 0 1 # 21 1 1 0 0 1 1 # 22 0 0 0 1 1 1 # 23 0 1 1 0 0 1 # 24 1 0 1 0 1 0 # 25 1 1 0 1 0 0 # 26 -2 -2 1 -2 1 1 # -2 1 -2 1 -2 1 # 1 -2 -2 1 1 -2 # 1 1 1 -2 -2 -2 # 0 0 1 0 1 1 # 31 0 1 0 1 0 1 # 32 1 0 0 1 1 0 # 33 1 1 1 0 0 0 # 34 0 2 3 3 2 0 # 35 0 3 2 2 3 0 # 36 2 0 3 3 0 2 # 37 2 3 0 0 3 2 # 38 3 0 2 2 0 3 # 39 3 2 0 0 2 3 # 40 15 16 17 18 19 27 28 29 30 --------------------------------(ikke-relevant output er fjernet) --------------------------------CONES {} # New orbit # Dimension 0 {0} # New orbit # Dimension 1 {1} # New orbit {2} {3} {4} {5} # New orbit {6} {7} 71 {8} # New orbit {9} {10} {11} {12} {13} {14} {15} {16} {17} {18} {19} {20} # New orbit {21} {22} {23} # New orbit {24} {25} {26} {27} # New orbit {28} {29} {30} {31} # New orbit {32} {33} {34} {35} # New orbit {36} {37} {38} {39} {40} {0 1} # New orbit # Dimension 2 {0 2} {0 3} {0 4} {1 8} # New orbit {1 9} {1 10} {2 11} 72 {2 12} {2 13} {3 14} {3 16} {3 17} {4 15} {4 18} {4 19} {1 27} # New orbit {2 28} {3 29} {4 30} {8 27} # New orbit {9 27} {10 27} {11 28} {12 28} {13 28} {14 29} {15 30} {16 29} {17 29} {18 30} {19 30} {27 31} # New orbit {28 32} {29 33} {30 34} {5 35} # New orbit {5 37} {6 36} {6 38} {7 39} {7 40} {20 35} # New orbit {20 36} {21 37} {21 39} {22 38} {22 40} {1 8 27} # New orbit # Dimension 3 73 {1 {1 {2 {2 {2 {3 {3 {3 {4 {4 {4 9 27} 10 27} 11 28} 12 28} 13 28} 14 29} 16 29} 17 29} 15 30} 18 30} 19 30} --------------------------------(ikke-relevant output er fjernet) --------------------------------- 74
© Copyright 2024