1. Operacijske raziskave (opredelitev pojma) …so interdisciplinarna veda. Nastala je iz nizov problemov, v katerih se ie optimalno stanje/gibanje nekega sistema. Gre za sklop metod, metodologijo, postopke, identifikacijo, algoritmacijo in implementacijo problemov in njihovih reitev na podlagi delovanja/operacij sistema. So sredstvo za generiranje alternativnih (optimalnih) reitev, med katerimi izbira nosilec odloanja. 2. Konveksna linearna kombinacija (dveh ali veih tok) Konveksna linearna kombinacija dveh ali ve tok je linearna kombinacija, pri kateri so koeficienti <1 in >0, njihova vsota pa je 1. Lin. komb. vektorjev/tok x1, x2, …, xn vektorskega prostora V s koeficienti p1, p2, …, pn p1x1 + p2x2 +…+ pnxn, kjer so koeficienti p1, p2, …, pn > 0 in < 1 ter velja: p1+p2+…+pn=1, se imenuje konveksna linearna kombinacija/sestava danih vektorjev/tok. Geom: Vsaka toka, ki je konveksna lin. komb. dveh tok, lei na daljici, ki ima ti dve toki za krajii in obratno (vsako toko na daljici je mogoe izraziti kot konveksno lin. komb. kraji daljice). 3. Konveksne mnoice (poljubni dve toki) Konveksne so mn. tok (M), za katere je znailno, da e sta x1 in x2 poljubna elementa te mnoice, je tudi vsaka njuna konveksna linearna kombinacija element te mnoice. Lei v vekt. prostoru (V). Geo: Poljubna mnoica M je konveksna, e je s poljubnima dvema tokama A in B iz M tudi cela daljica AB v M. primeri: ena sama toka; daljica, premica; krog, trikotnik, pravokotnik; ravnina, polravnina, toke med dvema krakoma ostrega kota; krogla, kocka, tetraeder, valj, stoec, ves prostor,… Toke konveksne mnoice delimo na ekstremne in neekstremne: 4. Ekstremna toka konveksne mnoice tok …je vsaka toka, ki jo ni mogoe izraziti kot konv. linearno komb. nobenih dveh tok mnoice (npr. krajii daljice; vse toke na povrini kocke+oglia) 5. Neekstremna toka konveksne mnoice tok …je vsaka toka, ki jo je mogoe izraziti kot konv. linearno komb. vsaj dveh drugih tok mnoice (npr. ostale toke kocke, brez ogli; notranje toke krogle – brez tistih, na povrini) 6. Konveksni polieder … je omejena konveksna mnoica tok s konnim tevilom ekstremnih tok (na katere je napet) vektorskega prostora V. Vse konveksne linearne kombinacije poljubnega konnega tevila tok vektorskega prostora sestavljajo konveksno mnoico, ki jo imenujemo konveksni polieder. Toke tega konveksnega poliedra so potemtakem vse konveksne linearne kombinacije konnega tevila tok x1, x2, … xn, katerih koeficienti pi (i=1…n) so < 1 in > 0, njihova vsota pa je 1. e je toka x konveksnega poliedra linearna kombinacija tok x1, x2,x3 … xn, in e je toka x1 linearna kombinacija tok x2,x3 … xn, je toka x tudi konveksna linearna kombinacija teh tok x2, x3,… xn. e iz sistema tok x1, x2, … xn, izpustimo vse tiste toke, ki so konveksne linearne kombinacije preostalih tok, se prvotno definirani konveksni polieder ne spremeni. Toke konveksnega poliedra je mogoe izraziti kot konveksne linearne kombinacije ekstremnih tok. 7. Linearno programiranje kot posebna matematina metoda …je panoga uporabne matematike, ki obiajno reuje probleme optimalne porabe ali alokacijo kakrnihkoli sredstev, ki so na razpolago le v omejenih koliinah. Bistvo za linearno programiranje je, da je namenska funkcija linearna in da so tudi vse pogojne neenabe ali enabe linearne. Def: Lin. progr. je posebna matematina metoda, ki jo uporabljamo pri obravnavi problema vezanega ekstrema z linearno namensko (kriterialno) funkcijo, kjer pogoje (omejitve) sestavlja sistem linearnih enab oz. neenab z dodatno zahtevo, da imajo spremenljivke nenegativno vrednost. 1 Loimo dve vrsti linearnega programiranja: za minimum, ali za maksimum namenske funkcije. 8. Linearni program za minimum (oz. maksimum) namenske funkcije v obliki neenab oz. enab MIN: (za max sta le neenaaja obrnjena: ) Doloiti je treba vrednosti spremenljivk x1, x2, …, xs, ki zadoajo pogojem nenegativnosti in a11x1 + ...+ a1s xs b1 linearnim enabam: ... tako, da ima namenska (oz. kriterialna funkcija am1x1 + ...+ amxs bm f (x1,...,xs ) = c1X 1 + ...+ cs xs minimum. m,n sta poljubni naravni tevili aij, cj poljubna realna tevila bi poljumna nenegativna tevila 9. Linearni program za minimum (oz. maksimum) v matrini obliki a11 ... a1s x1 b1 c = c1 ... cs A'= : ... : x= : b= : am1 ... ams xs bm Doloiti je treba vektor x, ki zadoa pogoju nenegativnosti in matrini neenabi A'x b, tako, da ima namenska funkcija f(x)=cx minimum. 10. Linearni program za minimum (oz. maksimum) v vektorski obliki Uvedemo vektorje: b1 a11 a1s 1 s 0 p = : , p = : , ……. , p = : . bm am1 ams Doloiti je treba vrednosti spremenljivk x1, x2, … xs, ki zadoajo pogojem nenegativnosti in xi p1 + ...+ xs ps p0 tako, da ima namenska funkcija f(x1,x2,…,xs)= vektorski neenabi c1x1+c2x2+…+csxs minimum. 11. Dopolnilne spremenljivke (neenabe spremenimo v enabe) kje pridejo v potev (pri max jih ni); navidezno spremenijo program; pripadajoi umetni vektorji tvorijo st. bazo… …uvedemo, ko moramo pogoje, ki nastopajo v obliki neenab spremeniti v enabe, da bi linearni program postal primeren za numerino reevanje. Neenabi ai1 + ...+ ais xs b1 dodamo e en len, da dobimo enabo: ai1 + ...+ ais xs xs+i = b1 Tako dobimo nov program z pogojnimi enabami namesto neenab. Nato moramo za zaetek numerinega reevanja v vsako pogojno enabo vstaviti e po eno umetno spremenljivko (s tem smo lin. progr. spremenili le navidezno, saj umetna spremenljivka lahko zavzema le vrednost 0 in tako optimalna reitev ostane nespremenjena. V programu za maksimum pa umetnih spremenljivk ni treba uvajati, saj njihovo vlogo sprejemajo dopolnilne spremenljivke. Umetni vektorji so enaki standardni bazi. 12. Umetne spremenljivke Z njimi dobimo izhodino nedegenirano bazno mono reitev razirjeno formulacijo problema. 13. Strukturni vektorji, dopolnilni vektorji, umetni vektorji 2 Linearen program v vektorski obliki: b1 p = : bm 0 a11 p = : am1 1 a1n p = : amn n Doloiti je treba vrednosti spremenljivk x1,x2,...xn, ki zadoajo pogojem xi 0(i = 1,2,...,n) in vektorski enabi x1 p1 + ...+ xn pn = p0 , tako, da ima namenska funkcija f (x1,...,xn ) = c1x1 + ...+ cn xn minimum. Vektorje p1, ..., ps imenujemo STRUKTURNI vektorji. Vektorje ps+1, ..., ps+m imenujemo DOPOLNILNI vektorji in ti so enaki vektorjem –e1, -e2,...,-em. To so torej z (-1) pomnoeni vektorji standardne baze v vektorskem prostoru m-teric Vm. Vektorje ps+m+1, ..., pn pa imenujemo UMETNI vektorji in so enaki standardni bazi e1,...,em vektorskega prostora Vm. 14. Mnoica K vseh monih reitev linearnega programa (opredelitev in lastnosti) polieder; optimalna reitev se bo pojavila vsaj v eni reitvi tega konveksnega poliedra Mona reitev je reitev, ki zadoa pogojem nenegativnosti in pogojni enabi Ax=b, ne glede na vrednosti, ki jo ima zanj namenska funkcija. Za mone reitve veljajo izreki: I. Mnoica K vseh monih reitev linearnega programa je konveksna. Vzemimo, da je konveksna mnoica monih reitev linearnega programa K neprazna in omejena (z konno mnogo hiperravninami, zato je ta mnoica konveksni polieder). II. Med ekstremnimi tokami konveksnega poliedra K monih reitev lin. progr. obstaja vsaj ena, v kateri ima namenska funkcija minimum. (e je le ena, je ta toka njegova ekstremna toka, e pa ima minimum v ve poliedrovih tokah, tedaj ima minimum v ve ekstremnih tokah in tudi v kakih neekstremnih tokah.) III. e ima namenska funkcija minimum v ve ekstremnih tokah konveksnega poliedra K, ima minimum tudi v vseh tokah poliedra, ki so konveksne linearne kombinacije teh ekstremnih tok (reitev je konveksni polieder: mnoica monih+optimalnih reitev). !!!!Ker je vsaka optimalna reitev linearnega programa konveksna linearna kombinacija samo tistih ekstremnih tok konveksnega poliedra monih reitev, ki so optimalne, je mnoica optimalnih reitev tudi konveksni polieder. IV. +3-je izreki za bazne mone reitve e obstaja kak km linearno odvisnih vektorjev p1,…,pk tako da velja vektorska ena ba x1p1+…+xkpk=p0, je ustrezna bazna mona reitev x=[x1, x2,…,xk,0,0,…,0]T ekstremna to ka konveksnega poliedra monih reitev V. vektorji p1,…,pk (km), ki ustrezajo kako bazni moni reitvi, ki je ekstremna to ka konveksnega poliedra monih reitev, so linearno neodvisni. ekstremna to ka konv. poli. K ima kve jemu M pozitivnih koeficientov/koordinat. VI. Vsaki bazni moni reitvi lin. progr., ki je ekstremna to ka konveksnega poliedra monih reitev, je mono med vektorji p1,…,pn prirediti natan no m linearno neodvisnih vektorjev (bazo vektorskega prostora Vm) Vsaka mona reitev ima po n komponent, kjer je n=s+m+m. Mona reitev je nebazna, e ima ve, kot m pozitivnih komponent in je bazna, e ima m ali manj pozitivnih komponent. Bazna reitev je nedegenerirana, e ima natanno m pozitivnih komponent in degenerirana, e ima manj kot m pozitivnih komponent. Mona reitev x je toka (ali vektor) vektorskega prostora V. 15. Mnoica optimalnih reitev linearnega programa (opredelitev in lastnosti) vsaj v eni to ki konveksnega poliedra bo reitev (ali pa v ve ekstremnih to kah) – e sta dve, potem je reitev tudi vsaka linearna kombinacija teh dveh to k Optimalna mona reitev je reitev, ko vektor x zadoa vsem pogojem in ima hkrati zanj namenska funkcija optimalno vrednost. 3 16. Grafino reevanje linearnega programa narii primer, e imamo 2 spr. vsak pogoj je ena polravnina;narii namensko funkcijo + vzporedni premik, dokler nima e kakne skupne toke z reitvami (ali vogal, ali se prekriva s premico in bo reitev daljica) 17. Metoda simpleksov (opis) gre za zamenjavo v bazi do naslednje… ko bo mona reitev bolja MS je najbolj splona metoda za numerino reevanje problemov LP. Izhajamo iz LP po uvedbi dopolnilnih in umetnih spremenljivk. Najprej vzamemo neko znano bazno mono reitev, ki je ekstremna toka konveksnega poliedra K monih reitev; vsaki od teh baznih monih reitev pa ustreza doloena baza vektorskega prostora Vm. V bazi zamenjamo kak njen vektor s kakim vektorjem, ki ga e ni, tako, da dobimo novo bazo, njej ustrezno novo ekstremno toko in njej ustrezno novo vrednost namenske funkcije. e je nova vrednost manja od prejnje, dobimo boljo reitev linearnega programa. Izberemo tako zamenjavo baznih vektorjev, da obstojeo mono lin. reitev izboljamo. Postopek ponovimo tolikokrat, da dobimo po iterativnih izboljavah mone reitve optimalno reitev. 18. Prisojene cene (Zj – vrednost vektorja v bazi) Zj vrednost vektorja, izraenega v enem iteracijskem koraku, na koncu pa … + za umetne !!! + za dopolnilne spremenljivke !!! Reitev primarnega programa sta prisojeni ceni, ki ustrezata prvi moni bazni reitvi Prisojene cene so tevila zj, ki so obiajno v spodnji vrstici tabele: zj pomeni vrednost vektorja pj v primeru, ko je njegov sestav izraen z baznimi vektorji. Prisojena cena pomeni realno vrednost sestavin vektorja pj, torej npr. tablete Tj. e je trna cena kakega vektorja oz. tablete veja od ustrezne prisojene cene, ta vektor oz. tableta ne nastopi v optimalni reitvi. 19. Dispozicija raunanja po metodi simpleksov (v koraku) 1) matematini zapis lin. programa 2) dopolnilne 3) 1 mona reitev; zamenjava v bazi 1) LP formuliramo v MA obliki, s pogoji nenegativnosti, s pogojnimi lin. neenabami ali enabami in z linearno namensko funkcijo. 2) pogojne linearne neenabe in namensko funkcijo z dopolnilnimi spremenljivkami. 3) e gre za minimum namenske funkcije, uvedemo e umetne spremenljivke, sicer pa ne. 4) Sestavimo tabelo; pri tem pazimo, kateri vektorji so bazni: e gre za minimum namenske funkcije, so bazni tisti vektorji, ki ustrezajo umetnim spremenljivkam; pri max pa tisti, ki ustrezajo dopolnilnim spremenljivkam. 5) V zadnjo vrstico tabele zapiemo koeficiente am+1,j=zj-cj (j=0,1,...n) 6) Doloimo vektor pk, ki ga uvedemo v novo bazo: • e gre za min namenske funkcije, doloimo v zadnji vrstici najvejo pozitivno vrednost razlike zj-cj zk-ck=max(zj-cj ) Tej najveji vrednosti ustreza vektor pk, ki ga uvedemo v novo bazo. • !!!!e gre za max nam. funkcije, doloimo v zadnji vrstici po absolutni vrednosti najveje negativno tevilo zj-cj zk-ck=max I(zj-cj )I za zj-cj < 0 temu tevilu ustreza vektor pk, ki ga uvedemo v novo bazo. 7) Doloimo vektor pr, ki ga odstranimo iz baze. Vsako komponento vektorja p0 delimo z istoleno komponento vektorja pk – pri tem upotevamo samo pozitivne komponente vektorja pk. Najmanji od x x teh ulomkov : r = min i (ark>0) doloa vektor pr, ki ga odstranimo iz prvotne baze. i ark aik 8) Vse koeficiente v tabeli transformiramo po transformacijskem zakonu: R'=SR 9) Po transformaciji dobimo novo mono reitev in njej ustrezno tabelo. 10) Ugotovimo, ali je mogoe novo mono reitev e izboljati. Izboljava je mona: 4 • e je v primeru min. namenske funkcije e kak koeficient v zadnji vrstici pozitiven • e je v primeru max. namenske funkcije e kak koeficient v zadnji vrstici negativen 11) e je izboljava mona, iteracijo ponovimo, e pa izboljava ni mona, je dobljena mona reitev optimalna. 20. Interpretacija rezultatov linearnega programa (izpisa v POM-u) prisojene cene … 21. Primarni in dualni program (priredba in povezanost reitev) kako so reitve povezane: min-max Vsakemu linearnemu programu je mogoe prirediti drug linearen program. Oba programa sta tako tesno povezana, da lahko izberemo optimalno mono reitev prvega br, ko poznamo optimalno mono reitev drugega. Prvotni linearni program se imenuje primarni program, njemu prirejeni pa dualni program. Programu na min torej priredimo program za max in obratno. Primarni linearni program doloiti je treba vrednosti spremenljivk x1, x2…,xs, ki zadoajo pogojem neengativnosti in linearnim neenabam, tako da ima namenska funkcija min. Dualni program doloiti je treba vrednosti spremenljivk y1,y2,…,ym, ki zadoajo pogojem nenegativnosti in linearnim neenabam, tako da ima namenska funkcija max. e ima eden od obeh linearnih programov konno optimalno mono reitev, jo ima tudi drugi in ekstremni vrednosti obeh namenskih funkcij sta enaki. e pa eden od programov nima konne optimalne reitve, je drugi protisloven in nima nobene mone reitve. 22. Normativna teorija odloanja, opisna teorija odloanja Normativna teorija odloanja govori o tem, kako naj racionalni odloevalec oceni zaelenost posledic preko zastavljenih ciljev in o tem, za katero izmed zastavljenih alternativ se odloiti, potem ko je e opredelil svoj model odloanja. Opisna teorija odloanja pa ugotavlja, kako se ljudje v resnici odloajo. Izkae se, da je odloanje posameznikov pogosto precej drugano od 'racionalnega' (tistega, ki ga dani situaciji priporoa normativna teorija). Med drugim se ukvarja z vpraanji, v kolikni meri je treba te razlike pripisati dejavnikom, ki jih model ni zajel in v kolikni meri iracionalnosti odloevalcev. 23. Stroga preferenna relacija in njene lastnosti Odloevalec zna svoje elje izraziti s pomojo neke relacije. ARB A>B (kadar je za odloevalca alternativa A bolj zaelena kot alternativa B). Preferenna relacija ima naslednje lastnosti: • Aksiom A asimetrinost: e za alternativi A in B velja A>B, potem ni res, da je B>A • Aksiom T tranzitivnost: e za alternative A, B in C velja A>B in B>C, potem velja tudi A>C Strogo-delna urejenost relacija na neki mnoici, ki je asimetrina in tranzitivna 24. Indeferenna relacija in njene lastnosti …relacija med A in B, kadar med njima ne velja niti A>B niti B>A; odloevalec se lahko odloi, da toda zaveda se njune enakovrednosti. Na ta nain je indiferenca porojena iz stroge preferenne relacije. Lastnosti indirerenne relacije: • Refleksivnost: za vsako alternativo A je A~A • Simetrinost: e za alternativo A in B velja A~B, potem je tudi B~A Radi bi, da bi bila tudi ta relacija tranzitivna, kar v splonem e ne sledi iz do sedaj privzetih aksiomov. Aksiom 1 tranzitivnost indiference: e za alternative A, B in C velja A~B in B~C, potem velja tudi A~C. Stroga preferenna relacija in iz nje porojena indiferenna relacija imata naslednje lastnosti: • 5 I. e za neke alternative A, B in C velja A~B in B>C, potem velja tudi A>C. II. e za neke alternative A, B in C velja A>B in B~C, potem velja tudi A>C. e veljajo aksiomi A, T, I ekvivalenna relacija (ki je tudi indiferenna relacija). Vedno pa velja ena relacija: ali B>A ali A>B ali A~B 25. ibka preferenna relacija in lastnosti L1, L2, L3, L4 AB A je vsaj tako dober kot B; odnosno velja, da B ni bolji od A. Poljubna 2 objekta sta primerljiva po tej relaciji stroga sovisnost/univerzalna primerljivost. …ima naslednje lastnosti: L1~ Univerzalna primerljivost: za poljubni alternativi A in B velja vsaj ena od mo nosti AB ali BA L2~ Tranzitivnost: e za neke alternative A, B in C velja AB in BC, potem velja tudi AC. L3~ Konsistentnost indiference s ibko preferenco: za poljubni alternativi A in B velja A~B natanko tedaj, kadar velja AB in BA. L4~ Konsistentnost stroge preference s ibko preferenco: za poljubni alternativi A in B velja AB natanko tedaj, kadar ni res, da je B>A. e na neki mo nosti obstaja relacija, ki je univerzalno primerljiva in tranzitivna, pravimo, da ta relacija to mno ic ibko ureja. 26. Ordinalna vrednostna funkcija (opredelitev, obstoj in enolinost) ibka preferenna relacija bo izra ena na ekvivalenten nain s pomojo ordinalnih vrednostnih funkcij, ki jih bomo vpeljali. Omejili se bomo le na primer, ko imamo konno mnogo alternativ. Zgled 2.3.1: Direktor eli zaposliti praktikanta. Izbira med A, B, C in D. AD, DB, AB, AC, AD, CB, CD Asimetrinost je vidna v tabeli (glede na diagonalo). Tranzitivnost: s permutacijo elementov mno ice dose emo, da so krogci pod diagonalno, kri ci pa nad njo. kandidati so razvreni v 3 razrede: A; C in B,D. Indiferenni razredi {A}, {C}, {B,D} Lastnosti indiferenni razredi imajo naslednje lastnosti: • Za poljubni 2 alternativi A in B velja A~B natanko tedaj, kadar je I(A)=I(B) • Za poljubni 2 alternativi A in B je bodisi I(A)I(B)=0 bodisi I(A)=I(B) • e za neki alternativi A in B velja A>B in je CI(A) ter DI(B) potem je tudi C>B Mno ica alternativ razpade an paroma disjunktne indiferenne razrede, med katerimi obstaja relacija stroge preference >, ki jo simbolino zapiemo I(A)>I(B). Realna funkcija r je ordinalna vrednostna funkcija, ki se ujema s ibko preferenno relacijo Z, e zanjo velja r(A)v(B) natanko tedaj, ko velja AB V zgledu smo dobili 3 indif. razrede, ki so opisani na naslednji nain {A}>{C}>{B,D}. Podobno lahko definiramo indif. razrede vsake ibke preferenne relacije, kar bomo storoili s pomojo ordinalne vrednostne funkcije. Imejmo neko realno funkcijo v definiramo na alternativah. Zanjo reemo, da je ordinalna vrednostna funkcija, ki se ujema s ibko preferenno relacijo Z, e zanjo velja: v(A)v(B) natanko takrat, ko je AB. Predstavitev ibke preferenne relacije z ordinalno vrednostno funkcijo ima praktine prednosti, saj so nam realna tevila zelo blizu. Ima pa tudi konceptualne prednosti, saj je celotna relacija predstavljena s konno mnogo tevili. Pojem ordinalna pomeni, da je pomembno le to, katera vrednost je veja in katera manja, ne smemo pa jih setevati, raunati,… 27. Intervalna vrednostna funkcija (aksioma U1 in U2) 6 Preferen ne relacije povedo le katera alternativa je bolj zaelena, ne pa v kakni meri. Za izmero tega vpeljemo pojem zamenjave. (AB) pomeni, da alternativo B zamenjamo z A. Poleg ibke preference in alternativah vpeljemo e ibko preferenco na zamenjavah. Takrat velja (AB)z(CD), da je zamenjava B z A odlo evalcu vsaj tako ve kot zamenjava D s C. Dobro je imeti vrednosti funkcije v, ki se ujema z obema relacijama. Aksiom U1: ujemanje z relacijo na alternativah. Za poljubni alternativi A in B velja AB natanko takrat, ko v(A)v(B) Aksiom U2: ujemanje z relacijo na zamenjavah. Za poljubne alter. A, B, C, D naj velja (AB) z(CD) natanko takrat, ko velja v(A)-v(B)v(C)-v(D) Realno funkcijo na alternativah, ki izpolnjuje aksiom U1 samo poimenovali ordinalna vrednostna funkcija. Kadar funkcija v izpolnjuje oba aksioma U1 in U2, jo imenujemo intervalna vrednostna funkcija. 28. Zadostni pogoji za obstoj intervalne vrednostne funkcije (P1, P2, P3, P4, P5, R1, R2) P1: relaciji na alternativah in z na zamenjavah sta univerzalno primerljivi in tranzitivni, zato pravimo, da sta ibki preferen ni relaciji na alternativah oz na zamenjavah. P2: za poljubni alternativi A in B velja AB natanko tedaj, ko velja (AB) z (CD) P3: za poljubne alternative A, B, C, D velja (AB) z (CD) natanko tedaj, ko velja (DC) z (BA) P4: za poljubne alt. A, B, C, D, E, F iz dejstva, da je (AB) z (DE) in (BC) z (EF) SLEDI, da je (AC) z (DF). P5: za poljubno alt. B v standardnem zaporedju velja, da obstaja kve jemu kon no mnogo lenov Ak z lastnostjo BzAk Pogoja reljivosti: R1: za poljubne alt. B, C, D obstaja taka alt. A, da velja (AB) ~z (CD) R2: za poljubni alt. A, C obstaja taka alt. B, da velja (AB) ~z (BC) e ibki preferen ni relaciji zado ata zadostnim pogojem od P1 do P5 in pogojema reljivosti R1, R2, tedaj obstaja intervalna vrednostna funkcija, ki se z njima ujema. 29. Pozitivna afina transformacija intervalne vrednostne funkcije Funkcije oblike f ( x) = x + pri > 0 imenujemo pozitivna afina transformacija. e sta poleg zadostnih pogojev od P1 do P5 izpolnjena e pogoja reljivosti R1 in R2, potem je intervalna vrednostna funkcija enoli na do pozitivne afine transformacije. Pravimo, da so pozitivne afine transformacije dopustne transformacije intervalnih vrednostnih funkcij. 30. Tabela odloanja …je na in shemati nega prikazovanja rezultatov predhodne analize odlo anja. Vse dejavnike, ki vplivajo na opazovani pojav, razdelimo na 2 skupini: (1) dejavniki, na katere lahko odlo evalec vpliva. Med te dejavnike opredelimo alternative/izbire. (2) v (2) pa so zunanji dejavniki (stanja narave), na katere ne moremo vplivati, imajo pa posledice na rezultat njegovih odlo itev. Ti dejavniki pa dolo ajo stanja. Alternative morajo biti opredeljene tako, da so izbire lahko le izklju ujo e in vseobsegajo e (ni alternativ, ki ne bi bile vklju ene v model). Pri dolo itvi stanj pa morajo biti upotevani vsi tisti dejavniki opazovanega problema odlo anja, na katere odlo evalec nima vpliva. Stanja morajo biti dolo ena tako, da se zgodi natanko eno stanje. Stanje, ki se v resnici zgodi, imenujemo resni no stanje. V teoriji verjetnosti re emo, da tvorita mnoica alternativ kot mnoica stanj popolni sistem dogodkov. V tabeli odlo anja so alternative/izbire vrstice tabele; stanja pa so stolpci. Za vsako alternativo in vsako stanje vpiemo v tabelo posledico te alternative v tem stanju. Vijposledice alternative Ai, ko se zgodi Sj, za i=1,2,…,m in j=1,2,…,n (predpostavljamo, da so tevila intervalne vrednostne funkcije. Posledice so odvisne od sprejetih odlo itev in stanja, ki dejansko nastopi. Izkaejo se lahko tevilsko ali opisno. 7 31. Odloanje v gotovosti, odloanje s tveganjem, odloanje v popolni negotovosti Kadar je stanje eno (n=1), je odloanje bolj enostavno, kot v primeru n>1, saj odloevalec tono ve posledice odloitve. odloanje v gotovosti. V splonem je stanj ve in tvorijo popoln sistem dogodkov. V primeru, da je odloevalec pozna verjetnost stanj (P(sj)), pravimo, da gre za odloanje s tveganjem. Ker menimo, da so posledice odloitev izraene z vrednostmi, dobljenimi s pomojo intervalne vrednostne funkcije, lahko n izraunamo priakovano vrednost i-te alternative Ai = Vij P( s j ) . j =1 Obiajno je v tem primeru vredn. funk. Neka uporabnostna funkcija (priakovana vrednost je priakovana uporabnost). V tem primeru se odloimo za tisto alternativo, pri kateri je ta priakovana uporabnost najveja. Najteji pa so problemi odloanja v popolni negotovosti. V tem primeru je stanj ve in o tem, katero stanje se bo uresniilo, nimamo nobenih informacij (poznamo 4 kriterije za odloanje): 32. Waldov kriterij maksimalno minimalnega vraila Poiemo v vsaki vrstici tabele odloanja (za vsako alternativo) element z najmanjo vrednostjo (vrailom). Potem pa se odloimo za tisto vrstico/alternativo, pri kateri je ta element najveji. To je najveje izmed najmanjih vrail oz maksimalno minimalno vrailo. Stopnja varnosti alternative Ai.: pesimistien (upoteva le, kar je slabega) S i = min Vij S k = max S i j =1,..., m i =1,..., m 33. Hurwiczev kriterij (krit. S Hurwiczovim optimistino pesimistinim indeksom) Minimizirati najvejo izgubo je preve pesimistino, max najveji dobiek pa je preve optimistino. Odloevalec izbere svoj optimalni pesimistini indeks [0,1] , s katerim se bo postavil nekam med oba ekstrema. e je Oi najveji, Si pa najmanji element i-te vrstice tabele odloanja, potem odloevalec po H kriteriju maksimizira S i + (1 )Oi po vseh i (alternativah). Stopnja optimizma alternativ Ai: Oi = max Vij . Pri danem indeksu bo po H izbrana alternativa Ai, j =1,..., n pri katerem je S K + (1 )Ok = max[S i + (1 )Oi ] . i =1,..., m H kriterij ima prednost pred W, da lahko pri njegovi uporabi s spreminjanjem optimistino pesimisstinega indeksa vplivali na to, v koliki meri je optimistien oz pesimistien. 34. Savagev kriterij minimalno maksimalnega obalovanja Vsaki tabeli odloanja priredimo tabelo obalovanj po pravilu, da vsak 'dobiek' v nekem okencu prvotne tabele odloanja odtejemo od najvejega 'dobika' v istem stolpcu. Tako dobljeno tevilo pomeni, koliko bi izgubili, e bi se odloili za alternativo, ki jo doloa ta vrstica in bi se zgodilo stanje, ki ga doloa ta stolpec, v primerjavi z najvejim monim dobikom istega stanja. Obalovali bomo torej zamujeno prilonost (razlika med najvejim monim dobikom v tem stanju in naim dejanskim dobikom). Wi = max Vij najveja izmed vrednosti stanja Sj. Najveje obalovanje: i =1,..., m i = max rij izberemo alternativo Ak, pri kateri k = min i j =1,..., n i =1,..., m 35. Laplaceov kriterij enakega verjetja Izraunamo povpreje vsake vrstice tabele odloanja, potem pa se odloimo za vrstico/alternativo, pri kateri je to povpreje max. To je verjetno najstareji kriterij odloanja, zasnovan na predpostavki, da je to, da o stanju niesar ne vemo, enakovredno s tem, da so vsa stanja enako verjetna. Kriterij: 1 n t i = Vij izberemo alternativo Ai, kjer je t , = max t i i =1,..., m n j =1 36. Aksiomi racionalnega odloanja, lastnosti tirih kriterijev 8 Lastnosti, za katere elimo, da jih izpolnjujejo kriterij odloanja ~ aksiomi racionalnega odloanja: 1) Razvrstitev alternativ: kriterij razvrsti alternative od najbolj do najmanj zaelene, pri emer dopua monost, da je ve alternativ razvrenih na isto mesto. 2) Neodvisnost od tabele: e stanja ali alt. vpiemo v tabelo v kakem drugem vrstnem redu, potem mora dati kriterij smiselno isti rezultat. 3) Neodvisnost od vrednostne lestvice: e vsem vrednostim v tabeli pritejemo isto konstanto ali jih pomnoimo z isto pozitivno konstanto, potem mora dati kriterij iste rezultate 4) Stroga dominantnost: e je pri dveh alt./vrsticah tabele vrednost v eni vrstici veja od vrednosti v drugi in v vseh stolpcih hkrati, potem mora kriterij razvrstiti prvo od teh dveh alternativ pred drugo. 5) Neodvisnost od irelavantnih alternativ: dve tabeli odloanja se razlikujeta le po tem, da je v drugi ena alternativa ve kot v prvi. Tedaj mora kriterij odloanja rangirati v obeh primerih vse ostale alternative enako. 6) Neodvisnost od pritevanja konstante k stolpcu: e k vsem vrednostim nekega stolpca tabele odloanja pritejemo isto konstanto, potem mora kriterij rangirati alt. enako kot prej. 7) !!! Neodvisnost od permutacije vrstice: e so v neki tabeli v 2 vrsticah iste vrednosti, eprav v prenesenem/permutiranem vrstnem redu, mora kriterij odloanja obe vrstici rangirati enako. Neodvisnost od ponovitve stolpca: e v neki tabeli enega od stolpcev ponovimo, mora kriterij vse alt. rangirati enako kot prej. Prvih 6 lastnosti je primernih za vsako odloitveno pravilo, ne glede ali se uporablja v popolni negotovosti ali ne. 7 in 8 predstavljata poizkus karateriziranja okoliin popolne negotovosti. Vsi 4 kriteriji zadoajo prvim 4 aksiomom.Vendar Savagev ne izpolnjuje 5, 7; Hurwiczev ne 6; Waldov ne 6; in Laplacev ne 8 37. Ali obstaja kriterij odloanja v popolni negotovosti, ki zadoa vsem 8 aksiomom racionalnega odloanja? (izrek 3.4.1) ne Izrek 3.4.1: V popolni negotovosti ne obstaja krit., ki bi zadoal vsem 8 aksiomom rac. odloanja. Ta rezultat nas vzpodbudi k premisleku o pravilnosti privzetka vseh 8 lastnosti/aksiomov. Tudi po ponovnem premisleku prvi 4 aksiomi niso vpraljivi. ele pri 5. se prvi pojavijo dvomi 38. ENOSTAVNA LOTERIJA, SESTAVLJENA LOTERIJA, POMONI EKSPERIMENT: Vpeljimo pojem loterije (v ojem pomenu besede). To bo vsaka porazdelitev verjetnosti po konno mnogo zadetkih. Mnoico vseh zadetkov bomo oznaili z X = {x1, x2, . . ., xn}. Tipino loterijo lahko predstavimo z zapisom l = <p1, x1; p2, x2; . . . ; pn, xn >, kjer je 0 <= pi <=1 verjetnost za zadetek xi za i =1, 2, . . ., n, torej je vsota vseh p-jev enaka 1. Fiksirajmo mnoico zadetkov X in si oglejmo vse loterije s temi zadetki. Loterijo na teh zadetkih, kot smo jo opredelili v ojem pomenu te besede, poimenujemo tudi enostavna loterija. Sestavljene loterije so loterije oblike <q1, l1; q2, l2; . . . ; qm, lm> kjer je qi verjetnost za zadetek li, ki pomeni vstop v loterijo li za i=1,2, . . . , m. Seveda je spet 0 <= qi <=1 za i =1, 2, . . ., m in vsota vseh q-jev je enaka 1. Tvegana alternativa. Z verjetnostjo p se zgodi posledica x1 (najbolja monost), z verjetnostjo 1- p pa posledica xn (najslaba monost). Tu opisani tvegani alternativi pravimo pomoni eksperiment in jo oznaimo z x1 p xn. 39. Uporabnostna funkcija na mnoici L (aksioma UF1, UF2) Aksiom UF1. (Ujemanje z relacijo na loterijah) Za poljubni l1 in l2 iz L velja l1>=l2 natanko tedaj, kadar je u(l1)>=u(l2). Aksiom UF2. (Formula o matematinem upanju) Za poljubno loterijo l = <p1, l1; p2, l2; . . . ; pm, lm> velja m u(l)= p i u (l i ) . i =1 9 40. Zadostni in potrebni pogoji za obstoj uporabnostne funkcije na mnoici L (VNM1, VNM2, VNM3, R, N) Aksiom VNM1. (Preference na loterijah) Mnoico L ureja neka ibka preferenna relacija. Aksiom VNM2. (Neodvisnost loterij) e za l1 L in l2 L velja l1 < l2, potem velja l1 q l3 < l2 q l3 za vsako tevilo q strogo med 0 in 1 neodvisno od izbire l3 L. Aksiom VNM3. (Arhimedska lastnost na loterijah) e za l1, l2, l3 L velja l1<l2 in l2 < l3, potem obstajata taki tevili p in q strogo med 0 in 1, da je l1 p l3 < l2 in l2 < l1 q l3 . Aksiom R. (Redukcija loterij) Izidi loterije l = <q1, l1; q2, l2; . . . ; qs, ls> naj predstavljajo vstope v loterije, ki so enakovredne naslednjim enostavnim loterijam lj = <pj1, x1; pj2, x2; . . . ; pjn, xn >, za j = 1, 2,...,s. Naj za enostavno loterijo l' = <p1, x1; p2, x2; . . . ; pn, xn > velja pi = q1 p1i + q2 p2i + + qs psi za i=1,2,...,n. Tedaj mora biti l ~ l'. Aksiom N. (Neindiferentnost) Med zadetki obstajata taka zadetka xi in xj, da je xi < xj. 41. Strateko ekvivalentni uporabnostni funkciji Naj bosta u in v uporabnostni funkciji na mnoici L. Zanju reemo, da sta strateko ekvivalentni, kadar predstavljata isto preferenno relacijo. To pomeni, za poljubni loteriji l, l' L velja, da je u(l) >= u(l') natanko tedaj, kadar je v(l) >= v(l'). Pod pogoji VNM1, VNM2, VNM3, R in N sta dve uporabnostni funkciji na L strateko ekvivalentni natanko tedaj, kadar obstaja med njima pozitivna afina transformacija. 50. Uporabnostna funkcija za dve vzajemno uporabnostno neodvisna kriterija (izrek 5.1.4.). Naj bosta X in Y vzajemno uporabnostno neodvisna in naj bo u(x, y) uporabnostna funkcija na X Y . Tedaj za poljubna x0 X in y0 Y obstaja taka konstanta k, da velja u(x, y) = u(x0, y0) + (x) + (y) + k (x) (y) (5.1.1) kjer je (x) = u(x, y0) u(x0, y0) in (y) = u(x0, y) u(x0, y0). Funkcija (x) je robna uporabnostna funkcija kriterija X, saj je strateko ekvivalentna funkciji u(x, y0) . Funkcija (y) je strateko ekvivalentna funkciji u(x0, y), torej je robna uporabnostna funkcija kriterija Y. Zapiimo zdaj izraz (5.1.1.) e nekoliko drugae. Odtejmo u(x0, y0) na obeh straneh, pomnoimo s konstanto k in pritejmo 1, da dobimo 1+ k (u(x, y) u(x0, y0)) = (1 + k (x)) (1 + k (y)). Loimo tri primere: 1. e je konstanta k strogo pozitivna, je w(x, y) = 1 + k (u(x, y) u(x0, y0)) k funkciji u(x, y) strateko ekvivalentna uporabnostna funkcija, funkcija w1(x) =1 + k(x) je robna uporabnostna funkcija kriterija X, funkcija w2(y) = 1 + k(y) je robna uporabnostna funkcija kriterija Y in velja w(x, y) = w1(x) w2(y). 2. e je konstanta k strogo negativna, je uporabnostna funkcija w(x, y) = (1 + k (u(x, y) u(x0, y0))) strateko ekvivalentna k funkciji u(x,y), funkcija w1(x) = (1 + k (x)) je robna uporabnostna funkcija kriterija X, funkcija w2(y) = (1 + k(y)) je robna uporabnostna funkcija kriterija Y in velja w(x, y) = w1(x) w2(y). 3. e pa je konstanta k enaka 0, je funkcija w(x, y) = u(x, y) u(x0, y0) 10 strateko ekvivalentna k funkciji u(x,y), funkcija w1(x) = (x) je robna uporabnostna funkcija kriterija X, funkcija w2(y) = (y) je robna uporabnostna funkcija kriterija Y in velja w(x, y) = w1(x) + w2(y). V prvih dveh primerih reemo, da je uporabnostna funkcija multiplikativna, v tretjem pa, da je aditivna. V splonem pa lahko reemo, da je uporabnostna funkcija po dveh vzajemno neodvisnih kriterijih vselej bodisi multiplikativna bodisi aditivna. 51. Linearna vrednostna funkcija. Opredelitev in pogoji! Za vrednostno funkcijo v, definirano na P (pravokotnik v ravnini), pravimo, da je linearna vrednostna funkcija, e je oblike v(x) = w1 x1 + w2 x2 + … + wq xq, kjer so w1, w2, …, wq nenielne konstante, ki jim reemo utei. Ta funkcija opredeljuje neko preferenno relacijo na P. V tem primeru so kriteriji vzajemno preferenno neodvisni in so vse robne preferenne urejenosti spet podane z linearnimi vrednostnimi funkcijami. Rekli bomo, da se i-ti in j-ti kriterij konstantno relativno kompenzirata, e obstaja taka konstanta ij, da velja (x1, …, xi, …, xj, …, xq ) (x1, …, xi + ij k, …, xj k, …, xq ) , za vse x P in za vsak k. To pomeni: e se vrednost j-tega kriterija zmanja za tevilo k, se to zmanjanje lahko kompenzira s poveanjem vrednosti i-tega kriterija za tevilo ijk. tevilu ij reemo kompenzacijski faktor. Kompenzacijski faktorji v linearni vrednostni funkciji so ij = wj wi . 11 Zanje velja: 1. Za vse i, j je ij ji = 1. 2. Za vse i, j, l je il = ij jl . e se poljubna dva kriterija konstantno relativno kompenzirata, potem so indiferenne krivulje v dveh razsenostih vzporedne premice, v treh pa vzporedne ravnine. Eksistenco linearne vrednostne funkcije zagotavljajo naslednji trije pogoji: Aksiom LIN1. Mnoico alternativ P = q ureja ibka preferenna relacija f . ~ Aksiom LIN2. Poljubna dva kriterija se konstantno relativno kompenzirata. Aksiom LIN3. (Monotonost) Obstaja taka alternativa x f (0, 0, …, 0), da za vsak ~ y P in vsak > 0 velja y + x f y. ~ Izrek 5.2.1. Na mnoici alternativ P = q obstaja linearna vrednostna funkcija usklajena s preferenno relacijo f natanko tedaj, kadar veljajo aksiomi LIN1, LIN2 in LIN3. ~ 52. Enolinost linearne vrednostne funkcije in standardna oblika. Linearne vrednostne funkcije so enoline do podobnostnih transformacij. Tako pravimo vsaki realni funkciji oblike (x) = x, kjer je > 0. Trditev 5.2.2. Dve linearni vrednostni funkciji q v(x) = w x i i in v(x) = q wx i i i =1 i =1 se ujemata z isto preferenno relacijo natanko takrat, kadar obstaja tak > 0, da je v(x)= v(x), oziroma ekvivalentno, kadar je wi = wi za vse i=1, 2, … , q. Z izbiro tevila lahko doseemo, da ima eden od kriterijev, recimo prvi, ute +1 ali 1. S tem pogojem je linearna vrednostna funkcija povsem enolino doloena, zato v tem primeru pravimo, da ima standardno obliko. 53. Skupinsko odloanje in drubena izbira. Gre za to, kako lahko v neki skupini ljudi iz hotenja posameznikov pridemo po im bolj pravini poti do odloitve cele skupine. • Skupine navadno odloajo preko neke vrste glasovanja. Med modeli skupinskega odloanja je najpogosteje uporabljano naelo enostavne veine. Po tem naelu pogosto odloajo poslovni odbori velikih podjetij ali drutev, uporabljajo ga v parlamentih in e marsikje. Delovanje najlaje razloimo na preprostem primeru. Zaradi enostavnosti izraanja vpeljimo nekaj pojmov. Vsem posameznikom v skupini, ki o em odloa, recimo volivci. • Druga monost je, da za poljubni dve alternativi obvelja relacija za skupino natanko tedaj, kadar glasuje za to relacijo ve lanov skupine, kot za nasprotno. Kadar obstaja alternativa, ki jo v primerjavi z vsako drugo alternativo ocenjuje veina volivcev kot boljo, ji reemo Condorcetov zmagovalec. Ta ne obstaja vselej. • Condorcetov paradoks je verjetno eden od glavnih razlogov, zakaj pojma enostavne veine navadno ne posploujemo na ta nain. Eden od nainov, ki se uporablja, je glasovanje po parih z izloanjem. To pomeni, da najprej izberemo dve alternativi ter glasujemo med njima, nato pa zavremo tisto, ki je dobila manj glasov, ''zmagovalko'' primerjamo s tretjo itd. 12 • V politi nem odlo anju so zelo popularne dvokrone volitve. V prvem krogu volitev zmaga alternativa, ki je najbolj ve ve ini, torej ve kot polovici volivcev. e take alternative ni, se v drugem krogu pomerita le tisti dve alternativi, ki sta dobili najve glasov v prvem krogu. Tudi ta metoda ni brez pomanjkljivosti • Metoda vrstinih vsot: Bordovo tetje Privzamemo, da noben volivec ni indiferenten med nobenima dvema alternativama. Ideja je v tem, da vsak volivec vse alternative, med katerimi se odlo a, uredi povrsti, pravimo, da jih rangira. Vsak rang, to je zaporedno tevilo alternative v tej ureditvi od najbolj do najmanj zaelene, pa da alternativi dolo eno tevilo to k. Ti rangi se potem setejejo in zmaga tista alternativa, ki ima najmanjo vsoto to k. Eden od glavnih problemov tega pravila je, da je njegov rezultat odvisen od izbora alternativ, ki smo jih vzeli v obzir. • Poskusi izboljanja volitvenih postopkov: Nansenov in Coombov algoritem V obzir vzamemo najprej vse mone alternative. Volivci jim dolo ijo range, nato pa v Nansenovem algoritmu izlo imo tiste alternative, ki imajo najve jo vsoto rangov, v Coombovem pa tiste, ki jih najve volivcev uvrsti na zadnje mesto. Zdaj ponovimo ta postopek na preostalih alternativah. Zmaga tista alternativa, ki ostane neizlo ena. Potem ko pridemo do "zmagovite" alternative, celotni postopek ponovimo na preostalih. Tako dobimo drugo alternativo, itd. 58.Sr funkcije veta: e pri neki alternativi B obstaja neka potencialna koalicija K volivcev, z mo jo k in neka podmnoica alternativi A', z mo jo –w(k), za katero velja, da je za vsako alternativo AA' in za vsakega volivca iK izpolnjeno a>iB, potem ima ta potencialna koalicija mo veta, s katero lahko izlo i vsako alternativo, ki ni A', med drugi tudi alternativo B. Vse tiste alternative za katere taka potencialna koalicija in taka druina alternativ ne obstajata pa uvrstimo v sr funkcije veta. Za neko funkcijo ne vemo ali ima neprazno sr, za proporcionalno funkcijo veta pase izkae, da njena sr vselej neprazna. Sr je neprazna natanko tedaj, kadar je navzgor omejena s proporcionalno funkcijo veta – le-ta je torej tudi optimalna funkcija veta, saj daje vsaki koaliciji najve je mono t. Pravic do veta, ki nas e zmerom privede do neprazne mnoice alternativ, za katere veto ni bil uporabljen. 59. in 6o. Igra: model neke konfliktne situacije/dogajanja, v katerem so posledice odvisne od odlo itev udeleencev igre, lahko tudi zunanjih dejavnikov. Privzamemo da so igralci racionalni odlo evalci. Vsak ocenjuje posledice igre s svojo preferen no relacijo. Strateka igra (mat model konfliktne situacije). Mnoica igralcev N={1,2…n}, z mnoico alternativ 1 ozna imo mnoico alternativ i-tega igralca za iN. Ko igrallec iz mnoice alternativ izbere eno Ai nastane profil izbora A=(A1,A2…An), oznaka A=(Ai)iN. Mnoica vseh profilov izbora je in je enaka kartezi nemu produktu (A1A2…An) mnoic alternativ posameznih igralcev. Igra je kon ana, ko je mnoica profilov izbora kon ana. Za vsak profil izbora A pri poljubnem iN vpeljemo oznako Ai=(Aj)jN{i}. To je zoeni profil izbora (izpustimo alternativo Ai). Profil izbora A*, za katerega velja ui(A*)>=ui(A*-i,B) za vse Bi in vsak iN, poimenujemo rvnoteni profil. Velja, da noben igralec ne more samo z zamenjavo svojega izbora alternative spremeniti tako, da bi mu bila posledica potem ve . Razlika med p. odlo anja vs. Strateke igre: v p.o. je rezultat odvisen od odlo eval eve alternative in morebitnih zunanjih dejavnikov, pri s.i. pa so posledice poleg obojega odvisne od odlo itev vseh drugih igralcev. 61. ={A1,…An} mnoica alternativ 1. igralca in ={B1,…Bn} mn. alternativ 2. igralca. Profili izbora oz. posledice so dvojice (Ai,Bj) za i=1,2…m in j=1,2…n. Za vsako posledico poznamo uporabnost posledice za prvega igralca u(Ai,Bj) in drugega –u(Ai,Bj). Uporabnosti zapiemo v uporabnostno matriko: 13 U= napii na roko Ker je za uporabnostno matriko igra natan no dolo ena, imenujemo kon ne antagonisti ne strateke igre med dvema igralcema kar matrine igre. Operacijske raziskava; odgovori na vpraanja 62 – 65. 62. Sedlo matrine igre, uporabnost matrine igre ali vrednost matrine igre. Profil (A*, B*), pri katerem je u ( A , B ) = max min u ( Ai , B j ) = min max u ( Ai , B j ) , Ai A B j B B j B Ai A to imenujemo sedlo matrine igre. Primer: Matri na igra je podana s pla ilno matriko 2 1 5 2 6 1 . 3 5 4 V tej igri so dobi ki prvega igralca hkrati izgube drugega igralca. Vsak od teh igralcev ima na izbiro tri alternative. e na primer igralec 1 izbere svojo tretjo alternativo (tretjo vrstico) in igralec 2 izbere svojo drugo alterantivo (drugi stolpec), pla a drugi igralec prvemu 5 d.e. Uporabimo Waldov kriterij za prvega igralca. Minimalna vrednost prve vrstice je 1, druge 1 in tretje 3. Najve ja od teh vrednosti je 3, doseena na se i u tretje vrstice s prvim stolpcem. Uporabimo Waldov kriterij e za drugega igralca. Po stolpcih so najve je vrednosti po vrsti 3, 6 in 5. Najmanja od teh vrednosti je 3, doseena na se i u tretje vrstice s prvim stolpcem. To je torej primer igre s sedlom z vrednostjo igre 3. Z izborom tretje vrstice si igralec 1 zagotovi, da bo dobil vsaj 3 d.e., z izborom prvega stolpca pa si igralec 2 zagotovi, da ne bo izgubil ve kot 3 d.e. V tej igri torej igralca zlahka najdeta optimalni na in igre, to je ravnoteni profil. Kadar ima matri na igra sedlo (A*,B*), imenujemo vrednost u(A*,B*) uporabnost matrine igre ali vrednost matrine igre. 63. Izrek o minimaksu. Pokazali smo, da je vsak ravnoteni profil matri ne igre tudi njeno sedlo. Izkae se, da to velja tudi v obratni smeri. Temu spoznanju pravimo izrek o minimaksu: Izrek 2.1. Za matri no igro velja: 1. e ima igra ravnoteni profil, potem je vsak njen ravnoteni profil tudi njeno sedlo. 2. e ima igra sedlo, potem je vsako njeno sedlo tudi njen ravnoteni profil. 64.Meana raziritev matrine igre. Nova igra je v nekem smislu raziritev prvotne matri ne igre. Prvotni alternativi prvega igralca AiA ustreza med meanimi strategijami ''neprava'' porazdelitev, opredeljena s pi = 1 in pj = 0 za j i. Tem strategijam pravimo iste strategije za razliko od ''resni no'' meanih strategij. Analogno vpeljemo pojem istih strategij drugega igralca. Tako smo mnoico alternativ A razirili do mnoice novih alternativ prvega igralca P(A), mnoico B pa do mnoice P(B). Funkcijo u, ki je kot uporabnostna funkcija prvega igralca definirana na A x B, smo razirili do funkcije u(p, q) = E(u | p,q), ki je definirana na P(A)xP(B). Na istih strategijah se uporabnost profila izbora ujema z uporabnostjo neposrednega izida. Nova strateka antagonisti na igra je torej raziritev prvotne, zato ji pravimo meana raziritev matrine igre. 14 65. Strateki ravnoteni profil, izrek 2.3. oz. 7.5. Poljubni matrini igri smo priredili njeno meano raziritev. e ima ta meana raziritev ravnoteni profil, ga imenujemo strateki ravnoteni profil matrine igre. Izrek 2.3. Vsaka matrina igra ima strateki ravnoteni profil. Dokaz. Lema (pomoni izrek) 2.2. 1. Vsaka linearna preslikava je hkrati konveksna in konkavna funkcija. 2. Uporabnostna funkcija u(p, q) = pTU q je zvezna, kvazikonkavna in kvazikonveksna. 3. Mnoica P(A) je neprazna, konveksna, zaprta in omejena podmnoica Ñm. Mnoica P(B) je neprazna, konveksna, zaprta in omejena podmnoica Ñn. Po tretji toki leme sta mnoici alternativ obeh igralcev v meani raziritvi matrine igre neprazni, konveksni, zaprti in omejeni podmnoici Ñm oziroma Ñn. Po drugi toki leme je uporabnostna funkcija prvega igralca u kvazikonkavna in zvezna. Uporabnostna funkcija drugega igralca je enaka -u in je prav tako zvezna. Ker je po drugi toki leme funkcija u tudi kvazikonveksna, je funkcija -u kvazikonkavna. Zato lahko uporabimo izrek 1.1, po katerem ima meana raziritev obravnavane igre ravnoteni profil. 15
© Copyright 2024