Dualnost u linearnom programiranju. Vrste ravnoteže: Nashova ravnoteža, Stekelbergova, Pareto-optimalna ravnoteža, ravnoteža dominantnih strategija Koji je optimalni mehanizam za pronalaženje rješenja ravnoteže

Osnovne definicije teorije dualnosti.

Svaki problem linearnog programiranja može se povezati s drugim problemom linearnog programiranja. Kad se jedan od njih riješi, automatski se rješava i drugi problem. Takvi se zadaci nazivaju međusobno dualnim. Pokažimo kako za zadani problem (nazvat ćemo ga izvornim) možemo konstruirati njegov dual.

Razmotrimo problem planiranog outputa.

F=3 x 1 + 5x 2 + 4x 3 + 5x 4 → maks.
5x 1 +0,4x 2 +2x 3 +0,5x 4 ≤400
5x2 +x3 +x4 ≤300
x 1 + x 3 + x 4 ≤100
x 1 ≥0, x 2 ≥0, x 3 ≥0, x 4 ≥0

Opća pravila za sastavljanje dualnog problema:

Ravno dual
Ciljna funkcija (maks.) Desna strana ograničenja
Desna strana ograničenja Ciljna funkcija (min.)
A - matrica ograničenja A T - matrica ograničenja
i -to ograničenje: ≤ 0, (≥ 0) Varijabla y i ≥ 0, (≤ 0)
i -to ograničenje: = 0 Varijabla y i ≠ 0
Varijabla x j ≥ 0 (≤ 0)
Varijabla x j ≠ 0 j-to ograničenje: = 0
max → min
Ravno dual
Ciljna funkcija (min.) Desna strana ograničenja
Desna strana ograničenja Ciljna funkcija (maks.)
A - matrica ograničenja A T - matrica ograničenja
i -to ograničenje: ≥ 0, (≤ 0) Varijabla y i ≥ 0, (≤ 0)
i -to ograničenje: = 0 Varijabla y i ≠ 0
Varijabla x j ≥ 0 (≤ 0) j -to ograničenje: ≤ 0 (≥ 0)
Varijabla x j ≠ 0 j-to ograničenje: = 0

Konstruirajmo njegov dualni problem prema sljedećim pravilima.

  1. Broj varijabli u dualnom problemu jednak je broju nejednakosti u izvornom.
  2. Matrica koeficijenata dualnog problema transponirana je u matricu koeficijenata izvornog.
  3. Stupac slobodnih članova izvornog problema je red koeficijenata za dualnu funkciju cilja. Funkcija cilja je maksimizirana u jednom problemu, a minimizirana u drugom.
  4. Uvjeti nenegativnosti varijabli izvornog problema odgovaraju nejednakostima-ograničenjima dualnog problema usmjerenim u drugom smjeru. I obrnuto, nejednakosti-ograničenja u izvorniku odgovaraju uvjetima nenegativnosti u dualu.

Uočimo da su retci matrice zadatka I stupci matrice zadatka II. Stoga su koeficijenti za varijable y i u zadatku II koeficijenti i -te nejednadžbe u zadatku I.
Rezultirajući model je ekonomski i matematički model problema dualan izravnom problemu.

Nejednadžbe povezane strelicama bit će nazvati konjugatom.
Smislena formulacija dualnog problema: pronaći takav skup cijena (procjena) resursa Y = (y 1 , y 2 ..., y m), pri kojem će ukupni trošak resursa biti minimalan, pod uvjetom da je trošak resursa u proizvodnji svake vrste proizvoda neće biti manji od dobiti (prihoda od prodaje tih proizvoda.
Cijene resursa y 1 , y 2 ..., y m u primljenoj ekonomskoj literaturi razne titule: računovodstvo, implicitno, sjena. Značenje ovih naziva je da su to uvjetne, "lažne" cijene. Za razliku od "eksternih" cijena od 1, od 2 ..., od n za proizvode, poznate, u pravilu, prije početka proizvodnje, cijene resursa y 1, y 2 ..., y m su interne. , jer se ne postavljaju izvana, već se određuju izravno kao rezultat rješavanja problema, pa se često nazivaju procjenama resursa.
Veza između izravnog i dualnog problema sastoji se, posebice, u činjenici da se rješenje jednog od njih može dobiti izravno iz rješenja drugog.

Teoremi dualnosti

Dualnost je temeljni koncept u teoriji linearnog programiranja. Glavni rezultati teorije dualnosti sadržani su u dva teorema koji se nazivaju teoremi dualnosti.

Prvi teorem dualnosti.

Ako je jedan od para dualnih problema I i II rješiv, onda je drugi rješiv, a vrijednosti funkcija cilja na optimalnim planovima su iste, F(x*) = G(g*), gdje su x *, y * - optimalna rješenja problema I. i II

Drugi teorem dualnosti.

Planovi x * i y * su optimalni u problemima I i II ako i samo ako, kada se zamijene u sustav ograničenja problema I i II, barem jedna od bilo kojeg para konjugiranih nejednakosti postane jednakost.
Ovaj temeljni teorem dualnosti. Drugim riječima, ako su x * i y * izvediva rješenja za primarni i dualni problem, i ako c T x*=b T y*, tada su x * i y * optimalna rješenja za par dualnih problema.

Treći teorem dualnosti. Vrijednosti varijabli y i u optimalnom rješenju dualnog problema su procjene utjecaja slobodnih članova b i sustava ograničenja - nejednakosti izravnog problema na vrijednost funkcije cilja ovog problema:
Δf(x) = b i y i

Rješavajući LLP simpleks metodom, istovremeno rješavamo dualni LLP. Vrijednosti varijabli dualnog problema y i , u optimalnom planu nazivaju se objektivno određene, ili dualne procjene. U primijenjenim problemima, dualne procjene y i često se nazivaju skrivene, sjenovite cijene ili procjene marginalnih resursa.

Svojstvo međusobno dualnih problema

  1. U jednom problemu traži se maksimum linearne funkcije, u drugom minimum.
  2. Koeficijenti za varijable u linearnoj funkciji jednog problema su slobodni članovi sustava ograničenja u drugom.
  3. Svaki od problema zadan je u standardnom obliku, i to u problemu maksimizacije sve nejednadžbe oblika ≤ , a u problemu minimizacije sve nejednadžbe oblika ≥ .
  4. Matrice koeficijenata za varijable u sustavima ograničenja oba problema transponiraju se jedna na drugu:
  5. Broj nejednakosti u sustavu ograničenja jednog problema jednak je broju varijabli u drugom problemu.
  6. Uvjeti za nenegativnost varijabli prisutni su u oba problema.

Teorem o ravnoteži

Zadatak 2
Sastavite dvojni zadatak za zadatak 1. Pronađite ga rješenje po teoremu o ravnoteži.
3x1 +x2 ≥12
x1 +2x2 ≥14
4x1 +11x2 ≥68

Teorem o ravnoteži . Neka su X*=(x 1 *,...,x n *) i Y*=(y 1 *,...,y n *) dopustivi dizajni para dualnih problema u simetričnom obliku. Ovi su planovi optimalni ako i samo ako su ispunjeni sljedeći komplementarni uvjeti labavosti:


Teorem 4 omogućuje nam da odredimo optimalno rješenje jednog od para dualnih problema rješavanjem drugog. Ako se ograničenje jednog problema pretvori u strogu nejednakost kada se optimalno rješenje zamijeni, tada je odgovarajuća dualna varijabla u optimalnom rješenju dualnog problema jednaka 0. Ako je bilo koja varijabla pozitivna u optimalnom planu jednog problema, tada odgovarajuće ograničenje dualnog problema je jednadžba.
Dajmo ekonomsku interpretaciju uvjeta komplementarne labavosti. Ako u optimalnom rješenju neka sirovina ima procjenu različitu od 0, tada će biti potpuno potrošena (resurs je oskudan). Ako sirovina nije u potpunosti utrošena (u suvišku), tada je njezina ocjena jednaka 0. Dakle, dobivamo da su dvojne procjene mjera oskudice sirovina. Procjena pokazuje koliko će se povećati vrijednost funkcije cilja s povećanjem zaliha odgovarajuće sirovine za 1 jedinicu. Ako je određena vrsta proizvoda uključena u plan proizvodnje, tada se trošak njegove proizvodnje podudara s troškom proizvedenog proizvoda. Ako je trošak proizvodnje proizvoda veći od troška proizvoda, tada proizvod nije proizveden.
Ako jedan od para dualnih problema sadrži dvije varijable, može se riješiti grafički, a zatim pronaći rješenje dualnog problema koristeći teoreme 3 i 4. U ovom slučaju mogu se pojaviti 3 slučaja: oba problema imaju izvediva rješenja, samo jedan ima problem izvedivih rješenja, oba problema nemaju izvediva rješenja.

Primjer 2
Sastavite dualni problem i pronađite njegovo rješenje pomoću teorema o ravnoteži
x 2 -2x 3 +2x 4 -2x 5 ≤4
-2x 1 -2x 2 +2x 3 +2x 4 +x 5 ≥2
x i ≥0, i=1,5
Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → max, ako je poznato rješenje izvornog problema: Zmax=(3;4;0;0;0).
Konstruirajmo dvostruki problem. Slažemo predznake nejednakosti s ciljem izvornog problema.

Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → maks.
Dvostruki zadatak:

W=4y 1 -2y 2 → min
Pronađimo optimalno rješenje dualnog problema pomoću teorema o ravnoteži. Zapišimo uvjete komplementarne labavosti.
y 1 (4-(x 2 -2x 3 +2x 4 -2x 5))=0
y 2 (-2-(2x 1 -2x 2 -2x 3 -2x 4 -x 5))=0
x 1 (-2y 2 -10)=0
x 2 (y 1 -2y 2 +9)=0
x 3 (-2y 1 -2y 2 +19)=0
x 4 (2y 1 -2y 2 +13)=0
x 5 (-2y 1 -y 2 +11)=0
Zamijenimo optimalno rješenje izvornog problema u sastavljeni sustav: x 1 =3, x 2 =4, x 3 =0, x 4 =0, x 5 =0.
y 1 (4-(4-2 0+2 0-2 0))=0
y 2 (-2-(2 3-2 4-2 0-2 0-0))=0 W(y 1 , y 2 , y 3)=12y 1 +31y 2 +18y 3 → maks. Prema teoremu 3 Zmax=Wmin=100000.
Konačno, Wmin=W(0; 4000/7; 32000/21) = 100000

U antagonističkoj igri prirodno je optimalnim ishodom smatrati onaj u kojem je bilo kojem igraču neisplativo odstupiti od njega. Takav ishod (x*,y*) naziva se ravnotežna situacija, a načelo optimalnosti koje se temelji na pronalaženju ravnotežne situacije naziva se ravnotežno načelo.

Definicija. U matričnoj igri s matricom dimenzija, ishod je ravnotežna situacija ili sedlo ako

U sedloj točki, element matrice je i minimum u svom retku i maksimum u svom stupcu. U igri iz primjera, element 2 a 33 je sedlo. Optimalne u ovoj igri su treće strategije za oba igrača. Ako prvi igrač odstupi od treće strategije, tada počinje pobjeđivati ​​manje od a 33. Ako drugi igrač odstupi od treće strategije, tada počinje gubiti više od a 33. Dakle, za oba igrača nema ništa bolje od dosljednog držanja treće strategije.

Načelo optimalnog ponašanja: ako u matričnoj igri postoji sedlo, tada je optimalna strategija izbor koji odgovara sedlu. Što se događa ako u igri postoji više od jedne sedlaste točke?

Teorema. Neka dvije proizvoljne sedlaste točke u matričnoj igri. Zatim:

Dokaz. Iz definicije ravnotežne situacije imamo:

Zamijenimo u lijevu stranu nejednadžbe (2.8) , a u desnu - , u lijevu stranu nejednadžbe (2.9) - , u desnu - . Tada dobivamo:

Odakle dolazi jednakost:

Iz teorema slijedi da funkcija isplate ima istu vrijednost u svim ravnotežnim situacijama. Zato se broj zove po cijenu igre. A strategije koje odgovaraju bilo kojoj od točaka sedla nazivaju se optimalne strategije igrači 1 i 2, redom. Na temelju (2.7), sve igračeve optimalne strategije su međusobno zamjenjive.

Optimalnost ponašanja igrača neće se promijeniti ako skup strategija u igri ostane isti, a funkcija isplate se pomnoži s pozitivnom konstantom (ili joj se doda konstantni broj).

Teorema. Da bi u matričnoj igri postojala sedla točka (i*,j*), potrebno je i dovoljno da maksimin bude jednak minimaksu:

(2.10)

Dokaz. Nužnost. Ako je (i*,j*) sedlasta točka, tada, prema (2.6):

(2.11)

Međutim, imamo:

(2.12)

Iz (2.11) i (2.12) dobivamo:

(2.13)

Raspravljajući na sličan način, dolazimo do jednakosti:

Tako,

S druge strane, obrnuta nejednakost (2.5) uvijek je zadovoljena, pa je (2.10) istinita.

Adekvatnost. Neka je (2.10) istinito. Dokažimo postojanje sedlaste točke. Imamo:

Prema jednakosti (2.10) nejednadžbe (2.15) i (2.16) prelaze u jednakosti. Nakon čega imamo:

Teorem je dokazan. Također je dokazano da opće značenje maximin i minimax jednaka je cijeni igre.

Proširenje mješovite igre

Promotrimo matričnu igru ​​G. Ako u njoj postoji ravnotežna situacija, tada je minimaks jednak maksiminu. Štoviše, svaki od igrača može drugom igraču dati informacije o svojoj optimalnoj strategiji. Njegov protivnik iz ove informacije neće moći izvući nikakvu dodatnu korist. Sada pretpostavimo da u igri G ne postoji ravnotežna situacija. Zatim:

U ovom slučaju minimax i maximin strategije nisu stabilne. Igrači mogu imati poticaje da odstupe od svojih razboritih strategija povezanih s mogućnošću dobivanja veće isplate, ali i rizikom od gubitka, tj. dobivanjem manje isplate od korištenja razborite strategije. Pri korištenju rizičnih strategija prijenos informacija o njima protivniku ima štetne posljedice: igrač automatski dobiva manji dobitak nego pri korištenju oprezne strategije.

Primjer 3. Neka matrica igre izgleda ovako:

Za takvu matricu, tj. ravnoteža ne postoji. Oprezne strategije igrača su i*=1, j*=2. Neka igrač 2 slijedi strategiju j*=2, a igrač 1 izabere strategiju i=2. tada će potonji dobiti isplatu od 3, što je dvije jedinice više od maksimina. Ako pak igrač 2 pogodi planove igrača 1, promijenit će svoju strategiju na j=1, a tada će prvi dobiti isplatu 0, odnosno manju od svog maximina. Slično razmišljanje može se izvesti za drugog igrača. Općenito, možemo zaključiti da uporaba avanturističke strategije u zasebnoj igrici igre može donijeti rezultat veći od zajamčenog, ali je njezina uporaba povezana s rizikom. Postavlja se pitanje je li moguće kombinirati pouzdanu opreznu strategiju s avanturističkom na takav način da povećate svoju prosječnu isplatu? U biti, pitanje je kako podijeliti dobitak (2,17) između igrača?

Pokazalo se da je razumno rješenje koristiti mješovitu strategiju, odnosno slučajan izbor čistih strategija. Prisjetite se toga strategija igrača 1 naziva se mješovita, ako izbor i-tog reda on napravi s nekom vjerojatnošću p i . Takva se strategija može identificirati s distribucijom vjerojatnosti na više linija. Pretpostavimo da prvi igrač ima m čistih strategija, a drugi igrač ima n čistih strategija. Tada su njihove mješovite strategije vektori vjerojatnosti:

(2.18)

Razmotrimo dvije moguće mješovite strategije za prvog igrača u primjeru 3: . Te se strategije razlikuju u distribucijama vjerojatnosti između čistih strategija. Ako u prvom slučaju retke matrice odabire igrač s jednakim vjerojatnostima, onda u drugom slučaju - s različitim. Kada govorimo o mješovitoj strategiji, mislimo slučajni izbor ne izbor "nasumce", već izbor temeljen na radu slučajnog mehanizma koji osigurava distribuciju vjerojatnosti koja nam je potrebna. Dakle, za provedbu prve od mješovitih strategija, bacanje novčića je vrlo prikladno. Igrač bira prvu ili drugu liniju, ovisno o tome kako ispadne novčić. U prosjeku, igrač će birati i prvi i drugi red jednako često, ali izbor u određenoj iteraciji igre ne podliježe nikakvom fiksnom pravilu i ima maksimalni stupanj tajnosti: prije implementacije nasumičnog mehanizma , nepoznato je čak i prvom igraču. Za provedbu druge mješovite strategije, mehanizam izvlačenja je dobro prilagođen. Igrač uzima sedam identičnih papirića, od kojih tri označava križićem, i baca ih u šešir. Zatim nasumce izvuče jednu od njih. Prema klasičnoj teoriji vjerojatnosti, papirić s križićem izvući će s vjerojatnošću 3/7, a čisti papirić s vjerojatnošću 4/7. Takav mehanizam izvlačenja sposoban je realizirati sve racionalne vjerojatnosti.

Neka se igrači pridržavaju mješovitih strategija (2.18). Tada je dobitak prvog igrača u jednoj iteraciji igre slučajna varijabla: v(X,Y). Budući da igrači biraju strategije neovisno jedan o drugome, tada je, prema teoremu množenja vjerojatnosti, vjerojatnost odabira ishoda (i, j) s pobjedom jednaka umnošku vjerojatnosti . Zatim zakon raspodjele slučajne varijable v(X,Y) dato sljedećom tablicom

Sada neka se igra odvija unedogled. Tada je prosječni dobitak u takvoj igri jednak matematičkom očekivanju vrijednosti v(X,Y).

(2.19)

Kad konačno ali dovoljno veliki brojevi ponavljanja igre, prosječna isplata malo će se razlikovati od vrijednosti (2,19).

Primjer 4. Izračunajte prosječni dobitak (2,19) za igru ​​iz primjera 3 kada igrači koriste sljedeće strategije: . Matrica isplate i matrica vjerojatnosti su sljedeće:

Nađimo prosjek:

Prema tome, prosječna isplata (2,20) nalazi se između maximina i minimaxa.

Budući da je za bilo koji par mješovitih strategija X i Y moguće izračunati prosječnu vrijednost igre, tada se javlja problem pronalaženja optimalne strategije. Prirodno je započeti istraživanjem opreznih strategija. Oprezna strategija prvog igrača daje mu maksimin. Oprezna strategija drugog igrača ne dopušta prvom da osvoji više od minimaksa. Najznačajniji rezultat u teoriji igara sa suprotnim interesima može se smatrati sljedećim:

Teorema. Svaka matrična igra ima ravnotežnu situaciju u mješovitim strategijama. Dokaz ovog teorema nije lak. Izostavljen je u ovom kolegiju.

Posljedice: Postojanje ravnotežne situacije znači da je maksimin jednak minimaksu, pa stoga svaka matrična igra ima cijenu. Optimalna strategija za prvog igrača je maximin strategija. Optimalna strategija druge je minimaks. Budući da je problem pronalaženja optimalnih strategija riješen, kažemo da svaka matrična igra rješiv na skupu mješovitih strategija.

Rješenje igre 2x2

Primjer 5. Riješite igru. Nije teško provjeriti da nema sedla. Označite optimalnu strategiju prvog igrača (x, 1-x) je vektor stupca, ali ga radi praktičnosti pišemo kao niz. Označite optimalnu strategiju drugog igrača (y,1-y).

Isplata prvog igrača je slučajna varijabla sa sljedećom distribucijom:

v(x,y) 2 -1 -4 7
str xy x(1-y) (1x)y (1-x)(1-y)

Nalazimo prosječnu isplatu za iteraciju prvog igrača - matematičko očekivanje slučajne varijable v(x,y):

Transformirajmo ovaj izraz:

Ovo matematičko očekivanje sastoji se od konstantnog (5/7) i varijabilnog dijela: 14(x-11/14)(y-8/14). Ako vrijednost g različito od 8/14, tada prvi igrač uvijek može izabrati x na takav način da varijabilni dio bude pozitivan, povećavajući vaše dobitke. Ako vrijednost x različito od 11/14, tada drugi igrač uvijek može izabrati g kako bi varijabilni dio bio negativan, smanjujući isplatu prvog igrača. Dakle, sedlo je definirano jednakostima: x*=11/14, y*=8/14.

2.5 Rješavanje igre

Primjer će pokazati kako rješavati takve igre.

Primjer 6. Riješite igru . Pazimo da nema sedla. Označite mješovitu strategiju prvog igrača X=(x, 1-x) je vektor stupca, ali ga radi praktičnosti pišemo kao niz.

Neka prvi igrač primijeni strategiju X, a drugi - svoju j-th čist strategija. Označimo prosječni dobitak prvog igrača u ovoj situaciji kao . Imamo:

Nacrtajmo grafove funkcija (2.21) na segmentu .

Ordinata točke koja se nalazi na bilo kojem segmentu linije odgovara dobitku prvog igrača u situaciji kada koristi mješovitu strategiju (x,(1-x)), a drugi igrač odgovarajuću čistu strategiju. Zajamčeni rezultat prvog igrača je donja omotnica obitelji linija (izlomljeni ABC). najviša točka ova isprekidana linija (točka B) je maksimalni zajamčeni rezultat igrača 1. Apscisa točke B odgovara optimalnoj strategiji prvog igrača.

Kako je željena točka B sjecište pravaca i, onda se njena apscisa može naći kao rješenje jednadžbe:

Dakle, optimalna mješovita strategija prvog igrača je (5/9, 4/9). Ordinata točke B je cijena igre. Jednako je:

(2.22)

Imajte na umu da linija koja odgovara drugoj strategiji drugog igrača prolazi iznad točke B. To znači da ako prvi igrač primijeni svoju optimalnu strategiju, a igrač 2 koristi drugu, tada se gubitak drugog igrača povećava u usporedbi s primjenom strategija. 1 ili 3. Dakle, druga strategija ne smije sudjelovati u optimalnoj strategiji drugog igrača. Optimalna strategija za igrača 2 trebala bi biti: . Čiste strategije 1 i 3 drugog igrača koje imaju komponente različite od nule u optimalnoj strategiji obično se nazivaju značajan. Strategija 2 se zove neznatan. Iz gornje slike, kao i iz jednakosti (2.22), može se vidjeti da kada prvi igrač primijeni svoju optimalnu strategiju, dobitak drugog igrača ne ovisi o tome koju od njegovih bitnih strategija koristi. Također može primijeniti bilo koju mješovitu strategiju koja se sastoji od bitnih (osobito optimalnih), isplata se neće promijeniti ni u ovom slučaju. Potpuno analogna tvrdnja vrijedi i za obrnuti slučaj. Ako drugi igrač koristi svoju optimalnu strategiju, tada isplata prvog igrača ne ovisi o tome koju od njegovih bitnih strategija koristi i jednaka je cijeni igre. Koristeći ovu izjavu, nalazimo optimalnu strategiju za drugog igrača.

Optimalne strategije u teoriji sukoba su one strategije koje dovode igrače do stabilnih ravnoteža, tj. neke situacije koje zadovoljavaju sve igrače.

Optimalnost rješenja u teoriji igara temelji se na konceptu ravnotežna situacija:

1) nijednom igraču nije isplativo odstupiti od ravnotežne situacije ako svi ostali ostanu u njoj,

2) značenje ravnoteže - ponovljenim ponavljanjem igre igrači će doći u situaciju ravnoteže, započinjući igru ​​u bilo kojoj strateškoj situaciji.

U svakoj interakciji mogu postojati sljedeće vrste ravnoteže:

1. ravnoteža u opreznim strategijama . Određeno strategijama koje pružaju igrači zajamčeni rezultat;

2. ravnoteža u dominantnim strategijama .

Dominantna strategija je takav plan djelovanja koji sudioniku osigurava maksimalnu dobit, bez obzira na postupke drugog sudionika. Stoga će ravnoteža dominantnih strategija biti sjecište dominantnih strategija obaju sudionika u igri.

Ako igračeve optimalne strategije dominiraju svim ostalim strategijama, tada igra ima ravnotežu u dominantnim strategijama. U igri zatvorenikove dileme, Nashov skup strategija ravnoteže bit će ("priznati - priznati"). Štoviše, važno je primijetiti da je i za igrača A i za igrača B "prepoznati" dominantna strategija, dok je "ne prepoznati" dominantna strategija;

3. ravnoteža Nash . Nashova ravnoteža je vrsta odluke igre dva ili više igrača, u kojoj niti jedan sudionik ne može povećati dobitak jednostranom promjenom svoje odluke, kada ostali sudionici ne promijene svoju odluku.

Recimo igra n lica u normalnom obliku, gdje je skup čistih strategija i skup isplata.

Kada svaki igrač odabere strategiju u profilu strategija, igrač dobiva isplatu. Štoviše, dobitak ovisi o cjelokupnom profilu strategija: ne samo o strategiji koju odabere sam igrač, već io strategijama drugih ljudi. Profil strategije je Nashova ravnoteža ako promjena njegove strategije nije korisna nijednom igraču, tj.

Igra može imati Nashovu ravnotežu i u čistim i u mješovitim strategijama.

Nash je to dokazao ako je dopušteno mješovite strategije, zatim u svakoj utakmici n igrači će imati barem jednu Nashovu ravnotežu.

U situaciji Nashove ravnoteže, strategija svakog igrača daje mu najbolji odgovor na strategije drugih igrača;

4. Ravnoteža Stackelberg. Stackelbergov model– teorijski model oligopolističkog tržišta u prisutnosti informacijske asimetrije. U ovom modelu ponašanje poduzeća opisuje se dinamičkom igrom s potpunom savršenom informacijom, u kojoj se ponašanje poduzeća modelira pomoću statički igre sa potpuna informacija. Glavna značajka Igra je prisutnost vodeće tvrtke, koja prva utvrđuje obujam proizvodnje robe, a ostale tvrtke se njime rukovode u svojim izračunima. Osnovni preduvjeti igre:


Industrija proizvodi homogen proizvod: razlike u proizvodima različitih tvrtki su zanemarive, što znači da se kupac pri odabiru tvrtke od koje će kupovati fokusira samo na cijenu;

Industrija ima mali broj tvrtki.

poduzeća određuju količinu proizvedenih proizvoda, a cijena se određuje na temelju potražnje;

Postoji takozvana vodeća tvrtka, na čiji se obujam proizvodnje vode druge tvrtke.

Stoga se Stackelbergov model koristi za pronalaženje optimalnog rješenja u dinamičkim igrama i odgovara maksimalnom dobitku igrača, na temelju uvjeta koji su se razvili nakon izbora koji je već napravio jedan ili više igrača. Stackelbergova ravnoteža.- situacija u kojoj nitko od igrača ne može jednostrano povećati svoj dobitak, a odluke prvo donosi jedan igrač i postaje poznat drugome igrač. U igri zatvorenikove dileme Stackelbergov ekvilibrij bit će postignut na kvadratu (1; 1) - "priznaju krivnju" oba zločinca;

5. Pareto optimalnost- takvo stanje sustava u kojem se vrijednost svakog pojedinog kriterija koji opisuje stanje sustava ne može poboljšati bez pogoršanja položaja ostalih igrača.

Paretovo načelo kaže: "Svaka promjena koja ne uzrokuje gubitak, ali koja koristi nekim ljudima (prema njihovoj vlastitoj procjeni), je poboljšanje." Time se priznaje pravo na sve promjene koje nikome ne donose dodatnu štetu.

Skup stanja sustava koji su Pareto optimalni naziva se "Paretov skup", "skup alternativa optimalnih u Paretovom smislu" ili "skup optimalnih alternativa".

Situacija u kojoj je postignuta Paretova učinkovitost je situacija u kojoj su iscrpljene sve koristi od razmjene.

Paretova učinkovitost jedan je od središnjih pojmova moderne ekonomije. Na temelju ovog koncepta konstruirani su prvi i drugi temeljni teorem blagostanja.

Jedna od primjena Pareto optimalnosti je Pareto raspodjela resursa (rada i kapitala) u međunarodnoj ekonomskoj integraciji, tj. ekonomska unija dviju ili više država. Zanimljivo je da je Pareto distribucija prije i nakon međunarodne ekonomske integracije adekvatno matematički opisana (Dalimov R.T., 2008). Analiza je pokazala da se dodana vrijednost sektora i prihod od radnih resursa kreću u suprotnim smjerovima u skladu s dobro poznatom jednadžbom provođenja topline, slično plinu ili tekućini u svemiru, što omogućuje primjenu tehnike analize koja se koristi u fizici u odnosu na ekonomske probleme migracije ekonomskih parametara.

Paretov optimum kaže da blagostanje društva doseže svoj maksimum, a raspodjela resursa postaje optimalna ako bilo koja promjena u toj raspodjeli pogoršava dobrobit barem jednog subjekta ekonomskog sustava.

Pareto-optimalno stanje tržišta- situacija u kojoj je nemoguće poboljšati položaj bilo kojeg sudionika u ekonomskom procesu, a da se istovremeno ne smanji blagostanje barem jednog od ostalih.

Prema Paretovu kriteriju (kriterij rasta društvenog blagostanja), kretanje prema optimumu moguće je samo uz takvu raspodjelu resursa koja povećava dobrobit barem jedne osobe, a da pritom ne šteti nikome drugome.

Za situaciju S* se kaže da je Pareto dominantna situacija S ako:

za bilo kojeg igrača njegova isplata u S<=S*

· postoji barem jedan igrač za kojeg je isplata u situaciji S*>S

U problemu "zatvoreničke dileme", Paretova ravnoteža, kada je nemoguće poboljšati položaj bilo kojeg igrača bez pogoršanja položaja drugoga, odgovara situaciji kvadrata (2; 2).

Smatrati primjer 1.

Optimalne strategije u teoriji sukoba su one strategije koje dovode igrače do stabilnih ravnoteža, tj. neke situacije koje zadovoljavaju sve igrače.

Optimalnost rješenja u teoriji igara temelji se na konceptu ravnotežna situacija:

1) nijednom igraču nije isplativo odstupiti od ravnotežne situacije ako svi ostali ostanu u njoj,

2) značenje ravnoteže - ponovljenim ponavljanjem igre igrači će doći u situaciju ravnoteže, započinjući igru ​​u bilo kojoj strateškoj situaciji.

U svakoj interakciji mogu postojati sljedeće vrste ravnoteže:

1. ravnoteža u opreznim strategijama . Određeno strategijama koje igračima daju zajamčeni rezultat;

2. ravnoteža u dominantnim strategijama .

Dominantna strategija je takav plan djelovanja koji sudioniku osigurava maksimalnu dobit, bez obzira na postupke drugog sudionika. Stoga će ravnoteža dominantnih strategija biti sjecište dominantnih strategija obaju sudionika u igri.

Ako igračeve optimalne strategije dominiraju svim ostalim strategijama, tada igra ima ravnotežu u dominantnim strategijama. U igri zatvorenikove dileme, Nashov skup strategija ravnoteže bit će ("priznati - priznati"). Štoviše, važno je primijetiti da je i za igrača A i za igrača B "prepoznati" dominantna strategija, dok je "ne prepoznati" dominantna strategija;

3. ravnoteža Nash . Nashova ravnoteža je vrsta odluke igre dva ili više igrača, u kojoj niti jedan sudionik ne može povećati dobitak jednostranom promjenom svoje odluke, kada ostali sudionici ne promijene svoju odluku.

Recimo igra n lica u normalnom obliku, gdje je skup čistih strategija i skup isplata.

Kada svaki igrač odabere strategiju u profilu strategija, igrač dobiva isplatu. Štoviše, dobitak ovisi o cjelokupnom profilu strategija: ne samo o strategiji koju odabere sam igrač, već io strategijama drugih ljudi. Profil strategije je Nashova ravnoteža ako promjena njegove strategije nije korisna nijednom igraču, tj.



Igra može imati Nashovu ravnotežu i u čistim i u mješovitim strategijama.

Nash je to dokazao ako je dopušteno mješovite strategije, zatim u svakoj utakmici n igrači će imati barem jednu Nashovu ravnotežu.

U situaciji Nashove ravnoteže, strategija svakog igrača daje mu najbolji odgovor na strategije drugih igrača;

4. Ravnoteža Stackelberg. Stackelbergov model– teorijski model oligopolističkog tržišta u prisutnosti informacijske asimetrije. U ovom modelu ponašanje poduzeća opisuje se dinamičkom igrom s potpunom savršenom informacijom, u kojoj se ponašanje poduzeća modelira pomoću statički igre s potpunim informacijama. Glavna značajka igre je prisutnost vodeće tvrtke, koja prva postavlja obujam proizvodnje robe, a ostale tvrtke se njime rukovode u svojim izračunima. Osnovni preduvjeti igre:

Industrija proizvodi homogen proizvod: razlike u proizvodima različitih tvrtki su zanemarive, što znači da se kupac pri odabiru tvrtke od koje će kupovati fokusira samo na cijenu;

Industrija ima mali broj tvrtki.

poduzeća određuju količinu proizvedenih proizvoda, a cijena se određuje na temelju potražnje;

Postoji takozvana vodeća tvrtka, na čiji se obujam proizvodnje vode druge tvrtke.

Stoga se Stackelbergov model koristi za pronalaženje optimalnog rješenja u dinamičkim igrama i odgovara maksimalnom dobitku igrača, na temelju uvjeta koji su se razvili nakon izbora koji je već napravio jedan ili više igrača. Stackelbergova ravnoteža.- situacija u kojoj nitko od igrača ne može jednostrano povećati svoj dobitak, a odluke prvi donosi jedan igrač, a postaju poznate drugom igraču. U igri zatvorenikove dileme Stackelbergov ekvilibrij bit će postignut na kvadratu (1; 1) - "priznaju krivnju" oba zločinca;

5. Pareto optimalnost- takvo stanje sustava u kojem se vrijednost svakog pojedinog kriterija koji opisuje stanje sustava ne može poboljšati bez pogoršanja položaja ostalih igrača.

Paretovo načelo kaže: "Svaka promjena koja ne uzrokuje gubitak, ali koja koristi nekim ljudima (prema njihovoj vlastitoj procjeni), je poboljšanje." Time se priznaje pravo na sve promjene koje nikome ne donose dodatnu štetu.

Skup stanja sustava koji su Pareto optimalni naziva se "Paretov skup", "skup alternativa optimalnih u Paretovom smislu" ili "skup optimalnih alternativa".

Situacija u kojoj je postignuta Paretova učinkovitost je situacija u kojoj su iscrpljene sve koristi od razmjene.

Paretova učinkovitost jedan je od središnjih pojmova moderne ekonomije. Na temelju ovog koncepta konstruirani su prvi i drugi temeljni teorem blagostanja.

Jedna od primjena Pareto optimalnosti je Pareto raspodjela resursa (rada i kapitala) u međunarodnoj ekonomskoj integraciji, tj. ekonomska unija dviju ili više država. Zanimljivo je da je Pareto distribucija prije i nakon međunarodne ekonomske integracije adekvatno matematički opisana (Dalimov R.T., 2008). Analiza je pokazala da se dodana vrijednost sektora i prihod od radnih resursa kreću u suprotnim smjerovima u skladu s dobro poznatom jednadžbom provođenja topline, slično plinu ili tekućini u svemiru, što omogućuje primjenu tehnike analize koja se koristi u fizici u odnosu na ekonomske probleme migracije ekonomskih parametara.

Paretov optimum kaže da blagostanje društva doseže svoj maksimum, a raspodjela resursa postaje optimalna ako bilo koja promjena u toj raspodjeli pogoršava dobrobit barem jednog subjekta ekonomskog sustava.

Pareto-optimalno stanje tržišta- situacija u kojoj je nemoguće poboljšati položaj bilo kojeg sudionika u ekonomskom procesu, a da se istovremeno ne smanji blagostanje barem jednog od ostalih.

Prema Paretovu kriteriju (kriterij rasta društvenog blagostanja), kretanje prema optimumu moguće je samo uz takvu raspodjelu resursa koja povećava dobrobit barem jedne osobe, a da pritom ne šteti nikome drugome.

Za situaciju S* se kaže da je Pareto dominantna situacija S ako:

za bilo kojeg igrača njegova isplata u S<=S*

· postoji barem jedan igrač za kojeg je isplata u situaciji S*>S

U problemu "zatvoreničke dileme", Paretova ravnoteža, kada je nemoguće poboljšati položaj bilo kojeg igrača bez pogoršanja položaja drugoga, odgovara situaciji kvadrata (2; 2).

Smatrati primjer 1:

Ravnoteže u dominantnim strategijama Ne.

Nashova ravnoteža. (5.5) i (4.4). Budući da je neisplativo bilo kojem od igrača pojedinačno odstupiti od odabrane strategije.

Paretov optimum. (5.5). Od isplate igrača pri odabiru ovih strategija više pobjeda pri odabiru drugih strategija.

Stackelbergova ravnoteža:

Igrač A čini prvi potez.

Odabire svoju prvu strategiju. B odabire prvu strategiju. A dobiva 5.

Odabire svoju drugu strategiju. B bira drugu. A dobiva 4.

5 > 4 =>

B čini prvi potez.

Odabire svoju prvu strategiju. A bira prvu strategiju. B dobiva 5.

Odabire svoju drugu strategiju. I izabere ovo drugo. B dobiva 4.

5 > 4 => Stackelbergova ravnoteža (5, 5)

Primjer 2modeliranje duopola.

Razmotrite suštinu ovog modela:

Neka postoji industrija s dvije tvrtke, od kojih je jedna "firma vodeća", a druga "firma sljedbenik". Neka cijena proizvoda bude linearna funkcija ukupna ponuda Q:

P(Q) = abQ.

Pretpostavimo također da su troškovi poduzeća po jedinici outputa konstantni i jednaki S 1 i S 2 respektivno. Tada će dobit prve tvrtke biti određena prema formula

Π 1 = P(Q 1 + Q 2) * Q 1 − c 1 Q 1 ,

odnosno dobit drugoga

Π 2 = P(Q 1 + Q 2) * Q 2 − c 2 Q 2 .

U skladu sa Stackelbergovim modelom, prva tvrtka - vodeća tvrtka - u prvom koraku dodjeljuje svoj output Q 1 . Nakon toga, drugo poduzeće - poduzeće sljedbenik - analizom djelovanja vodećeg poduzeća utvrđuje svoj output Q 2. Cilj obje tvrtke je maksimizirati svoje funkcije plaćanja.

Nashova ravnoteža u ovoj igri određena je povratnom indukcijom. Razmotrimo pretposljednju fazu igre - potez druge firme. U ovoj fazi, tvrtka 2 zna optimalni učinak tvrtke 1 Q 1 * . Zatim problem određivanja optimalnog outputa Q 2 * svodi se na rješavanje problema pronalaženja maksimalne točke funkcije isplate drugog poduzeća. Maksimiziranje funkcije Π 2 s obzirom na varijablu Q 2 računajući Q 1, nalazimo da je optimalna proizvodnja drugog poduzeća

Ovo je najbolji odgovor tvrtke sljedbenika na izbor vodeće tvrtke izdanja Q 1 * . Vodeća tvrtka može maksimizirati svoju funkciju isplativosti s obzirom na oblik funkcije Q 2*. Maksimalna točka funkcije Π 1 u varijabli Q 1 prilikom zamjene Q 2 * volja

Zamjenjujući ovo u izraz za Q 2 * , dobivamo

Stoga, u ravnoteži, vodeća tvrtka proizvodi dvostruko više outputa od tvrtke sljedbenice.

Kombinirajući linije ponude i potražnje u jednom grafikonu, dobivamo grafička slika ravnoteža u koordinatama P, Q(Slika 2.6). Točka sjecišta pravaca ima koordinate (P*, Q*), Gdje R* - ravnotežna cijena, Q*- ravnotežni obujam proizvodnje i potrošnje.

Tržišna ravnoteža- ovo je stanje na tržištu u kojem je za određenu razinu cijena tražena količina jednaka ponuđenoj količini.

Samo u točki ravnoteže E tržište je uravnoteženo, nitko od tržišnih subjekata nema poticaja promijeniti situaciju. To znači da tržišna ravnoteža ima svojstvo održivost - u slučaju neravnotežnog stanja tržišni subjekti su motivirani vratiti tržište u ravnotežno stanje. Za dokazivanje stabilnosti obično se koristi logika L. Walrasa ili A. Marshalla.

Prema L. Walrasu, kod previsokih cijena dolazi do viška ponude – hiperprodukcije (segment A-B na sl. 2.6i), takvo se tržište naziva kupčevo tržište budući da kupac ima mogućnost zahtijevati sniženje cijene prilikom sklapanja posla. U takvoj situaciji, prije svega, nije zainteresiran prodavač, koji je prisiljen smanjiti cijene i smanjiti količinu proizvodnje. Kako cijene padaju, potražnja se povećava A-B skuplja se dok ne postane točka ravnoteže E.

Na niske cijene postoji višak potražnje - manjak (segment CFna sl. 2.6a), razvija se tržište prodavača. Kupac je prisiljen


Ako potrošač smanji potrošnju i preplati za oskudno dobro, kako cijena raste, količina ponude raste, a oskudica se smanjuje dok se tržište ne uravnoteži.

Prema A. Marshallu (sl. 2.66), za male količine proizvodnje, cijena potražnje premašuje cijenu prodavača, za velike količine - obrnuto. U svakom slučaju, situacija neravnoteže potiče pomak u cijeni ili obujmu ponude i potražnje prema ravnoteži. Ravnoteža (A) prema Walrasu - cijena regulira neravnotežu ponude i potražnje, (b) prema Marshallu – cijene kupca i prodavatelja uravnotežene su promjenom volumena.

Riža. 2.6. Uspostava tržišne ravnoteže: c) prema L. Walrasu; b) prema A. Marshallu

Promjena tržišne potražnje ili ponude dovodi do promjene ravnoteže (slika 2.7). Ako, na primjer, potražnja na tržištu raste, tada se linija potražnje pomiče udesno, tada se ravnotežna cijena i količina povećavaju. Ako se ponuda na tržištu smanji, linija ponude se pomiče ulijevo, što rezultira povećanjem cijene i smanjenjem količine.

Ovaj model Tržište je statično jer se na njemu ne pojavljuje vrijeme.

Model "pauk".

Kao primjer dinamičkog modela tržišne ravnoteže predstavljamo najjednostavniji model "paučine". Pretpostavimo da tražena količina ovisi o razini cijena u tekućem razdoblju t, a obujam ponude - iz cijena prethodnog razdoblja t-1:

Q d i = Q d i (P t), Q s i = Q s i (P t -1),

gdje je t = 0,1….T diskretna vrijednost vremenskog razdoblja.




Riža. 2.7. Promjena tržišne ravnoteže:

a) zbog povećanja potražnje; b) zbog smanjenja

ponude

Tržišna cijena P t možda neće odgovarati ravnotežnoj cijeni R*, a postoje tri moguće dinamike P t(Slika 2.8).

Varijanta putanje razvoja u ovom modelu ovisi o omjeru nagiba linija ponude i potražnje.

Riža. 2.8. "Pauk" model tržišne ravnoteže:

a) odstupanje od ravnoteže se smanjuje; 5) odstupanje

raste od ravnoteže (model “katastrofe”); c) tržište

ciklički oscilira oko ravnotežne točke, ali ravnoteža



Vrh