Linijinio programavimo dvilypumas. Pusiausvyros tipai: Nešo pusiausvyra, Stekelberg, Pareto-optimali pusiausvyra, dominuojančių strategijų pusiausvyra Koks yra optimalus mechanizmas ieškant pusiausvyros sprendimo

Pagrindiniai dualumo teorijos apibrėžimai.

Kiekviena linijinio programavimo problema gali būti susieta su kita linijinio programavimo problema. Išsprendus vieną iš jų, automatiškai išsprendžiama kita problema. Tokios užduotys vadinamos abipusiai dvejopomis. Parodykime, kaip, atsižvelgiant į pateiktą problemą (vadinsime ją pradine), galime sukurti jos dualą.

Apsvarstykite planuojamos produkcijos problemą.

F = 3 X 1 + 5X 2 + 4X 3 + 5X 4 → maks.
5x1 +0,4x2 +2x3 +0,5x4 ≤400
5x2 +x3 +x4 ≤300
x 1 + x 3 + x 4 ≤100
x 1 ≥0, x 2 ≥0, x 3 ≥0, x 4 ≥0

Bendrosios dvigubos problemos sudarymo taisyklės:

Tiesiai dvilypis
Tikslinė funkcija (maks.) Dešinė apribojimų pusė
Dešinė apribojimų pusė Tikslinė funkcija (min.)
A – apribojimo matrica A T – apribojimo matrica
i-asis apribojimas: ≤ 0, (≥ 0) Kintamasis y i ≥ 0, (≤ 0)
i-asis apribojimas: = 0 Kintamasis y i ≠ 0
Kintamasis x j ≥ 0 (≤ 0)
Kintamasis x j ≠ 0 j-asis apribojimas: = 0
maks. → min
Tiesiai dvilypis
Tikslinė funkcija (min.) Dešinė apribojimų pusė
Dešinė apribojimų pusė Tikslinė funkcija (maks.)
A – apribojimo matrica A T – apribojimo matrica
i-asis apribojimas: ≥ 0, (≤ 0) Kintamasis y i ≥ 0, (≤ 0)
i-asis apribojimas: = 0 Kintamasis y i ≠ 0
Kintamasis x j ≥ 0 (≤ 0) j-asis apribojimas: ≤ 0 (≥ 0)
Kintamasis x j ≠ 0 j-asis apribojimas: = 0

Sukurkime jos dvigubą problemą pagal šias taisykles.

  1. Kintamųjų skaičius dviguboje užduotyje yra lygus nelygybių skaičiui pradinėje užduotyje.
  2. Dvigubo uždavinio koeficientų matrica perkeliama į pradinės problemos koeficientų matricą.
  3. Pradinio uždavinio laisvųjų terminų stulpelis yra dvigubos tikslo funkcijos koeficientų eilutė. Tikslinė funkcija vienoje problemoje yra maksimaliai padidinta, o kitoje – sumažinta.
  4. Pirminės problemos kintamųjų neneigiamumo sąlygos atitinka priešingos krypties dualinės problemos nelygybes-ribojimus. Ir atvirkščiai, nelygybės-apribojimai originale atitinka dualo neneigiamumo sąlygas.

Atkreipkite dėmesį, kad I užduoties matricos eilutės yra II užduoties matricos stulpeliai. Todėl II uždavinio kintamųjų y i koeficientai yra atitinkamai I uždavinio i-osios nelygybės koeficientai.
Gautas modelis yra ekonominis ir matematinis problemos modelis, susietas su tiesiogine problema.

Rodyklėmis sujungtos nelygybės bus skambučio konjugatas.
Prasminga dvigubos problemos formuluotė: suraskite tokią išteklių kainų (įverčių) rinkinį Y = (y 1 , y 2 ..., y m), kuriai esant bendra išteklių kaina bus minimali, su sąlyga, kad išteklių sąnaudos kiekvienos rūšies gamyboje produkto bus ne mažiau kaip pelnas ( pajamos iš šių produktų pardavimo.
Išteklių kainos y 1 , y 2 ..., y m gautoje ekonominėje literatūroje įvairūs titulai: apskaita, numanomas, šešėlis. Šių pavadinimų reikšmė yra ta, kad tai yra sąlyginės, „netikros“ kainos. Priešingai nei „išorinės“ produktų kainos nuo 1 , nuo 2 ..., nuo n, paprastai žinomos prieš pradedant gamybą, išteklių y 1, y 2 ..., y m kainos yra vidinės. , nes jie nustatomi ne iš išorės, o nustatomi tiesiogiai sprendžiant problemą, todėl dažnai vadinami išteklių įvertinimais.
Ryšys tarp tiesioginių ir dvejopų problemų visų pirma susideda iš to, kad vienos iš jų sprendimas gali būti gaunamas tiesiogiai sprendžiant kitą.

Dualumo teoremos

Dvilypumas yra pagrindinė linijinio programavimo teorijos sąvoka. Pagrindiniai dualumo teorijos rezultatai yra dviejose teoremose, vadinamose dualumo teoremomis.

Pirmoji dvilypumo teorema.

Jei viena iš dviejų I ir II uždavinių poros yra sprendžiama, tai kita yra išsprendžiama, o objektyvių funkcijų reikšmės optimaliuose planuose yra vienodos, F(x*) = G(y*), kur x *, y * - optimalūs I ir II uždavinių sprendimai

Antroji dvilypumo teorema.

Planai x * ir y * yra optimalūs I ir II uždaviniuose tada ir tik tada, kai juos atitinkamai pakeitus į I ir II uždavinių apribojimų sistemą, bent viena iš bet kurios konjuguotų nelygybių poros tampa lygybe.
Tai pamatinė dvilypumo teorema. Kitaip tariant, jei x * ir y * yra įmanomi pirminių ir dvigubų uždavinių sprendimai, o jei c T x*=b T y*, tai x * ir y * yra optimalūs dvigubų uždavinių poros sprendimai.

Trečioji dvilypumo teorema. Kintamųjų y i reikšmės optimaliame dvigubos problemos sprendime yra apribojimų sistemos laisvųjų narių b i - tiesioginės problemos nelygybės - įtakos šios problemos objektyvios funkcijos vertei:
Δf(x) = b i y i

Išspręsdami LLP simplekso metodu, tuo pačiu metu išsprendžiame ir dvigubą LLP. Dvigubos problemos y i kintamųjų reikšmės optimaliame plane vadinamos objektyviai nustatytais arba dvigubais įverčiais. Taikomuose uždaviniuose dvigubi įverčiai y i dažnai vadinami paslėptomis, šešėlinėmis kainomis arba ribinių išteklių įvertinimais.

Abipusių dvejopų problemų savybė

  1. Viename uždavinyje ieškoma tiesinės funkcijos maksimumo, kitoje – minimumo.
  2. Vienos problemos tiesinės funkcijos kintamųjų koeficientai yra laisvieji apribojimų sistemos nariai kitoje.
  3. Kiekvienas uždavinys pateiktas standartine forma, o maksimizavimo uždavinyje visos formos nelygybės ≤ , o minimizavimo uždavinyje visos formos nelygybės ≥ .
  4. Abiejų uždavinių apribojimų sistemų kintamųjų koeficientų matricos perkeliamos viena į kitą:
  5. Nelygybių skaičius vienos problemos apribojimų sistemoje yra toks pat, kaip ir kitos problemos kintamųjų skaičius.
  6. Abiejose problemose yra kintamųjų neneigiamumo sąlygos.

Pusiausvyros teorema

2 užduotis
Sukurkite dvigubą uždavinį 1 uždaviniui. Raskite jį sprendimas pagal pusiausvyros teoremą.
3x1 +x2 ≥12
x1 +2x2 ≥14
4x1 +11x2 ≥68

Pusiausvyros teorema . Tegul X*=(x 1 *,...,x n *) ir Y*=(y 1 *,...,y n *) yra leistini simetriškos formos dvigubų uždavinių modeliai. Šie planai yra optimalūs, jei ir tik tenkinamos šios papildomos laisvumo sąlygos:


4 teorema leidžia nustatyti optimalų vienos iš dvejopų uždavinių poros sprendimą, sprendžiant kitą. Jei vienos problemos suvaržymas pakeičiant optimalų sprendimą virsta griežta nelygybe, tai atitinkamas dvigubas kintamasis optimaliame dvigubos problemos sprendime lygus 0. Jei bet kuris kintamasis yra teigiamas optimaliame vienos problemos plane, tai atitinkamas dvigubos problemos apribojimas yra lygtis.
Pateiksime ekonominį komplemento tingumo sąlygų aiškinimą. Jei optimaliame sprendime kai kurios žaliavos įvertis yra kitoks nei 0, tada ji bus visiškai išnaudota (resursų yra mažai). Jeigu žaliava nėra pilnai sunaudota (yra perteklius), tai jos įvertinimas lygus 0. Taigi gauname, kad dvigubi vertinimai yra žaliavų trūkumo matas. Įvertis parodo, kiek tikslo funkcijos reikšmė padidės, atitinkamos žaliavos atsargoms padidėjus 1 vienetu. Jei tam tikros rūšies gaminys yra įtrauktas į gamybos planą, tai jo gamybos savikaina sutampa su pagamintos prekės savikaina. Jei prekės pagaminimo kaštai yra didesni už prekės savikainą, tai produktas negaminamas.
Jei vienoje iš dvigubų uždavinių poros yra du kintamieji, ją galima išspręsti grafiškai, o tada, naudojant 3 ir 4 teoremas, rasti dvigubos problemos sprendimą. Tokiu atveju gali atsirasti 3 atvejai: abi problemos turi įmanomus sprendimus, tik viena turi įmanomų sprendimų problemą, abi problemos neturi įmanomų sprendimų.

2 pavyzdys
Sudarykite dvigubą uždavinį ir raskite jos sprendimą, naudodami pusiausvyros teoremą
x 2 -2x 3 +2x 4 -2x 5 ≤4
-2x 1 -2x 2 +2x 3 +2x 4 +x 5 ≥2
x i ≥0, i=1,5
Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → max, jei žinomas pradinės problemos sprendimas: Zmax=(3;4;0;0;0).
Sukurkime dvigubą problemą. Nelygybės požymius sutinkame su pradinės problemos tikslu.

Z = 10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → maks.
Dviguba užduotis:

W=4 m. 1 -2 m. 2 → min
Raskime optimalų dvigubo uždavinio sprendimą naudodamiesi pusiausvyros teorema. Užrašykime komplementarinio laisvumo sąlygas.
y 1 (4-(x 2 -2x 3 +2x 4 -2x 5)) = 0
y 2 (-2-(2x 1 -2x 2 -2x 3 -2x 4 -x 5)) = 0
x 1 (-2y 2 -10) = 0
x 2 (y 1 -2y 2 +9) = 0
x 3 (-2y 1 -2y 2 +19) = 0
x 4 (2 m. 1 - 2 m. 2 +13) = 0
x 5 (-2y 1 -y 2 +11) = 0
Sukompiliuota sistema pakeisime optimalų pradinio uždavinio sprendimą: x 1 =3, x 2 =4, x 3 =0, x 4 =0, x 5 =0.
y 1 (4-(4-2 0+2 0-2 0)) = 0
y 2 (-2-(2 3-2 4-2 0-2 0-0)) = 0 W(y 1, y 2, y 3) = 12y 1 +31y 2 +18y 3 → maks. Pagal 3 teoremą Zmax=Wmin=100000.
Galiausiai Wmin=W(0; 4000/7; 32000/21) = 100000

Antagoniškame žaidime natūralu, kad optimaliu rezultatu galima laikyti tokį rezultatą, kuriame jokiam žaidėjui nenaudinga nuo jo nukrypti. Toks rezultatas (x*,y*) vadinamas pusiausvyros situacija, o optimalumo principas, pagrįstas pusiausvyros situacijos radimu, vadinamas pusiausvyros principu.

Apibrėžimas. Matricos žaidime su matmenų matrica rezultatas yra toks pusiausvyros situacija arba balno taškas, jei

Balno taške matricos elementas yra ir minimumas savo eilutėje, ir didžiausias stulpelyje. Žaidime iš pavyzdžio elementas 2 a 33 yra balno taškas. Šiame žaidime optimalios yra trečiosios abiejų žaidėjų strategijos. Jei pirmasis žaidėjas nukrypsta nuo trečiosios strategijos, jis pradeda laimėti mažiau nei a 33. Jei antrasis žaidėjas nukrypsta nuo trečiosios strategijos, jis pradeda prarasti daugiau nei a 33. Taigi, abiem žaidėjams nėra nieko geriau, kaip nuosekliai laikytis trečiosios strategijos.

Optimalaus elgesio principas: jei matricos žaidime yra balno taškas, tai optimali strategija yra balno tašką atitinkantis pasirinkimas. Kas atsitiks, jei žaidime yra daugiau nei vienas balno taškas?

Teorema. Leisti du savavališki balno taškai matricos žaidime. Tada:

Įrodymas. Iš pusiausvyros situacijos apibrėžimo turime:

Pakeiskime į kairę nelygybės pusę (2.8) , o į dešinę - , į kairę nelygybės (2.9) pusę - , į dešinę - . Tada gauname:

Iš kur atsiranda lygybė:

Iš teoremos išplaukia, kad išmokėjimo funkcija visose pusiausvyros situacijose įgyja tą pačią reikšmę. Dėl to ir vadinamas numeris žaidimo kaina. Ir vadinamos bet kurį balno tašką atitinkančios strategijos optimalios strategijos atitinkamai 1 ir 2 žaidėjai. Remiantis (2.7), visos žaidėjo optimalios strategijos yra keičiamos.

Žaidėjų elgsenos optimalumas nepasikeis, jei žaidimo strategijų rinkinys išliks toks pat, o išmokėjimo funkcija padauginama iš teigiamos konstantos (arba prie jos pridedamas pastovus skaičius).

Teorema. Kad matricos žaidime egzistuotų balno taškas (i*,j*), būtina ir pakanka, kad maksimumas būtų lygus minimax:

(2.10)

Įrodymas. Būtinybė. Jei (i*,j*) yra balno taškas, tada pagal (2.6):

(2.11)

Tačiau mes turime:

(2.12)

Iš (2.11) ir (2.12) gauname:

(2.13)

Ginčiuodami panašiai, gauname lygybes:

Taigi,

Kita vertus, atvirkštinė nelygybė (2.5) visada tenkinama, taigi (2.10) yra teisinga.

Tinkamumas. Tegul (2.10) yra tiesa. Įrodykime balno taško egzistavimą. Mes turime:

Pagal lygybę (2.10) nelygybės (2.15) ir (2.16) virsta lygybėmis. Po kurio turime:

Teorema įrodyta. Taip pat buvo įrodyta bendrą reikšmę maximin ir minimax yra lygūs žaidimo kainai.

Mišrus žaidimo išplėtimas

Apsvarstykite matricinį žaidimą G. Jei jame yra pusiausvyros situacija, tai minimax yra lygi maximin. Be to, kiekvienas žaidėjas gali pasakyti kitam žaidėjui informaciją apie savo optimalią strategiją. Jo priešininkas iš šios informacijos neturės jokios papildomos naudos. Dabar tarkime, kad žaidime G nėra pusiausvyros situacijos. Tada:

Šiuo atveju minimalios ir maksimalios strategijos nėra stabilios. Žaidėjai gali turėti paskatų nukrypti nuo savo apdairių strategijų, susijusių su galimybe gauti daugiau išmokų, bet taip pat su rizika prarasti, t. y. gauti mažesnį atlygį nei naudojant apdairią strategiją. Naudojant rizikingas strategijas, informacijos apie jas perdavimas priešininkui turi žalingų pasekmių: žaidėjas automatiškai gauna mažesnę atlygį nei naudojant atsargią strategiją.

3 pavyzdys. Tegul žaidimo matrica atrodo taip:

Tokiai matricai t.y. pusiausvyra neegzistuoja. Atsargios žaidėjų strategijos yra i*=1, j*=2. Tegul 2 žaidėjas laikosi strategijos j*=2, o 1 žaidėjas pasirenka strategiją i=2. tada pastarasis gaus 3 išmoką, tai yra dviem vienetais daugiau nei maksimalus. Tačiau jei 2 žaidėjas atspėja apie 1 žaidėjo planus, jis pakeis savo strategiją į j=1, o tada pirmasis gaus 0 išmoką, ty mažesnę nei jo maksimumas. Panašus samprotavimas gali būti atliktas ir antrajam žaidėjui. Apskritai galime daryti išvadą, kad nuotykių strategijos panaudojimas atskirame žaidimo žaidime gali duoti didesnį rezultatą nei garantuotas, tačiau jos naudojimas yra susijęs su rizika. Kyla klausimas, ar galima patikimą atsargią strategiją derinti su drąsia strategiją taip, kad padidėtų jūsų vidutinis pelnas? Iš esmės kyla klausimas, kaip padalyti atlygį (2,17) tarp žaidėjų?

Pasirodo, protingas sprendimas yra naudoti mišrią strategiją, tai yra atsitiktinis grynų strategijų pasirinkimas. Prisiminkite tai 1 žaidėjo strategija vadinama mišria, jei i-tą eilutę pasirinko jis su tam tikra tikimybe p i . Tokią strategiją galima identifikuoti su tikimybių skirstiniu keliose eilutėse. Tarkime, kad pirmasis žaidėjas turi m grynų strategijų, o antrasis žaidėjas turi n grynų strategijų. Tada jų mišrios strategijos yra tikimybių vektoriai:

(2.18)

Apsvarstykite dvi galimas mišrias strategijas pirmajam žaidėjui 3 pavyzdyje: . Šios strategijos skiriasi tikimybių pasiskirstymu tarp grynųjų strategijų. Jei pirmuoju atveju matricos eilutes žaidėjas pasirenka vienodomis tikimybėmis, tai antruoju atveju – skirtingomis. Kai kalbame apie mišrią strategiją, turime omenyje atsitiktinis pasirinkimas ne pasirinkimas „atsitiktinai“, o pasirinkimas, pagrįstas atsitiktinio mechanizmo, suteikiančio mums reikalingą tikimybių pasiskirstymą, darbu. Taigi, norint įgyvendinti pirmąją iš mišrių strategijų, monetos metimas puikiai tinka. Žaidėjas pasirenka pirmąją arba antrąją eilutę, priklausomai nuo to, kaip moneta iškrenta. Vidutiniškai žaidėjas pirmąją ir antrąją eilutes rinksis vienodai dažnai, tačiau pasirinkimui tam tikroje žaidimo iteracijoje netaikoma jokia fiksuota taisyklė ir jis turi maksimalų slaptumo laipsnį: prieš įdiegiant atsitiktinį mechanizmą. , jis nežinomas net pačiam pirmam žaidėjui. Antrajai mišriai strategijai įgyvendinti puikiai tinka traukimo mechanizmas. Žaidėjas paima septynis vienodus popieriaus lapus, tris iš jų pažymėdamas kryželiu ir įmeta į kepurę. Tada atsitiktinai jis ištraukia vieną iš jų. Pagal klasikinę tikimybių teoriją, jis ištrauks popieriaus lapą su kryželiu tikimybe 3/7, o švarų – 4/7 tikimybe. Toks traukimo mechanizmas gali realizuoti bet kokias racionalias tikimybes.

Tegul žaidėjai laikosi mišrių strategijų (2.18). Tada pirmojo žaidėjo atlyginimas per vieną žaidimo iteraciją yra atsitiktinis kintamasis: v(X,Y). Kadangi žaidėjai renkasi strategijas nepriklausomai vienas nuo kito, tai pagal tikimybių daugybos teoremą tikimybė pasirinkti rezultatą (i, j) su laimėjimu yra lygi tikimybių sandaugai. Tada atsitiktinio dydžio pasiskirstymo dėsnis v(X,Y) pateiktą toliau pateiktoje lentelėje

Dabar leiskite žaidimui tęstis neribotą laiką. Tada vidutinis laimėjimas tokiame žaidime yra lygus matematiniam vertės lūkesčiui v(X,Y).

(2.19)

Kai galutinis, bet pakankamai dideli skaičiaižaidimo iteracijų, vidutinis laimėjimas šiek tiek skirsis nuo vertės (2,19).

Pavyzdys 4. Apskaičiuokite vidutinį žaidimo laimėjimą (2,19) pagal 3 pavyzdį, kai žaidėjai naudoja šias strategijas: . Išmokėjimo matrica ir tikimybių matrica yra tokios:

Raskime vidurkį:

Taigi vidutinė išmoka (2,20) yra tarpinė tarp maximin ir minimax.

Kadangi bet kuriai mišrių strategijų X ir Y porai galima apskaičiuoti vidutinę žaidimo reikšmę, tada iškyla optimalios strategijos paieškos problema. Natūralu pradėti tyrinėjant atsargias strategijas. Atsargi pirmojo žaidėjo strategija suteikia jam maksimalų. Atsargi antrojo žaidėjo strategija neleidžia pirmajam laimėti daugiau nei minimax. Reikšmingiausiu rezultatu priešingų interesų žaidimų teorijoje galima laikyti šiuos rezultatus:

Teorema. Kiekvienas matricos žaidimas turi pusiausvyros situaciją mišriose strategijose. Įrodyti šią teoremą nėra lengva. Šiame kurse jis praleistas.

Pasekmės: Pusiausvyros situacijos egzistavimas reiškia, kad maximin yra lygus minimax, todėl bet koks matricos žaidimas turi kainą. Optimali strategija pirmajam žaidėjui yra maksimali strategija. Optimali antrojo strategija yra minimax. Kadangi optimalių strategijų paieškos problema buvo išspręsta, mes sakome, kad bet koks matricos žaidimas išsprendžiamas dėl mišrių strategijų rinkinio.

Žaidimo sprendimas 2x2

Pavyzdys 5. Išspręskite žaidimą. Nesunku patikrinti, ar nėra balno taško. Pažymėkite optimalią pirmojo žaidėjo strategiją (x, 1-x) yra stulpelio vektorius, bet patogumo dėlei jį rašome kaip eilutę. Pažymėkite optimalią antrojo žaidėjo strategiją (y, 1-y).

Pirmojo žaidėjo atlyginimas yra atsitiktinis dydis, kurio pasiskirstymas yra toks:

v(x,y) 2 -1 -4 7
p xy x(1-y) (1x) m (1–x) (1–y)

Mes randame vidutinį atlyginimą už pirmojo žaidėjo iteraciją - matematinį atsitiktinio kintamojo lūkesčius v(x,y):

Paverskime šią išraišką:

Šis matematinis lūkestis susideda iš pastovios (5/7) ir kintamos dalies: 14 (x-11/14) (y-8/14). Jei vertė y skiriasi nuo 8/14, tada pirmasis žaidėjas visada gali pasirinkti X tokiu būdu, kad kintamoji dalis būtų teigiama, padidinant jūsų laimėjimą. Jei vertė X skiriasi nuo 11/14, tada antrasis žaidėjas visada gali pasirinkti y kad kintamoji dalis būtų neigiama, sumažinant pirmojo žaidėjo pelną. Taigi balno taškas apibrėžiamas lygybėmis: x*=11/14, y*=8/14.

2.5 Žaidimo sprendimas

Pavyzdys parodys, kaip išspręsti tokius žaidimus.

Pavyzdys 6. Išspręskite žaidimą . Pasirūpiname, kad nebūtų balno taško. Pažymėkite mišrią pirmojo žaidėjo strategiją X=(x, 1-x) yra stulpelio vektorius, bet patogumo dėlei jį rašome kaip eilutę.

Tegul pirmasis žaidėjas taiko strategiją X, o antrasis – savo j-tas švarus strategija. Pažymime vidutinį pirmojo žaidėjo atlyginimą šioje situacijoje kaip . Mes turime:

Nubraižykime atkarpoje funkcijų (2.21) grafikus.

Taško, esančio bet kurioje linijos atkarpoje, ordinatės atitinka pirmojo žaidėjo išmoką situacijoje, kai jis naudoja mišrią strategiją (x, (1-x)), o antrasis žaidėjas – atitinkamą grynąją strategiją. Pirmojo žaidėjo garantuotas rezultatas yra apatinis eilučių šeimos vokas (sulaužytas ABC). aukščiausias taškasši trūkinė linija (taškas B) yra maksimalus garantuotas žaidėjo 1 rezultatas. Taško B abscisė atitinka optimalią pirmojo žaidėjo strategiją.

Kadangi norimas taškas B yra tiesių susikirtimas ir jo abscisę galima rasti kaip lygties sprendimą:

Taigi optimali pirmojo žaidėjo mišri strategija yra (5/9, 4/9). Taško B ordinatė yra žaidimo kaina. Jis lygus:

(2.22)

Atkreipkite dėmesį, kad linija, atitinkanti antrojo žaidėjo antrąją strategiją, eina virš taško B. Tai reiškia, kad jei pirmasis žaidėjas taiko savo optimalią strategiją, o 2 žaidėjas naudoja antrąją, antrojo žaidėjo praradimas padidėja, palyginti su strategijų taikymu. 1 arba 3. Taigi antroji strategija neturi dalyvauti optimalioje antrojo žaidėjo strategijoje. Optimali 2 žaidėjo strategija turėtų būti: . Paprastai vadinamos grynosios antrojo žaidėjo 1 ir 3 strategijos, kurių optimalioje strategijoje nėra nulio komponentų reikšmingas. 2 strategija vadinama nereikšmingas. Iš aukščiau pateikto paveikslo, taip pat iš lygybės (2.22), matyti, kad pirmajam žaidėjui pritaikius savo optimalią strategiją, antrojo žaidėjo atsipirkimas nepriklauso nuo to, kurią iš jo esminių strategijų jis naudoja. Jis taip pat gali taikyti bet kokią mišrią strategiją, susidedančią iš esminių (ypač optimalių), atlygis šiuo atveju taip pat nepasikeis. Visiškai analogiškas teiginys galioja ir priešingu atveju. Jei antrasis žaidėjas naudoja savo optimalią strategiją, tai pirmojo žaidėjo atlyginimas nepriklauso nuo to, kurią esminę jo strategiją jis naudoja ir yra lygus žaidimo kainai. Naudodamiesi šiuo teiginiu, randame optimalią strategiją antrajam žaidėjui.

Optimalios strategijos konfliktų teorijoje yra tos strategijos, kurios veda žaidėjus į stabilią pusiausvyrą, t.y. kai kurios situacijos, kurios tenkina visus žaidėjus.

Žaidimo teorijos sprendimo optimalumas grindžiamas koncepcija pusiausvyros situacija:

1) nė vienam žaidėjui neapsimoka nukrypti nuo pusiausvyros situacijos, jei joje lieka visi kiti,

2) pusiausvyros prasmė – pakartotinai kartojant žaidimą žaidėjai pasieks pusiausvyros situaciją, pradėdami žaidimą bet kurioje strateginėje situacijoje.

Kiekvienoje sąveikoje gali būti šių tipų pusiausvyros:

1. pusiausvyra atsargiose strategijose . Tai lemia strategijos, kurios suteikia žaidėjams garantuotas rezultatas;

2. pusiausvyra dominuojančiose strategijose .

Dominuojanti strategija yra toks veiksmų planas, suteikiantis dalyviui didžiausią naudą, nepriklausomai nuo kito dalyvio veiksmų. Todėl dominuojančių strategijų pusiausvyra bus abiejų žaidimo dalyvių dominuojančių strategijų sankirta.

Jei žaidėjų optimalios strategijos dominuoja visose kitose jų strategijose, tada žaidime yra dominuojančių strategijų pusiausvyra. Kalinio dilemos žaidime Nash pusiausvyros strategijų rinkinys bus („pripažink – pripažink“). Be to, svarbu pažymėti, kad ir žaidėjui A, ir žaidėjui B dominuojanti strategija yra „atpažinti“, o „neatpažinti“ dominuoja;

3. pusiausvyra Nešas . Nešo pusiausvyra yra dviejų ar daugiau žaidėjų žaidimo sprendimo tipas, kuriame joks dalyvis negali padidinti laimėjimo vienašališkai pakeisdamas savo sprendimą, kai kiti dalyviai nekeičia savo sprendimo.

Tarkime, žaidimas nįprastos formos veidai, kur yra grynųjų strategijų rinkinys ir išmokų rinkinys.

Kai kiekvienas žaidėjas pasirenka strategiją strategijų profilyje, žaidėjas gauna atlygį. Be to, atsipirkimas priklauso nuo viso strategijų profilio: ne tik nuo paties žaidėjo pasirinktos strategijos, bet ir nuo kitų žmonių strategijų. Strategijos profilis yra Nash pusiausvyra, jei strategijos pakeitimas nėra naudingas jokiam žaidėjui, ty bet kuriam

Žaidimas gali turėti Nash pusiausvyrą tiek grynoje, tiek mišrioje strategijoje.

Nashas tai įrodė, jei buvo leista mišrios strategijos, tada kiekviename žaidime nžaidėjai turės bent vieną Nešo pusiausvyrą.

Nash pusiausvyros situacijoje kiekvieno žaidėjo strategija suteikia jam geriausią atsaką į kitų žaidėjų strategijas;

4. Balansas Stackelbergas. Stackelbergo modelis– žaidimo teorinis oligopolinės rinkos modelis, esant informacijos asimetrijai. Šiame modelyje įmonių elgsena apibūdinama dinamišku žaidimu su visa tobula informacija, kuriame firmų elgsena modeliuojama naudojant statinisžaidimai su pilna informacija. Pagrindinis bruožasŽaidimas yra pirmaujančios įmonės buvimas, kuri pirmoji nustato prekių gamybos apimtį, o likusios įmonės tuo vadovaujasi savo skaičiavimuose. Pagrindinės žaidimo sąlygos:


Pramonė gamina vienalytę prekę: skirtingų firmų produkcijos skirtumai yra nežymūs, vadinasi, pirkėjas, rinkdamasis, iš kurios firmos pirkti, orientuojasi tik į kainą;

Pramonėje yra nedaug įmonių.

firmos nustato pagaminamos produkcijos kiekį, o jo kaina nustatoma pagal paklausą;

Yra vadinamoji lyderė, kurios gamybos apimtimi vadovaujasi kitos firmos.

Taigi, Stackelberg modelis naudojamas ieškant optimalaus sprendimo dinaminiuose žaidimuose ir atitinka maksimalų žaidėjų atsipirkimą, remiantis sąlygomis, kurios susidarė po vieno ar kelių žaidėjų jau padaryto pasirinkimo. Stackelbergo pusiausvyra.- situacija, kai nė vienas žaidėjas negali vienašališkai padidinti savo laimėjimo, o sprendimus pirmiausia priima vienas žaidėjas ir tampa žinomas antrajamžaidėjas. Kalinio dilemos žaidime Stackelbergo pusiausvyra bus pasiekta aikštėje (1; 1) – abiejų nusikaltėlių „pripažinti kaltę“;

5. Pareto optimalumas- tokia sistemos būsena, kai kiekvieno konkretaus kriterijaus, apibūdinančio sistemos būklę, reikšmė negali būti pagerinta nepabloginant kitų žaidėjų padėties.

Pareto principas teigia: „Bet koks pokytis, kuris neatneša nuostolių, bet yra naudingas kai kuriems žmonėms (jų pačių vertinimu), yra patobulinimas. Taigi pripažįstama teisė į visus pakeitimus, kurie niekam nedaro papildomos žalos.

Sistemos būsenų, kurios yra Pareto optimalios, rinkinys vadinamas „Pareto aibė“, „optimaliųjų alternatyvų rinkinys Pareto prasme“ arba „optimalių alternatyvų rinkinys“.

Situacija, kai buvo pasiektas Pareto efektyvumas, yra situacija, kai išnaudota visa mainų nauda.

Pareto efektyvumas yra viena iš pagrindinių šiuolaikinės ekonomikos sąvokų. Remiantis šia koncepcija, sukonstruojamos pirmoji ir antroji pagrindinės gerovės teoremos.

Vienas iš Pareto optimalumo pritaikymų yra Pareto išteklių (darbo ir kapitalo) paskirstymas tarptautinėje ekonominėje integracijoje, t.y. dviejų ar daugiau valstybių ekonominė sąjunga. Įdomu tai, kad Pareto pasiskirstymas prieš ir po tarptautinės ekonominės integracijos buvo tinkamai aprašytas matematiškai (Dalimov R.T., 2008). Analizė parodė, kad sektorių pridėtinė vertė ir darbo resursų pajamos juda priešingomis kryptimis pagal gerai žinomą šilumos laidumo lygtį, panašiai kaip dujos ar skystis erdvėje, kas leidžia pritaikyti naudojamą analizės techniką. fizikoje, susijusioje su ekonominėmis ekonominių parametrų migracijos problemomis.

Pareto optimalus teigia, kad visuomenės gerovė pasiekia maksimumą, o išteklių paskirstymas tampa optimalus, jei bet koks šio pasiskirstymo pokytis pablogina bent vieno ekonominės sistemos subjekto gerovę.

Pareto-optimali rinkos būklė- situacija, kai neįmanoma pagerinti kurio nors ekonominio proceso dalyvio padėties, tuo pačiu nesumažinant bent vieno iš kitų gerovės.

Pagal Pareto kriterijų (socialinės gerovės augimo kriterijų) judėjimas optimalaus link galimas tik tokiu resursų paskirstymu, kuris didina bent vieno žmogaus gerovę, nepakenkiant niekam kitam.

Situacija S* laikoma Pareto dominuojančia situacija S, jei:

bet kuriam žaidėjui jo atlyginimas S<=S*

· yra bent vienas žaidėjas, kuriam jo išmokėjimas situacijoje S*>S

„Kalinių dilemos“ problemoje Pareto pusiausvyra, kai neįmanoma pagerinti nė vieno žaidėjo padėties nepabloginant kito padėties, atitinka aikštės situaciją (2; 2).

Apsvarstykite 1 pavyzdys.

Optimalios strategijos konfliktų teorijoje yra tos strategijos, kurios veda žaidėjus į stabilią pusiausvyrą, t.y. kai kurios situacijos, kurios tenkina visus žaidėjus.

Žaidimo teorijos sprendimo optimalumas grindžiamas koncepcija pusiausvyros situacija:

1) nė vienam žaidėjui neapsimoka nukrypti nuo pusiausvyros situacijos, jei joje lieka visi kiti,

2) pusiausvyros prasmė – pakartotinai kartojant žaidimą žaidėjai pasieks pusiausvyros situaciją, pradėdami žaidimą bet kurioje strateginėje situacijoje.

Kiekvienoje sąveikoje gali būti šių tipų pusiausvyros:

1. pusiausvyra atsargiose strategijose . Nulemta strategijų, kurios suteikia žaidėjams garantuotą rezultatą;

2. pusiausvyra dominuojančiose strategijose .

Dominuojanti strategija yra toks veiksmų planas, suteikiantis dalyviui didžiausią naudą, nepriklausomai nuo kito dalyvio veiksmų. Todėl dominuojančių strategijų pusiausvyra bus abiejų žaidimo dalyvių dominuojančių strategijų sankirta.

Jei žaidėjų optimalios strategijos dominuoja visose kitose jų strategijose, tada žaidime yra dominuojančių strategijų pusiausvyra. Kalinio dilemos žaidime Nash pusiausvyros strategijų rinkinys bus („pripažink – pripažink“). Be to, svarbu pažymėti, kad ir žaidėjui A, ir žaidėjui B dominuojanti strategija yra „atpažinti“, o „neatpažinti“ dominuoja;

3. pusiausvyra Nešas . Nešo pusiausvyra yra dviejų ar daugiau žaidėjų žaidimo sprendimo tipas, kuriame joks dalyvis negali padidinti laimėjimo vienašališkai pakeisdamas savo sprendimą, kai kiti dalyviai nekeičia savo sprendimo.

Tarkime, žaidimas nįprastos formos veidai, kur yra grynųjų strategijų rinkinys ir išmokų rinkinys.

Kai kiekvienas žaidėjas pasirenka strategiją strategijų profilyje, žaidėjas gauna atlygį. Be to, atsipirkimas priklauso nuo viso strategijų profilio: ne tik nuo paties žaidėjo pasirinktos strategijos, bet ir nuo kitų žmonių strategijų. Strategijos profilis yra Nash pusiausvyra, jei strategijos pakeitimas nėra naudingas jokiam žaidėjui, ty bet kuriam



Žaidimas gali turėti Nash pusiausvyrą tiek grynoje, tiek mišrioje strategijoje.

Nashas tai įrodė, jei buvo leista mišrios strategijos, tada kiekviename žaidime nžaidėjai turės bent vieną Nešo pusiausvyrą.

Nash pusiausvyros situacijoje kiekvieno žaidėjo strategija suteikia jam geriausią atsaką į kitų žaidėjų strategijas;

4. Balansas Stackelbergas. Stackelbergo modelis– žaidimo teorinis oligopolinės rinkos modelis, esant informacijos asimetrijai. Šiame modelyje įmonių elgsena apibūdinama dinamišku žaidimu su visa tobula informacija, kuriame firmų elgsena modeliuojama naudojant statinisžaidimai su visa informacija. Pagrindinis žaidimo bruožas yra pirmaujančios įmonės buvimas, kuri pirmiausia nustato prekių produkcijos apimtį, o likusios įmonės ja vadovaujasi savo skaičiavimuose. Pagrindinės žaidimo sąlygos:

Pramonė gamina vienalytę prekę: skirtingų firmų produkcijos skirtumai yra nežymūs, vadinasi, pirkėjas, rinkdamasis, iš kurios firmos pirkti, orientuojasi tik į kainą;

Pramonėje yra nedaug įmonių.

firmos nustato pagaminamos produkcijos kiekį, o jo kaina nustatoma pagal paklausą;

Yra vadinamoji lyderė, kurios gamybos apimtimi vadovaujasi kitos firmos.

Taigi, Stackelberg modelis naudojamas ieškant optimalaus sprendimo dinaminiuose žaidimuose ir atitinka maksimalų žaidėjų atsipirkimą, remiantis sąlygomis, kurios susidarė po vieno ar kelių žaidėjų jau padaryto pasirinkimo. Stackelbergo pusiausvyra.- situacija, kai nė vienas žaidėjas negali vienašališkai padidinti savo laimėjimo, o sprendimus pirmiausia priima vienas žaidėjas, o antrasis tampa žinomas. Kalinio dilemos žaidime Stackelbergo pusiausvyra bus pasiekta aikštėje (1; 1) – abiejų nusikaltėlių „pripažinti kaltę“;

5. Pareto optimalumas- tokia sistemos būsena, kai kiekvieno konkretaus kriterijaus, apibūdinančio sistemos būklę, reikšmė negali būti pagerinta nepabloginant kitų žaidėjų padėties.

Pareto principas teigia: „Bet koks pokytis, kuris neatneša nuostolių, bet yra naudingas kai kuriems žmonėms (jų pačių vertinimu), yra patobulinimas. Taigi pripažįstama teisė į visus pakeitimus, kurie niekam nedaro papildomos žalos.

Sistemos būsenų, kurios yra Pareto optimalios, rinkinys vadinamas „Pareto aibė“, „optimaliųjų alternatyvų rinkinys Pareto prasme“ arba „optimalių alternatyvų rinkinys“.

Situacija, kai buvo pasiektas Pareto efektyvumas, yra situacija, kai išnaudota visa mainų nauda.

Pareto efektyvumas yra viena iš pagrindinių šiuolaikinės ekonomikos sąvokų. Remiantis šia koncepcija, sukonstruojamos pirmoji ir antroji pagrindinės gerovės teoremos.

Vienas iš Pareto optimalumo pritaikymų yra Pareto išteklių (darbo ir kapitalo) paskirstymas tarptautinėje ekonominėje integracijoje, t.y. dviejų ar daugiau valstybių ekonominė sąjunga. Įdomu tai, kad Pareto pasiskirstymas prieš ir po tarptautinės ekonominės integracijos buvo tinkamai aprašytas matematiškai (Dalimov R.T., 2008). Analizė parodė, kad sektorių pridėtinė vertė ir darbo resursų pajamos juda priešingomis kryptimis pagal gerai žinomą šilumos laidumo lygtį, panašiai kaip dujos ar skystis erdvėje, kas leidžia pritaikyti naudojamą analizės techniką. fizikoje, susijusioje su ekonominėmis ekonominių parametrų migracijos problemomis.

Pareto optimalus teigia, kad visuomenės gerovė pasiekia maksimumą, o išteklių paskirstymas tampa optimalus, jei bet koks šio pasiskirstymo pokytis pablogina bent vieno ekonominės sistemos subjekto gerovę.

Pareto-optimali rinkos būklė- situacija, kai neįmanoma pagerinti kurio nors ekonominio proceso dalyvio padėties, tuo pačiu nesumažinant bent vieno iš kitų gerovės.

Pagal Pareto kriterijų (socialinės gerovės augimo kriterijų) judėjimas optimalaus link galimas tik tokiu resursų paskirstymu, kuris didina bent vieno žmogaus gerovę, nepakenkiant niekam kitam.

Situacija S* laikoma Pareto dominuojančia situacija S, jei:

bet kuriam žaidėjui jo atlyginimas S<=S*

· yra bent vienas žaidėjas, kuriam jo išmokėjimas situacijoje S*>S

„Kalinių dilemos“ problemoje Pareto pusiausvyra, kai neįmanoma pagerinti nė vieno žaidėjo padėties nepabloginant kito padėties, atitinka aikštės situaciją (2; 2).

Apsvarstykite 1 pavyzdys:

Pusiausvyra dominuojančiose strategijose Nr.

Nešo pusiausvyra. (5.5) ir (4.4). Kadangi nukrypti nuo pasirinktos strategijos vienam žaidėjui yra nenaudinga.

Pareto optimalus. (5.5). Kadangi žaidėjų atsipirkimas renkantis šias strategijas daugiau laimėjimų renkantis kitas strategijas.

Stackelbergo pusiausvyra:

Žaidėjas A atlieka pirmąjį ėjimą.

Pasirenka savo pirmąją strategiją. B pasirenka pirmąją strategiją. A gauna 5.

Pasirinko antrąją strategiją. B pasirenka antrąjį. A gauna 4.

5 > 4 =>

B žengia pirmą žingsnį.

Pasirenka savo pirmąją strategiją. A pasirenka pirmąją strategiją. B gauna 5.

Pasirinko antrąją strategiją. Ir jis pasirenka antrąjį. B gauna 4.

5 > 4 => Stackelbergo pusiausvyra (5, 5)

2 pavyzdysduopolijos modeliavimas.

Apsvarstykite šio modelio esmę:

Tebūnie pramonė su dviem firmomis, iš kurių viena yra „vadovaujanti įmonė“, o kita – „pasekančioji įmonė“. Tegul prekės kaina būna tiesinė funkcija visos pasiūlos K:

P(K) = abQ.

Taip pat darykime prielaidą, kad įmonių kaštai produkcijos vienetui yra pastovūs ir lygūs Su 1 ir Su 2 atitinkamai. Tada pirmosios firmos pelną lems formulę

Π 1 = P(K 1 + K 2) * K 1 − c 1 K 1 ,

ir atitinkamai antrojo pelno

Π 2 = P(K 1 + K 2) * K 2 − c 2 K 2 .

Pagal Stackelberg modelį pirmoji įmonė - pirmaujanti įmonė - pirmuoju žingsniu priskiria savo produkciją K 1 . Po to antroji firma – sekanti įmonė – analizuodama lyderiaujančios įmonės veiksmus nustato jos produkciją. K 2. Abiejų firmų tikslas yra maksimaliai padidinti savo mokėjimo funkcijas.

Nešo pusiausvyrą šiame žaidime lemia atgalinė indukcija. Apsvarstykite priešpaskutinį žaidimo etapą – antrosios firmos žingsnį. Šiame etape 2 įmonė žino optimalų 1 įmonės našumą K 1*. Tada optimalios produkcijos nustatymo problema K 2 * yra sumažintas iki problemos, kaip rasti maksimalų antrosios įmonės išmokėjimo funkcijos tašką, sprendimą. Funkcijos Π 2 maksimizavimas kintamojo atžvilgiu K 2 skaičiavimas K 1, mes nustatome, kad optimali antrosios įmonės produkcija

Tai geriausias sekančios įmonės atsakymas į lyderės įmonės pasirinkimą K 1*. Pirmaujanti įmonė gali maksimaliai padidinti savo atsipirkimo funkciją, atsižvelgdama į funkcijos formą K 2*. Maksimalus funkcijos Π 1 taškas kintamajame K 1 pakeičiant K 2 * valia

Pakeičiant tai išraiška for K 2 * , mes gauname

Taigi, esant pusiausvyrai, pirmaujanti įmonė pagamina dvigubai daugiau produkcijos nei sekanti įmonė.

Sujungę pasiūlos ir paklausos eilutes vienoje diagramoje, gauname grafinis vaizdas pusiausvyra koordinatėmis P, Q(2.6 pav.). Tiesių susikirtimo taškas turi koordinates (P * , Q*), Kur R* - pusiausvyros kaina, Q*- pusiausvyros gamybos ir vartojimo apimtis.

Rinkos pusiausvyra- tai rinkos būklė, kai tam tikram kainų lygiui paklausa yra lygi tiekiamam kiekiui.

Tik pusiausvyros taške E rinka subalansuota, nė vienas iš rinkos agentų neturi paskatų keisti situacijos. Tai reiškia, kad rinkos pusiausvyra turi savybę tvarumas - nepusiausvyros būsenos atveju rinkos agentai yra motyvuoti grąžinti rinką į pusiausvyrą. Stabilumui įrodyti dažniausiai pasitelkiama L. Walras arba A. Marshall logika.

L. Walras teigimu, esant per didelėms kainoms, susidaro pasiūlos perteklius – perprodukcija (segment A-B pav. 2.6i), tokia rinka vadinama pirkėjų turgus kadangi pirkėjas, sudarydamas sandorius, turi galimybę reikalauti sumažinti kainą. Esant tokiai situacijai, pirmiausia neįdomus pardavėjas, kuris yra priverstas mažinti kainas ir mažinti gamybos apimtis. Kai kainoms krentant, paklausa didėja A-B susitraukia, kol tampa pusiausvyros tašku E.

At žemos kainos yra paklausos perteklius - susidaro trūkumas (segmentas CFna 2.6a pav.), pardavėjų turgus. Pirkėjas yra priverstas


Jei vartotojas mažina vartojimą ir permoka už ribotą prekę, kainai kylant, tiekiamas kiekis didėja, o trūkumas mažėja, kol rinka susibalansuoja.

Pasak A. Marshallo (pav. 2.66), mažoms produkcijos apimtims paklausos kaina viršija pardavėjo kainą, didelėms apimtims – atvirkščiai. Bet kuriuo atveju disbalanso situacija skatina kainos arba pasiūlos ir paklausos apimties poslinkį link pusiausvyros. Pusiausvyra (A) pagal Walrasą – kaina reguliuoja pasiūlos ir paklausos disbalansą, b) pagal Maršalą – pirkėjo ir pardavėjo kainas subalansuoja apimčių pokytis.

Ryžiai. 2.6. Rinkos pusiausvyros nustatymas: c) pagal L. Walrasą; b) pagal A. Marshallą

Rinkos paklausos ar pasiūlos pokytis lemia pusiausvyros pasikeitimą (2.7 pav.). Jei, pavyzdžiui, paklausa rinkoje didėja, paklausos linija pasislenka į dešinę, tada padidėja pusiausvyros kaina ir apimtis. Jei rinkos pasiūla mažėja, tiekimo linija pasislenka į kairę, dėl to padidėja kaina ir sumažėja apimtis.

Šis modelis Rinka yra statiška, nes laikas joje neatsiranda.

„Voro“ modelis

Kaip dinaminio rinkos pusiausvyros modelio pavyzdį pateikiame paprasčiausią „voratinklio“ modelį. Tarkime, kad paklausos kiekis priklauso nuo einamojo laikotarpio kainų lygio t, o tiekimo apimtis – nuo ​​praėjusio laikotarpio t-1 kainų:

Q d i = Q d i (P t) , Q s i = Q s i (P t -1) ,

čia t = 0,1….T yra atskira laikotarpio reikšmė.




Ryžiai. 2.7. Rinkos pusiausvyros pokytis:

a) dėl padidėjusios paklausos; b) dėl sumažėjimo

pasiūlymai

Rinkos kaina P t gali neatitikti pusiausvyros kainos R*, ir yra trys galimos dinamikos P t(2.8 pav.).

Plėtros trajektorijos variantas šiame modelyje priklauso nuo pasiūlos ir paklausos linijų nuolydžių santykio.

Ryžiai. 2.8. „Spider“ rinkos pusiausvyros modelis:

a) mažėja nuokrypis nuo pusiausvyros; 5) nuokrypis

didėja nuo pusiausvyros („katastrofos“ modelis); c) rinka

cikliškai svyruoja aplink pusiausvyros tašką, bet pusiausvyra



Į viršų