Dualitet i lineær programmering. Typer likevekt: Nash likevekt, Stekelberg, Pareto-optimal likevekt, likevekt av dominerende strategier Hva er den optimale mekanismen for å finne en løsning på likevekten

Grunnleggende definisjoner av dualitetsteori.

Hvert lineært programmeringsproblem kan assosieres med et annet lineært programmeringsproblem. Når en av dem er løst, løses det andre problemet automatisk. Slike oppgaver kalles gjensidig doble. La oss vise hvordan vi, gitt et gitt problem (vi vil kalle det det opprinnelige), kan konstruere dets dual.

Vurder problemet med den planlagte produksjonen.

F=3 X 1 + 5X 2 + 4X 3 + 5X 4 → maks.
5x 1 +0,4x 2 +2x 3 +0,5x 4 ≤400
5x2 +x3 +x4 ≤300
x 1 + x 3 + x 4 ≤100
x 1 ≥0, x 2 ≥0, x 3 ≥0, x 4 ≥0

Generelle regler for kompilering av et dobbeltproblem:

Rett Dobbel
Målfunksjon (maks.) Høyre side av begrensninger
Høyre side av begrensninger Målfunksjon (min)
A - begrensningsmatrise En T - begrensningsmatrise
i-te begrensning: ≤ 0, (≥ 0) Variabel y i ≥ 0, (≤ 0)
i -th begrensning: = 0 Variabel y i ≠ 0
Variabel x j ≥ 0 (≤ 0)
Variabel x j ≠ 0 j-te begrensning: = 0
maks → min
Rett Dobbel
Målfunksjon (min) Høyre side av begrensninger
Høyre side av begrensninger Målfunksjon (maks.)
A - begrensningsmatrise En T - begrensningsmatrise
i-te begrensning: ≥ 0, (≤ 0) Variabel y i ≥ 0, (≤ 0)
i -th begrensning: = 0 Variabel y i ≠ 0
Variabel x j ≥ 0 (≤ 0) j -te begrensning: ≤ 0 (≥ 0)
Variabel x j ≠ 0 j-te begrensning: = 0

La oss konstruere det doble problemet i henhold til følgende regler.

  1. Antall variabler i den doble oppgaven er lik antall ulikheter i den opprinnelige.
  2. Matrisen av koeffisienter for det doble problemet transponeres til matrisen av koeffisienter for den opprinnelige.
  3. Kolonnen med frie termer i det opprinnelige problemet er en rad med koeffisienter for den doble objektivfunksjonen. Den objektive funksjonen maksimeres i ett problem og minimeres i et annet.
  4. Betingelsene for ikke-negativiteten til variablene i det opprinnelige problemet tilsvarer ulikhetsbegrensningene til det doble problemet rettet i den andre retningen. Og omvendt, ulikhetsbegrensninger i originalen tilsvarer betingelsene for ikke-negativitet i dualen.

Merk at radene i matrisen til oppgave I er kolonnene i matrisen til oppgave II. Derfor er koeffisientene for variablene y i i oppgave II henholdsvis koeffisientene til den i-te ulikheten i oppgave I.
Den resulterende modellen er den økonomiske og matematiske modellen av problemet dobbelt til det direkte problemet.

Ulikhetene forbundet med piler vil være kalle konjugat.
Meningsfull formulering av det doble problemet: finn et slikt sett med priser (estimater) av ressurser Y = (y 1 , y 2 ..., y m), der den totale ressurskostnaden vil være minimal, forutsatt at ressurskostnaden i produksjonen av hver type av produktet vil ikke være mindre enn fortjeneste (inntekter fra salg av disse produktene.
Ressurspriser y 1 , y 2 ..., y m i økonomisk litteratur mottatt ulike titler: regnskap, implisitt, skygge. Betydningen av disse navnene er at disse er betingede, "falske" priser. I motsetning til de "eksterne" prisene fra 1 , fra 2 ..., fra n for produkter, kjent som regel før produksjonsstart, er prisene på ressursene y 1 , y 2 ..., y m interne , fordi de ikke er satt utenfra , men bestemmes direkte som et resultat av å løse problemet, så de kalles ofte ressursanslag.
Sammenhengen mellom de direkte og doble problemene består særlig i det faktum at løsningen av det ene kan oppnås direkte fra løsningen av det andre.

Dualitetsteoremer

Dualitet er et grunnleggende konsept i lineær programmeringsteori. Hovedresultatene av dualitetsteori er inneholdt i to teoremer kalt dualitetsteoremer.

Første dualitetsteorem.

Hvis ett av paret med doble problemer I og II er løsbart, er det andre løsbart, og verdiene til objektivfunksjonene på de optimale planene er de samme, F(x*) = G(y*), hvor x *, y * - optimale løsninger av oppgavene I og II

Andre dualitetsteorem.

Planene x * og y * er optimale i oppgavene I og II hvis og bare hvis, når de settes inn i systemet av begrensninger for henholdsvis oppgavene I og II, blir minst ett av ethvert par av konjugerte ulikheter en likhet.
Dette grunnleggende dualitetsteorem. Med andre ord, hvis x * og y * er mulige løsninger på de primære og doble problemene, og hvis c T x*=b T y*, så er x * og y * optimale løsninger på et par doble problemer.

Tredje dualitetsteorem. Verdiene av variablene y i i den optimale løsningen av det doble problemet er estimater av innflytelsen til frie medlemmer bi av systemet med begrensninger - ulikheter i det direkte problemet på verdien av den objektive funksjonen til dette problemet:
Δf(x) = b i y i

Løser vi LLP ved simpleksmetoden, løser vi samtidig den doble LLP. Verdiene av variablene for det doble problemet y i, i den optimale planen kalles objektivt bestemt, eller doble estimater. I anvendte problemer kalles doble estimater y i ofte skjulte, skyggepriser eller marginale ressursestimater.

Egenskaper for gjensidig doble problemer

  1. I det ene problemet søkes maksimum av en lineær funksjon, i det andre minimum.
  2. Koeffisientene for variabler i en lineær funksjon av ett problem er frie medlemmer av systemet av begrensninger i et annet.
  3. Hver av problemene er gitt i standardskjemaet, og i maksimeringsproblemet er alle ulikheter i formen ≤ , og i minimeringsproblemet alle ulikheter i formen ≥ .
  4. Koeffisientmatrisene for variablene i begrensningssystemene til begge problemene er transponert til hverandre:
  5. Antall ulikheter i begrensningssystemet til det ene problemet er det samme som antallet variabler i det andre problemet.
  6. Betingelser for ikke-negativitet til variabler er tilstede i begge problemene.

Likevektsteorem

Oppgave 2
Lag en dobbeltoppgave for oppgave 1. Finn den løsning ved likevektsteoremet.
3x1 +x2 ≥12
x1 +2x2 ≥14
4x1 +11x2 ≥68

Likevektsteorem . La X*=(x 1 *,...,x n *) og Y*=(y 1 *,...,y n *) være tillatte utforminger av et par doble problemer i symmetrisk form. Disse planene er optimale hvis og bare hvis følgende komplementære slakkhetsbetingelser er oppfylt:


Teorem 4 lar oss bestemme den optimale løsningen på det ene av et par med to problemer ved å løse det andre. Hvis begrensningen for ett problem blir til en streng ulikhet når den optimale løsningen erstattes, så er den tilsvarende doble variabelen i den optimale løsningen av det doble problemet lik 0. Hvis en variabel er positiv i den optimale planen for ett problem, så den tilsvarende begrensningen for det doble problemet er en ligning.
La oss gi en økonomisk tolkning av betingelsene for komplementær slapphet. Hvis et råstoff i den optimale løsningen har et annet estimat enn 0, vil det være helt oppbrukt (ressursen er knapp). Hvis råstoffet ikke er fullt forbrukt (er i overkant), så er vurderingen lik 0. Dermed får vi at doble vurderinger er et mål på knapphet på råvarer. Estimatet viser hvor mye verdien av målfunksjonen vil øke med en økning i beholdningen av tilsvarende råstoff med 1 enhet. Hvis en bestemt type produkt er inkludert i produksjonsplanen, faller kostnaden for produksjonen sammen med kostnaden for det produserte produktet. Hvis kostnaden ved å produsere et produkt er større enn kostnaden for produktet, produseres ikke produktet.
Hvis ett av paret med doble oppgaver inneholder to variabler, kan det løses grafisk, og deretter finne en løsning på det doble problemet ved å bruke teoremer 3 og 4. I dette tilfellet kan det oppstå 3 tilfeller: begge problemene har gjennomførbare løsninger, bare ett har gjennomførbare løsninger problem, begge problemene har ingen gjennomførbare løsninger.

Eksempel 2
Komponer et dobbeltproblem og finn løsningen ved hjelp av likevektsteoremet
x 2 -2x 3 +2x 4 -2x 5 ≤4
-2x 1 -2x 2 +2x 3 +2x 4 +x 5 ≥2
x i ≥0, i=1,5
Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → maks, hvis løsningen på det opprinnelige problemet er kjent: Zmax=(3;4;0;0;0).
La oss konstruere et dobbeltproblem. Vi er enige om tegnene på ulikheter med målet for det opprinnelige problemet.

Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → maks.
Dobbel oppgave:

W=4y 1 -2y 2 → min
La oss finne den optimale løsningen av det dobbelte problemet ved å bruke likevektsteoremet. La oss skrive ned betingelsene for komplementær slapphet.
y 1 (4-(x 2 -2x 3 +2x 4 -2x 5))=0
y 2 (-2-(2x 1 -2x 2 -2x 3 -2x 4 -x 5))=0
x 1 (-2y 2 -10)=0
x 2 (y 1 -2y 2 +9) = 0
x 3 (-2y 1 -2y 2 +19)=0
x 4 (2y 1 -2y 2 +13)=0
x 5 (-2y 1 -y 2 +11)=0
La oss erstatte den optimale løsningen av det opprinnelige problemet i det kompilerte systemet: x 1 =3, x 2 =4, x 3 =0, x 4 =0, x 5 =0.
y 1 (4-(4-2 0+2 0-2 0))=0
y 2 (-2-(2 3-2 4-2 0-2 0-0))=0 W(y 1, y 2, y 3)=12y 1 +31y 2 +18y 3 → maks. Ved setning 3 Zmax=Wmin=100000.
Til slutt, Wmin=W(0; 4000/7; 32000/21) = 100000

I et antagonistisk spill er det naturlig å vurdere det optimale resultatet som et der det er ulønnsomt for noen av spillerne å avvike fra det. Et slikt utfall (x*,y*) kalles en likevektssituasjon, og prinsippet om optimalitet basert på å finne en likevektssituasjon kalles likevektsprinsippet.

Definisjon. I et matrisespill med en matrise av dimensjoner er utfallet likevektssituasjon eller et setepunkt hvis

På et setepunkt er et matriseelement både minimum i sin rad og maksimum i kolonnen. I spillet fra eksemplet, element 2 en 33 er et setepunkt. Optimal i dette spillet er de tredje strategiene for begge spillerne. Hvis den første spilleren avviker fra den tredje strategien, begynner han å vinne mindre enn en 33. Hvis den andre spilleren avviker fra den tredje strategien, begynner han å tape mer enn en 33. For begge spillerne er det derfor ingenting bedre enn å konsekvent holde seg til den tredje strategien.

Prinsippet for optimal oppførsel: hvis det er et setepunkt i et matrisespill, så er den optimale strategien valget som tilsvarer setepunktet. Hva skjer hvis det er mer enn ett setepunkt i spillet?

Teorem. La to vilkårlige seterpoeng i et matrisespill. Deretter:

Bevis. Fra definisjonen av likevektssituasjonen har vi:

La oss bytte inn i venstre side av ulikhet (2.8) , og inn i høyre - , inn i venstre side av ulikhet (2.9) - , inn i høyre - . Da får vi:

Hvor kommer likestillingen fra:

Det følger av teoremet at utbetalingsfunksjonen har samme verdi i alle likevektssituasjoner. Det er derfor nummeret kalles på bekostning av spillet. Og strategiene som tilsvarer et av salpunktene kalles optimale strategier henholdsvis spiller 1 og 2. I kraft av (2.7) er alle spillerens optimale strategier utskiftbare.

Optimiteten til spillernes oppførsel vil ikke endres hvis settet med strategier i spillet forblir det samme, og utbetalingsfunksjonen multipliseres med en positiv konstant (eller et konstant tall legges til den).

Teorem. For at et setepunkt (i*,j*) skal eksistere i matrisespillet, er det nødvendig og tilstrekkelig at maximin er lik minimax:

(2.10)

Bevis. Nødvendighet. Hvis (i*,j*) er et setepunkt, så ifølge (2.6):

(2.11)

Imidlertid har vi:

(2.12)

Fra (2.11) og (2.12) får vi:

(2.13)

Ved å argumentere på samme måte kommer vi til likhetene:

Dermed,

På den annen side er den omvendte ulikheten (2.5) alltid oppfylt, så (2.10) er sann.

Tilstrekkelighet. La (2.10) være sann. La oss bevise eksistensen av et setepunkt. Vi har:

I følge likestilling (2.10) blir ulikheter (2.15) og (2.16) til likheter. Deretter har vi:

Teoremet er bevist. Det er også bevist generell betydning maximin og minimax er lik prisen på spillet.

Mixed Game Expansion

Tenk på et matrisespill G. Hvis det er en likevektssituasjon i det, så er minimaks lik maximin. Dessuten kan hver av spillerne fortelle den andre spilleren informasjon om hans optimale strategi. Motstanderen hans vil ikke kunne dra noen ekstra fordel av denne informasjonen. Anta nå at det ikke er noen likevektssituasjon i spillet G. Deretter:

I dette tilfellet er minimax- og maximin-strategiene ikke stabile. Spillere kan ha insentiver til å avvike fra sine forsvarlige strategier knyttet til muligheten for å få mer uttelling, men også risikoen for å tape, dvs. få en utbetaling mindre enn å bruke en forsvarlig strategi. Når du bruker risikofylte strategier, har overføring av informasjon om dem til motstanderen skadelige konsekvenser: spilleren mottar automatisk en mindre utbetaling enn når han bruker en forsiktig strategi.

Eksempel 3. La spillmatrisen se slik ut:

For en slik matrise, dvs. likevekt eksisterer ikke. De forsiktige strategiene til spillerne er i*=1, j*=2. La spiller 2 følge strategi j*=2, og spiller 1 velge strategi i=2. da vil sistnevnte motta en utbetaling på 3, som er to enheter mer enn maximin. Hvis spiller 2 imidlertid gjetter om planene til spiller 1, vil han endre strategien sin til j=1, og da vil den første motta en utbetaling på 0, det vil si mindre enn hans maksimum. Lignende resonnement kan utføres for den andre spilleren. Generelt kan vi konkludere med at bruken av en eventyrlig strategi i et eget spill av spillet kan gi et resultat som er større enn garantert, men bruken er forbundet med risiko. Spørsmålet oppstår, er det mulig å kombinere en pålitelig forsiktig strategi med en eventyrlysten på en slik måte at du øker den gjennomsnittlige gevinsten din? Spørsmålet er i hovedsak hvordan man fordeler gevinsten (2,17) mellom spillerne?

Det viser seg at en rimelig løsning er å bruke en blandet strategi, det vil si et tilfeldig valg av rene strategier. Husk det Spiller 1s strategi kalles blandet, hvis valget av i-te rad er gjort av ham med en viss sannsynlighet p i . En slik strategi kan identifiseres med sannsynlighetsfordelingen på flere linjer. Anta at den første spilleren har m rene strategier og den andre spilleren har n rene strategier. Da er deres blandede strategier sannsynlighetsvektorer:

(2.18)

Vurder to mulige blandede strategier for den første spilleren i eksempel 3: . Disse strategiene er forskjellige i sannsynlighetsfordelingene mellom rene strategier. Hvis i det første tilfellet radene i matrisen velges av spilleren med like sannsynligheter, så i det andre tilfellet - med forskjellige. Når vi snakker om blandet strategi, mener vi tilfeldig valg ikke et valg «tilfeldig», men et valg basert på arbeidet til en tilfeldig mekanisme som gir den sannsynlighetsfordelingen vi trenger. Så for implementeringen av den første av de blandede strategiene er en myntkast godt egnet. Spilleren velger den første eller den andre linjen, avhengig av hvordan mynten faller ut. I gjennomsnitt vil spilleren velge både den første raden og den andre raden like ofte, men valget ved en bestemt iterasjon av spillet er ikke underlagt noen fast regel og har den maksimale graden av hemmelighold: før implementeringen av den tilfeldige mekanismen , det er ukjent selv for den aller første spilleren. For å implementere den andre blandede strategien er trekningsmekanismen godt egnet. Spilleren tar syv identiske stykker papir, markerer tre av dem med et kryss, og kaster dem i hatten. Så, tilfeldig, trekker han ut en av dem. I følge klassisk sannsynlighetsteori vil han trekke ut et papir med et kryss med sannsynlighet 3/7, og et rent papir med sannsynlighet 4/7. En slik trekkmekanisme er i stand til å realisere alle rasjonelle sannsynligheter.

La spillerne følge blandede strategier (2.18). Da er utbetalingen til den første spilleren ved en enkelt iterasjon av spillet en tilfeldig variabel: v(X,Y). Siden spillere velger strategier uavhengig av hverandre, er sannsynligheten for å velge et utfall (i, j) med en seier i henhold til sannslik produktet av sannsynligheter . Deretter fordelingsloven til den tilfeldige variabelen v(X,Y) gitt av følgende tabell

La nå spillet spille ut på ubestemt tid. Da er gjennomsnittlig gevinst i et slikt spill lik den matematiske forventningen til verdien v(X,Y).

(2.19)

Når endelig men nok store tall gjentakelser av spillet, vil den gjennomsnittlige utbetalingen avvike litt fra verdien (2,19).

Eksempel 4. Beregn gjennomsnittlig utbetaling (2,19) for spillet fra eksempel 3 når spillerne bruker følgende strategier: . Utbetalingsmatrisen og sannsynlighetsmatrisen er som følger:

La oss finne gjennomsnittet:

Dermed er gjennomsnittlig utbetaling (2,20) mellom maksimum og minimaks.

Siden det for et hvilket som helst par av blandede strategier X og Y er mulig å beregne gjennomsnittsverdien av spillet, oppstår problemet med å finne den optimale strategien. Det er naturlig å starte med å utforske forsiktige strategier. Den forsiktige strategien til den første spilleren gir ham et maksimum. Den forsiktige strategien til den andre spilleren tillater ikke den første å vinne mer enn minimaks. Det viktigste resultatet i teorien om spill med motsatte interesser kan betraktes som følgende:

Teorem. Hvert matrisespill har en likevektssituasjon i blandede strategier. Beviset for denne teoremet er ikke lett. Det er utelatt i dette kurset.

Konsekvenser: Eksistensen av en likevektssituasjon betyr at maximin er lik minimax, og derfor har ethvert matrisespill en pris. Den optimale strategien for den første spilleren er maximin-strategien. Den optimale strategien for den andre er minimax. Siden problemet med å finne optimale strategier er løst, sier vi at ethvert matrisespill løselig på et sett med blandede strategier.

Løsning av spillet 2x2

Eksempel 5. Løs spillet. Det er ikke vanskelig å verifisere at det ikke er noe sadelpunkt. Angi den optimale strategien til den første spilleren (x, 1-x) er en kolonnevektor, men for enkelhets skyld skriver vi den som en streng. Angi den optimale strategien til den andre spilleren (å, 1-å).

Utbetalingen til den første spilleren er en tilfeldig variabel med følgende fordeling:

v(x,y) 2 -1 -4 7
s xy x(1-y) (1x)y (1-x)(1-y)

Vi finner den gjennomsnittlige utbetalingen for iterasjonen til den første spilleren - den matematiske forventningen til en tilfeldig variabel v(x,y):

La oss transformere dette uttrykket:

Denne matematiske forventningen består av en konstant (5/7) og en variabel del: 14(x-11/14)(y-8/14). Hvis verdien y forskjellig fra 8/14, så kan den første spilleren alltid velge X på en slik måte at den variable delen blir positiv, og øker gevinsten din. Hvis verdien X forskjellig fra 11/14, så kan den andre spilleren alltid velge y for å gjøre den variable delen negativ, og redusere utbetalingen til den første spilleren. Dermed er setepunktet definert av likhetene: x*=11/14, y*=8/14.

2.5 Spillløsning

Et eksempel vil vise hvordan man løser slike spill.

Eksempel 6. Løs spillet . Vi sørger for at det ikke er seterpunkt. Angi den blandede strategien til den første spilleren X=(x, 1-x) er en kolonnevektor, men for enkelhets skyld skriver vi den som en streng.

La den første spilleren bruke strategi X, og den andre - hans j-th ren strategi. La oss betegne den gjennomsnittlige utbetalingen til den første spilleren i denne situasjonen som . Vi har:

La oss tegne grafene til funksjoner (2.21) på segmentet .

Ordinaten til et punkt plassert på et av linjesegmentene tilsvarer gevinsten til den første spilleren i en situasjon der han bruker en blandet strategi (x,(1-x)), og den andre spilleren den tilsvarende rene strategien. Det garanterte resultatet for den første spilleren er den nedre konvolutten i linjefamilien (bruddet ABC). høyeste punkt denne stiplede linjen (punkt B) er det maksimale garanterte resultatet for spiller 1. Abscissen til punkt B tilsvarer den optimale strategien til den første spilleren.

Siden det ønskede punktet B er skjæringspunktet mellom linjene og, kan abscissen finnes som en løsning på ligningen:

Dermed er den optimale blandede strategien til den første spilleren (5/9, 4/9). Ordinaten til punkt B er prisen på spillet. Det er lik:

(2.22)

Merk at linjen som tilsvarer den andre strategien til den andre spilleren passerer over punkt B. Dette betyr at hvis den første spilleren bruker sin optimale strategi, og spiller 2 bruker den andre, så øker tapet til den andre spilleren sammenlignet med å bruke strategier 1 eller 3. Dermed må den andre strategien ikke delta i den optimale strategien til den andre spilleren. Den optimale strategien for spiller 2 bør være: . Rene strategier 1 og 3 til den andre spilleren som har komponenter som ikke er null i den optimale strategien, kalles vanligvis betydelige. Strategi 2 kalles ubetydelig. Fra figuren ovenfor, samt fra likhet (2.22), kan man se at når den første spilleren bruker sin optimale strategi, avhenger ikke utbetalingen til den andre spilleren av hvilke av hans essensielle strategier han bruker. Han kan også bruke hvilken som helst blandet strategi som består av essensielle (spesielt optimal), utbetalingen vil heller ikke endre seg i dette tilfellet. Et helt analogt utsagn gjelder også for det motsatte tilfellet. Hvis den andre spilleren bruker sin optimale strategi, så avhenger ikke utbetalingen til den første spilleren av hvilken av hans essensielle strategier han bruker og er lik kostnadene ved spillet. Ved å bruke denne uttalelsen finner vi den optimale strategien for den andre spilleren.

Optimale strategier i konfliktteorien er de strategiene som leder spillerne til stabile likevekter, dvs. noen situasjoner som tilfredsstiller alle spillere.

Optimiteten til en løsning i spillteori er basert på konseptet likevektssituasjon:

1) det er ikke lønnsomt for noen av aktørene å avvike fra likevektssituasjonen hvis alle de andre forblir i den,

2) betydningen av likevekt - med gjentatt gjentakelse av spillet, vil spillerne nå en situasjon med likevekt, og starte spillet i enhver strategisk situasjon.

I hver interaksjon kan følgende typer likevekter eksistere:

1. likevekt i forsiktige strategier . Bestemt av strategier som gir spillere garantert resultat;

2. likevekt i dominerende strategier .

Dominerende strategi er en slik handlingsplan som gir deltakeren maksimal gevinst, uavhengig av handlingene til den andre deltakeren. Derfor vil likevekten til de dominerende strategiene være skjæringspunktet mellom de dominerende strategiene til begge deltakerne i spillet.

Hvis spillernes optimale strategier dominerer alle deres andre strategier, så har spillet en likevekt i de dominerende strategiene. I fangenes dilemma-spill vil Nash-likevektssettet med strategier være ("innrømme - innrømme"). Dessuten er det viktig å merke seg at for både spiller A og spiller B er "gjenkjenne" den dominerende strategien, mens "ikke gjenkjenne" er dominert;

3. likevekt Nash . Nash likevekt er en type avgjørelse av et spill med to eller flere spillere, der ingen deltaker kan øke utbetalingen ved å endre sin avgjørelse ensidig, når andre deltakere ikke endrer avgjørelsen.

La oss si spillet n ansikter i normal form, hvor er settet med rene strategier og er settet med utbetalinger.

Når hver spiller velger en strategi i strategiprofilen, mottar spilleren en utbetaling. Dessuten avhenger gevinsten av hele profilen til strategier: ikke bare på strategien valgt av spilleren selv, men også på andres strategier. Strategiprofilen er en Nash-likevekt dersom en endring i strategien ikke er fordelaktig for noen spiller, det vil si for noen

Et spill kan ha en Nash-likevekt i både rene og blandede strategier.

Nash beviste det hvis tillatt blandede strategier, deretter i hvert spill n spillere vil ha minst én Nash-likevekt.

I en Nash-likevektssituasjon gir strategien til hver spiller ham det beste svaret på strategiene til andre spillere;

4. Balanse Stackelberg. Stackelberg modell– Spillteoretisk modell av et oligopolistisk marked i nærvær av informasjonsasymmetri. I denne modellen er atferden til bedrifter beskrevet av et dynamisk spill med fullstendig perfekt informasjon, der atferden til bedrifter er modellert ved hjelp av statisk spill med fullstendig informasjon. Hovedfunksjon spillet er tilstedeværelsen av et ledende firma, som er det første som fastslår volumet av produksjonen av varer, og resten av firmaene styres av det i sine beregninger. Grunnleggende forutsetninger for spillet:


Industrien produserer et homogent produkt: forskjellene i produktene til forskjellige firmaer er ubetydelige, noe som betyr at kjøperen, når han velger hvilket firma han skal kjøpe fra, fokuserer kun på prisen;

Bransjen har et lite antall bedrifter.

bedrifter setter mengden av produserte produkter, og prisen for det bestemmes basert på etterspørsel;

Det er et såkalt lederfirma, på produksjonsvolumet som andre firmaer veiledes av.

Dermed brukes Stackelberg-modellen for å finne den optimale løsningen i dynamiske spill og tilsvarer spillernes maksimale uttelling, basert på forholdene som har utviklet seg etter valget allerede gjort av en eller flere spillere. Stackelberg-likevekt.- en situasjon der ingen av spillerne kan øke gevinstene sine ensidig, og beslutninger tas først av én spiller og blir kjent for den andre spiller. I fangens dilemma-spill vil Stackelberg-likevekten nås på torget (1; 1) - "innrømme skyld" av begge kriminelle;

5. Pareto optimalitet- en slik tilstand av systemet, der verdien av hvert enkelt kriterium som beskriver tilstanden til systemet ikke kan forbedres uten å forverre andre spilleres posisjon.

Pareto-prinsippet sier: "Enhver endring som ikke forårsaker tap, men som kommer noen mennesker til gode (etter deres egen vurdering), er en forbedring." Dermed anerkjennes retten til alle endringer som ikke medfører ytterligere skade for noen.

Settet med systemtilstander som er Pareto-optimale kalles "Pareto-settet", "settet av alternativer som er optimale i betydningen Pareto", eller "settet med optimale alternativer".

En situasjon hvor Pareto-effektivitet er oppnådd, er en situasjon der alle fordelene fra utvekslingen er oppbrukt.

Pareto-effektivitet er et av de sentrale konseptene for moderne økonomi. Basert på dette konseptet konstrueres det første og andre grunnleggende velferdsteoremet.

En av anvendelsene av Pareto-optimalitet er Pareto-fordelingen av ressurser (arbeid og kapital) i internasjonal økonomisk integrasjon, dvs. økonomisk union av to eller flere stater. Interessant nok ble Pareto-fordelingen før og etter internasjonal økonomisk integrasjon tilstrekkelig beskrevet matematisk (Dalimov R.T., 2008). Analysen viste at merverdien til sektorene og inntekten av arbeidsressurser beveger seg i motsatte retninger i samsvar med den velkjente varmeledningsligningen, lik en gass eller væske i rommet, som gjør det mulig å anvende analyseteknikken som brukes i fysikk i forhold til økonomiske problemer med migrasjon av økonomiske parametere.

Pareto optimum sier at samfunnets velferd når sitt maksimum, og fordelingen av ressurser blir optimal dersom en endring i denne fordelingen forverrer velferden til minst ett subjekt i det økonomiske systemet.

Pareto-optimal tilstand av markedet- en situasjon der det er umulig å forbedre posisjonen til noen deltaker i den økonomiske prosessen uten samtidig å redusere trivselen til minst en av de andre.

I følge Pareto-kriteriet (kriterium for vekst av sosial velferd) er bevegelse mot det optimale bare mulig med en slik fordeling av ressurser som øker velferden til minst én person uten å skade noen andre.

Situasjon S* sies å være Pareto-dominerende situasjon S hvis:

for enhver spiller hans utbetaling i S<=S*

· det er minst én spiller for hvem hans utbetaling i situasjonen S*>S

I "fangenes dilemma"-problemet tilsvarer Pareto-likevekt, når det er umulig å forbedre posisjonen til noen av spillerne uten å forverre posisjonen til den andre, med situasjonen til kvadratet (2; 2).

Ta i betraktning eksempel 1.

Optimale strategier i konfliktteorien er de strategiene som leder spillerne til stabile likevekter, dvs. noen situasjoner som tilfredsstiller alle spillere.

Optimiteten til en løsning i spillteori er basert på konseptet likevektssituasjon:

1) det er ikke lønnsomt for noen av aktørene å avvike fra likevektssituasjonen hvis alle de andre forblir i den,

2) betydningen av likevekt - med gjentatt gjentakelse av spillet, vil spillerne nå en situasjon med likevekt, og starte spillet i enhver strategisk situasjon.

I hver interaksjon kan følgende typer likevekter eksistere:

1. likevekt i forsiktige strategier . Bestemt av strategier som gir spillere et garantert resultat;

2. likevekt i dominerende strategier .

Dominerende strategi er en slik handlingsplan som gir deltakeren maksimal gevinst, uavhengig av handlingene til den andre deltakeren. Derfor vil likevekten til de dominerende strategiene være skjæringspunktet mellom de dominerende strategiene til begge deltakerne i spillet.

Hvis spillernes optimale strategier dominerer alle deres andre strategier, så har spillet en likevekt i de dominerende strategiene. I fangenes dilemma-spill vil Nash-likevektssettet med strategier være ("innrømme - innrømme"). Dessuten er det viktig å merke seg at for både spiller A og spiller B er "gjenkjenne" den dominerende strategien, mens "ikke gjenkjenne" er dominert;

3. likevekt Nash . Nash likevekt er en type avgjørelse av et spill med to eller flere spillere, der ingen deltaker kan øke utbetalingen ved å endre sin avgjørelse ensidig, når andre deltakere ikke endrer avgjørelsen.

La oss si spillet n ansikter i normal form, hvor er settet med rene strategier og er settet med utbetalinger.

Når hver spiller velger en strategi i strategiprofilen, mottar spilleren en utbetaling. Dessuten avhenger gevinsten av hele profilen til strategier: ikke bare på strategien valgt av spilleren selv, men også på andres strategier. Strategiprofilen er en Nash-likevekt dersom en endring i strategien ikke er fordelaktig for noen spiller, det vil si for noen



Et spill kan ha en Nash-likevekt i både rene og blandede strategier.

Nash beviste det hvis tillatt blandede strategier, deretter i hvert spill n spillere vil ha minst én Nash-likevekt.

I en Nash-likevektssituasjon gir strategien til hver spiller ham det beste svaret på strategiene til andre spillere;

4. Balanse Stackelberg. Stackelberg modell– Spillteoretisk modell av et oligopolistisk marked i nærvær av informasjonsasymmetri. I denne modellen er atferden til bedrifter beskrevet av et dynamisk spill med fullstendig perfekt informasjon, der atferden til bedrifter er modellert ved hjelp av statisk spill med fullstendig informasjon. Hovedtrekket i spillet er tilstedeværelsen av et ledende firma, som først setter volumet av produksjonen av varer, og resten av firmaene blir styrt av det i sine beregninger. Grunnleggende forutsetninger for spillet:

Industrien produserer et homogent produkt: forskjellene i produktene til forskjellige firmaer er ubetydelige, noe som betyr at kjøperen, når han velger hvilket firma han skal kjøpe fra, fokuserer kun på prisen;

Bransjen har et lite antall bedrifter.

bedrifter setter mengden av produserte produkter, og prisen for det bestemmes basert på etterspørsel;

Det er et såkalt lederfirma, på produksjonsvolumet som andre firmaer veiledes av.

Dermed brukes Stackelberg-modellen for å finne den optimale løsningen i dynamiske spill og tilsvarer spillernes maksimale uttelling, basert på forholdene som har utviklet seg etter valget allerede gjort av en eller flere spillere. Stackelberg-likevekt.- en situasjon der ingen av spillerne kan øke gevinstene sine ensidig, og beslutninger tas først av en spiller og blir kjent for den andre spilleren. I fangens dilemma-spill vil Stackelberg-likevekten nås på torget (1; 1) - "innrømme skyld" av begge kriminelle;

5. Pareto optimalitet- en slik tilstand av systemet, der verdien av hvert enkelt kriterium som beskriver tilstanden til systemet ikke kan forbedres uten å forverre andre spilleres posisjon.

Pareto-prinsippet sier: "Enhver endring som ikke forårsaker tap, men som kommer noen mennesker til gode (etter deres egen vurdering), er en forbedring." Dermed anerkjennes retten til alle endringer som ikke medfører ytterligere skade for noen.

Settet med systemtilstander som er Pareto-optimale kalles "Pareto-settet", "settet av alternativer som er optimale i betydningen Pareto", eller "settet med optimale alternativer".

En situasjon hvor Pareto-effektivitet er oppnådd, er en situasjon der alle fordelene fra utvekslingen er oppbrukt.

Pareto-effektivitet er et av de sentrale konseptene for moderne økonomi. Basert på dette konseptet konstrueres det første og andre grunnleggende velferdsteoremet.

En av anvendelsene av Pareto-optimalitet er Pareto-fordelingen av ressurser (arbeid og kapital) i internasjonal økonomisk integrasjon, dvs. økonomisk union av to eller flere stater. Interessant nok ble Pareto-fordelingen før og etter internasjonal økonomisk integrasjon tilstrekkelig beskrevet matematisk (Dalimov R.T., 2008). Analysen viste at merverdien til sektorene og inntekten av arbeidsressurser beveger seg i motsatte retninger i samsvar med den velkjente varmeledningsligningen, lik en gass eller væske i rommet, som gjør det mulig å anvende analyseteknikken som brukes i fysikk i forhold til økonomiske problemer med migrasjon av økonomiske parametere.

Pareto optimum sier at samfunnets velferd når sitt maksimum, og fordelingen av ressurser blir optimal dersom en endring i denne fordelingen forverrer velferden til minst ett subjekt i det økonomiske systemet.

Pareto-optimal tilstand av markedet- en situasjon der det er umulig å forbedre posisjonen til noen deltaker i den økonomiske prosessen uten samtidig å redusere trivselen til minst en av de andre.

I følge Pareto-kriteriet (kriterium for vekst av sosial velferd) er bevegelse mot det optimale bare mulig med en slik fordeling av ressurser som øker velferden til minst én person uten å skade noen andre.

Situasjon S* sies å være Pareto-dominerende situasjon S hvis:

for enhver spiller hans utbetaling i S<=S*

· det er minst én spiller for hvem hans utbetaling i situasjonen S*>S

I "fangenes dilemma"-problemet tilsvarer Pareto-likevekt, når det er umulig å forbedre posisjonen til noen av spillerne uten å forverre posisjonen til den andre, med situasjonen til kvadratet (2; 2).

Ta i betraktning eksempel 1:

Likevekt i dominerende strategier Nei.

Nash likevekt. (5.5) og (4.4). Siden det er ulønnsomt for noen av spillerne å avvike fra den valgte strategien individuelt.

Pareto optimum. (5.5). Siden utbetalingen til spillerne når de velger disse strategiene flere seire når du velger andre strategier.

Stackelberg-likevekt:

Spiller A gjør det første trekket.

Velger sin første strategi. B velger den første strategien. A får 5.

Velger sin andre strategi. B velger den andre. A får 4.

5 > 4 =>

B gjør det første trekket.

Velger sin første strategi. A velger den første strategien. B får 5.

Velger sin andre strategi. Og han velger den andre. B får 4.

5 > 4 => Stackelberg-likevekt (5, 5)

Eksempel 2duopolmodellering.

Tenk på essensen av denne modellen:

La det være en bransje med to firmaer, hvorav den ene er "lederfirmaet" og den andre er "følgerfirmaet". La produktprisen være lineær funksjon totalt tilbud Q:

P(Q) = enbQ.

La oss også anta at bedrifters kostnader per produksjonsenhet er konstante og lik Med 1 og Med 2 henholdsvis. Deretter vil fortjenesten til det første firmaet bestemmes av formel

Π 1 = P(Q 1 + Q 2) * Q 1 − c 1 Q 1 ,

og fortjenesten til den andre, henholdsvis

Π 2 = P(Q 1 + Q 2) * Q 2 − c 2 Q 2 .

I samsvar med Stackelberg-modellen tildeler det første firmaet - det ledende firmaet - i første trinn sin produksjon Q 1 . Etter det bestemmer det andre firmaet - etterfølgerfirmaet - ved å analysere handlingene til lederfirmaet dets produksjon Q 2. Målet til begge firmaene er å maksimere betalingsfunksjonene deres.

Nash-likevekten i dette spillet bestemmes av induksjon bakover. Vurder den nest siste fasen av spillet - flyttingen til det andre firmaet. På dette stadiet vet firma 2 den optimale ytelsen til firma 1 Q 1 * . Deretter er problemet med å bestemme den optimale utgangen Q 2 * reduseres til å løse problemet med å finne maksimumspunktet for utbetalingsfunksjonen til det andre firmaet. Maksimering av funksjonen Π 2 med hensyn til variabelen Q 2 teller Q 1 gitt, finner vi at den optimale produksjonen til det andre firmaet

Dette er det beste svaret til følgerfirmaet på valget fra lederfirmaet for utgivelsen Q 1 * . Det ledende firmaet kan maksimere sin utbetalingsfunksjon gitt funksjonens form Q 2*. Maksimumspunktet for funksjonen Π 1 i variabelen Q 1 ved erstatning Q 2 * vil

Bytter dette inn i uttrykket for Q 2 * , får vi

I likevekt produserer således lederfirmaet dobbelt så mye produksjon som følgefirmaet.

Ved å kombinere tilbuds- og etterspørselslinjene i et enkelt diagram, får vi grafisk bilde likevekt i koordinater P, Q(Fig. 2.6). Skjæringspunktet mellom linjene har koordinater (P * , Q*), Hvor R* - likevektspris, Q*- likevektsvolum av produksjon og forbruk.

Markedslikevekt- dette er en tilstand i markedet der, for et gitt prisnivå, etterspurt kvantum er lik det leverte kvantumet.

Bare på balansepunktet E markedet er balansert, ingen av markedsaktørene har insentiver til å endre situasjonen. Dette betyr at markedslikevekten har egenskapen bærekraft - i tilfelle en ikke-likevektstilstand er markedsaktørene motivert til å bringe markedet tilbake til likevekt. For å bevise stabilitet brukes vanligvis logikken til L. Walras eller A. Marshall.

Ifølge L. Walras, til for høye priser, er det et overskudd - overproduksjon (segment A-B i fig. 2.6i), kalles et slikt marked kjøpers marked siden kjøper har mulighet til å kreve prisavslag ved inngåelse av transaksjoner. I en slik situasjon er selgeren først og fremst ikke interessert, som er tvunget til å redusere prisene og redusere produksjonsvolumet. Etter hvert som prisene faller, øker etterspurt mengde A-B krymper til det blir et likevektspunkt E.

lave priser det er et overskudd av etterspørsel - en mangel (segment CFna Fig. 2.6a), utvikler seg selgers marked. Kjøperen er tvunget


Hvis en forbruker kutter forbruket og betaler for mye for en knapp vare, stiger prisen etter hvert som den tilførte kvantiteten øker, og knappheten krymper inntil markedet balanserer.

I følge A. Marshall (fig. 2.66), for små produksjonsvolumer overstiger etterspørselsprisen selgerens pris, for store volumer - omvendt. I alle fall stimulerer ubalansesituasjonen til et skifte i pris eller volum av tilbud og etterspørsel mot likevekt. Likevekt (EN) ifølge Walras - prisen regulerer ubalansen mellom tilbud og etterspørsel, (b) ifølge Marshall - prisene til kjøper og selger balanseres av en endring i volumer.

Ris. 2.6. Etablering av markedslikevekt: c) ifølge L. Walras; b) ifølge A. Marshall

En endring i markedets etterspørsel eller tilbud fører til en endring i likevekt (fig. 2.7). Hvis for eksempel markedsetterspørselen øker, så skifter etterspørselslinjen til høyre, så øker likevektsprisen og volumet. Hvis tilbudet på markedet avtar, flyttes forsyningslinjen til venstre, noe som resulterer i en økning i pris og en reduksjon i volum.

Denne modellen Markedet er statisk, siden tiden ikke vises i det.

"Spider" modell

Som et eksempel på en dynamisk modell for markedslikevekt presenterer vi den enkleste "spindelvev"-modellen. Anta at det etterspurte kvantumet avhenger av prisnivået i den aktuelle perioden t, og forsyningsvolumet - fra prisene fra forrige periode t-1:

Q di = Q di (P t), Q s i = Q s i (P t -1) ,

hvor t = 0,1….T er den diskrete verdien av tidsperioden.




Ris. 2.7. Endring i markedslikevekt:

a) på grunn av økt etterspørsel; b) på grunn av en nedgang

tilbud

Markedspris P t samsvarer kanskje ikke med likevektsprisen R*, og det er tre mulige dynamikker P t(Fig. 2.8).

Varianten av utviklingsbanen i denne modellen avhenger av forholdet mellom skråningene til tilbuds- og etterspørselslinjene.

Ris. 2.8. "Edderkopp" modell for markedslikevekt:

a) avviket fra likevekt avtar; 5) avvik

øker fra likevekt («katastrofe»-modellen); c) markedet

svinger syklisk rundt likevektspunktet, men likevekten



Topp