Dualidade em programação linear. Tipos de equilíbrio: Equilíbrio de Nash, Stekelberg, Equilíbrio ótimo de Pareto, Equilíbrio de estratégias dominantes Qual é o mecanismo ideal para encontrar uma solução para o equilíbrio

Definições básicas da teoria da dualidade.

Cada problema de programação linear pode ser associado a outro problema de programação linear. Quando um deles é resolvido, o outro problema é automaticamente resolvido. Tais tarefas são chamadas mutuamente duais. Vamos mostrar como, dado um dado problema (vamos chamá-lo de original), podemos construir seu dual.

Considere o problema da saída planejada.

F=3 x 1 + 5x 2 + 4x 3 + 5x 4 → máx.
5x 1 +0,4x 2 +2x 3 +0,5x 4 ≤400
5x2 +x3 +x4 ≤300
x 1 + x 3 + x 4 ≤100
x 1 ≥0, x 2 ≥0, x 3 ≥0, x 4 ≥0

Regras gerais para compilar um problema dual:

Direto dual
Função de destino (máx.) Lado direito das restrições
Lado direito das restrições Função alvo (min)
A - matriz de restrição A T - matriz de restrição
i -ésima restrição: ≤ 0, (≥ 0) Variável y i ≥ 0, (≤ 0)
i -ésima restrição: = 0 Variável y i ≠ 0
Variável x j ≥ 0 (≤ 0)
Variável x j ≠ 0 j-ésima restrição: = 0
máximo → mínimo
Direto dual
Função alvo (min) Lado direito das restrições
Lado direito das restrições Função de destino (máx.)
A - matriz de restrição A T - matriz de restrição
i -ésima restrição: ≥ 0, (≤ 0) Variável y i ≥ 0, (≤ 0)
i -ésima restrição: = 0 Variável y i ≠ 0
Variável x j ≥ 0 (≤ 0) j -ésima restrição: ≤ 0 (≥ 0)
Variável x j ≠ 0 j-ésima restrição: = 0

Vamos construir seu problema dual de acordo com as seguintes regras.

  1. O número de variáveis ​​no problema dual é igual ao número de desigualdades no problema original.
  2. A matriz de coeficientes do problema dual é transposta para a matriz de coeficientes do problema original.
  3. A coluna de termos livres do problema original é uma linha de coeficientes para a função objetivo dual. A função objetivo é maximizada em um problema e minimizada em outro.
  4. As condições de não negatividade das variáveis ​​do problema original correspondem às inequações-restrições do problema dual direcionadas na outra direção. E vice-versa, desigualdades-restrições no original correspondem às condições de não negatividade no dual.

Observe que as linhas da matriz da tarefa I são as colunas da matriz da tarefa II. Portanto, os coeficientes para as variáveis ​​y i no problema II são, respectivamente, os coeficientes da i -ésima desigualdade no problema I.
O modelo resultante é o modelo econômico e matemático do problema dual ao problema direto.

As desigualdades conectadas por setas serão chamar conjugado.
Formulação significativa do problema dual: encontre tal conjunto de preços (estimativas) dos recursos Y = (y 1 , y 2 ..., y m), no qual o custo total dos recursos será mínimo, desde que o custo dos recursos na produção de cada tipo do produto não será inferior ao lucro (receita da venda desses produtos.
Preços dos recursos y 1 , y 2 ..., y m na literatura econômica recebida vários títulos: contabilidade, implícito, sombra. O significado desses nomes é que são preços condicionais e “falsos”. Ao contrário dos preços "externos" de 1 , de 2 ..., de n para produtos, conhecidos, via de regra, antes do início da produção, os preços dos recursos y 1 , y 2 ..., y m são internos , porque eles não são definidos de fora , mas são determinados diretamente como resultado da solução do problema, portanto, geralmente são chamados de estimativas de recursos.
A conexão entre os problemas direto e dual consiste, em particular, no fato de que a solução de um deles pode ser obtida diretamente da solução do outro.

teoremas de dualidade

A dualidade é um conceito fundamental na teoria da programação linear. Os principais resultados da teoria da dualidade estão contidos em dois teoremas chamados teoremas da dualidade.

Primeiro teorema da dualidade.

Se um dos pares de problemas duais I e II for solúvel, então o outro é solúvel e os valores das funções objetivo nos planos ótimos são os mesmos, F(x*) = G(y*), onde x *, y * - soluções ótimas dos problemas I e II

Segundo teorema da dualidade.

Os planos x * e y * são ótimos nos Problemas I e II se e somente se, quando são substituídos no sistema de restrições dos Problemas I e II, respectivamente, pelo menos um de qualquer par de desigualdades conjugadas torna-se uma igualdade.
Esse teorema fundamental da dualidade. Em outras palavras, se x * e y * são soluções viáveis ​​para os problemas primal e dual, e se c T x*=b T y*, então x * e y * são soluções ótimas para um par de problemas duais.

Terceiro teorema da dualidade. Os valores das variáveis ​​y i na solução ótima do problema dual são estimativas da influência dos membros livres b i do sistema de restrições - desigualdades do problema direto no valor da função objetivo deste problema:
Δf(x) = b i y i

Resolvendo o LLP pelo método simplex, resolvemos simultaneamente o LLP dual. Os valores das variáveis ​​do problema dual y i , no plano ótimo são chamados de determinados objetivamente, ou estimativas duais. Em problemas aplicados, as estimativas duais y i são frequentemente chamadas de preços ocultos, preços-sombra ou estimativas de recursos marginais.

Propriedade de problemas mutuamente duais

  1. Em um problema busca-se o máximo de uma função linear, no outro, o mínimo.
  2. Os coeficientes das variáveis ​​em uma função linear de um problema são membros livres do sistema de restrições em outro.
  3. Cada um dos problemas é dado na forma padrão, sendo que no problema de maximização todas as desigualdades da forma ≤ , e no problema de minimização todas as desigualdades da forma ≥ .
  4. As matrizes de coeficientes para as variáveis ​​nos sistemas de restrição de ambos os problemas são transpostas uma para a outra:
  5. O número de desigualdades no sistema de restrições de um problema é o mesmo que o número de variáveis ​​no outro problema.
  6. Condições para a não negatividade das variáveis ​​estão presentes em ambos os problemas.

teorema de equilíbrio

Tarefa 2
Componha um problema duplo para o problema 1. Encontre-o solução pelo teorema do equilíbrio.
3x1 +x2 ≥12
x1 +2x2 ≥14
4x1 +11x2 ≥68

teorema de equilíbrio . Sejam X*=(x 1 *,...,x n *) e Y*=(y 1 *,...,y n *) designs admissíveis de um par de problemas duais na forma simétrica. Esses planos são ótimos se e somente se as seguintes condições complementares de folga forem atendidas:


O Teorema 4 nos permite determinar a solução ótima para um de um par de problemas duais resolvendo o outro. Se a restrição de um problema se transformar em uma desigualdade estrita quando a solução ótima for substituída, então a variável dual correspondente na solução ótima do problema dual será igual a 0. Se qualquer variável for positiva no plano ótimo de um problema, então a restrição correspondente do problema dual é uma equação.
Vamos dar uma interpretação econômica das condições de ociosidade complementar. Se na solução ótima alguma matéria-prima tiver uma estimativa diferente de 0, ela será totalmente consumida (o recurso é escasso). Se a matéria-prima não for totalmente consumida (está em excesso), então sua avaliação é igual a 0. Assim, obtemos que as avaliações duais são uma medida da escassez de matérias-primas. A estimativa mostra quanto aumentará o valor da função objetivo com o aumento do estoque da matéria-prima correspondente em 1 unidade. Se um determinado tipo de produto estiver incluído no plano de produção, o custo de sua produção coincide com o custo do produto produzido. Se o custo de produção de um produto for maior que o custo do produto, então o produto não é produzido.
Se um dos problemas duais contiver duas variáveis, ele pode ser resolvido graficamente e, a seguir, encontrar uma solução para o problema dual usando os Teoremas 3 e 4. Nesse caso, podem surgir 3 casos: ambos os problemas têm soluções viáveis, apenas um tem problema de soluções viáveis, ambos os problemas não têm soluções viáveis.

Exemplo 2
Componha um problema dual e encontre sua solução usando o teorema do equilíbrio
x 2 -2x 3 +2x 4 -2x 5 ≤4
-2x 1 -2x 2 +2x 3 +2x 4 +x 5 ≥2
x i ≥0, i=1,5
Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → max, se a solução do problema original for conhecida: Zmax=(3;4;0;0;0).
Vamos construir um problema dual. Concordamos os sinais das desigualdades com o objetivo do problema original.

Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → máx.
Dupla tarefa:

W=4y 1 -2y 2 → min
Vamos encontrar a solução ótima do problema dual usando o teorema do equilíbrio. Vamos anotar as condições de frouxidão complementar.
y 1 (4-(x 2 -2x 3 +2x 4 -2x 5))=0
y 2 (-2-(2x 1 -2x 2 -2x 3 -2x 4 -x 5))=0
x 1 (-2y 2 -10)=0
x 2 (y 1 -2y 2 +9)=0
x 3 (-2y 1 -2y 2 +19)=0
x 4 (2a 1 -2a 2 +13)=0
x 5 (-2y 1 -y 2 +11)=0
Vamos substituir a solução ótima do problema original no sistema compilado: x 1 =3, x 2 =4, x 3 =0, x 4 =0, x 5 =0.
y 1 (4-(4-2 0+2 0-2 0))=0
y 2 (-2-(2 3-2 4-2 0-2 0-0))=0 W(y 1 , y 2 , y 3)=12y 1 +31y 2 +18y 3 → máx. Pelo Teorema 3 Zmax=Wmin=100000.
Finalmente, Wmin=W(0; 4000/7; 32000/21) = 100000

Em um jogo antagônico, é natural considerar que o resultado ótimo é aquele em que não é lucrativo para nenhum dos jogadores desviar-se dele. Tal resultado (x*,y*) é chamado de situação de equilíbrio, e o princípio de otimização baseado em encontrar uma situação de equilíbrio é chamado de princípio de equilíbrio.

Definição. Em um jogo de matriz com uma matriz de dimensões, o resultado é situação de equilíbrio ou um ponto de sela se

Em um ponto de sela, um elemento de matriz é o mínimo em sua linha e o máximo em sua coluna. No jogo do exemplo, elemento 2 um 33é um ponto de sela. O ideal neste jogo são as terceiras estratégias para ambos os jogadores. Se o primeiro jogador se desviar da terceira estratégia, ele começa a ganhar menos do que um 33. Se o segundo jogador se desviar da terceira estratégia, ele começa a perder mais de um 33. Assim, para ambos os jogadores, nada melhor do que aderir consistentemente à terceira estratégia.

O princípio do comportamento ótimo: se existe um ponto de sela em um jogo de matriz, então a estratégia ótima é a escolha correspondente ao ponto de sela. O que acontece se houver mais de um ponto de sela no jogo?

Teorema. Deixar dois pontos de sela arbitrários em um jogo de matriz. Então:

Prova. Da definição da situação de equilíbrio, temos:

Substituamos no lado esquerdo da desigualdade (2.8) , e no lado direito - , no lado esquerdo da desigualdade (2.9) - , no lado direito - . Então obtemos:

De onde vem a igualdade:

Segue-se do teorema que a função payoff assume o mesmo valor em todas as situações de equilíbrio. É por isso que o número é chamado ao custo do jogo. E as estratégias correspondentes a qualquer um dos pontos de sela são chamadas estratégias ótimas jogadores 1 e 2, respectivamente. Em virtude de (2.7), todas as estratégias ótimas do jogador são intercambiáveis.

A otimização do comportamento dos jogadores não mudará se o conjunto de estratégias no jogo permanecer o mesmo e a função de recompensa for multiplicada por uma constante positiva (ou um número constante for adicionado a ela).

Teorema. Para que exista um ponto de sela (i*,j*) no jogo de matrizes, é necessário e suficiente que o maximin seja igual ao minimax:

(2.10)

Prova. Necessidade. Se (i*,j*) é um ponto de sela, então, de acordo com (2.6):

(2.11)

No entanto, temos:

(2.12)

De (2.11) e (2.12) obtemos:

(2.13)

Argumentando da mesma forma, chegamos às igualdades:

Por isso,

Por outro lado, a desigualdade reversa (2.5) é sempre satisfeita, então (2.10) é verdadeira.

Adequação. Seja (2.10) verdadeira. Vamos provar a existência de um ponto de sela. Nós temos:

De acordo com a igualdade (2.10), as desigualdades (2.15) e (2.16) se transformam em igualdades. Após o que temos:

O teorema foi provado. Também foi provado que Significado geral maximin e minimax é igual ao preço do jogo.

Expansão de jogo misto

Considere um jogo de matrizes G. Se houver uma situação de equilíbrio nele, então o minimax é igual ao maximin. Além disso, cada um dos jogadores pode contar ao outro informações sobre sua estratégia ideal. Seu oponente não poderá obter nenhum benefício adicional dessa informação. Agora suponha que não haja situação de equilíbrio no jogo G. Então:

Neste caso, as estratégias minimax e maximin não são estáveis. Os jogadores podem ter incentivos para se desviarem de suas estratégias prudentes relacionadas à possibilidade de obter mais retorno, mas também ao risco de perder, ou seja, obter um retorno menor do que usar uma estratégia prudente. Ao usar estratégias arriscadas, a transferência de informações sobre eles para o oponente tem consequências prejudiciais: o jogador recebe automaticamente um retorno menor do que ao usar uma estratégia cautelosa.

Exemplo 3. Deixe a matriz do jogo ficar assim:

Para tal matriz , ou seja, equilíbrio não existe. As estratégias cautelosas dos jogadores são i*=1, j*=2. Deixe o jogador 2 seguir a estratégia j*=2, e o jogador 1 escolher a estratégia i=2. então o último receberá um payoff de 3, que é duas unidades a mais que o maximin. Se, porém, o jogador 2 adivinhar os planos do jogador 1, ele mudará sua estratégia para j=1, e então o primeiro receberá um payoff de 0, ou seja, menor que seu maximin. Raciocínio semelhante pode ser feito para o segundo jogador. De maneira geral, podemos concluir que o uso de uma estratégia aventureira em uma partida separada do jogo pode trazer um resultado maior do que o garantido, mas seu uso está associado ao risco. Surge a pergunta: é possível combinar uma estratégia cautelosa confiável com uma aventureira de forma a aumentar seu retorno médio? Essencialmente, a questão é como dividir o payoff (2,17) entre os jogadores?

Acontece que uma solução razoável é usar uma estratégia mista, ou seja, uma escolha aleatória de estratégias puras. Lembre-se que a estratégia do jogador 1 é chamada de mista, se a escolha da i-ésima linha for feita por ele com alguma probabilidade pi. Tal estratégia pode ser identificada com a distribuição de probabilidade em várias linhas. Suponha que o primeiro jogador tenha m estratégias puras e o segundo jogador tenha n estratégias puras. Então suas estratégias mistas são vetores de probabilidade:

(2.18)

Considere duas possíveis estratégias mistas para o primeiro jogador no Exemplo 3: . Essas estratégias diferem nas distribuições de probabilidade entre estratégias puras. Se no primeiro caso as linhas da matriz são escolhidas pelo jogador com probabilidades iguais, no segundo caso - com probabilidades diferentes. Quando falamos de estratégia mista, queremos dizer escolha aleatória não uma escolha "ao acaso", mas uma escolha baseada no trabalho de um mecanismo aleatório que fornece a distribuição de probabilidade de que precisamos. Portanto, para a implementação da primeira das estratégias mistas, o lançamento de uma moeda é adequado. O jogador escolhe a primeira linha ou a segunda, dependendo de como a moeda cai. Em média, o jogador escolherá a primeira linha e a segunda linha com a mesma frequência, mas a escolha em uma determinada iteração do jogo não está sujeita a nenhuma regra fixa e tem o grau máximo de sigilo: antes da implementação do mecanismo aleatório , é desconhecido até mesmo para o primeiro jogador. Para implementar a segunda estratégia mista, o mecanismo de empate é adequado. O jogador pega sete pedaços de papel idênticos, marcando três deles com uma cruz, e os joga dentro do chapéu. Então, aleatoriamente, ele extrai um deles. De acordo com a teoria clássica da probabilidade, ele retirará um pedaço de papel com uma cruz com probabilidade de 3/7 e um pedaço de papel limpo com probabilidade de 4/7. Tal mecanismo de sorteio é capaz de realizar quaisquer probabilidades racionais.

Deixe os jogadores aderirem a estratégias mistas (2.18). Então, o pagamento do primeiro jogador em uma única iteração do jogo é uma variável aleatória: v(X,Y). Como os jogadores escolhem estratégias independentemente uns dos outros, então, de acordo com o teorema da multiplicação de probabilidade, a probabilidade de escolher um resultado (i, j) com uma vitória é igual ao produto das probabilidades . Então a lei de distribuição da variável aleatória v(X,Y) dada pela seguinte tabela

Agora deixe o jogo continuar indefinidamente. Então o retorno médio em tal jogo é igual à expectativa matemática do valor v(X,Y).

(2.19)

Quando final, mas suficiente grandes números iterações do jogo, o pagamento médio será ligeiramente diferente do valor (2,19).

Exemplo 4. Calcule o payoff médio (2,19) para o jogo do exemplo 3 quando os jogadores usam as seguintes estratégias: . A matriz de payoff e a matriz de probabilidade são as seguintes:

Vamos encontrar a média:

Assim, o payoff médio (2,20) é intermediário entre o maximin e o minimax.

Como para qualquer par de estratégias mistas X e Y é possível calcular o valor médio do jogo, surge o problema de encontrar a estratégia ótima. É natural começar explorando estratégias cautelosas. A estratégia cautelosa do primeiro jogador fornece a ele um maximin. A estratégia cautelosa do segundo jogador não permite que o primeiro ganhe mais do que o minimax. O resultado mais significativo na teoria dos jogos com interesses opostos pode ser considerado o seguinte:

Teorema. Todo jogo de matrizes tem uma situação de equilíbrio em estratégias mistas. A prova deste teorema não é fácil. É omitido neste curso.

Consequências: A existência de uma situação de equilíbrio significa que o maximin é igual ao minimax e, portanto, qualquer jogo de matrizes tem um preço. A estratégia ótima para o primeiro jogador é a estratégia maximin. A estratégia ótima do segundo é minimax. Uma vez que o problema de encontrar estratégias ótimas foi resolvido, dizemos que qualquer jogo de matrizes solucionável em um conjunto de estratégias mistas.

Solução do jogo 2x2

Exemplo 5. Resolva o jogo. Não é difícil verificar que não há ponto de sela. Denotar a estratégia ótima do primeiro jogador (x, 1-x)é um vetor coluna, mas por conveniência, o escrevemos como uma string. Denotar a estratégia ótima do segundo jogador (y,1-y).

O payoff do primeiro jogador é uma variável aleatória com a seguinte distribuição:

v(x,y) 2 -1 -4 7
p xy x(1-y) (1x)y (1-x)(1-ano)

Encontramos o retorno médio para a iteração do primeiro jogador - a expectativa matemática de uma variável aleatória v(x,y):

Vamos transformar esta expressão:

Essa expectativa matemática consiste em uma constante (5/7) e uma parte variável: 14(x-11/14)(y-8/14). Se o valor y diferente de 8/14, então o primeiro jogador sempre pode escolher x de forma a tornar a parte variável positiva, aumentando seus ganhos. Se o valor x diferente de 11/14, então o segundo jogador sempre pode escolher y de forma a tornar a parte variável negativa, reduzindo o payoff do primeiro jogador. Assim, o ponto de sela é definido pelas igualdades: x*=11/14, y*=8/14.

2.5 Resolução de jogos

Um exemplo mostrará como resolver esses jogos.

Exemplo 6. Resolva o jogo . Garantimos que não haja ponto de sela. Denotar a estratégia mista do primeiro jogador X=(x, 1-x)é um vetor coluna, mas por conveniência, o escrevemos como uma string.

Deixe o primeiro jogador aplicar a estratégia X, e o segundo - seu j-th limpo estratégia. Vamos denotar o payoff médio do primeiro jogador nesta situação como . Nós temos:

Tracemos os gráficos das funções (2.21) sobre o segmento .

A ordenada de um ponto localizado em qualquer um dos segmentos de linha corresponde ao payoff do primeiro jogador em uma situação em que ele usa uma estratégia mista (x,(1-x)), e o segundo jogador a estratégia pura correspondente. O resultado garantido do primeiro jogador é o envelope inferior da família de linhas (ABC quebrado). Ponto mais alto esta linha tracejada (ponto B) é o resultado máximo garantido do jogador 1. A abcissa do ponto B corresponde à estratégia ótima do primeiro jogador.

Como o ponto B desejado é a interseção das retas e, então sua abcissa pode ser encontrada como solução da equação:

Assim, a estratégia mista ótima do primeiro jogador é (5/9, 4/9). A ordenada do ponto B é o preço do jogo. É igual a:

(2.22)

Observe que a linha correspondente à segunda estratégia do segundo jogador passa acima do ponto B. Isso significa que, se o primeiro jogador aplicar sua estratégia ideal e o jogador 2 usar a segunda, a perda do segundo jogador aumentará em comparação com a aplicação de estratégias 1 ou 3. Assim, a segunda estratégia não deve participar da estratégia ótima do segundo jogador. A estratégia ideal para o jogador 2 deve ser: . As estratégias puras 1 e 3 do segundo jogador que possuem componentes diferentes de zero na estratégia ótima são geralmente chamadas de significativo. A estratégia 2 é chamada insignificante. Da figura acima, bem como da igualdade (2.22), pode-se ver que quando o primeiro jogador aplica sua estratégia ótima, o payoff do segundo jogador não depende de qual de suas estratégias essenciais ele usa. Ele também pode aplicar qualquer estratégia mista que consiste em essencial (em particular, ótima), o retorno também não mudará neste caso. Uma afirmação completamente análoga também é verdadeira para o caso oposto. Se o segundo jogador usar sua estratégia ótima, o pagamento do primeiro jogador não dependerá de qual de suas estratégias essenciais ele usará e será igual ao custo do jogo. Usando esta declaração, encontramos a estratégia ideal para o segundo jogador.

Estratégias ótimas na teoria dos conflitos são aquelas estratégias que levam os jogadores a equilíbrios estáveis, ou seja, algumas situações que satisfazem todos os jogadores.

A otimalidade de uma solução na teoria dos jogos é baseada no conceito situação de equilíbrio:

1) não é lucrativo para nenhum dos jogadores desviar-se da situação de equilíbrio se todos os outros permanecerem nela,

2) o significado de equilíbrio - com a repetição repetida do jogo, os jogadores chegarão a uma situação de equilíbrio, iniciando o jogo em qualquer situação estratégica.

Em cada interação, podem existir os seguintes tipos de equilíbrio:

1. equilíbrio em estratégias cautelosas . Determinado por estratégias que fornecem jogadores resultado garantido;

2. equilíbrio em estratégias dominantes .

estratégia dominanteé um plano de ação que fornece ao participante o ganho máximo, independentemente das ações do outro participante. Portanto, o equilíbrio das estratégias dominantes será a interseção das estratégias dominantes de ambos os participantes do jogo.

Se as estratégias ótimas dos jogadores dominam todas as suas outras estratégias, então o jogo tem um equilíbrio nas estratégias dominantes. No jogo do dilema do prisioneiro, o conjunto de estratégias de equilíbrio de Nash será ("admitir - admitir"). Além disso, é importante observar que tanto para o jogador A quanto para o jogador B "reconhecer" é a estratégia dominante, enquanto "não reconhecer" é a estratégia dominada;

3. equilíbrio nash . equilíbrio de Nashé um tipo de decisão de um jogo de dois ou mais jogadores, em que nenhum participante pode aumentar o payoff mudando sua decisão unilateralmente, quando os outros participantes não mudam sua decisão.

digamos que o jogo n faces na forma normal, onde é o conjunto de estratégias puras e é o conjunto de payoffs.

Quando cada jogador seleciona uma estratégia no perfil de estratégias, o jogador recebe um pagamento. Além disso, o payoff depende de todo o perfil das estratégias: não só da estratégia escolhida pelo próprio jogador, mas também das estratégias de outras pessoas. O perfil da estratégia é um equilíbrio de Nash se uma mudança em sua estratégia não for benéfica para nenhum jogador, ou seja, para qualquer

Um jogo pode ter um equilíbrio de Nash em estratégias puras e mistas.

Nash provou que, se permitido estratégias mistas, então em cada jogo n os jogadores terão pelo menos um equilíbrio de Nash.

Numa situação de equilíbrio de Nash, a estratégia de cada jogador dá-lhe a melhor resposta às estratégias dos outros jogadores;

4. Saldo Stackelberg. modelo Stackelberg– modelo da teoria dos jogos de um mercado oligopolista na presença de assimetria de informação. Neste modelo, o comportamento das firmas é descrito por um jogo dinâmico com informação perfeita completa, no qual o comportamento das firmas é modelado usando estático jogos com informação completa. Característica principal jogo é a presença de uma empresa líder, que é a primeira a estabelecer o volume de produção de mercadorias, e as demais empresas são guiadas em seus cálculos por ela. Pré-requisitos básicos do jogo:


A indústria produz um produto homogêneo: as diferenças nos produtos das diferentes empresas são desprezíveis, o que significa que o comprador, ao escolher de qual empresa comprar, se concentra apenas no preço;

A indústria tem um pequeno número de empresas.

as empresas estabelecem a quantidade de produtos produzidos e o preço é determinado com base na demanda;

Existe uma empresa chamada líder, cujo volume de produção é guiado por outras empresas.

Assim, o modelo de Stackelberg é utilizado para encontrar a solução ótima em jogos dinâmicos e corresponde ao payoff máximo dos jogadores, com base nas condições que se desenvolveram após a escolha já feita por um ou mais jogadores. Equilíbrio de Stackelberg.- uma situação em que nenhum dos jogadores pode aumentar seus ganhos unilateralmente e as decisões são tomadas primeiro por um jogador e se tornam conhecido ao segundo jogador. No jogo do dilema do prisioneiro, o equilíbrio de Stackelberg será alcançado no quadrado (1; 1) - "admitir a culpa" por ambos os criminosos;

5. otimalidade de Pareto- tal estado do sistema, no qual o valor de cada critério particular que descreve o estado do sistema não pode ser melhorado sem piorar a posição de outros jogadores.

O Princípio de Pareto afirma: “Qualquer mudança que não cause perda, mas que beneficie algumas pessoas (em sua própria opinião), é uma melhoria”. Assim, reconhece-se o direito a todas as alterações que não tragam danos adicionais a ninguém.

O conjunto de estados do sistema que são ótimos de Pareto é chamado de "conjunto de Pareto", "o conjunto de alternativas ótimas no sentido de Pareto" ou "conjunto de alternativas ótimas".

Uma situação em que a eficiência de Pareto foi alcançada é uma situação em que todos os benefícios da troca foram esgotados.

A eficiência de Pareto é um dos conceitos centrais da economia moderna. Com base nesse conceito, são construídos o primeiro e o segundo teoremas fundamentais do bem-estar.

Uma das aplicações da otimização de Pareto é a distribuição de Pareto de recursos (trabalho e capital) na integração econômica internacional, ou seja, União econômica de dois ou mais Estados. Curiosamente, a distribuição de Pareto antes e depois da integração econômica internacional foi adequadamente descrita matematicamente (Dalimov R.T., 2008). A análise mostrou que o valor agregado dos setores e a renda dos recursos trabalhistas caminham em direções opostas de acordo com a conhecida equação de condução de calor, semelhante a um gás ou líquido no espaço, o que possibilita a aplicação da técnica de análise utilizada em física em relação a problemas econômicos de migração de parâmetros econômicos.

Ótimo de Pareto afirma que o bem-estar da sociedade atinge seu máximo, e a distribuição de recursos torna-se ótima se qualquer alteração nessa distribuição piorar o bem-estar de pelo menos um sujeito do sistema econômico.

Estado Pareto-ótimo do mercado- uma situação em que é impossível melhorar a posição de qualquer participante do processo econômico sem reduzir simultaneamente o bem-estar de pelo menos um dos demais.

De acordo com o critério de Pareto (critério para o crescimento do bem-estar social), o movimento em direção ao ótimo só é possível com uma distribuição de recursos que aumente o bem-estar de pelo menos uma pessoa sem prejudicar ninguém.

A situação S* é chamada de situação Pareto dominante S se:

para qualquer jogador, seu pagamento em S<=S*

· há pelo menos um jogador para quem seu payoff na situação S*>S

No problema do "dilema dos prisioneiros", o equilíbrio de Pareto, quando é impossível melhorar a posição de algum dos jogadores sem piorar a posição do outro, corresponde à situação do quadrado (2; 2).

Considerar Exemplo 1.

Estratégias ótimas na teoria dos conflitos são aquelas estratégias que levam os jogadores a equilíbrios estáveis, ou seja, algumas situações que satisfazem todos os jogadores.

A otimalidade de uma solução na teoria dos jogos é baseada no conceito situação de equilíbrio:

1) não é lucrativo para nenhum dos jogadores desviar-se da situação de equilíbrio se todos os outros permanecerem nela,

2) o significado de equilíbrio - com a repetição repetida do jogo, os jogadores chegarão a uma situação de equilíbrio, iniciando o jogo em qualquer situação estratégica.

Em cada interação, podem existir os seguintes tipos de equilíbrio:

1. equilíbrio em estratégias cautelosas . Determinado por estratégias que fornecem aos jogadores um resultado garantido;

2. equilíbrio em estratégias dominantes .

estratégia dominanteé um plano de ação que fornece ao participante o ganho máximo, independentemente das ações do outro participante. Portanto, o equilíbrio das estratégias dominantes será a interseção das estratégias dominantes de ambos os participantes do jogo.

Se as estratégias ótimas dos jogadores dominam todas as suas outras estratégias, então o jogo tem um equilíbrio nas estratégias dominantes. No jogo do dilema do prisioneiro, o conjunto de estratégias de equilíbrio de Nash será ("admitir - admitir"). Além disso, é importante observar que tanto para o jogador A quanto para o jogador B "reconhecer" é a estratégia dominante, enquanto "não reconhecer" é a estratégia dominada;

3. equilíbrio nash . equilíbrio de Nashé um tipo de decisão de um jogo de dois ou mais jogadores, em que nenhum participante pode aumentar o payoff mudando sua decisão unilateralmente, quando os outros participantes não mudam sua decisão.

digamos que o jogo n faces na forma normal, onde é o conjunto de estratégias puras e é o conjunto de payoffs.

Quando cada jogador seleciona uma estratégia no perfil de estratégias, o jogador recebe um pagamento. Além disso, o payoff depende de todo o perfil das estratégias: não só da estratégia escolhida pelo próprio jogador, mas também das estratégias de outras pessoas. O perfil da estratégia é um equilíbrio de Nash se uma mudança em sua estratégia não for benéfica para nenhum jogador, ou seja, para qualquer



Um jogo pode ter um equilíbrio de Nash em estratégias puras e mistas.

Nash provou que, se permitido estratégias mistas, então em cada jogo n os jogadores terão pelo menos um equilíbrio de Nash.

Numa situação de equilíbrio de Nash, a estratégia de cada jogador dá-lhe a melhor resposta às estratégias dos outros jogadores;

4. Saldo Stackelberg. modelo Stackelberg– modelo da teoria dos jogos de um mercado oligopolista na presença de assimetria de informação. Neste modelo, o comportamento das firmas é descrito por um jogo dinâmico com informação perfeita completa, no qual o comportamento das firmas é modelado usando estático jogos com informações completas. A principal característica do jogo é a presença de uma empresa líder, que primeiro define o volume de produção de mercadorias, e as demais empresas são guiadas por ela em seus cálculos. Pré-requisitos básicos do jogo:

A indústria produz um produto homogêneo: as diferenças nos produtos das diferentes empresas são desprezíveis, o que significa que o comprador, ao escolher de qual empresa comprar, se concentra apenas no preço;

A indústria tem um pequeno número de empresas.

as empresas estabelecem a quantidade de produtos produzidos e o preço é determinado com base na demanda;

Existe uma empresa chamada líder, cujo volume de produção é guiado por outras empresas.

Assim, o modelo de Stackelberg é utilizado para encontrar a solução ótima em jogos dinâmicos e corresponde ao payoff máximo dos jogadores, com base nas condições que se desenvolveram após a escolha já feita por um ou mais jogadores. Equilíbrio de Stackelberg.- uma situação em que nenhum dos jogadores pode aumentar seus ganhos unilateralmente, e as decisões são tomadas primeiro por um jogador e se tornam conhecidas do segundo jogador. No jogo do dilema do prisioneiro, o equilíbrio de Stackelberg será alcançado no quadrado (1; 1) - "admitir a culpa" por ambos os criminosos;

5. otimalidade de Pareto- tal estado do sistema, no qual o valor de cada critério particular que descreve o estado do sistema não pode ser melhorado sem piorar a posição de outros jogadores.

O Princípio de Pareto afirma: “Qualquer mudança que não cause perda, mas que beneficie algumas pessoas (em sua própria opinião), é uma melhoria”. Assim, reconhece-se o direito a todas as alterações que não tragam danos adicionais a ninguém.

O conjunto de estados do sistema que são ótimos de Pareto é chamado de "conjunto de Pareto", "o conjunto de alternativas ótimas no sentido de Pareto" ou "conjunto de alternativas ótimas".

Uma situação em que a eficiência de Pareto foi alcançada é uma situação em que todos os benefícios da troca foram esgotados.

A eficiência de Pareto é um dos conceitos centrais da economia moderna. Com base nesse conceito, são construídos o primeiro e o segundo teoremas fundamentais do bem-estar.

Uma das aplicações da otimização de Pareto é a distribuição de Pareto de recursos (trabalho e capital) na integração econômica internacional, ou seja, União econômica de dois ou mais Estados. Curiosamente, a distribuição de Pareto antes e depois da integração econômica internacional foi adequadamente descrita matematicamente (Dalimov R.T., 2008). A análise mostrou que o valor agregado dos setores e a renda dos recursos trabalhistas caminham em direções opostas de acordo com a conhecida equação de condução de calor, semelhante a um gás ou líquido no espaço, o que possibilita a aplicação da técnica de análise utilizada em física em relação a problemas econômicos de migração de parâmetros econômicos.

Ótimo de Pareto afirma que o bem-estar da sociedade atinge seu máximo, e a distribuição de recursos torna-se ótima se qualquer alteração nessa distribuição piorar o bem-estar de pelo menos um sujeito do sistema econômico.

Estado Pareto-ótimo do mercado- uma situação em que é impossível melhorar a posição de qualquer participante do processo econômico sem reduzir simultaneamente o bem-estar de pelo menos um dos demais.

De acordo com o critério de Pareto (critério para o crescimento do bem-estar social), o movimento em direção ao ótimo só é possível com uma distribuição de recursos que aumente o bem-estar de pelo menos uma pessoa sem prejudicar ninguém.

A situação S* é chamada de situação Pareto dominante S se:

para qualquer jogador, seu pagamento em S<=S*

· há pelo menos um jogador para quem seu payoff na situação S*>S

No problema do "dilema dos prisioneiros", o equilíbrio de Pareto, quando é impossível melhorar a posição de algum dos jogadores sem piorar a posição do outro, corresponde à situação do quadrado (2; 2).

Considerar Exemplo 1:

Equilíbrios em estratégias dominantes Não.

equilíbrio de Nash. (5.5) e (4.4). Uma vez que não é lucrativo para nenhum dos jogadores desviar-se da estratégia escolhida individualmente.

Ótimo de Pareto. (5.5). Já que o payoff dos jogadores ao escolher essas estratégias mais vitórias ao escolher outras estratégias.

Equilíbrio de Stackelberg:

O jogador A faz o primeiro movimento.

Escolhe sua primeira estratégia. B escolhe a primeira estratégia. A recebe 5.

Escolhe sua segunda estratégia. B escolhe o segundo. A recebe 4.

5 > 4 =>

B faz o primeiro movimento.

Escolhe sua primeira estratégia. A escolhe a primeira estratégia. B recebe 5.

Escolhe sua segunda estratégia. E ele escolhe o segundo. B recebe 4.

5 > 4 => Equilíbrio de Stackelberg (5, 5)

Exemplo 2modelagem de duopólio.

Considere a essência deste modelo:

Suponha que haja uma indústria com duas empresas, uma das quais é a “firma líder” e a outra é a “firma seguidora”. Seja o preço do produto Função linear oferta total Q:

P(Q) = abQ.

Suponhamos também que os custos das firmas por unidade de produto sejam constantes e iguais a Com 1 e Com 2 respectivamente. Então o lucro da primeira empresa será determinado por Fórmula

Π 1 = P(Q 1 + Q 2) * Q 1 − c 1 Q 1 ,

e o lucro do segundo, respectivamente

Π 2 = P(Q 1 + Q 2) * Q 2 − c 2 Q 2 .

De acordo com o modelo de Stackelberg, a primeira empresa - a empresa líder - na primeira etapa atribui sua produção Q 1 . Depois disso, a segunda empresa - a empresa seguidora - analisando as ações da empresa líder determina sua saída Q 2. O objetivo de ambas as empresas é maximizar suas funções de pagamento.

O equilíbrio de Nash neste jogo é determinado por indução retrógrada. Considere o penúltimo estágio do jogo - o movimento da segunda empresa. Nesta fase, a Empresa 2 conhece a produção ótima da Empresa 1 Q 1* . Então o problema de determinar a saída ótima Q 2 * se reduz a resolver o problema de encontrar o ponto máximo da função payoff da segunda firma. Maximizando a função Π 2 em relação à variável Q 2 contando Q 1 dado, descobrimos que a produção ótima da segunda empresa

Esta é a melhor resposta da empresa seguidora à escolha da empresa líder do lançamento Q 1* . A empresa líder pode maximizar sua função payoff dada a forma da função Q 2*. O ponto máximo da função Π 1 na variável Q 1 ao substituir Q 2 * vontade

Substituindo isso na expressão para Q 2 * , obtemos

Assim, em equilíbrio, a empresa líder produz o dobro da produção da empresa seguidora.

Combinando as linhas de oferta e demanda em um único gráfico, obtemos imagem gráfica equilíbrio em coordenadas P, Q(Fig. 2.6). O ponto de interseção das linhas tem coordenadas (P*,Q*), Onde R* - preço de equilibrio, Q*- volume de equilíbrio de produção e consumo.

Equilíbrio do mercado- trata-se de um estado do mercado em que, para um determinado nível de preços, a quantidade demandada é igual à quantidade ofertada.

Apenas no ponto de equilíbrio E o mercado está equilibrado, nenhum dos agentes de mercado tem incentivos para mudar a situação. Isso significa que o equilíbrio de mercado tem a propriedade sustentabilidade - no caso de um estado de não equilíbrio, os agentes de mercado são motivados a retornar o mercado ao equilíbrio. Para provar a estabilidade, costuma-se usar a lógica de L. Walras ou A. Marshall.

Segundo L. Walras, com preços muito altos, há excesso de oferta - superprodução (segmento A-B na fig. 2.6i), tal mercado é chamado mercado de compradores já que o comprador tem a oportunidade de exigir uma redução de preço ao concluir as transações. Em tal situação, em primeiro lugar, o vendedor não está interessado, que é forçado a reduzir os preços e reduzir os volumes de produção. À medida que os preços caem, a quantidade demandada aumenta A-B encolhe até se tornar um ponto de equilíbrio E.

No preços baixos há um excesso de demanda - uma escassez (segmento CFna Fig. 2.6a), desenvolve mercado do vendedor. O comprador é forçado


Se um consumidor corta o consumo e paga demais por um bem escasso, à medida que o preço aumenta, a quantidade ofertada aumenta e a escassez diminui até que o mercado se equilibre.

De acordo com A. Marshall (fig. 2.66), para pequenos volumes de produção, o preço de demanda supera o preço do vendedor, para grandes volumes - vice-versa. De qualquer forma, a situação de desequilíbrio estimula um deslocamento de preço ou volume de oferta e demanda em direção ao equilíbrio. Equilíbrio (A) segundo Walras - o preço regula o desequilíbrio entre oferta e demanda, (b) de acordo com Marshall - os preços do comprador e do vendedor são equilibrados por uma mudança nos volumes.

Arroz. 2.6. Estabelecimento do equilíbrio de mercado: c) segundo L. Walras; b) de acordo com A. Marshall

Uma mudança na demanda ou oferta do mercado leva a uma mudança no equilíbrio (Fig. 2.7). Se, por exemplo, a demanda do mercado aumenta, então a linha de demanda se desloca para a direita, então o preço de equilíbrio e o volume aumentam. Se a oferta do mercado diminui, a linha de oferta se desloca para a esquerda, resultando em um aumento no preço e uma diminuição no volume.

Este modelo O mercado é estático, pois o tempo não aparece nele.

modelo "aranha"

Como exemplo de um modelo dinâmico de equilíbrio de mercado, apresentamos o modelo mais simples de "teia de aranha". Suponha que a quantidade demandada dependa do nível de preços do período atual t, e o volume de oferta - a partir dos preços do período anterior t-1:

Q d i = Q d i (P t) , Q s i = Q s i (P t -1) ,

onde t = 0,1….T é o valor discreto do período de tempo.




Arroz. 2.7. Mudança no equilíbrio de mercado:

a) devido a um aumento da procura; b) devido a uma diminuição

ofertas

Preço de mercado P t pode não corresponder ao preço de equilíbrio R*, e há três dinâmicas possíveis P t(Fig. 2.8).

A variante da trajetória de desenvolvimento neste modelo depende da razão entre as inclinações das linhas de oferta e demanda.

Arroz. 2.8. Modelo "aranha" de equilíbrio de mercado:

a) o desvio do equilíbrio diminui; 5) desvio

aumenta a partir do equilíbrio (o modelo de “catástrofe”); c) o mercado

oscila ciclicamente em torno do ponto de equilíbrio, mas o equilíbrio



Principal