Двойственность в линейном программировании. Типы равновесия: равновесие по Нэшу, Штекельбергу, Паретто-оптимальное равновесие, равновесие доминирующих стратегий Каков оптимальный механизм нахождения решения равновесия

Основные определения теории двойственности .

Каждой задаче линейного программирования можно поставить в соответствие другую задачу линейного программирования. При решении одной из них автоматически решается и другая задача. Такие задачи называют взаимодвойственными. Покажем, как по данной задаче (будем называть ее исходной) построить двойственную ей.

Рассмотрим задачу о планируемом выпуске продукции.

F = 3х 1 + 5х 2 + 4х 3 + 5х 4 → max.
5x 1 +0.4x 2 +2x 3 +0.5x 4 ≤400
5x 2 +x 3 +x 4 ≤300
x 1 +x 3 +x 4 ≤100
x 1 ≥0, x 2 ≥0, x 3 ≥0, x 4 ≥0

Общие правила составления двойственной задачи :

Прямая Двойственная
Целевая функция (max) Правая часть ограничений
Правая часть ограничений Целевая функция (min)
A - матрица ограничений A T - матрица ограничений
i -ое ограничение: ≤ 0, (≥ 0) Переменная y i ≥ 0, (≤ 0)
i -ое ограничение: = 0 Переменная y i ≠ 0
Переменная x j ≥ 0 (≤ 0)
Переменная x j ≠ 0 j -ое ограничение: = 0
max → min
Прямая Двойственная
Целевая функция (min) Правая часть ограничений
Правая часть ограничений Целевая функция (max)
A - матрица ограничений A T - матрица ограничений
i -ое ограничение: ≥ 0, (≤ 0) Переменная y i ≥ 0, (≤ 0)
i -ое ограничение: = 0 Переменная y i ≠ 0
Переменная x j ≥ 0 (≤ 0) j -ое ограничение: ≤ 0 (≥ 0)
Переменная x j ≠ 0 j -ое ограничение: = 0

Построим двойственную ей задачу по следующим правилам.

  1. Количество переменных в двойственной задаче равно количеству неравенств в исходной.
  2. Матрица коэффициентов двойственной задачи является транспонированной к матрице коэффициентов исходной.
  3. Столбец свободных членов исходной задачи является строкой коэффициентов для целевой функции двойственной. Целевая функция в одной задаче максимизируется, в другой минимизируется.
  4. Условиям неотрицательности переменных исходной задачи соответствуют неравенства-ограничения двойственной, направленные в другую сторону. И наоборот, неравенствам-ограничениям в исходной соответствуют условия неотрицательности в двойственной.

Заметим, что строки матрицы задачи I являются столбцами матрицы задачи II. Поэтому коэффициенты при переменных y i в задаче II - это, соответственно, коэффициенты i -го неравенства в задаче I.
Полученная модель и есть экономико-математическая модель задачи, двойственной к прямой задаче.

Неравенства, соединенные стрелочками, будем называть сопряженными .
Содержательная постановка двойственной задачи : найти такой набор цен (оценок) ресурсов Y = (y 1 , у 2 ..., у m), при котором общие затраты на ресурсы будут минимальны при условии, что затраты на ресурсы при производстве каждого вида продукции будут не менее прибыли (выручки) от реализации этой продукции.
Цены ресурсов у 1 , у 2 ..., у m в экономической литературе получили различные названия: учетные, неявные, теневые. Смысл этих названий состоит в том, что это условные, «ненастоящие» цены. В отличие от «внешних» цен с 1 , с 2 ..., с n на продукцию, известных, как правило, до начала производства цены ресурсов у 1 , у 2 ..., у m являются внутренними, ибо они задаются не извне, а определяются непосредственно в результате решения задачи, поэтому их чаще называют оценками ресурсов.
Связь прямой и двойственной задач состоит, в частности, в том, что решение одной из них может быть получено непосредственно из решения другой.

Теоремы двойственности

Двойственность является фундаментальным понятием в теории линейного программирования. Основные результаты теории двойственности заключены в двух теоремах, называемых теоремами двойственности.

Первая теорема двойственности .

Если одна из пары двойственных задач I и II разрешима, то разрешима и другая, причем значения целевых функций на оптимальных планах совпадают, F (x *) = G (y *), где х *, у * - оптимальные решения задач I и II

Вторая теорема двойственности .

Планы х * и у * оптимальны в задачах I и II тогда и только тогда, когда при подстановке их в систему ограничений задач I и II соответственно хотя бы одно из любой пары сопряженных неравенств обращается в равенство.
Это основная теорема двойственности . Другими словами, если х * и у * - допустимые решения прямой и двойственной задач и если c T x*=b T y*, то х * и у * – оптимальные решения пары двойственных задач.

Третья теорема двойственности . Значения переменных y i в оптимальном решении двойственной задачи представляют собой оценки влияния свободных членов b i системы ограничений - неравенств прямой задачи на величину целевой функции этой задачи:
Δf(x) = b i y i

Решая ЗЛП симплексным методом, мы одновременно решаем двойственную ЗЛП. Значения переменных двойственной задачи y i , в оптимальном плане называют объективно обусловленными, или двойственными оценками. В прикладных задачах двойственные оценки y i часто называются скрытыми, теневыми ценами или маргинальными оценками ресурсов.

Свойство взаимно двойственных задач

  1. В одной задаче ищут максимум линейной функции, в другой - минимум.
  2. Коэффициенты при переменных в линейной функции одной задачи являются свободными членами системы ограничений в другой.
  3. Каждая из задач задана в стандартной форме, причем в задаче максимизации все неравенства вида ≤ , а в задаче минимизации все неравенства вида ≥ .
  4. Матрицы коэффициентов при переменных в системах ограничений обеих задач являются транспонированными друг к другу:
  5. Число неравенств в системе ограничений одной задачи совпадает с числом переменных в другой задаче.
  6. Условия неотрицательности переменных имеются в обеих задачах.

Теорема равновесия

Задача 2
Составить двойственную задачу к задаче 1. Найти ее решение по теореме равновесия .
3x 1 +x 2 ≥12
x 1 +2x 2 ≥14
4x 1 +11x 2 ≥68

Теорема равновесия . Пусть X*=(x 1 *,...,x n *) и Y*=(y 1 *,...,y n *) - допустимые планы пары двойственных задач в симметричной форме. Эти планы являются оптимальными тогда и только тогда, когда выполняются следующие условия дополняющей нежесткости:


Теорема 4 позволяет определить оптимальное решение одной из пары двойственных задач по решению другой. Если ограничение одной задачи при подстановке оптимального решения обращается в строгое неравенство, то соответствующая двойственная переменная в оптимальном решении двойственной задачи равна 0. Если в оптимальном плане одной задачи какая-нибудь переменная положительна, то соответствующее ей ограничение двойственной задачи является уравнением.
Дадим экономическую интерпретацию условиям дополняющей нежесткости . Если в оптимальном решении какое-нибудь сырье имеет отличную от 0 оценку, то оно будет израсходовано полностью (ресурс является дефицитным). Если сырье расходуется не полностью (находится в избытке), то его оценка равна 0. Таким образом, получаем, что двойственные оценки – это мера дефицитности сырья. Оценка показывает, на сколько возрастет значение целевой функции при увеличении запаса соответствующего сырья на 1 ед. Если некоторый вид продукции входит в план производства, то затраты на его производство совпадают со стоимостью произведенной продукции. Если затраты на производство какого-нибудь вида продукции больше стоимости продукции, то продукция не производится.
В случае если одна из пары двойственных задач содержит две переменных, ее можно решить графически , а, затем, найти решение двойственной задачи , используя Теоремы 3 и 4. При этом могут возникнуть 3 случая: обе задачи имеют допустимые решения, допустимые решения имеет только одна задача, обе задачи не имеют допустимых решений.

Пример 2
Составить двойственную задачу и найти ее решение по теореме равновесия
x 2 -2x 3 +2x 4 -2x 5 ≤4
-2x 1 -2x 2 +2x 3 +2x 4 +x 5 ≥2
x i ≥0, i=1,5
Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → max, если известно решение исходной задачи: Zmax=(3;4;0;0;0).
Построим двойственную задачу. Согласуем знаки неравенств с целью исходной задачи.

Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → max
Двойственная задача:

W=4y 1 -2y 2 → min
Найдем оптимальное решение двойственной задачи по теореме равновесия. Запишем условия дополняющей нежесткости.
y 1 (4-(x 2 -2x 3 +2x 4 -2x 5))=0
y 2 (-2-(2x 1 -2x 2 -2x 3 -2x 4 -x 5))=0
x 1 (-2y 2 -10)=0
x 2 (y 1 -2y 2 +9)=0
x 3 (-2y 1 -2y 2 +19)=0
x 4 (2y 1 -2y 2 +13)=0
x 5 (-2y 1 -y 2 +11)=0
Подставим в составленную систему оптимальное решение исходной задачи: x 1 =3, x 2 =4, x 3 =0, x 4 =0, x 5 =0.
y 1 (4-(4-2·0+2·0-2·0))=0
y 2 (-2-(2·3-2·4-2·0-2·0-0))=0 W(y 1 , y 2 , y 3)=12y 1 +31y 2 +18y 3 → max . По Теореме 3 Zmax=Wmin=100000.
Окончательно, Wmin=W(0; 4000/7; 32000/21) = 100000

В антагонистической игре естественно считать оптимальным такой исход, при котором ни одному из игроков невыгодно от него отклоняться. Подобный исход (x*,y*) называется ситуацией равновесия, а принцип оптимальности, основанный на отыскании ситуации равновесия, - принципом равновесия.

Определение . В матричной игре с матрицей размерности исход является ситуацией равновесия или седловой точкой, если

В седловой точке элемент матрицы является одновременно минимумом в своей строке и максимумом в своем столбце. В игре из примера 2 элемент a 33 является седловой точкой. Оптимальными в этой игре являются третьи стратегии для обоих игроков. Если первый игрок отклоняется от третьей стратегии, то он начинает выигрывать меньше, чем a 33 . Если второй игрок отклоняется от третьей стратегии, то он начинает проигрывать больше, чем a 33 . Таким образом, для обоих игроков нет ничего лучшего, чем последовательно придерживаться третьей стратегии.

Принцип оптимального поведения: если в матричной игре имеется седловая точка, то оптимальным является выбор стратегии, соответствующей седловой точке. Что будет, если в игре окажется более одной седловой точки?

Теорема . Пусть две произвольные седловые точки в матричной игре. Тогда:

Доказательство . Из определения ситуации равновесия имеем:

Подставим в левую часть неравенства (2.8) , а в правую - , в левую часть неравенства (2.9) - , в правую - . Тогда получим:

Откуда следует равенство:

Из теоремы следует, что функция выигрыша принимает одно и то же значение во всех ситуациях равновесия. Именно поэтому число называется ценой игры . А стратегии , соответствующие любой из седловых точек, называются оптимальными стратегиями игроков 1 и 2, соответственно. В силу (2.7) все оптимальные стратегии игрока взаимозаменяемы.

Оптимальность поведения игроков не изменится, если в игре множества стратегий остаются прежними, а функция выигрыша умножается на положительную константу (или к ней прибавляется постоянное число).

Теорема . Для существования в матричной игре cедловой точки (i*,j*) необходимо и достаточно, чтобы максимин был равен минимаксу:

(2.10)

Доказательство . Необходимость. Если (i*,j*) – седловая точка, то, согласно (2.6) :

(2.11)

Вместе с тем имеем:

(2.12)

Из (2.11) и (2.12) получаем:

(2.13)

Рассуждая аналогично, приходим к равенствам:

Таким образом,

С другой стороны, всегда выполняется обратное неравенство (2.5), поэтому справедливым оказывается (2.10).

Достаточность . Пусть справедливо (2.10). Докажем наличие седловой точки. Имеем:

Согласно равенству (2.10), неравенства (2.15) и (2.16) превращаются в равенства. После чего имеем:

Теорема доказана. Попутно доказано, что общее значение максимина и минимакса равно цене игры .

Смешанное расширение игры

Рассмотрим матричную игру G. Если в ней существует ситуация равновесия, то минимакс равен максимину. Причем каждый из игроков может сообщить другому игроку информацию о своей оптимальной стратегии. Его соперник не сможет извлечь из этой информации никакой дополнительной выгоды. Теперь предположим, что в игре G нет ситуации равновесия. Тогда:

В этом случае минимаксная и максиминная стратегии не являются устойчивыми. Игроки могут иметь стимулы к отклонению от своих осторожных стратегий, связанные с возможностью получения большего выигрыша, но и с риском проигрыша, то есть получения выигрыша меньшего, чем при применении осторожной стратегии. При применении рискованных стратегий передача информации о них противнику имеет пагубные последствия: игрок автоматически получает выигрыш меньший, чем при применении осторожной стратегии.

Пример 3 . Пусть матрица игры имеет вид:

Для такой матрицы , т.е. ситуации равновесия не существует. Осторожными стратегиями игроков являются i*=1, j*=2. Пусть игрок 2 придерживается стратегии j*=2, а игрок 1 выберет стратегию i=2. тогда последний получит выигрыш 3, что на две единицы больше, чем максимин. Если, однако, игрок 2 догадается о планах игрока 1, он сменит свою стратегию на j=1, и тогда первый получит выигрыш 0, то есть меньше своего максимина. Аналогичные рассуждения можно провести и для второго игрока. В целом можно сделать вывод, что применение авантюрной стратегии может в отдельной партии игры принести результат больший, чем гарантированный, но ее применение связано с риском. Возникает вопрос, нельзя ли скомбинировать надежную осторожную стратегию с авантюрной таким образом, чтобы увеличить свой средний выигрыш? По существу вопрос стоит о том, как разделить между игроками выигрыш (2.17)?

Оказывается, что разумным решением является применение смешанной стратегии, то есть случайный выбор чистых стратегий. Напомним, что стратегия игрока 1 называется смешанной , если выбор i-ой строки производится им с некоторой вероятностью p i . Такую стратегию можно отождествить с распределением вероятностей на множестве строк. Предположим, что первый игрок имеет m чистых стратегий, а второй – n чистых стратегий. Тогда их смешанные стратегии – это вероятностные вектора:

(2.18)

Рассмотрим две возможные смешанные стратегии первого игрока из примера 3: . Эти стратегии отличаются распределениями вероятностей между чистыми стратегиями. Если в первом случае строки матрицы выбираются игроком с равными вероятностями, то во втором случае – с разными. Когда мы говорим о смешанной стратегии, то имеем ввиду под случайным выбором не выбор «наобум», а выбор, основанный на работе случайного механизма, обеспечивающего нужное нам распределение вероятностей. Так для реализации первой из смешанных стратегий хорошо подходит подбрасывание монетки. Игрок выбирает первую строку или вторую в зависимости от того, как выпадет монетка. В среднем игрок будет одинаково часто выбирать как первую строку, так и вторую, однако выбор на конкретной итерации игры не подчинен никакому фиксированному правилу и обладает максимальной степенью скрытности: до реализации случайного механизма он неизвестен даже самому первому игроку. Для реализации второй смешанной стратегии хорошо подходит механизм жеребьевки. Игрок берет семь одинаковых бумажек, пометив три их них крестиком, и бросает в шапку. Затем, наудачу, извлекает одну из них. Согласно классической теории вероятностей он вытащит бумажку с крестиком с вероятностью 3/7, а чистую бумажку – с вероятностью 4/7. Подобный механизм жеребьевки способен реализовывать любые рациональные вероятности.

Пусть игроки придерживаются смешанных стратегий (2.18). Тогда выигрыш первого игрока на отдельно взятой итерации игры является случайной величиной: v(X,Y) . Поскольку игроки выбирают стратегии независимо друг от друга, то, согласно теореме умножения вероятностей, вероятность выбора исхода (i,j) с выигрышем равна произведению вероятностей . Тогда закон распределения случайной величины v(X,Y) задан следующей таблицей

Пусть теперь игра разыгрывается бесконечно долго. Тогда средний выигрыш в такой игре равен математическому ожиданию величины v(X,Y) .

(2.19)

При конечном, но достаточно большом числе итераций игры средний выигрыш будет незначительно отличаться от величины (2.19).

Пример 4. Рассчитаем средний выигрыш (2.19) для игры из примера 3 при использовании игроками следующих стратегий: . Матрица выигрышей и матрица вероятностей выглядят следующим образом:

Найдем среднее:

Таким образом, средний выигрыш (2.20) имеет промежуточное значение между максимином и минимаксом.

Поскольку для любой пары смешанных стратегий X и Y можно подсчитать среднее значение игры, то возникает задача о поиске оптимальной стратегии. Естественно начать с исследования осторожных стратегий. Осторожная стратегия первого игрока обеспечивает ему максимин. Осторожная стратегия второго игрока не позволяет первому выиграть более минимакса. Самым значительным результатом в теории игр с противоположными интересами можно считать следующий:

Теорема . Всякая матричная игра имеет ситуацию равновесия в смешанных стратегиях . Доказательство данной теоремы непросто. В данном курсе оно опускается.

Следствия : Существование ситуации равновесия означает, что максимин равен минимаксу, и следовательно, любая матричная игра имеет цену. Оптимальной стратегией первого игрока является максиминная стратегия. Оптимальной стратегией второго – минимаксная. Поскольку задача поиска оптимальных стратегий решена, то говорят, что любая матричная игра разрешима на множестве смешанных стратегий.

Решение игры 2х2

Пример 5. Решить игру . Не трудно убедиться, что седловой точки нет. Обозначим оптимальную стратегию первого игрока (х, 1-х) – это вектор столбец, но для удобства записываем его в виде строки. Оптимальную стратегию второго игрока обозначим (y,1-y) .

Выигрыш первого игрока есть случайная величина со следующим распределением:

v(x,y) 2 -1 -4 7
p xy x(1-y) (1-x)y (1-x)(1-y)

Находим средний выигрыш за итерацию первого игрока – математическое ожидание случайной величины v(x,y):

Преобразуем данное выражение:

Данное математическое ожидание состоит из константы (5/7) и переменной части: 14(x-11/14)(y-8/14) . Если значение y отличается от 8/14, то первый игрок всегда может выбрать х таким образом, чтобы сделать переменную часть положительной, увеличивая свой выигрыш. Если значение х отличается от 11/14, то второй игрок всегда может выбрать y таким образом, чтобы сделать переменную часть отрицательной, уменьшая выигрыш первого игрока. Таким образом, седловая точка определяется равенствами: x*=11/14, y*=8/14.

2.5 Решение игр

Способ решения подобных игр покажем на примере.

Пример 6. Решить игру . Убеждаемся, что седловой точки нет. Обозначим смешанную стратегию первого игрока X=(х, 1-х) – это вектор столбец, но для удобства записываем его в виде строки.

Пусть первый игрок применяет стратегию Х, а второй – свою j-ю чистую стратегию. Обозначим средний выигрыш первого игрока в этой ситуации как . Имеем:

Изобразим графики функций (2.21) на отрезке .

Ордината точки, находящейся на любом из отрезков прямых, соответствует выигрышу первого игрока в ситуации, когда он применяет смешанную стратегию (х,(1-х)) , а второй игрок – соответствующую чистую стратегию. Гарантированный результат первого игрока – это нижняя огибающая семейства прямых (ломанная АВС). Наивысшая точка этой ломанной (точка В) является максимальным гарантированным результатом игрока 1. Абсцисса точки В соответствует оптимальной стратегии первого игрока.

Поскольку искомая точка В является пересечением линий и , то ее абсцисса может быть найдена как решение уравнения:

Таким образом, оптимальная смешанная стратегия первого игрока – (5/9, 4/9). Ордината точки В является ценой игры. Она равна:

(2.22)

Заметим, что линия, соответствующая второй стратегии второго игрока проходит выше точки В. Это означает, что если первый игрок применяет свою оптимальную стратегию, а игрок 2 – вторую, то проигрыш второго увеличивается по сравнению с применением стратегий 1 или 3. Таким образом, вторая стратегия не должна участвовать в оптимальной стратегии второго игрока. Оптимальная стратегия игрока 2 должна иметь вид: . Чистые стратегии 1 и 3 второго игрока, имеющие в оптимальной стратегии ненулевые составляющие, принято называть существенными . Стратегия 2 называется несущественной . Из рисунка выше, а также из равенства (2.22) видно, что при применении первым игроком своей оптимальной стратегии выигрыш второго игрока не зависит от того, какую из своих существенных стратегий он применяет. Он может применить также любую смешанную стратегию, состоящую из существенных (в частности – оптимальную), выигрыш и в этом случае не изменится. Совершенно аналогичное утверждение справедливо и для противоположного случая. Если второй игрок применяет свою оптимальную стратегию, то выигрыш первого игрока не зависит от того, какую из своих существенных стратегий он применяет и равен цене игры. Пользуясь этим утверждением, найдем оптимальную стратегию второго игрока.

Оптимальными стратегиями в теории конфликтов считаются такие стратегии, которые приводят игроков к устойчивым равновесиям, т.е. неким ситуациям, удовлетворяющим всех игроков.

Оптимальность решения в теории игр основана на понятии равновесной ситуации :

1) ни одному из игроков не выгодно отклоняться от равновесной ситуации, если все другие остаются в ней,

2) смысл равновесия - при многократном повторении игры, игроки выйдут на ситуацию равновесия, начав игру в любой стратегической ситуации.

В каждом взаимодействии могут существовать следующие виды равновесий:

1. равновесие в осторожных стратегиях . Определяется стратегиями, обеспечивающими игрокам гарантированный результат;

2. равновесие в доминирующих стратегиях .

Доминирующей стратегией называется такой план действий, который обеспечивает участнику максимальный выигрыш вне зависимости от действий другого участника. Поэтому равновесием доминирующих стратегий будет пересечение доминирующих стратегий обоих участников игры.

Если оптимальные стратегии игроков доминируют над всеми остальными их стратегиями, то игра имеет равновесие в доминирующих стратегиях. В игре "дилемма заключенных" равновесным по Нэшу набором стратегий будет ("признавать - признавать"). Причем важно отметить, что как для игрока А, так и для игрока Б "признавать" является доминирующей стратегией, тогда как "не признавать" – доминируемой;

3. равновесие Нэша . Равновесием Нэша называется тип решений игры двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив своё решение в одностороннем порядке, когда другие участники не меняют решения.

Допустим, - игра n лиц в нормальной форме, где - набор чистых стратегий, а - набор выигрышей.

Когда каждый игрок выбирает стратегию в профиле стратегий , игрок получает выигрыш . Причем выигрыш зависит от всего профиля стратегий: не только от стратегии, выбранной самим игроком , но и от чужих стратегий. Профиль стратегий является равновесием по Нэшу, если изменение своей стратегии не выгодно ни одному игроку, то есть для любого

Игра может иметь равновесие Нэша и в чистых стратегиях, и в смешанных.

Нэш доказал, что если разрешить смешанные стратегии , тогда в каждой игре n игроков будет хотя бы одно равновесие Нэша.

В ситуации, равновесной по Нэшу, стратегия каждого игрока обеспечивает ему наилучший отклик на стратегии других игроков;

4. Равновесие Штакельберга . Модель Штакельберга – теоретико-игровая модель олигополистического рынка при наличии информационной асимметрии. В этой модели поведение фирм описывается динамической игрой с полной совершенной информацией, в которой поведение фирм моделируется с помощью статической игры с полной информацией. Главной особенностью игры является наличие лидирующей фирмы, которая первой устанавливает объём выпуска товаров, а остальные фирмы ориентируются в своих расчетах на нее. Основные предпосылки игры:


· отрасль производит однородный товар: отличия продукции разных фирм пренебрежимо малы, а значит, покупатель при выборе, у какой фирмы покупать, ориентируется только на цену;

· в отрасли действует небольшое число фирм;

· фирмы устанавливают количество производимой продукции, а цена на неё определяется исходя из спроса;

· существует так называемая фирма-лидер, на объём производства которой ориентируются остальные фирмы.

Таким образом, модель Штакельберга используется для нахождения оптимального решения в динамических играх и соответствует максимальному выигрышу игроков, исходя из условий, сложившихся после уже сделанного выбора одним или несколькими игроками. Равновесие по Штакельбергу. - ситуация, когда ни один из игроков не может увеличить свой выигрыш в одностороннем порядке, а решения принимаются сначала одним игроком и становятся известными второму игроку. В игре «дилемма заключенных» равновесие по Штакельбергу будет достигнуто в квадрате (1;1) - "признавать вину" обоими преступниками;

5. оптимальность по Парето - такое состояние системы, при котором значение каждого частного критерия, описывающего состояние системы, не может быть улучшено без ухудшения положения других игроков.

Принцип Парето гласит так: «Всякое изменение, которое не приносит убытков, а которое некоторым людям приносит пользу (по их собственной оценке), является улучшением». Таким образом, признаётся право на все изменения, которые не приносят никому дополнительного вреда.

Множество состояний системы, оптимальных по Парето, называют «множеством Парето», «множеством альтернатив, оптимальных в смысле Парето», либо «множеством оптимальных альтернатив».

Ситуация, когда достигнута эффективность по Парето - это ситуация, когда все выгоды от обмена исчерпаны.

Эффективность по Парето является одним из центральных понятий для современной экономической науки. На основе этого понятия строятся первая и вторая фундаментальные теоремы благосостояния.

Одним из приложений Парето-оптимальности является Парето-распределение ресурсов (трудовых ресурсов и капитала) при международной экономической интеграции, т.е. экономическом объединении двух и более государств. Интересно, что Парето-распределение до и после международной экономической интеграции было адекватно математически описано (Далимов Р.Т., 2008). Анализ показал, что добавленная стоимость секторов и доходы трудовых ресурсов движутся противонаправленно в соответствии с хорошо известным уравнением теплопроводности аналогично газу или жидкости в пространстве, что дает возможность применить методику анализа, используемую в физике, в отношении экономических задач по миграции экономических параметров.

Оптимум по Парето гласит, что благосостояние общества достигает максимума, а распределение ресурсов становится оптимальным, если любое изменение этого распределения ухудшает благосостояние хотя бы одного субъекта экономической системы.

Парето-оптимальное состояние рынка - ситуация, когда нельзя улучшить положение любого участника экономического процесса, одновременно не снижая благосостояния как минимум одного из остальных.

Согласно критерию Парето (критерию роста общественного благосостояния), движение в сторону оптимума возможно лишь при таком распределении ресурсов, которое увеличивает благосостояние по крайней мере одного человека, не нанося ущерба никому другому.

Говорят, что ситуация S* доминирует по Парето ситуацию S, если:

· для любого игрока его выигрыш в S<=S*

· есть хотя бы один игрок, для которого его выигрыш в ситуации S*>S

В задаче "дилемма заключенных" равновесию по Парето, когда улучшить положение ни одного из игроков, не ухудшая при этом положение другого, нельзя, соответствует ситуация квадрата (2;2).

Рассмотрим пример 1 .

Оптимальными стратегиями в теории конфликтов считаются такие стратегии, которые приводят игроков к устойчивым равновесиям, т.е. неким ситуациям, удовлетворяющим всех игроков.

Оптимальность решения в теории игр основана на понятии равновесной ситуации :

1) ни одному из игроков не выгодно отклоняться от равновесной ситуации, если все другие остаются в ней,

2) смысл равновесия - при многократном повторении игры, игроки выйдут на ситуацию равновесия, начав игру в любой стратегической ситуации.

В каждом взаимодействии могут существовать следующие виды равновесий:

1. равновесие в осторожных стратегиях . Определяется стратегиями, обеспечивающими игрокам гарантированный результат;

2. равновесие в доминирующих стратегиях .

Доминирующей стратегией называется такой план действий, который обеспечивает участнику максимальный выигрыш вне зависимости от действий другого участника. Поэтому равновесием доминирующих стратегий будет пересечение доминирующих стратегий обоих участников игры.

Если оптимальные стратегии игроков доминируют над всеми остальными их стратегиями, то игра имеет равновесие в доминирующих стратегиях. В игре "дилемма заключенных" равновесным по Нэшу набором стратегий будет ("признавать - признавать"). Причем важно отметить, что как для игрока А, так и для игрока Б "признавать" является доминирующей стратегией, тогда как "не признавать" – доминируемой;

3. равновесие Нэша . Равновесием Нэша называется тип решений игры двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив своё решение в одностороннем порядке, когда другие участники не меняют решения.

Допустим, - игра n лиц в нормальной форме, где - набор чистых стратегий, а - набор выигрышей.

Когда каждый игрок выбирает стратегию в профиле стратегий , игрок получает выигрыш . Причем выигрыш зависит от всего профиля стратегий: не только от стратегии, выбранной самим игроком , но и от чужих стратегий. Профиль стратегий является равновесием по Нэшу, если изменение своей стратегии не выгодно ни одному игроку, то есть для любого



Игра может иметь равновесие Нэша и в чистых стратегиях, и в смешанных.

Нэш доказал, что если разрешить смешанные стратегии , тогда в каждой игре n игроков будет хотя бы одно равновесие Нэша.

В ситуации, равновесной по Нэшу, стратегия каждого игрока обеспечивает ему наилучший отклик на стратегии других игроков;

4. Равновесие Штакельберга . Модель Штакельберга – теоретико-игровая модель олигополистического рынка при наличии информационной асимметрии. В этой модели поведение фирм описывается динамической игрой с полной совершенной информацией, в которой поведение фирм моделируется с помощью статической игры с полной информацией. Главной особенностью игры является наличие лидирующей фирмы, которая первой устанавливает объём выпуска товаров, а остальные фирмы ориентируются в своих расчетах на нее. Основные предпосылки игры:

· отрасль производит однородный товар: отличия продукции разных фирм пренебрежимо малы, а значит, покупатель при выборе, у какой фирмы покупать, ориентируется только на цену;

· в отрасли действует небольшое число фирм;

· фирмы устанавливают количество производимой продукции, а цена на неё определяется исходя из спроса;

· существует так называемая фирма-лидер, на объём производства которой ориентируются остальные фирмы.

Таким образом, модель Штакельберга используется для нахождения оптимального решения в динамических играх и соответствует максимальному выигрышу игроков, исходя из условий, сложившихся после уже сделанного выбора одним или несколькими игроками. Равновесие по Штакельбергу. - ситуация, когда ни один из игроков не может увеличить свой выигрыш в одностороннем порядке, а решения принимаются сначала одним игроком и становятся известными второму игроку. В игре «дилемма заключенных» равновесие по Штакельбергу будет достигнуто в квадрате (1;1) - "признавать вину" обоими преступниками;

5. оптимальность по Парето - такое состояние системы, при котором значение каждого частного критерия, описывающего состояние системы, не может быть улучшено без ухудшения положения других игроков.

Принцип Парето гласит так: «Всякое изменение, которое не приносит убытков, а которое некоторым людям приносит пользу (по их собственной оценке), является улучшением». Таким образом, признаётся право на все изменения, которые не приносят никому дополнительного вреда.

Множество состояний системы, оптимальных по Парето, называют «множеством Парето», «множеством альтернатив, оптимальных в смысле Парето», либо «множеством оптимальных альтернатив».

Ситуация, когда достигнута эффективность по Парето - это ситуация, когда все выгоды от обмена исчерпаны.

Эффективность по Парето является одним из центральных понятий для современной экономической науки. На основе этого понятия строятся первая и вторая фундаментальные теоремы благосостояния.

Одним из приложений Парето-оптимальности является Парето-распределение ресурсов (трудовых ресурсов и капитала) при международной экономической интеграции, т.е. экономическом объединении двух и более государств. Интересно, что Парето-распределение до и после международной экономической интеграции было адекватно математически описано (Далимов Р.Т., 2008). Анализ показал, что добавленная стоимость секторов и доходы трудовых ресурсов движутся противонаправленно в соответствии с хорошо известным уравнением теплопроводности аналогично газу или жидкости в пространстве, что дает возможность применить методику анализа, используемую в физике, в отношении экономических задач по миграции экономических параметров.

Оптимум по Парето гласит, что благосостояние общества достигает максимума, а распределение ресурсов становится оптимальным, если любое изменение этого распределения ухудшает благосостояние хотя бы одного субъекта экономической системы.

Парето-оптимальное состояние рынка - ситуация, когда нельзя улучшить положение любого участника экономического процесса, одновременно не снижая благосостояния как минимум одного из остальных.

Согласно критерию Парето (критерию роста общественного благосостояния), движение в сторону оптимума возможно лишь при таком распределении ресурсов, которое увеличивает благосостояние по крайней мере одного человека, не нанося ущерба никому другому.

Говорят, что ситуация S* доминирует по Парето ситуацию S, если:

· для любого игрока его выигрыш в S<=S*

· есть хотя бы один игрок, для которого его выигрыш в ситуации S*>S

В задаче "дилемма заключенных" равновесию по Парето, когда улучшить положение ни одного из игроков, не ухудшая при этом положение другого, нельзя, соответствует ситуация квадрата (2;2).

Рассмотрим пример 1 :

Равновесия в доминирующих стратегиях нет.

Равновесие по Нэшу . (5,5) и (4,4). Так как ни одному из игроков невыгодно по отдельности отклоняться от выбранной стратегии.

Оптимум по Парето . (5,5). Так как выигрыш игроков при выборе этих стратегий больше выигрышей при выборе других стратегий.

Равновесие Штакельберга :

Первый ход делает игрок А.

Выбирает свою первую стратегию. Б выбирает первую стратегию. А получает 5.

Выбирает свою вторую стратегию. Б выбирает вторую. А получает 4.

5 > 4 =>

Первый ход делает Б.

Выбирает свою первую стратегию. А выбирает первую стратегию. Б получает 5.

Выбирает свою вторую стратегию. А выбирает вторую. Б получает 4.

5 > 4 => равновесие по Штакельбергу (5, 5)

Пример 2. Моделирование дуополии .

Рассмотрим существо этой модели:

пусть существует отрасль с двумя фирмами, одна из которых «фирма-лидер», другая - «фирма-последователь». Пусть цена на продукцию является линейной функцией общего объема предложения Q :

P (Q ) = a bQ .

Предположим также, что издержки фирм на единицу продукции постоянны и равны с 1 и с 2 соответственно. Тогда прибыль первой фирмы будет определяться формулой

Π 1 = P (Q 1 + Q 2) * Q 1 − c 1 Q 1 ,

а прибыль второй соответственно

Π 2 = P (Q 1 + Q 2) * Q 2 − c 2 Q 2 .

В соответствии с моделью Штакельберга, первая фирма - фирма-лидер - на первом шаге назначает свой выпуск Q 1 . После этого вторая фирма - фирма-последователь - анализируя действия фирмы-лидера определяет свой выпуск Q 2 . Целью обеих фирм является максимизация своих платёжных функций.

Равновесие Нэша в этой игре определяется методом обратной индукции. Рассмотрим предпоследний этап игры - ход второй фирмы. На этом этапе фирма 2 знает объем оптимального выпуска продукции первой фирмой Q 1 * . Тогда задача определения оптимального выпуска Q 2 * сводится к решению задачи нахождения точки максимума платёжной функции второй фирмы. Максимизируя функцию Π 2 по переменной Q 2 , считая Q 1 заданным, находим, что оптимальный выпуск второй фирмы

Это наилучший ответ фирмы-последователя на выбор фирмой-лидером выпуска Q 1 * . Фирма-лидер может максимизировать свою платёжную функцию, учитывая вид функции Q 2 * . Точка максимума функции Π 1 по переменной Q 1 при подстановке Q 2 * будет

Подставляя это в выражение для Q 2 * , получим

Таким образом, в равновесии фирма-лидер производит в два раза большее количество продукции, нежели фирма-последователь.

Совмещая в едином графике линии спроса и предложения, полу­чаем графическое изображение равновесия в координатах Р, Q (рис. 2.6). Точка пересечения линий имеет координаты (Р * , Q*), где р* - равновесная цена, Q * - равновесный объем производства и потребле­ния.

Рыночное равновесие - это такое состояние рынка, при котором для данного уровня цены объем спроса равен объему предложения.

Лишь в точке равновесия Е рынок сбалансирован, ни у кого из рыночных агентов нет стимулов к изменению ситуации. Это означает, что рыночное равновесие обладает свойством устойчивости - в слу­чае возникновения неравновесного состояния рыночные агенты моти­вированы к возвращению рынка в равновесие. Для доказательства ус­тойчивости обычно применяют логику Л. Вальраса или А. Маршалла.

По Л. Вальрасу, при слишком высоких ценах возникает избыток предложения - перепроизводство (отрезок А-В на рис. 2.6я), такой рынок называется рынком покупателя, так как покупатель имеет воз­можность при заключении сделок требовать снижения цен. В такой ситуации не заинтересован прежде всего продавец, который вынуж­ден снижать цены и сокращать объемы производства. По мере сниже­ния цен объем спроса увеличивается, отрезок А- В сокращается, пока не становится точкой равновесия Е.

При низких ценах возникает избыток спроса - дефицит (отре­зок CFna рис. 2.6а), складывается рынок продавца. Покупатель вынуж-


ден сокращать потребление и переплачивать за дефицитный товар, вслед за повышением цены растет объем предложения, дефицит со­кращается, пока рынок не приходит в равновесие.

По А. Маршаллу (рис. 2.66), при малых объемах производства цена спроса превышает цену продавца, при больших объемах - наоборот. В любом случае ситуация дисбаланса стимулирует смещение цены или объема спроса и предложения в сторону равновесия. Равновесие (а) по Вальрасу - цена регулирует дисбаланс объемов спроса и предло­жения, (б) по Маршаллу - изменением объемов уравновешиваются цены покупателя и продавца.

Рис. 2.6. Установление рыночного равновесия: в) по Л. Вальрасу; б) по А. Маршаллу

Изменение рыночного спроса или предложения приводит к изме­нению равновесия (рис. 2.7). Если, например, рыночный спрос растет, то линия спроса сдвигается вправо, тогда равновесная цена и объем растут. Если рыночное предложение уменьшается, линия предложения сдви­гается влево, что приводит к увеличению цены и сокращению объемов.

Данная модель рынка является статической, так как в ней не фи­гурирует время.

«Паутинообразная» модель

В качестве примера динамической модели рыночного равновесия приведем простейшую «паутинообразную» модель. Предположим, объем спроса зависит от уровня цен текущего периода t, а объем пред­ложения - от цен предыдущего периода t-1:

Q d i = Q d i (P t) , Q s i = Q s i (P t -1) ,

где t = 0,1….T- дискретное значение временного периода.




Рис. 2.7. Изменение рыночного равновесия:

а) вследствие увеличения спроса; б) вследствие уменьшения

предложения

Рыночная цена P t может не совпадать с равновесной ценой р*, причем возможны три варианта динамики P t (рис. 2.8).

Вариант траектории развития в данной модели зависит от соот­ношения наклонов линий спроса и предложения.

Рис. 2.8. «Паутинообразная» модель рыночного равновесия:

а) отклонение от равновесия уменьшается; 5) отклонение

от равновесия увеличивается (модель «катастрофы»); в) рынок

циклически колеблется вокруг точки равновесия, но равновесие



Top