Подвійність у лінійному програмуванні. Типи рівноваги: ​​рівновага по Нешу, Штекельбергу, Паретто-оптимальна рівновага, рівновага домінуючих стратегій Який оптимальний механізм знаходження рішення рівноваги

Основні визначення теорії двоїстості.

Кожному завданню лінійного програмування можна поставити у відповідність інше завдання лінійного програмування. Під час вирішення однієї з них автоматично вирішується й інше завдання. Такі завдання називають взаємодвійними. Покажемо, як за цим завданням (будемо називати її вихідною) побудувати подвійну їй.

Розглянемо завдання про запланований випуск продукції.

F = 3 х 1 + 5х 2 + 4х 3 + 5х 4 → max.
5x 1 +0.4x 2 +2x 3 +0.5x 4 ≤400
5x 2 +x 3 +x 4 ≤300
x 1 +x 3 +x 4 ≤100
x 1 ≥0, x 2 ≥0, x 3 ≥0, x 4 ≥0

Загальні правила складання двоїстої задачі:

Пряма Подвійна
Цільова функція (max) Права частина обмежень
Права частина обмежень Цільова функція (min)
A – матриця обмежень A T - матриця обмежень
i-е обмеження: ≤ 0, (≥ 0) Змінна y i ≥ 0, (≤ 0)
i-е обмеження: = 0 Змінна y i ≠ 0
Змінна x j ≥ 0 (≤ 0)
Змінна x j ≠ 0 j-е обмеження: = 0
max → min
Пряма Подвійна
Цільова функція (min) Права частина обмежень
Права частина обмежень Цільова функція (max)
A – матриця обмежень A T - матриця обмежень
i-е обмеження: ≥ 0, (≤ 0) Змінна y i ≥ 0, (≤ 0)
i-е обмеження: = 0 Змінна y i ≠ 0
Змінна x j ≥ 0 (≤ 0) j-е обмеження: ≤ 0 (≥ 0)
Змінна x j ≠ 0 j-е обмеження: = 0

Побудуємо двоїсте їй завдання за такими правилами.

  1. Кількість змінних у двоїстої задачі дорівнює кількості нерівностей у вихідній.
  2. Матриця коефіцієнтів двоїстої задачі є транспонованою до матриці коефіцієнтів вихідної.
  3. Стовпець вільних членів вихідного завдання є рядком коефіцієнтів для цільової функції двоїстої. Цільова функція в одному завданні максимізується, в іншій мінімізується.
  4. Умови невід'ємності змінних вихідної задачі відповідають нерівності-обмеження двоїстої, спрямовані в інший бік. І навпаки, нерівностям-обмеженням у вихідній відповідають умови невід'ємності у подвійній.

Зауважимо, що рядки матриці задачі є стовпцями матриці задачі II. Тому коефіцієнти при змінних y у задачі II - це, відповідно, коефіцієнти i -ї нерівності в задачі I.
Отримана модель є економіко-математична модель завдання, двоїстої до прямої задачі.

Нерівності, з'єднані стрілочками, будемо називати сполученими.
Змістовна постановка двоїстої задачі: знайти такий набір цін (оцінок) ресурсів Y = (y 1 , у 2 ..., у m), за якого загальні витрати на ресурси будуть мінімальними за умови, що витрати на ресурси при виробництві кожного виду продукції будуть не меншими за прибуток ( виручки) від цієї продукції.
Ціни ресурсів у 1, у 2 ..., у m в економічній літературі отримали різні назви: облікові, неявні, тіньові Сенс цих назв у тому, що це умовні, «несправжні» ціни. На відміну від «зовнішніх» цін з 1, з 2…, з n на продукцію, відомих, як правило, до початку виробництва ціни ресурсів у 1, у 2…, у m є внутрішніми, бо вони задаються не ззовні , а визначаються безпосередньо результаті вирішення завдання, тому їх частіше називають оцінками ресурсів.
Зв'язок прямий і двоїстої завдань полягає, зокрема, у цьому, що рішення однієї з них можна отримати безпосередньо з рішення інший.

Теореми двоїстості

Подвійність є фундаментальним поняттям у теорії лінійного програмування. Основні результати теорії двоїстості укладено у двох теоремах, званих теоремами двоїстості.

Перша теорема двоїстості.

Якщо одне з пари двоїстих завдань I і II можна розв'язати, то можна розв'язати й іншу, причому значення цільових функцій на оптимальних планах збігаються, F(x*) = G(y*), де х *, у * - оптимальні розв'язування задач I та II

Друга теорема двоїстості.

Плани х * і у * оптимальні у завданнях I і II тоді й лише тоді, коли за підстановці в систему обмежень завдань I і II відповідно хоча одне з будь-якої пари сполучених нерівностей звертається у рівність.
Це основна теорема двоїстості. Іншими словами, якщо х * і у * - допустимі рішення прямої та двоїстої задач і якщо c T x * = b T y *, то х * і у * - оптимальні рішення пари двоїстих задач.

Третя теорема двоїстості. Значення змінних y i в оптимальному розв'язанні двоїстої задачі є оцінкою впливу вільних членів b i системи обмежень - нерівностей прямої задачі на величину цільової функції цього завдання:
Δf(x) = b i y i

Вирішуючи ЗЛП симплексним методом, ми одночасно вирішуємо подвійну ЗЛП. Значення змінних двоїстої задачі y, в оптимальному плані називають об'єктивно обумовленими, або двоїстими оцінками. У прикладних задачах подвійні оцінки y i часто називаються прихованими, тіньовими цінами чи маргінальними оцінками ресурсів.

Властивість взаємно двоїстих завдань

  1. В одному завданні шукають максимум лінійної функції, в іншому – мінімум.
  2. Коефіцієнти при змінних лінійної функції однієї задачі є вільними членами системи обмежень в інший.
  3. Кожне із завдань задане у стандартній формі, причому у задачі максимізації всі нерівності виду ≤ , а задачі мінімізації всі нерівності виду ≥ .
  4. Матриці коефіцієнтів при змінних системах обмежень обох завдань є транспонованими друг до друга:
  5. Число нерівностей у системі обмежень однієї задачі збігається з числом змінних в іншому завданні.
  6. Умови невід'ємності змінних є обох задачах.

Теорема рівноваги

Завдання 2
Скласти подвійне завдання до задачі 1. Знайти її рішення щодо теореми рівноваги.
3x 1 +x 2 ≥12
x 1 +2x 2 ≥14
4x 1 +11x 2 ≥68

Теорема рівноваги . Нехай X*=(x 1 *,...,x n *) та Y*=(y 1 *,...,y n *) - допустимі плани пари двоїстих завдань у симетричній формі. Ці плани є оптимальними тоді і лише тоді, коли виконуються такі умови, що доповнюють нежорсткості:


Теорема 4 дозволяє визначити оптимальне рішення однієї з пари двоїстих завдань за рішенням іншої. Якщо обмеження однієї задачі при підстановці оптимального рішення перетворюється на сувору нерівність, то відповідна двоїста змінна в оптимальному розв'язанні двоїстої задачі дорівнює 0. Якщо оптимальному плані однієї завдання якась змінна позитивна, то відповідне їй обмеження двоїстої завдання є рівнянням.
Дамо економічну інтерпретацію умовам доповнюючої нежорсткості. Якщо оптимальному рішенні яке-небудь сировину має відмінну від 0 оцінку, воно буде витрачено повністю (ресурс є дефіцитним). Якщо сировина витрачається в повному обсязі (знаходиться надлишку), його оцінка дорівнює 0. Отже, отримуємо, що двоїсті оцінки – це міра дефіцитності сировини. Оцінка показує, скільки зросте значення цільової функції зі збільшенням запасу відповідної сировини на 1 од. Якщо певний вид продукції входить до плану виробництва, то витрати на його виробництво збігаються з вартістю виробленої продукції. Якщо витрати виробництва якогось виду продукції більше вартості продукції, то продукція не виробляється.
Якщо одна з пари подвійних завдань містить дві змінні, її можна вирішити графічно , а, потім, знайти рішення двоїстої задачі , використовуючи Теореми 3 і 4. При цьому можуть виникнути 3 випадки: обидві задачі мають допустимі рішення, допустимі рішення має тільки одна Завдання, обидві задачі не мають допустимих рішень.

Приклад 2
Скласти подвійне завдання та знайти його рішення з теореми рівноваги
x 2 -2x 3 +2x 4 -2x 5 ≤4
-2x 1 -2x 2 +2x 3 +2x 4 +x 5 ≥2
x i ≥0, i=1,5
Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → max, якщо відоме рішення вихідної задачі: Zmax=(3;4;0;0;0).
Побудуємо подвійне завдання. Узгоджуємо знаки нерівностей з метою вихідного завдання.

Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → max
Подвійне завдання:

W=4y 1 -2y 2 → min
Знайдемо оптимальне рішення двоїстої задачі з теореми рівноваги. Запишемо умови нежорсткості, що доповнює.
y 1 (4-(x 2 -2x 3 +2x 4 -2x 5))=0
y 2 (-2-(2x 1 -2x 2 -2x 3 -2x 4 -x 5))=0
x 1 (-2y 2 -10) = 0
x 2 (y 1 -2y 2 +9) = 0
x 3 (-2y 1 -2y 2 +19) = 0
x 4 (2y 1 -2y 2 +13) = 0
x 5 (-2y 1 -y 2 +11) = 0
Підставимо у складену систему оптимальне рішення вихідної задачі: x 1 = 3, x 2 = 4, x 3 = 0, x 4 = 0, x 5 = 0.
y 1 (4-(4-2·0+2·0-2·0))=0
y 2 (-2-(2·3-2·4-2·0-2·0-0))=0 W(y 1 , y 2 , y 3)=12y 1 +31y 2 +18y 3 → max . По Теоремі 3 Zmax = Wmin = 100000.
Остаточно, Wmin=W(0; 4000/7; 32000/21) = 100000

В антагоністичній грі природно вважати оптимальним такий результат, при якому жодному гравцю невигідно від нього відхилятися. Подібний результат (x *, y *) називається ситуацією рівноваги, а принцип оптимальності, заснований на пошуку ситуації рівноваги, - принцип рівноваги.

Визначення. У матричній грі з матрицею розмірності результат є ситуацією рівновагиабо сідловою точкою, якщо

У сідловій точці елемент матриці є одночасно мінімумом у своєму рядку та максимумом у своєму стовпці. У грі з прикладу 2 елемент a 33є сідловою точкою. Оптимальними у цій грі є треті стратегії для обох гравців. Якщо перший гравець відхиляється від третьої стратегії, він починає вигравати менше, ніж a 33. Якщо другий гравець відхиляється від третьої стратегії, він починає програвати більше, ніж a 33. Таким чином, для обох гравців немає нічого кращого, ніж послідовно дотримуватись третьої стратегії.

Принцип оптимальної поведінки: якщо в матричній грі є сідлова точка, то оптимальним є вибір стратегії, що відповідає сідловій точці. Що буде, якщо в грі виявиться більше однієї сідлової точки?

Теорема. Нехай дві довільні сідлові точки у матричній грі. Тоді:

Доведення. З визначення ситуації рівноваги маємо:

Підставимо в ліву частину нерівності (2.8) , а праву - , в ліву частина нерівності (2.9) - , праву - . Тоді отримаємо:

Звідки випливає рівність:

З теореми випливає, що функція виграшу набуває те саме значення у всіх ситуаціях рівноваги. Саме тому число називається ціною гри. А стратегії, що відповідають будь-якій із сідлових точок, називаються оптимальними стратегіямигравців 1 та 2, відповідно. З огляду на (2.7) всі оптимальні стратегії гравця взаємозамінні.

Оптимальність поведінки гравців не зміниться, якщо у грі безлічі стратегій залишаються колишніми, а функція виграшу множиться на позитивну константу (або до неї додається постійне число).

Теорема. Для існування в матричній грі сідлової точки (i*,j*) необхідно і достатньо, щоб максимін дорівнював мінімакс:

(2.10)

Доведення. Необхідність.Якщо (i*,j*) – сідлова точка, то згідно (2.6):

(2.11)

Водночас маємо:

(2.12)

З (2.11) та (2.12) отримуємо:

(2.13)

Розмірковуючи аналогічно, приходимо до рівностей:

Таким чином,

З іншого боку, завжди виконується зворотна нерівність (2.5), тому справедливою виявляється (2.10).

Достатність. Нехай справедливо (2.10). Доведемо наявність сідлової точки. Маємо:

Відповідно до рівності (2.10), нерівності (2.15) та (2.16) перетворюються на рівності. Після чого маємо:

Теорему доведено. Принагідно доведено, що загальне значеннямаксиміна і мінімакса дорівнює ціні гри.

Змішане розширення гри

Розглянемо матричну гру G. Якщо існує ситуація рівноваги, то мінімакс дорівнює максимину. Причому кожен із гравців може повідомити іншого гравця інформацію про свою оптимальну стратегію. Його суперник не зможе отримати з цієї інформації жодної додаткової вигоди. Тепер припустимо, що у грі G немає ситуації рівноваги. Тоді:

У цьому випадку мінімаксна та максимінна стратегії не є стійкими. Гравці можуть мати стимули до відхилення від своїх обережних стратегій, пов'язані з можливістю отримання більшого виграшу, але й ризиком програшу, тобто отримання виграшу меншого, ніж при застосуванні обережної стратегії. При застосуванні ризикованих стратегій передача інформації про них противнику має згубні наслідки: гравець автоматично отримує менший виграш, ніж при застосуванні обережної стратегії.

Приклад 3. Нехай матриця гри має вигляд:

Для такої матриці, тобто. ситуації рівноваги немає. Обережними стратегіями гравців є i * = 1, j * = 2. Нехай гравець 2 дотримується стратегії j*=2, а гравець 1 вибере стратегію i=2. тоді останній отримає виграш 3, що у дві одиниці більше, ніж максимин. Якщо, однак, гравець 2 здогадається про плани гравця 1, він змінить свою стратегію на j=1, і тоді перший отримає виграш 0, тобто менше максиміна. Аналогічні міркування можна провести і другого гравця. Загалом можна дійти невтішного висновку, що застосування авантюрної стратегії може у окремої партії гри принести результат більший, ніж гарантований, та її застосування пов'язані з ризиком. Постає питання, чи не можна скомбінувати надійну обережну стратегію з авантюрною таким чином, щоб збільшити свій середній виграш? По суті, питання стоїть про те, як розділити між гравцями виграш (2.17)?

Виявляється, розумним рішенням є застосування змішаної стратегії, тобто випадковий вибір чистих стратегій. Нагадаємо, що стратегія гравця 1 називається змішаною, якщо вибір i-го рядка проводиться ним з деякою ймовірністю p i .Таку стратегію можна ототожнити з розподілом ймовірностей на безлічі рядків. Припустимо, перший гравець має m чистих стратегій, а другий – n чистих стратегій. Тоді їх змішані стратегії – це ймовірнісні вектори:

(2.18)

Розглянемо дві можливі змішані стратегії першого гравця з прикладу 3: . Ці стратегії відрізняються розподілом ймовірностей між чистими стратегіями. Якщо в першому випадку рядки матриці вибираються гравцем з рівними імовірностями, то в другому – з різними. Коли ми говоримо про змішану стратегію, то маємо на увазі під випадковим виборомне вибір «наобум», а вибір, заснований на роботі випадкового механізму, який би потрібний нам розподіл ймовірностей. Так для реалізації першої із змішаних стратегій добре підходить підкидання монети. Гравець обирає перший рядок або другий залежно від того, як випаде монетка. У середньому гравець однаково часто вибиратиме як перший рядок, так і другий, проте вибір на конкретній ітерації гри не підпорядкований ніякому фіксованому правилу і має максимальний ступінь скритності: до реалізації випадкового механізму він невідомий навіть самому першому гравцю. Для реалізації другої змішаної стратегії добре підходить механізм жеребкування. Гравець бере сім однакових папірців, помітивши три з них хрестиком, і кидає в шапку. Потім, навмання, витягує одну з них. Відповідно до класичної теорії ймовірностей він витягне папірець з хрестиком з ймовірністю 3/7, а чистий папірець – з ймовірністю 4/7. Подібний механізм жеребкування здатний реалізовувати будь-які раціональні можливості.

Нехай гравці дотримуються змішаних стратегій (2.18). Тоді виграш першого гравця на окремо взятій ітерації гри є випадковою величиною: v(X,Y). Оскільки гравці вибирають стратегії незалежно одна від одної, то, згідно з теоремою множення ймовірностей, ймовірність вибору результату (i,j) з виграшем дорівнює добутку ймовірностей. Тоді закон розподілу випадкової величини v(X,Y)заданий наступною таблицею

Нехай тепер гра розігрується нескінченно довго. Тоді середній виграш у такій грі дорівнює математичному очікуванню величини v(X,Y).

(2.19)

При кінцевому, але достатньо великому числіітерацій гри середній виграш трохи відрізнятиметься від величини (2.19).

приклад 4. Розрахуємо середній виграш (2.19) для гри з прикладу 3 під час використання гравцями наступних стратегій: . Матриця виграшів і матриця ймовірностей виглядають так:

Знайдемо середнє:

Таким чином, середній виграш (2.20) має проміжне значення між максиміном та мінімаксом.

Оскільки будь-якої пари змішаних стратегій X і Y можна підрахувати середнє значення гри, виникає завдання пошуку оптимальної стратегії. Природно розпочати з вивчення обережних стратегій. Обережна стратегія першого гравця забезпечує йому максимін. Обережна стратегія другого гравця не дозволяє першому виграти більш за мінімаксу. Найзначнішим результатом теорії ігор з протилежними інтересами вважатимуться наступний:

Теорема. Будь-яка матрична гра має ситуацію рівноваги у змішаних стратегіях. Доказ цієї теореми непросто. У цьому курсі воно опускається.

Наслідки: Існування ситуації рівноваги означає, що максимін дорівнює мінімакс, і, отже, будь-яка матрична гра має ціну. Оптимальною стратегією першого гравця є максимальна стратегія. Оптимальною стратегією другого – мінімаксна. Оскільки завдання пошуку оптимальних стратегій вирішено, то кажуть, що будь-яка матрична гра можна розв'язатина багатьох змішаних стратегій.

Рішення гри 2х2

приклад 5. Вирішити гру. Не важко переконатися, що сідлової точки немає. Позначимо оптимальну стратегію першого гравця (х, 1-х)– це вектор стовпець, але для зручності записуємо його у вигляді рядка. Оптимальну стратегію другого гравця позначимо (y,1-y).

Виграш першого гравця є випадковою величиною з наступним розподілом:

v(x,y) 2 -1 -4 7
p xy x(1-y) (1-x)y (1-x)(1-y)

Знаходимо середній виграш за ітерацію першого гравця – математичне очікування випадкової величини v(x,y):

Перетворимо цей вираз:

Дане математичне очікування складається з константи (5/7) та змінної частини: 14(x-11/14)(y-8/14). Якщо значення yвідрізняється від 8/14, то перший гравець завжди може вибрати хтаким чином, щоб зробити змінну частину позитивною, збільшуючи власний виграш. Якщо значення хвідрізняється від 11/14, то другий гравець завжди може вибрати yтаким чином, щоб зробити змінну частину негативною, зменшуючи виграш першого гравця. Таким чином, сідлова точка визначається рівностями: x * = 11/14, y * = 8/14.

2.5 Вирішення ігор

Спосіб вирішення подібних ігор покажемо на прикладі.

приклад 6. Вирішити гру . Переконуємося, що сідлової точки немає. Позначимо змішану стратегію першого гравця X=(х, 1-х)– це вектор стовпець, але для зручності записуємо його у вигляді рядка.

Нехай перший гравець застосовує стратегію Х, а другий – свою j-ю чистустратегію. Позначимо середній виграш першого гравця у цій ситуації як. Маємо:

Зобразимо графіки функцій (2.21) на відрізку .

Ордината точки, що знаходиться на будь-якому з прямих відрізків, відповідає виграшу першого гравця в ситуації, коли він застосовує змішану стратегію (х, (1-х)), а другий гравець – відповідну чисту стратегію. Гарантований результат першого гравця – це нижня загальна родина прямих (ламана АВС). Найвища точкаЦя ламана (точка В) є максимальним гарантованим результатом гравця 1. Абсцис точки В відповідає оптимальній стратегії першого гравця.

Оскільки точка є перетином ліній і , то її абсцису може бути знайдена як рішення рівняння:

Таким чином, оптимальна змішана стратегія першого гравця – (5/9, 4/9). Ордината точки є ціною гри. Вона дорівнює:

(2.22)

Зауважимо, що лінія, що відповідає другій стратегії другого гравця, проходить вище точки В. Це означає, що якщо перший гравець застосовує свою оптимальну стратегію, а гравець 2 – другу, то програш другого збільшується порівняно із застосуванням стратегій 1 або 3. Таким чином, друга стратегія має брати участь у оптимальної стратегії другого гравця. Оптимальна стратегія гравця 2 повинна мати вигляд: . Чисті стратегії 1 і 3 другого гравця, що мають в оптимальній стратегії ненульові складові, прийнято називати суттєвими. Стратегія 2 називається несуттєвою. З малюнка вище, і навіть з рівності (2.22) видно, що з застосуванні першим гравцем своєї оптимальної стратегії виграш другого гравця залежить від того, яку зі своїх істотних стратегій він застосовує. Він може застосувати також будь-яку змішану стратегію, що складається з істотних (зокрема оптимальну), виграш і в цьому випадку не зміниться. Цілком аналогічне твердження справедливе і для протилежного випадку. Якщо другий гравець застосовує свою оптимальну стратегію, то виграш першого гравця не залежить від того, яку зі своїх суттєвих стратегій він застосовує та дорівнює ціні гри. Використовуючи це твердження, знайдемо оптимальну стратегію другого гравця.

Оптимальними стратегіями теорії конфліктів вважаються такі стратегії, які призводять гравців до стійким рівновагам, тобто. деяким ситуаціям, які задовольняють всіх гравців.

Оптимальність вирішення теорії ігор полягає в понятті рівноважної ситуації:

1) жодному з гравців не вигідно відхилятися від рівноважної ситуації, якщо всі інші залишаються у ній,

2) сенс рівноваги – при багаторазовому повторенні гри, гравці вийдуть на ситуацію рівноваги, розпочавши гру у будь-якій стратегічній ситуації.

У кожному взаємодії можуть бути такі види рівноваг:

1. рівновага в обережних стратегіях . Визначається стратегіями, які забезпечують гравцям гарантований результат;

2. рівновага у домінуючих стратегіях .

Домінуючою стратегієюназивається такий план дій, що забезпечує учаснику максимальний виграш незалежно від дій іншого учасника. Тому рівновагою домінуючих стратегій буде перетин домінуючих стратегій обох учасників гри.

Якщо оптимальні стратегії гравців домінують над рештою їхніх стратегій, то гра має рівновагу в домінуючих стратегіях. У грі "дилема ув'язнених" рівноважним за Нешем набором стратегій буде ("визнавати - визнавати"). Причому важливо відзначити, що як для гравця А, так і для гравця Б "визнавати" є домінуючою стратегією, тоді як "не визнавати" – домінованою;

3. рівновага Неша . Рівновагою Нешаназивається тип рішень гри двох і більше гравців, у якому жоден учасник неспроможна збільшити виграш, змінивши своє рішення у односторонньому порядку, коли інші учасники не змінюють рішення.

Допустимо, - гра nосіб у нормальній формі, де – набір чистих стратегій, а – набір виграшів.

Коли кожен гравець вибирає стратегію у профілі стратегій, гравець отримує виграш. Причому виграш залежить від профілю стратегій: як від стратегії, обраної самим гравцем , а й від чужих стратегій. Профіль стратегій є рівновагою по Нешу, якщо зміна своєї стратегії не вигідна жодному гравцю, тобто для будь-якого

Гра може мати рівновагу Неша і в чистих стратегіях, і змішаних.

Неш довів, що якщо дозволити змішані стратегіїтоді в кожній грі nгравців буде хоча б одна рівновага Неша.

У ситуації, рівноважній Нешу, стратегія кожного гравця забезпечує йому найкращий відгук на стратегії інших гравців;

4. Рівнавага Штакельберга. Модель Штакельберга- Теоретико-ігрова модель олігополістичного ринку за наявності інформаційної асиметрії. У цій моделі поведінка фірм описується динамічною грою з повною досконалою інформацією, в якій поведінка фірм моделюється за допомогою статичноїігри з повною інформацією. Головною особливістюІгри є наявність лідируючої фірми, яка першою встановлює обсяг випуску товарів, а інші фірми орієнтуються у своїх розрахунках на неї. Основні передумови гри:


· Галузь виробляє однорідний товар: відмінності продукції різних фірм зневажливо малі, а значить, покупець при виборі, у якої фірми купувати, орієнтується лише на ціну;

· У галузі діє невелика кількість фірм;

· Фірми встановлюють кількість виробленої продукції, а ціна на неї визначається виходячи з попиту;

· Існує так звана фірма-лідер, на обсяг виробництва якої орієнтуються інші фірми.

Таким чином, модель Штакельберга використовується для знаходження оптимального рішення в динамічних іграх і відповідає максимальному виграшу гравців, виходячи з умов, що склалися після вибору одного або кількома гравцями. рівновагу по Штакельбергу.- Ситуація, коли жоден з гравців не може збільшити свій виграш в односторонньому порядку, а рішення приймаються спочатку одним гравцем і стають відомими другомугравцю. У грі «дилема ув'язнених» рівновага за Штакельбергом буде досягнуто в квадраті (1; 1) – "визнавати провину" обома злочинцями;

5. оптимальність за Парето- такий стан системи, у якому значення кожного приватного критерію, описує стан системи, може бути поліпшено без погіршення становища інших гравців.

Принцип Парето говорить так: «Будь-яка зміна, яка не приносить збитків, а яка деяким людям приносить користь (за їхньою власною оцінкою), є поліпшенням». Таким чином, визнається право на всі зміни, які не завдають нікому додаткової шкоди.

Безліч станів системи, оптимальних за Парето, називають «множиною Парето», «множиною альтернатив, оптимальних у сенсі Парето», або «множиною оптимальних альтернатив».

Ситуація, коли досягнуто ефективності щодо Парето - це ситуація, коли всі вигоди від обміну вичерпані.

Ефективність за Парето одна із центральних понять для сучасної економічної науки. На основі цього поняття будуються перша та друга фундаментальні теореми добробуту.

Однією з додатків Парето-оптимальності є Парето-распределение ресурсів (трудових ресурсів і капіталу) за міжнародної економічної інтеграції, тобто. економічному об'єднанні двох і більше держав. Цікаво, що Парето-розподіл до та після міжнародної економічної інтеграції було адекватно математично описано (Далімов Р.Т., 2008). Аналіз показав, що додана вартість секторів та доходи трудових ресурсів рухаються протиспрямовано відповідно до добре відомого рівняння теплопровідності аналогічно газу або рідини у просторі, що дає можливість застосувати методику аналізу, що використовується у фізиці, щодо економічних завдань з міграції економічних параметрів.

Оптимум за Паретосвідчить, що добробут суспільства досягає максимуму, а розподіл ресурсів стає оптимальним, якщо будь-яка зміна цього розподілу погіршує добробут хоча одного суб'єкта економічної системи.

Парето-оптимальний стан ринку- Ситуація, коли не можна поліпшити становище будь-якого учасника економічного процесу, одночасно не знижуючи добробуту як мінімум одного з інших.

Згідно з критерієм Парето (критерієм зростання суспільного добробуту), рух у бік оптимуму можливий лише за такого розподілу ресурсів, який збільшує добробут принаймні одну людину, не завдаючи шкоди нікому іншому.

Кажуть, що ситуація S* домінує за Парето ситуацію S, якщо:

· для будь-якого гравця його виграш у S<=S*

· є хоча б один гравець, для якого його виграш у ситуації S*>S

У задачі " дилема ув'язнених " рівновагу по Парето, коли поліпшити становище жодного з гравців, не погіршуючи у своїй становище іншого, не можна, відповідає ситуація квадрата (2;2).

Розглянемо приклад 1.

Оптимальними стратегіями теорії конфліктів вважаються такі стратегії, які призводять гравців до стійким рівновагам, тобто. деяким ситуаціям, які задовольняють всіх гравців.

Оптимальність вирішення теорії ігор полягає в понятті рівноважної ситуації:

1) жодному з гравців не вигідно відхилятися від рівноважної ситуації, якщо всі інші залишаються у ній,

2) сенс рівноваги – при багаторазовому повторенні гри, гравці вийдуть на ситуацію рівноваги, розпочавши гру у будь-якій стратегічній ситуації.

У кожному взаємодії можуть бути такі види рівноваг:

1. рівновага в обережних стратегіях . Визначається стратегіями, які забезпечують гравцям гарантований результат;

2. рівновага у домінуючих стратегіях .

Домінуючою стратегієюназивається такий план дій, що забезпечує учаснику максимальний виграш незалежно від дій іншого учасника. Тому рівновагою домінуючих стратегій буде перетин домінуючих стратегій обох учасників гри.

Якщо оптимальні стратегії гравців домінують над рештою їхніх стратегій, то гра має рівновагу в домінуючих стратегіях. У грі "дилема ув'язнених" рівноважним за Нешем набором стратегій буде ("визнавати - визнавати"). Причому важливо відзначити, що як для гравця А, так і для гравця Б "визнавати" є домінуючою стратегією, тоді як "не визнавати" – домінованою;

3. рівновага Неша . Рівновагою Нешаназивається тип рішень гри двох і більше гравців, у якому жоден учасник неспроможна збільшити виграш, змінивши своє рішення у односторонньому порядку, коли інші учасники не змінюють рішення.

Допустимо, - гра nосіб у нормальній формі, де – набір чистих стратегій, а – набір виграшів.

Коли кожен гравець вибирає стратегію у профілі стратегій, гравець отримує виграш. Причому виграш залежить від профілю стратегій: як від стратегії, обраної самим гравцем , а й від чужих стратегій. Профіль стратегій є рівновагою по Нешу, якщо зміна своєї стратегії не вигідна жодному гравцю, тобто для будь-якого



Гра може мати рівновагу Неша і в чистих стратегіях, і змішаних.

Неш довів, що якщо дозволити змішані стратегіїтоді в кожній грі nгравців буде хоча б одна рівновага Неша.

У ситуації, рівноважній Нешу, стратегія кожного гравця забезпечує йому найкращий відгук на стратегії інших гравців;

4. Рівнавага Штакельберга. Модель Штакельберга- Теоретико-ігрова модель олігополістичного ринку за наявності інформаційної асиметрії. У цій моделі поведінка фірм описується динамічною грою з повною досконалою інформацією, в якій поведінка фірм моделюється за допомогою статичноїігри з повною інформацією. Головною особливістю гри є наявність лідируючої фірми, яка першою встановлює обсяг випуску товарів, інші фірми орієнтуються у розрахунках її у. Основні передумови гри:

· Галузь виробляє однорідний товар: відмінності продукції різних фірм зневажливо малі, а значить, покупець при виборі, у якої фірми купувати, орієнтується лише на ціну;

· У галузі діє невелика кількість фірм;

· Фірми встановлюють кількість виробленої продукції, а ціна на неї визначається виходячи з попиту;

· Існує так звана фірма-лідер, на обсяг виробництва якої орієнтуються інші фірми.

Таким чином, модель Штакельберга використовується для знаходження оптимального рішення в динамічних іграх і відповідає максимальному виграшу гравців, виходячи з умов, що склалися після вибору одного або кількома гравцями. рівновагу по Штакельбергу.- Ситуація, коли жоден з гравців не може збільшити свій виграш в односторонньому порядку, а рішення приймаються спочатку одним гравцем і стають відомими другому гравцю. У грі «дилема ув'язнених» рівновага за Штакельбергом буде досягнуто в квадраті (1; 1) – "визнавати провину" обома злочинцями;

5. оптимальність за Парето- такий стан системи, у якому значення кожного приватного критерію, описує стан системи, може бути поліпшено без погіршення становища інших гравців.

Принцип Парето говорить так: «Будь-яка зміна, яка не приносить збитків, а яка деяким людям приносить користь (за їхньою власною оцінкою), є поліпшенням». Таким чином, визнається право на всі зміни, які не завдають нікому додаткової шкоди.

Безліч станів системи, оптимальних за Парето, називають «множиною Парето», «множиною альтернатив, оптимальних у сенсі Парето», або «множиною оптимальних альтернатив».

Ситуація, коли досягнуто ефективності щодо Парето - це ситуація, коли всі вигоди від обміну вичерпані.

Ефективність за Парето одна із центральних понять для сучасної економічної науки. На основі цього поняття будуються перша та друга фундаментальні теореми добробуту.

Однією з додатків Парето-оптимальності є Парето-распределение ресурсів (трудових ресурсів і капіталу) за міжнародної економічної інтеграції, тобто. економічному об'єднанні двох і більше держав. Цікаво, що Парето-розподіл до та після міжнародної економічної інтеграції було адекватно математично описано (Далімов Р.Т., 2008). Аналіз показав, що додана вартість секторів та доходи трудових ресурсів рухаються протиспрямовано відповідно до добре відомого рівняння теплопровідності аналогічно газу або рідини у просторі, що дає можливість застосувати методику аналізу, що використовується у фізиці, щодо економічних завдань з міграції економічних параметрів.

Оптимум за Паретосвідчить, що добробут суспільства досягає максимуму, а розподіл ресурсів стає оптимальним, якщо будь-яка зміна цього розподілу погіршує добробут хоча одного суб'єкта економічної системи.

Парето-оптимальний стан ринку- Ситуація, коли не можна поліпшити становище будь-якого учасника економічного процесу, одночасно не знижуючи добробуту як мінімум одного з інших.

Згідно з критерієм Парето (критерієм зростання суспільного добробуту), рух у бік оптимуму можливий лише за такого розподілу ресурсів, який збільшує добробут принаймні одну людину, не завдаючи шкоди нікому іншому.

Кажуть, що ситуація S* домінує за Парето ситуацію S, якщо:

· для будь-якого гравця його виграш у S<=S*

· є хоча б один гравець, для якого його виграш у ситуації S*>S

У задачі " дилема ув'язнених " рівновагу по Парето, коли поліпшити становище жодного з гравців, не погіршуючи у своїй становище іншого, не можна, відповідає ситуація квадрата (2;2).

Розглянемо приклад 1:

Рівноваги у домінуючих стратегіяхні.

Рівновага по Нешу. (5,5) та (4,4). Оскільки жодному гравцю невигідно окремо відхилятися від обраної стратегії.

Оптимум за Парето. (5,5). Тому що виграш гравців при виборі цих стратегій більше виграшівпід час виборів інших стратегій.

Рівновага Штакельберга:

Перший хід робить гравець А.

Вибирає свою першу стратегію. Б обирає першу стратегію. А отримує 5.

Вибирає свою другу стратегію. Б обирає другу. А отримує 4.

5 > 4 =>

Перший хід робить Б.

Вибирає свою першу стратегію. А обирає першу стратегію. Б отримує 5.

Вибирає свою другу стратегію. А вибирає другу. Б отримує 4.

5 > 4 => рівновага за Штакельбергом (5, 5)

приклад 2.Моделювання дуополії.

Розглянемо істоту цієї моделі:

нехай існує галузь із двома фірмами, одна з яких «фірма-лідер», інша – «фірма-послідовник». Нехай ціна на продукцію є лінійною функцієюзагального обсягу пропозиції Q:

P(Q) = abQ.

Припустимо також, що витрати фірм на одиницю продукції постійні та рівні з 1 і з 2 відповідно. Тоді прибуток першої фірми визначатиметься формулою

Π 1 = P(Q 1 + Q 2) * Q 1 − c 1 Q 1 ,

а прибуток другий відповідно

Π 2 = P(Q 1 + Q 2) * Q 2 − c 2 Q 2 .

Відповідно до моделі Штакельберга, перша фірма - фірма-лідер - на першому кроці призначає свій випуск Q 1 . Після цього друга фірма – фірма-послідовник – аналізуючи дії фірми-лідера визначає свій випуск Q 2 . Метою обох фірм є максимізація своїх функцій.

Рівновага Неша у цій грі визначається шляхом зворотної індукції. Розглянемо передостанній етап гри – перебіг другої фірми. На цьому етапі фірма 2 знає обсяг оптимального випуску продукції першою фірмою Q 1*. Тоді завдання визначення оптимального випуску Q 2 * зводиться до вирішення завдання знаходження точки максимуму платіжної функції другої фірми. Максимізуючи функцію Π 2 за змінною Q 2 , вважаючи Q 1 заданим, знаходимо, що оптимальний випуск другої фірми

Це найкраща відповідь фірми-послідовника на вибір фірмою-лідером випуску Q 1*. Фірма-лідер може максимізувати свою платіжну функцію з огляду на вид функції Q 2*. Точка максимуму функції Π 1 за змінною Q 1 при підстановці Q 2* буде

Підставляючи це у вираз для Q 2 * , отримаємо

Таким чином, у рівновазі фірма-лідер виробляє вдвічі більшу кількість продукції, ніж фірма-послідовник.

Поєднуючи в єдиному графіку лінії попиту та пропозиції, отримуємо графічне зображеннярівноваги в координатах Р, Q(Рис. 2.6). Точка перетину ліній має координати (Р *, Q *),де р * -рівноважна ціна, Q *- рівноважний обсяг виробництва та споживання.

Ринкова рівновага- це стан ринку, у якому для цього рівня ціни обсяг попиту дорівнює обсягу пропозиції.

Лише у точці рівноваги Еринок збалансований, ні з ринкових агентів немає стимулів до зміни ситуації. Це означає, що ринкова рівновага має властивість стійкості -у разі виникнення нерівноважного стану ринкові агенти мотивовані повернення ринку на рівновагу. Для підтвердження стійкості зазвичай застосовують логіку Л. Вальраса чи А. Маршалла.

За Л. Вальрасом, за дуже високих цін виникає надлишок пропозиції - надвиробництво (відрізок А-Вна рис. 2.6я), такий ринок називається ринком покупця,оскільки покупець має можливість під час укладання угод вимагати зниження цін. У такій ситуації не зацікавлений насамперед продавець, який змушений знижувати ціни та скорочувати обсяги виробництва. У міру зниження цін обсяг попиту збільшується, відрізок А-Вскорочується, доки стає точкою рівноваги е.

При низьких цінахвиникає надлишок попиту – дефіцит (відрізок CFna рис. 2.6а), що складається ринок продавця.Покупець змушений-


ден скорочувати споживання і переплачувати за дефіцитний товар, за підвищенням ціни зростає обсяг пропозиції, дефіцит скорочується, доки ринок приходить у рівновагу.

За А. Маршаллу (рис. 2.66), при малих обсягах виробництва ціна попиту перевищує ціну продавця, за більших обсягів - навпаки. У будь-якому випадку ситуація дисбалансу стимулює усунення ціни або обсягу попиту та пропозиції у бік рівноваги. Рівновага (а)по Вальрасу - ціна регулює дисбаланс обсягів попиту та пропозиції, (б)за Маршаллом - зміною обсягів врівноважуються ціни покупця та продавця.

Мал. 2.6. Встановлення ринкової рівноваги: ​​в) за Л. Вальрасом; б) за А. Маршаллом

Зміна ринкового попиту чи пропозиції призводить до зміни рівноваги (рис. 2.7). Якщо, наприклад, ринковий попит зростає, то лінія попиту зрушується праворуч, тоді рівноважна ціна та обсяг зростають. Якщо ринкова пропозиція зменшується, лінія пропозиції зрушується вліво, що призводить до збільшення ціни та скорочення обсягів.

Ця модельринку є статичною, оскільки у ній не фігурує час.

«Павутиноподібна» модель

Як приклад динамічної моделі ринкової рівноваги наведемо найпростішу «павутиноподібну» модель. Припустимо, обсяг попиту залежить від рівня цін поточного періоду t,а обсяг пропозиції – від цін попереднього періоду t-1:

Q d i = Q d i (P t) , Q s i = Q s i (P t -1) ,

де t = 0,1 .... T-дискретне значення тимчасового періоду.




Мал. 2.7. Зміна ринкової рівноваги:

а) внаслідок збільшення попиту; б)внаслідок зменшення

пропозиції

Ринкова ціна P tможе не збігатися з рівноважною ціною р *,причому можливі три варіанти динаміки P t(Рис. 2.8).

Варіант траєкторії розвитку в цій моделі залежить від співвідношення нахилів ліній попиту та пропозиції.

Мал. 2.8. «Павутиноподібна» модель ринкової рівноваги:

а) відхилення від рівноваги зменшується; 5) відхилення

від рівноваги збільшується (модель "катастрофи"); в) ринок

циклічно коливається навколо точки рівноваги, але рівновага



Top