Dualiti dalam pengaturcaraan linear. Jenis keseimbangan: Nash equilibrium, Stekelberg, Pareto-optimum equilibrium, keseimbangan strategi dominan Apakah mekanisme optimum untuk mencari penyelesaian kepada keseimbangan

Definisi asas teori dualiti.

Setiap masalah pengaturcaraan linear boleh dikaitkan dengan masalah pengaturcaraan linear yang lain. Apabila salah satu daripada mereka diselesaikan, masalah yang lain diselesaikan secara automatik. Tugas sedemikian dipanggil saling dua. Mari kita tunjukkan bagaimana, memandangkan masalah yang diberikan (kita akan memanggilnya yang asal), kita boleh membina dwinya.

Pertimbangkan masalah output yang dirancang.

F=3 X 1 + 5X 2 + 4X 3 + 5X 4 → maks.
5x 1 +0.4x 2 +2x 3 +0.5x 4 ≤400
5x2 +x3 +x4 ≤300
x 1 + x 3 + x 4 ≤100
x 1 ≥0, x 2 ≥0, x 3 ≥0, x 4 ≥0

Peraturan am untuk menyusun dua masalah:

Lurus dwi
Fungsi sasaran (maks) Sebelah kanan kekangan
Sebelah kanan kekangan Fungsi sasaran (min)
A - matriks kekangan A T - matriks kekangan
kekangan ke-i: ≤ 0, (≥ 0) Pembolehubah y i ≥ 0, (≤ 0)
kekangan ke-i: = 0 Pembolehubah y i ≠ 0
Pembolehubah x j ≥ 0 (≤ 0)
Pembolehubah x j ≠ 0 kekangan ke-j: = 0
maks → min
Lurus dwi
Fungsi sasaran (min) Sebelah kanan kekangan
Sebelah kanan kekangan Fungsi sasaran (maks)
A - matriks kekangan A T - matriks kekangan
kekangan ke-i: ≥ 0, (≤ 0) Pembolehubah y i ≥ 0, (≤ 0)
kekangan ke-i: = 0 Pembolehubah y i ≠ 0
Pembolehubah x j ≥ 0 (≤ 0) kekangan ke-j: ≤ 0 (≥ 0)
Pembolehubah x j ≠ 0 kekangan ke-j: = 0

Mari kita bina masalah dwinya mengikut peraturan berikut.

  1. Bilangan pembolehubah dalam masalah dwi adalah sama dengan bilangan ketaksamaan dalam masalah asal.
  2. Matriks pekali masalah dwi ditukarkan kepada matriks pekali masalah asal.
  3. Lajur sebutan bebas masalah asal ialah deretan pekali untuk fungsi dwi objektif. Fungsi objektif dimaksimumkan dalam satu masalah dan diminimumkan dalam masalah lain.
  4. Syarat untuk bukan negatif pembolehubah masalah asal sepadan dengan ketidaksamaan-sekatan masalah dwi yang diarahkan ke arah yang bertentangan. Dan sebaliknya, ketidaksamaan-sekatan dalam asal sepadan dengan syarat bukan negatif dalam dwi.

Perhatikan bahawa baris matriks tugasan I ialah lajur matriks tugasan II. Oleh itu, pekali bagi pembolehubah y i dalam masalah II adalah, masing-masing, pekali bagi ketaksamaan ke-i dalam masalah I.
Model yang terhasil ialah model ekonomi dan matematik bagi masalah dwi kepada masalah langsung.

Ketaksamaan yang disambungkan oleh anak panah ialah panggil conjugate.
Rumusan bermakna bagi masalah dwi: cari set harga (anggaran) sumber sedemikian Y = (y 1 , y 2 ..., y m), di mana jumlah kos sumber akan menjadi minimum, dengan syarat kos sumber dalam pengeluaran setiap jenis produk akan tidak kurang daripada keuntungan ( hasil daripada penjualan produk ini.
Harga sumber y 1 , y 2 ..., y m dalam literatur ekonomi yang diterima pelbagai gelaran: perakaunan, tersirat, bayangan. Maksud nama-nama ini ialah ini adalah harga "palsu" bersyarat. Berbeza dengan harga "luaran" dari 1 , dari 2 ..., dari n untuk produk, yang diketahui, sebagai peraturan, sebelum permulaan pengeluaran, harga sumber y 1 , y 2 ..., y m adalah dalaman , kerana ia tidak ditetapkan dari luar , tetapi ditentukan secara langsung sebagai hasil daripada menyelesaikan masalah, jadi ia sering dipanggil anggaran sumber.
Hubungan antara masalah langsung dan dua terdiri, khususnya, dalam fakta bahawa penyelesaian salah satu daripada mereka boleh diperolehi terus daripada penyelesaian yang lain.

Teorem dualiti

Duality adalah konsep asas dalam teori pengaturcaraan linear. Keputusan utama teori dualiti terkandung dalam dua teorem yang dipanggil teorem dualiti.

Teorem dualiti pertama.

Jika salah satu daripada pasangan masalah dwi I dan II boleh diselesaikan, maka yang lain boleh diselesaikan, dan nilai fungsi objektif pada rancangan optimum adalah sama, F(x*) = G(y*), di mana x *, y * - penyelesaian optimum masalah I dan II

Teorem dualiti kedua.

Pelan x * dan y * adalah optimum dalam Masalah I dan II jika dan hanya jika, apabila ia digantikan ke dalam sistem kekangan Masalah I dan II, masing-masing, sekurang-kurangnya satu daripada mana-mana pasangan ketaksamaan konjugat menjadi kesamaan.
ini teorem dualiti asas. Dalam erti kata lain, jika x * dan y * ialah penyelesaian yang boleh dilaksanakan kepada masalah primal dan dwi, ​​dan jika c T x*=b T y*, maka x * dan y * ialah penyelesaian optimum kepada sepasang masalah dwi.

Teorem dualiti ketiga. Nilai pembolehubah y i dalam penyelesaian optimum masalah dwi adalah anggaran pengaruh ahli bebas b i sistem kekangan - ketidaksamaan masalah langsung pada nilai fungsi objektif masalah ini:
Δf(x) = b i y i

Menyelesaikan LLP dengan kaedah simplex, kami menyelesaikan dua LLP secara serentak. Nilai pembolehubah masalah dwi y i , dalam pelan optimum dipanggil ditentukan secara objektif, atau anggaran dwi. Dalam masalah yang digunakan, anggaran dwi y i sering dipanggil tersembunyi, harga bayangan atau anggaran sumber marginal.

Harta masalah yang saling berganda

  1. Dalam satu masalah, maksimum fungsi linear dicari, yang lain, minimum.
  2. Pekali untuk pembolehubah dalam fungsi linear satu masalah adalah ahli bebas sistem kekangan dalam masalah lain.
  3. Setiap masalah diberikan dalam bentuk piawai, dan dalam masalah pemaksimuman semua ketaksamaan bentuk ≤ , dan dalam masalah pengecilan semua ketaksamaan bentuk ≥ .
  4. Matriks pekali untuk pembolehubah dalam sistem kekangan kedua-dua masalah ditranspose antara satu sama lain:
  5. Bilangan ketaksamaan dalam sistem kekangan satu masalah adalah sama dengan bilangan pembolehubah dalam masalah yang lain.
  6. Syarat untuk pembolehubah bukan negatif terdapat dalam kedua-dua masalah.

Teorem keseimbangan

Tugasan 2
Karang dua masalah untuk masalah 1. Cari penyelesaian dengan teorem keseimbangan.
3x1 +x2 ≥12
x1 +2x2 ≥14
4x1 +11x2 ≥68

Teorem keseimbangan . Biarkan X*=(x 1 *,...,x n *) dan Y*=(y 1 *,...,y n *) ialah reka bentuk yang boleh diterima bagi sepasang masalah dwi dalam bentuk simetri. Pelan ini adalah optimum jika dan hanya jika syarat kelonggaran pelengkap berikut dipenuhi:


Teorem 4 membolehkan kita menentukan penyelesaian optimum kepada satu daripada sepasang masalah dwi dengan menyelesaikan yang lain. Jika kekangan satu masalah bertukar menjadi ketaksamaan yang ketat apabila penyelesaian optimum digantikan, maka pembolehubah dwi sepadan dalam penyelesaian optimum masalah dwi adalah sama dengan 0. Jika mana-mana pembolehubah positif dalam rancangan optimum satu masalah, maka kekangan yang sepadan bagi masalah dwi ialah persamaan.
Marilah kita memberi tafsiran ekonomi tentang syarat-syarat kelonggaran yang saling melengkapi. Jika dalam penyelesaian optimum beberapa bahan mentah mempunyai anggaran selain daripada 0, maka ia akan digunakan sepenuhnya (sumbernya terhad). Jika bahan mentah tidak digunakan sepenuhnya (berlebihan), maka penilaiannya adalah sama dengan 0. Oleh itu, kami memperoleh bahawa penilaian dwi adalah ukuran kekurangan bahan mentah. Anggaran menunjukkan berapa banyak nilai fungsi objektif akan meningkat dengan peningkatan dalam stok bahan mentah yang sepadan sebanyak 1 unit. Jika sesuatu jenis produk dimasukkan ke dalam rancangan pengeluaran, maka kos pengeluarannya bertepatan dengan kos produk yang dihasilkan. Jika kos pengeluaran produk lebih besar daripada kos produk, maka produk itu tidak dihasilkan.
Jika satu daripada pasangan masalah dwi mengandungi dua pembolehubah, ia boleh diselesaikan secara grafik, dan kemudian, cari penyelesaian kepada masalah dwi menggunakan Teorem 3 dan 4. Dalam kes ini, 3 kes mungkin timbul: kedua-dua masalah mempunyai penyelesaian yang boleh dilaksanakan, hanya seseorang mempunyai masalah penyelesaian yang boleh dilaksanakan, kedua-dua masalah tidak mempunyai penyelesaian yang boleh dilaksanakan.

Contoh 2
Susun masalah dwi dan cari penyelesaiannya menggunakan teorem keseimbangan
x 2 -2x 3 +2x 4 -2x 5 ≤4
-2x 1 -2x 2 +2x 3 +2x 4 +x 5 ≥2
x i ≥0, i=1.5
Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → maks, jika penyelesaian kepada masalah asal diketahui: Zmax=(3;4;0;0;0).
Mari kita bina masalah dwi. Kami bersetuju dengan tanda-tanda ketidaksamaan dengan matlamat masalah asal.

Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → maks
Dua tugas:

W=4y 1 -2y 2 → min
Mari kita cari penyelesaian optimum bagi masalah dwi menggunakan teorem keseimbangan. Mari kita catatkan syarat-syarat kelonggaran yang saling melengkapi.
y 1 (4-(x 2 -2x 3 +2x 4 -2x 5))=0
y 2 (-2-(2x 1 -2x 2 -2x 3 -2x 4 -x 5))=0
x 1 (-2y 2 -10)=0
x 2 (y 1 -2y 2 +9)=0
x 3 (-2y 1 -2y 2 +19)=0
x 4 (2y 1 -2y 2 +13)=0
x 5 (-2y 1 -y 2 +11)=0
Mari kita gantikan penyelesaian optimum masalah asal ke dalam sistem yang disusun: x 1 =3, x 2 =4, x 3 =0, x 4 =0, x 5 =0.
y 1 (4-(4-2 0+2 0-2 0))=0
y 2 (-2-(2 3-2 4-2 0-2 0-0))=0 W(y 1 , y 2 , y 3)=12y 1 +31y 2 +18y 3 → maks. Mengikut Teorem 3 Zmax=Wmin=100000.
Akhirnya, Wmin=W(0; 4000/7; 32000/21) = 100000

Dalam permainan antagonis, adalah wajar untuk menganggap hasil yang optimum sebagai permainan yang tidak menguntungkan bagi mana-mana pemain untuk menyimpang daripadanya. Hasil sebegini (x*,y*) dipanggil situasi keseimbangan, dan prinsip optimum berdasarkan mencari situasi keseimbangan dipanggil prinsip keseimbangan.

Definisi. Dalam permainan matriks dengan matriks dimensi, hasilnya ialah keadaan keseimbangan atau titik pelana jika

Pada titik pelana, elemen matriks ialah kedua-dua minimum dalam barisnya dan maksimum dalam lajurnya. Dalam permainan dari contoh, elemen 2 a 33 ialah titik pelana. Optimum dalam permainan ini adalah strategi ketiga untuk kedua-dua pemain. Jika pemain pertama menyimpang dari strategi ketiga, maka dia mula menang kurang daripada a 33. Jika pemain kedua menyimpang dari strategi ketiga, maka dia mula kehilangan lebih daripada a 33. Oleh itu, untuk kedua-dua pemain, tidak ada yang lebih baik daripada berpegang pada strategi ketiga secara konsisten.

Prinsip tingkah laku optimum: jika terdapat titik pelana dalam permainan matriks, maka strategi optimum ialah pilihan yang sepadan dengan titik pelana. Apakah yang berlaku jika terdapat lebih daripada satu mata pelana dalam permainan?

Teorem. biarlah dua mata pelana sewenang-wenangnya dalam permainan matriks. Kemudian:

Bukti. Daripada definisi keadaan keseimbangan, kita ada:

Mari kita gantikan ke bahagian kiri ketaksamaan (2.8) , dan ke kanan - , ke bahagian kiri ketaksamaan (2.9) - , ke kanan - . Kemudian kita dapat:

Dari mana datangnya persamaan:

Ia berikutan daripada teorem bahawa fungsi hasil mengambil nilai yang sama dalam semua situasi keseimbangan. Itulah sebabnya nombor itu dipanggil dengan kos permainan. Dan strategi yang sepadan dengan mana-mana mata pelana dipanggil strategi yang optimum pemain 1 dan 2, masing-masing. Berdasarkan (2.7), semua strategi optimum pemain boleh ditukar ganti.

Keoptimuman tingkah laku pemain tidak akan berubah jika set strategi dalam permainan kekal sama, dan fungsi hasil didarab dengan pemalar positif (atau nombor malar ditambah kepadanya).

Teorem. Untuk titik pelana (i*,j*) wujud dalam permainan matriks, adalah perlu dan mencukupi bahawa maksimin adalah sama dengan minimaks:

(2.10)

Bukti. Keperluan. Jika (i*,j*) ialah titik pelana, maka, mengikut (2.6):

(2.11)

Walau bagaimanapun, kami mempunyai:

(2.12)

Daripada (2.11) dan (2.12) kita dapat:

(2.13)

Berhujah yang sama, kita sampai pada persamaan:

Oleh itu,

Sebaliknya, ketaksamaan terbalik (2.5) sentiasa berpuas hati, jadi (2.10) adalah benar.

Kecukupan. Biarkan (2.10) benar. Mari kita buktikan kewujudan titik pelana. Kami ada:

Mengikut kesamaan (2.10), ketaksamaan (2.15) dan (2.16) bertukar menjadi kesamaan. Selepas itu kami mempunyai:

Teorem telah terbukti. Ia juga telah terbukti bahawa makna umum maximin dan minimax adalah sama dengan harga permainan.

Peluasan Permainan Campuran

Pertimbangkan permainan matriks G. Jika terdapat situasi keseimbangan di dalamnya, maka minimax adalah sama dengan maximin. Selain itu, setiap pemain boleh memberitahu maklumat pemain lain tentang strategi optimumnya. Lawannya tidak akan dapat memperoleh apa-apa faedah tambahan daripada maklumat ini. Sekarang andaikan bahawa tiada situasi keseimbangan dalam permainan G. Kemudian:

Dalam kes ini, strategi minimax dan maximin tidak stabil. Pemain mungkin mempunyai insentif untuk menyimpang daripada strategi berhemat mereka yang berkaitan dengan kemungkinan mendapat lebih banyak hasil, tetapi juga risiko kehilangan, iaitu, mendapat bayaran kurang daripada menggunakan strategi berhemat. Apabila menggunakan strategi berisiko, pemindahan maklumat tentang mereka kepada pihak lawan mempunyai akibat yang memudaratkan: pemain secara automatik menerima bayaran yang lebih kecil daripada apabila menggunakan strategi berhati-hati.

Contoh 3. Biarkan matriks permainan kelihatan seperti:

Untuk matriks sedemikian, i.e. keseimbangan tidak wujud. Strategi berhati-hati pemain ialah i*=1, j*=2. Biarkan pemain 2 mengikut strategi j*=2, dan pemain 1 memilih strategi i=2. maka yang terakhir akan menerima bayaran sebanyak 3, iaitu dua unit lebih daripada maksimum. Walau bagaimanapun, jika pemain 2 meneka tentang rancangan pemain 1, dia akan menukar strateginya kepada j=1, dan kemudian yang pertama akan menerima ganjaran 0, iaitu kurang daripada maksimumnya. Penaakulan yang sama boleh dilakukan untuk pemain kedua. Secara umum, kita boleh membuat kesimpulan bahawa penggunaan strategi mencabar dalam permainan berasingan permainan boleh membawa hasil yang lebih besar daripada yang dijamin, tetapi penggunaannya dikaitkan dengan risiko. Timbul persoalan, adakah mungkin untuk menggabungkan strategi berhati-hati yang boleh dipercayai dengan strategi yang mencabar sedemikian rupa untuk meningkatkan pendapatan purata anda? Pada asasnya, persoalannya ialah bagaimana membahagikan hasil (2.17) antara pemain?

Ternyata penyelesaian yang munasabah adalah menggunakan strategi campuran, iaitu pilihan rawak strategi tulen. Ingat itu strategi pemain 1 dipanggil campuran, jika pilihan baris ke-i dibuat olehnya dengan beberapa kebarangkalian p i . Strategi sedemikian boleh dikenal pasti dengan taburan kebarangkalian pada berbilang baris. Katakan pemain pertama mempunyai m strategi tulen dan pemain kedua mempunyai n strategi tulen. Maka strategi campuran mereka ialah vektor kebarangkalian:

(2.18)

Pertimbangkan dua kemungkinan strategi campuran untuk pemain pertama dalam Contoh 3: . Strategi ini berbeza dalam taburan kebarangkalian antara strategi tulen. Jika dalam kes pertama baris matriks dipilih oleh pemain dengan kebarangkalian yang sama, maka dalam kes kedua - dengan yang berbeza. Apabila kita bercakap tentang strategi campuran, yang kita maksudkan pilihan rawak bukan pilihan "secara rawak", tetapi pilihan berdasarkan kerja mekanisme rawak yang menyediakan taburan kebarangkalian yang kita perlukan. Jadi untuk pelaksanaan strategi campuran pertama, lambungan syiling sangat sesuai. Pemain memilih baris pertama atau kedua, bergantung pada bagaimana syiling itu jatuh. Secara purata, pemain akan memilih kedua-dua baris pertama dan baris kedua sama kerap, tetapi pilihan pada lelaran tertentu permainan tidak tertakluk kepada mana-mana peraturan tetap dan mempunyai tahap kerahsiaan maksimum: sebelum pelaksanaan mekanisme rawak , ia tidak diketahui walaupun kepada pemain pertama. Untuk melaksanakan strategi campuran kedua, mekanisme cabutan sangat sesuai. Pemain mengambil tujuh keping kertas yang sama, menandakan tiga daripadanya dengan salib, dan melemparkannya ke dalam topi. Kemudian, secara rawak, dia mengeluarkan salah satu daripadanya. Mengikut teori kebarangkalian klasik, dia akan mengeluarkan sekeping kertas dengan pangkah dengan kebarangkalian 3/7, dan sehelai kertas bersih dengan kebarangkalian 4/7. Mekanisme cabutan sedemikian mampu merealisasikan sebarang kebarangkalian rasional.

Biarkan pemain mematuhi strategi campuran (2.18). Kemudian ganjaran pemain pertama pada satu lelaran permainan ialah pembolehubah rawak: v(X,Y). Oleh kerana pemain memilih strategi secara bebas antara satu sama lain, maka, mengikut teorem pendaraban kebarangkalian, kebarangkalian untuk memilih hasil (i, j) dengan kemenangan adalah sama dengan hasil darab kebarangkalian . Kemudian hukum taburan pembolehubah rawak v(X,Y) diberikan oleh jadual berikut

Sekarang biarkan permainan itu dimainkan selama-lamanya. Maka pulangan purata dalam permainan sedemikian adalah sama dengan jangkaan matematik nilai v(X,Y).

(2.19)

Apabila muktamad tetapi cukup bilangan yang besar lelaran permainan, bayaran purata akan berbeza sedikit daripada nilai (2.19).

Contoh 4. Kira pulangan purata (2.19) untuk permainan daripada contoh 3 apabila pemain menggunakan strategi berikut: . Matriks hasil dan matriks kebarangkalian adalah seperti berikut:

Mari cari purata:

Oleh itu, pulangan purata (2.20) adalah pertengahan antara maksimum dan minimax.

Oleh kerana bagi mana-mana pasangan strategi campuran X dan Y adalah mungkin untuk mengira nilai purata permainan, maka masalah mencari strategi optimum timbul. Adalah wajar untuk bermula dengan meneroka strategi berhati-hati. Strategi berhati-hati pemain pertama memberikannya maksimum. Strategi berhati-hati pemain kedua tidak membenarkan yang pertama menang lebih daripada minimax. Hasil yang paling ketara dalam teori permainan dengan minat yang bertentangan boleh dianggap sebagai berikut:

Teorem. Setiap permainan matriks mempunyai situasi keseimbangan dalam strategi campuran. Bukti teorem ini tidak mudah. Ia ditinggalkan dalam kursus ini.

Akibat: Kewujudan keadaan keseimbangan bermakna bahawa maximin adalah sama dengan minimax, dan oleh itu mana-mana permainan matriks mempunyai harga. Strategi optimum untuk pemain pertama ialah strategi maximin. Strategi optimum yang kedua ialah minimax. Oleh kerana masalah mencari strategi optimum telah diselesaikan, kami mengatakan bahawa mana-mana permainan matriks boleh diselesaikan pada satu set strategi campuran.

Penyelesaian permainan 2x2

Contoh 5. Selesaikan permainan. Tidak sukar untuk mengesahkan bahawa tiada titik pelana. Nyatakan strategi optimum pemain pertama (x, 1-x) ialah vektor lajur, tetapi untuk kemudahan kami menulisnya sebagai rentetan. Nyatakan strategi optimum pemain kedua (y,1-y).

Ganjaran pemain pertama ialah pembolehubah rawak dengan taburan berikut:

v(x,y) 2 -1 -4 7
hlm xy x(1-y) (1x)y (1-x)(1-y)

Kami mendapati pulangan purata untuk lelaran pemain pertama - jangkaan matematik pembolehubah rawak v(x,y):

Mari kita ubah ungkapan ini:

Jangkaan matematik ini terdiri daripada pemalar (5/7) dan bahagian pembolehubah: 14(x-11/14)(y-8/14). Jika nilai y berbeza daripada 8/14, maka pemain pertama sentiasa boleh memilih X dengan cara untuk menjadikan bahagian pembolehubah positif, meningkatkan kemenangan anda. Jika nilai X berbeza daripada 11/14, maka pemain kedua sentiasa boleh memilih y supaya membuat bahagian pembolehubah negatif, mengurangkan hasil pemain pertama. Oleh itu, titik pelana ditakrifkan oleh kesamaan: x*=11/14, y*=8/14.

2.5 Penyelesaian permainan

Satu contoh akan menunjukkan cara menyelesaikan permainan sedemikian.

Contoh 6. Selesaikan permainan . Kami memastikan bahawa tiada titik pelana. Nyatakan strategi campuran pemain pertama X=(x, 1-x) ialah vektor lajur, tetapi untuk kemudahan kami menulisnya sebagai rentetan.

Biarkan pemain pertama menggunakan strategi X, dan yang kedua - miliknya ke-j bersih strategi. Mari kita nyatakan pulangan purata pemain pertama dalam situasi ini sebagai . Kami ada:

Mari kita lukis graf fungsi (2.21) pada segmen .

Ordinasi titik yang terletak pada mana-mana segmen garisan sepadan dengan bayaran pemain pertama dalam situasi di mana dia menggunakan strategi campuran (x,(1-x)), dan pemain kedua strategi tulen yang sepadan. Hasil terjamin pemain pertama ialah sampul bawah keluarga garisan (ABC patah). titik tertinggi garis putus ini (titik B) adalah hasil maksimum yang dijamin pemain 1. Absis mata B sepadan dengan strategi optimum pemain pertama.

Oleh kerana titik B yang dikehendaki ialah persilangan garis dan, maka absisnya boleh didapati sebagai penyelesaian kepada persamaan:

Oleh itu, strategi campuran optimum pemain pertama ialah (5/9, 4/9). Ordinasi titik B ialah harga permainan. Ia sama dengan:

(2.22)

Ambil perhatian bahawa garisan yang sepadan dengan strategi kedua pemain kedua melepasi titik B. Ini bermakna jika pemain pertama menggunakan strategi optimumnya, dan pemain 2 menggunakan strategi kedua, maka kerugian pemain kedua meningkat berbanding menggunakan strategi. 1 atau 3. Oleh itu, strategi kedua tidak boleh mengambil bahagian dalam strategi optimum pemain kedua. Strategi optimum untuk pemain 2 hendaklah: . Strategi tulen 1 dan 3 pemain kedua yang mempunyai komponen bukan sifar dalam strategi optimum biasanya dipanggil ketara. Strategi 2 dipanggil tidak penting. Daripada rajah di atas, dan juga dari kesamarataan (2.22), dapat dilihat bahawa apabila pemain pertama menggunakan strategi optimumnya, ganjaran pemain kedua tidak bergantung pada strategi penting yang digunakannya. Dia juga boleh menggunakan mana-mana strategi campuran yang terdiri daripada penting (khususnya, optimum), hasil tidak akan berubah dalam kes ini sama ada. Pernyataan yang sama sepenuhnya juga benar untuk kes yang bertentangan. Jika pemain kedua menggunakan strategi optimumnya, maka ganjaran pemain pertama tidak bergantung pada strategi penting yang mana dia gunakan dan sama dengan kos permainan. Menggunakan kenyataan ini, kami mencari strategi optimum untuk pemain kedua.

Strategi optimum dalam teori konflik ialah strategi yang membawa pemain kepada keseimbangan yang stabil, i.e. beberapa situasi yang memuaskan hati semua pemain.

Keoptimuman penyelesaian dalam teori permainan adalah berdasarkan konsep keadaan keseimbangan:

1) adalah tidak menguntungkan bagi mana-mana pemain untuk menyimpang daripada situasi keseimbangan jika semua yang lain kekal di dalamnya,

2) maksud keseimbangan - dengan pengulangan permainan yang berulang, pemain akan mencapai situasi keseimbangan, memulakan permainan dalam sebarang situasi strategik.

Dalam setiap interaksi, jenis keseimbangan berikut boleh wujud:

1. keseimbangan dalam strategi berhati-hati . Ditentukan oleh strategi yang menyediakan pemain hasil terjamin;

2. keseimbangan dalam strategi dominan .

Strategi dominan ialah pelan tindakan yang memberikan peserta keuntungan maksimum, tanpa mengira tindakan peserta lain. Oleh itu, keseimbangan strategi dominan akan menjadi persilangan strategi dominan kedua-dua peserta dalam permainan.

Jika strategi optimum pemain menguasai semua strategi mereka yang lain, maka permainan mempunyai keseimbangan dalam strategi dominan. Dalam permainan dilema banduan, set strategi keseimbangan Nash ialah ("akui - akui"). Selain itu, adalah penting untuk ambil perhatian bahawa untuk kedua-dua pemain A dan pemain B "mengiktiraf" adalah strategi dominan, manakala "tidak mengenali" dikuasai;

3. keseimbangan Nash . keseimbangan Nash ialah sejenis keputusan permainan dua atau lebih pemain, di mana tiada peserta boleh meningkatkan hasil dengan menukar keputusannya secara unilateral, apabila peserta lain tidak mengubah keputusan mereka.

Katakan permainan n menghadapi dalam bentuk biasa, di manakah set strategi tulen dan merupakan set hasil.

Apabila setiap pemain memilih strategi dalam profil strategi, pemain menerima ganjaran. Lebih-lebih lagi, ganjaran bergantung pada keseluruhan profil strategi: bukan sahaja pada strategi yang dipilih oleh pemain itu sendiri, tetapi juga pada strategi orang lain. Profil strategi adalah keseimbangan Nash jika perubahan dalam strateginya tidak memberi manfaat kepada mana-mana pemain, iaitu, kepada mana-mana

Permainan boleh mempunyai keseimbangan Nash dalam kedua-dua strategi tulen dan campuran.

Nash membuktikan bahawa jika dibenarkan strategi bercampur, kemudian dalam setiap permainan n pemain akan mempunyai sekurang-kurangnya satu keseimbangan Nash.

Dalam situasi keseimbangan Nash, strategi setiap pemain memberikannya tindak balas terbaik kepada strategi pemain lain;

4. Imbangan Stackelberg. Model Stackelberg– model permainan-teoretik pasaran oligopolistik dengan kehadiran asimetri maklumat. Dalam model ini, tingkah laku firma digambarkan dengan permainan dinamik dengan maklumat sempurna yang lengkap, di mana tingkah laku firma dimodelkan menggunakan statik permainan dengan maklumat lengkap. Ciri utama permainan ialah kehadiran firma terkemuka, yang merupakan yang pertama untuk menetapkan jumlah keluaran barangan, dan firma lain dipandu dalam pengiraan mereka olehnya. Prasyarat asas permainan:


Industri menghasilkan produk homogen: perbezaan dalam produk firma yang berbeza boleh diabaikan, yang bermaksud bahawa pembeli, apabila memilih firma mana yang hendak dibeli, hanya menumpukan pada harga;

Industri ini mempunyai bilangan firma yang kecil.

firma menetapkan kuantiti produk yang dikeluarkan, dan harga untuknya ditentukan berdasarkan permintaan;

Terdapat firma pemimpin yang dipanggil, mengenai jumlah pengeluaran yang mana firma lain dibimbing.

Oleh itu, model Stackelberg digunakan untuk mencari penyelesaian optimum dalam permainan dinamik dan sepadan dengan hasil maksimum pemain, berdasarkan syarat yang telah dibangunkan selepas pilihan telah dibuat oleh satu atau lebih pemain. keseimbangan Stackelberg.- situasi di mana tiada pemain boleh meningkatkan kemenangan mereka secara unilateral, dan keputusan dibuat terlebih dahulu oleh seorang pemain dan menjadi diketahui yang kedua pemain. Dalam permainan dilema banduan, keseimbangan Stackelberg akan dicapai dalam petak (1; 1) - "mengakui kesalahan" oleh kedua-dua penjenayah;

5. Keoptimuman Pareto- keadaan sistem sedemikian, di mana nilai setiap kriteria tertentu yang menggambarkan keadaan sistem tidak boleh diperbaiki tanpa memburukkan kedudukan pemain lain.

Prinsip Pareto menyatakan: "Sebarang perubahan yang tidak menyebabkan kerugian, tetapi memberi manfaat kepada sesetengah orang (dalam anggaran mereka sendiri), adalah peningkatan." Oleh itu, hak untuk semua perubahan yang tidak membawa mudarat tambahan kepada sesiapa pun diiktiraf.

Set keadaan sistem yang Pareto optimum dipanggil "set Pareto", "set alternatif optimum dalam erti kata Pareto", atau "set alternatif optimum".

Situasi di mana kecekapan Pareto telah dicapai adalah keadaan di mana semua faedah daripada pertukaran telah habis.

Kecekapan Pareto adalah salah satu konsep utama untuk ekonomi moden. Berdasarkan konsep ini, teorem kebajikan asas pertama dan kedua dibina.

Salah satu aplikasi Pareto optimum ialah pengagihan Pareto sumber (buruh dan modal) dalam integrasi ekonomi antarabangsa, i.e. kesatuan ekonomi dua atau lebih negeri. Menariknya, taburan Pareto sebelum dan selepas integrasi ekonomi antarabangsa diterangkan dengan secukupnya secara matematik (Dalimov R.T., 2008). Analisis menunjukkan bahawa nilai tambah sektor dan pendapatan sumber buruh bergerak ke arah yang bertentangan mengikut persamaan pengaliran haba yang terkenal, serupa dengan gas atau cecair dalam ruang, yang memungkinkan untuk menggunakan teknik analisis yang digunakan. dalam fizik berhubung dengan masalah ekonomi penghijrahan parameter ekonomi.

Pareto optimum menyatakan bahawa kebajikan masyarakat mencapai tahap maksimum, dan pengagihan sumber menjadi optimum sekiranya sebarang perubahan dalam pengagihan ini memburukkan kesejahteraan sekurang-kurangnya satu subjek sistem ekonomi.

Keadaan pasaran pareto-optimum- keadaan di mana mustahil untuk memperbaiki kedudukan mana-mana peserta dalam proses ekonomi tanpa mengurangkan kesejahteraan sekurang-kurangnya satu daripada yang lain secara serentak.

Menurut kriteria Pareto (kriteria pertumbuhan kesejahteraan sosial), pergerakan ke arah optimum hanya mungkin dengan pengagihan sumber sedemikian yang meningkatkan kebajikan sekurang-kurangnya seorang tanpa merugikan orang lain.

Situasi S* dikatakan situasi dominan Pareto S jika:

bagi mana-mana pemain ganjarannya dalam S<=S*

· terdapat sekurang-kurangnya seorang pemain yang mendapat ganjarannya dalam situasi S*>S

Dalam masalah "dilema banduan", keseimbangan Pareto, apabila mustahil untuk memperbaiki kedudukan mana-mana pemain tanpa memburukkan kedudukan pemain lain, sepadan dengan situasi petak (2; 2).

Pertimbangkan contoh 1.

Strategi optimum dalam teori konflik ialah strategi yang membawa pemain kepada keseimbangan yang stabil, i.e. beberapa situasi yang memuaskan hati semua pemain.

Keoptimuman penyelesaian dalam teori permainan adalah berdasarkan konsep keadaan keseimbangan:

1) adalah tidak menguntungkan bagi mana-mana pemain untuk menyimpang daripada situasi keseimbangan jika semua yang lain kekal di dalamnya,

2) maksud keseimbangan - dengan pengulangan permainan yang berulang, pemain akan mencapai situasi keseimbangan, memulakan permainan dalam sebarang situasi strategik.

Dalam setiap interaksi, jenis keseimbangan berikut boleh wujud:

1. keseimbangan dalam strategi berhati-hati . Ditentukan oleh strategi yang memberikan pemain hasil yang terjamin;

2. keseimbangan dalam strategi dominan .

Strategi dominan ialah pelan tindakan yang memberikan peserta keuntungan maksimum, tanpa mengira tindakan peserta lain. Oleh itu, keseimbangan strategi dominan akan menjadi persilangan strategi dominan kedua-dua peserta dalam permainan.

Jika strategi optimum pemain menguasai semua strategi mereka yang lain, maka permainan mempunyai keseimbangan dalam strategi dominan. Dalam permainan dilema banduan, set strategi keseimbangan Nash ialah ("akui - akui"). Selain itu, adalah penting untuk ambil perhatian bahawa untuk kedua-dua pemain A dan pemain B "mengiktiraf" adalah strategi dominan, manakala "tidak mengenali" dikuasai;

3. keseimbangan Nash . keseimbangan Nash ialah sejenis keputusan permainan dua atau lebih pemain, di mana tiada peserta boleh meningkatkan hasil dengan menukar keputusannya secara unilateral, apabila peserta lain tidak mengubah keputusan mereka.

Katakan permainan n menghadapi dalam bentuk biasa, di manakah set strategi tulen dan merupakan set hasil.

Apabila setiap pemain memilih strategi dalam profil strategi, pemain menerima ganjaran. Lebih-lebih lagi, ganjaran bergantung pada keseluruhan profil strategi: bukan sahaja pada strategi yang dipilih oleh pemain itu sendiri, tetapi juga pada strategi orang lain. Profil strategi adalah keseimbangan Nash jika perubahan dalam strateginya tidak memberi manfaat kepada mana-mana pemain, iaitu, kepada mana-mana



Permainan boleh mempunyai keseimbangan Nash dalam kedua-dua strategi tulen dan campuran.

Nash membuktikan bahawa jika dibenarkan strategi bercampur, kemudian dalam setiap permainan n pemain akan mempunyai sekurang-kurangnya satu keseimbangan Nash.

Dalam situasi keseimbangan Nash, strategi setiap pemain memberikannya tindak balas terbaik kepada strategi pemain lain;

4. Imbangan Stackelberg. Model Stackelberg– model permainan-teoretik pasaran oligopolistik dengan kehadiran asimetri maklumat. Dalam model ini, tingkah laku firma digambarkan dengan permainan dinamik dengan maklumat sempurna yang lengkap, di mana tingkah laku firma dimodelkan menggunakan statik permainan dengan maklumat yang lengkap. Ciri utama permainan ini ialah kehadiran firma terkemuka, yang mula-mula menetapkan volum keluaran barangan, dan firma selebihnya dipandu dalam pengiraan mereka olehnya. Prasyarat asas permainan:

Industri menghasilkan produk homogen: perbezaan dalam produk firma yang berbeza boleh diabaikan, yang bermaksud bahawa pembeli, apabila memilih firma mana yang hendak dibeli, hanya menumpukan pada harga;

Industri ini mempunyai bilangan firma yang kecil.

firma menetapkan kuantiti produk yang dikeluarkan, dan harga untuknya ditentukan berdasarkan permintaan;

Terdapat firma pemimpin yang dipanggil, mengenai jumlah pengeluaran yang mana firma lain dibimbing.

Oleh itu, model Stackelberg digunakan untuk mencari penyelesaian optimum dalam permainan dinamik dan sepadan dengan hasil maksimum pemain, berdasarkan syarat yang telah dibangunkan selepas pilihan telah dibuat oleh satu atau lebih pemain. keseimbangan Stackelberg.- situasi di mana tiada pemain boleh meningkatkan kemenangan mereka secara unilateral, dan keputusan dibuat terlebih dahulu oleh seorang pemain dan diketahui oleh pemain kedua. Dalam permainan dilema banduan, keseimbangan Stackelberg akan dicapai dalam petak (1; 1) - "mengakui kesalahan" oleh kedua-dua penjenayah;

5. Keoptimuman Pareto- keadaan sistem sedemikian, di mana nilai setiap kriteria tertentu yang menggambarkan keadaan sistem tidak boleh diperbaiki tanpa memburukkan kedudukan pemain lain.

Prinsip Pareto menyatakan: "Sebarang perubahan yang tidak menyebabkan kerugian, tetapi memberi manfaat kepada sesetengah orang (dalam anggaran mereka sendiri), adalah peningkatan." Oleh itu, hak untuk semua perubahan yang tidak membawa mudarat tambahan kepada sesiapa pun diiktiraf.

Set keadaan sistem yang Pareto optimum dipanggil "set Pareto", "set alternatif optimum dalam erti kata Pareto", atau "set alternatif optimum".

Situasi di mana kecekapan Pareto telah dicapai adalah keadaan di mana semua faedah daripada pertukaran telah habis.

Kecekapan Pareto adalah salah satu konsep utama untuk ekonomi moden. Berdasarkan konsep ini, teorem kebajikan asas pertama dan kedua dibina.

Salah satu aplikasi Pareto optimum ialah pengagihan Pareto sumber (buruh dan modal) dalam integrasi ekonomi antarabangsa, i.e. kesatuan ekonomi dua atau lebih negeri. Menariknya, taburan Pareto sebelum dan selepas integrasi ekonomi antarabangsa diterangkan dengan secukupnya secara matematik (Dalimov R.T., 2008). Analisis menunjukkan bahawa nilai tambah sektor dan pendapatan sumber buruh bergerak ke arah yang bertentangan mengikut persamaan pengaliran haba yang terkenal, serupa dengan gas atau cecair dalam ruang, yang memungkinkan untuk menggunakan teknik analisis yang digunakan. dalam fizik berhubung dengan masalah ekonomi penghijrahan parameter ekonomi.

Pareto optimum menyatakan bahawa kebajikan masyarakat mencapai tahap maksimum, dan pengagihan sumber menjadi optimum sekiranya sebarang perubahan dalam pengagihan ini memburukkan kesejahteraan sekurang-kurangnya satu subjek sistem ekonomi.

Keadaan pasaran pareto-optimum- keadaan di mana mustahil untuk memperbaiki kedudukan mana-mana peserta dalam proses ekonomi tanpa mengurangkan kesejahteraan sekurang-kurangnya satu daripada yang lain secara serentak.

Menurut kriteria Pareto (kriteria pertumbuhan kesejahteraan sosial), pergerakan ke arah optimum hanya mungkin dengan pengagihan sumber sedemikian yang meningkatkan kebajikan sekurang-kurangnya seorang tanpa merugikan orang lain.

Situasi S* dikatakan situasi dominan Pareto S jika:

bagi mana-mana pemain ganjarannya dalam S<=S*

· terdapat sekurang-kurangnya seorang pemain yang mendapat ganjarannya dalam situasi S*>S

Dalam masalah "dilema banduan", keseimbangan Pareto, apabila mustahil untuk memperbaiki kedudukan mana-mana pemain tanpa memburukkan kedudukan pemain lain, sepadan dengan situasi petak (2; 2).

Pertimbangkan contoh 1:

Keseimbangan dalam strategi dominan Tidak.

keseimbangan Nash. (5.5) dan (4.4). Memandangkan adalah tidak menguntungkan bagi mana-mana pemain untuk menyimpang daripada strategi yang dipilih secara individu.

Pareto optimum. (5.5). Sejak ganjaran pemain apabila memilih strategi ini lebih banyak kemenangan apabila memilih strategi lain.

keseimbangan Stackelberg:

Pemain A membuat langkah pertama.

Memilih strategi pertamanya. B memilih strategi pertama. A mendapat 5.

Memilih strategi keduanya. B memilih yang kedua. A mendapat 4.

5 > 4 =>

B membuat langkah pertama.

Memilih strategi pertamanya. A memilih strategi pertama. B mendapat 5.

Memilih strategi keduanya. Dan dia memilih yang kedua. B mendapat 4.

5 > 4 => keseimbangan Stackelberg (5, 5)

Contoh 2pemodelan duopoli.

Pertimbangkan intipati model ini:

Biar ada industri dengan dua firma, satu daripadanya adalah "firma pemimpin" dan satu lagi "firma pengikut". Biarlah harga produk fungsi linear jumlah bekalan Q:

P(Q) = abQ.

Marilah kita juga menganggap bahawa kos firma seunit output adalah malar dan sama dengan Dengan 1 dan Dengan 2 masing-masing. Kemudian keuntungan firma pertama akan ditentukan oleh formula

Π 1 = P(Q 1 + Q 2) * Q 1 − c 1 Q 1 ,

dan keuntungan kedua, masing-masing

Π 2 = P(Q 1 + Q 2) * Q 2 − c 2 Q 2 .

Selaras dengan model Stackelberg, firma pertama - firma terkemuka - dalam langkah pertama memberikan outputnya Q 1 . Selepas itu, firma kedua - firma pengikut - dengan menganalisis tindakan firma pemimpin menentukan outputnya Q 2. Matlamat kedua-dua firma adalah untuk memaksimumkan fungsi pembayaran mereka.

Keseimbangan Nash dalam permainan ini ditentukan oleh aruhan ke belakang. Pertimbangkan peringkat kedua terakhir permainan - langkah firma kedua. Pada peringkat ini, Firma 2 mengetahui output optimum Firma 1 Q 1 * . Kemudian masalah menentukan output optimum Q 2 * dikurangkan untuk menyelesaikan masalah mencari titik maksimum fungsi bayaran firma kedua. Memaksimumkan fungsi Π 2 berkenaan dengan pembolehubah Q 2 mengira Q 1 diberikan, kita dapati bahawa output optimum firma kedua

Ini adalah tindak balas terbaik firma pengikut kepada pilihan oleh firma pemimpin keluaran Q 1 * . Firma terkemuka boleh memaksimumkan fungsi pembayarannya berdasarkan bentuk fungsi tersebut Q 2*. Titik maksimum fungsi Π 1 dalam pembolehubah Q 1 apabila menggantikan Q 2 * kehendak

Menggantikan ini ke dalam ungkapan untuk Q 2 * , kita dapat

Oleh itu, dalam keseimbangan, firma pemimpin menghasilkan output dua kali lebih banyak daripada firma pengikut.

Menggabungkan garis bekalan dan permintaan dalam satu carta, kami dapat imej grafik keseimbangan dalam koordinat P, Q(Gamb. 2.6). Titik persilangan garis mempunyai koordinat (P * , Q*), di mana R* - harga keseimbangan, Q*- isipadu keseimbangan pengeluaran dan penggunaan.

Keseimbangan pasaran- ini adalah keadaan pasaran di mana, untuk tahap harga tertentu, kuantiti yang diminta adalah sama dengan kuantiti yang dibekalkan.

Hanya pada titik keseimbangan E pasaran adalah seimbang, tiada ejen pasaran mempunyai insentif untuk mengubah keadaan. Ini bermakna keseimbangan pasaran mempunyai harta kelestarian - sekiranya keadaan tidak seimbang, ejen pasaran bermotivasi untuk mengembalikan pasaran kepada keseimbangan. Untuk membuktikan kestabilan, logik L. Walras atau A. Marshall biasanya digunakan.

Menurut L. Walras, pada harga yang terlalu tinggi, terdapat lebihan bekalan - lebihan pengeluaran (segmen A-B dalam rajah. 2.6i), pasaran sedemikian dipanggil pasaran pembeli memandangkan pembeli mempunyai peluang untuk menuntut pengurangan harga apabila membuat urus niaga. Dalam keadaan sedemikian, pertama sekali, penjual tidak berminat, yang terpaksa mengurangkan harga dan mengurangkan jumlah pengeluaran. Apabila harga jatuh, kuantiti diminta meningkat A-B mengecut sehingga menjadi titik keseimbangan E.

Pada harga rendah terdapat lebihan permintaan - kekurangan (segmen CFna Rajah 2.6a), berkembang pasaran penjual. Pembeli terpaksa


Jika pengguna mengurangkan penggunaan dan membayar lebih untuk barang yang terhad, apabila harga meningkat, kuantiti yang dibekalkan meningkat, dan kekurangan itu mengecut sehingga keseimbangan pasaran.

Menurut A. Marshall (Rajah. 2.66), untuk jumlah pengeluaran yang kecil, harga permintaan melebihi harga penjual, untuk jumlah yang besar - sebaliknya. Walau apa pun, keadaan ketidakseimbangan merangsang peralihan harga atau volum penawaran dan permintaan ke arah keseimbangan. Keseimbangan (A) menurut Walras - harga mengawal ketidakseimbangan bekalan dan permintaan, (b) menurut Marshall - harga pembeli dan penjual diimbangi dengan perubahan dalam jumlah.

nasi. 2.6. Penubuhan keseimbangan pasaran: c) menurut L. Walras; b) menurut A. Marshall

Perubahan dalam permintaan atau penawaran pasaran membawa kepada perubahan dalam keseimbangan (Rajah 2.7). Jika, sebagai contoh, permintaan pasaran meningkat, maka garis permintaan beralih ke kanan, maka harga keseimbangan dan volum meningkat. Jika bekalan pasaran berkurangan, talian bekalan beralih ke kiri, mengakibatkan kenaikan harga dan pengurangan volum.

model ini Pasaran adalah statik, kerana masa tidak muncul di dalamnya.

Model "Labah-labah".

Sebagai contoh model dinamik keseimbangan pasaran, kami mempersembahkan model "jaring labah-labah" yang paling mudah. Katakan kuantiti diminta bergantung pada tingkat harga tempoh semasa t, dan volum bekalan - daripada harga tempoh sebelumnya t-1:

Q d i = Q d i (P t) , Q s i = Q s i (P t -1) ,

dengan t = 0.1….T ialah nilai diskret bagi tempoh masa.




nasi. 2.7. Perubahan dalam keseimbangan pasaran:

a) disebabkan oleh peningkatan dalam permintaan; b) disebabkan penurunan

tawaran

Harga pasaran P t mungkin tidak sepadan dengan harga keseimbangan R*, dan terdapat tiga kemungkinan dinamik P t(Gamb. 2.8).

Varian trajektori pembangunan dalam model ini bergantung pada nisbah cerun garisan bekalan dan permintaan.

nasi. 2.8. Model keseimbangan pasaran "Labah-labah":

a) sisihan daripada keseimbangan berkurangan; 5) penyelewengan

meningkat daripada keseimbangan (model "malapetaka"); c) pasaran

berayun secara kitaran di sekitar titik keseimbangan, tetapi keseimbangan



Atas