Dualitas dalam pemrograman linier. Jenis-jenis kesetimbangan: Kesetimbangan Nash, Stekelberg, Kesetimbangan Pareto-Optimal, Kesetimbangan Strategi Dominan Apa mekanisme optimal untuk mencari solusi kesetimbangan

Definisi dasar teori dualitas.

Setiap masalah pemrograman linier dapat dikaitkan dengan masalah pemrograman linier lainnya. Ketika salah satu dari mereka terpecahkan, masalah lainnya secara otomatis terpecahkan. Tugas seperti itu disebut saling ganda. Mari kita tunjukkan bagaimana, dengan masalah yang diberikan (kita akan menyebutnya yang asli), kita dapat membuat dualnya.

Pertimbangkan masalah keluaran yang direncanakan.

F=3 X 1 + 5X 2 + 4X 3 + 5X 4 → maks.
5x 1 +0,4x 2 +2x 3 +0,5x 4 ≤400
5x2 +x3 +x4 ≤300
x 1 + x 3 + x 4 ≤100
x 1 ≥0, x 2 ≥0, x 3 ≥0, x 4 ≥0

Aturan umum untuk mengkompilasi masalah ganda:

Lurus ganda
Fungsi target (maks) Batasan sisi kanan
Batasan sisi kanan Fungsi target (min)
A - matriks kendala A T - matriks kendala
kendala ke-i: ≤ 0, (≥ 0) Variabel y i ≥ 0, (≤ 0)
kendala ke-i: = 0 Variabel yi ≠ 0
Variabel x j ≥ 0 (≤ 0)
Variabel x j ≠ 0 batasan ke-j: = 0
maks → min
Lurus ganda
Fungsi target (min) Batasan sisi kanan
Batasan sisi kanan Fungsi target (maks)
A - matriks kendala A T - matriks kendala
kendala ke-i: ≥ 0, (≤ 0) Variabel y i ≥ 0, (≤ 0)
kendala ke-i: = 0 Variabel yi ≠ 0
Variabel x j ≥ 0 (≤ 0) kendala ke-j: ≤ 0 (≥ 0)
Variabel x j ≠ 0 batasan ke-j: = 0

Mari kita bangun masalah rangkapnya menurut aturan berikut.

  1. Jumlah variabel dalam soal ganda sama dengan jumlah pertidaksamaan dalam soal awal.
  2. Matriks koefisien dari masalah ganda ditransposisikan ke matriks koefisien dari yang asli.
  3. Kolom suku bebas dari soal awal adalah deretan koefisien untuk fungsi tujuan ganda. Fungsi tujuan dimaksimalkan dalam satu masalah dan diminimalkan di masalah lain.
  4. Kondisi non-negatifitas variabel dari masalah asli sesuai dengan ketidaksetaraan-pembatasan dari masalah ganda yang diarahkan ke arah yang berlawanan. Dan sebaliknya, ketidaksetaraan-pembatasan dalam aslinya sesuai dengan kondisi non-negatif dalam ganda.

Perhatikan bahwa baris matriks tugas I adalah kolom matriks tugas II. Oleh karena itu, koefisien untuk variabel y i pada soal II berturut-turut adalah koefisien pertidaksamaan ke-i pada soal I.
Model yang dihasilkan adalah model ekonomi dan matematika dari masalah dual to the direct problem.

Ketidaksetaraan yang dihubungkan dengan panah akan menjadi konjugasi panggilan.
Rumusan yang bermakna dari masalah ganda: temukan seperangkat harga (perkiraan) sumber daya Y = (y 1 , y 2 ..., y m), di mana total biaya sumber daya akan minimal, asalkan biaya sumber daya dalam produksi setiap jenis produk akan tidak kurang dari keuntungan (hasil dari penjualan produk-produk ini.
Harga sumber daya y 1 , y 2 ..., y m dalam literatur ekonomi diterima berbagai judul: akuntansi, implisit, bayangan. Arti dari nama-nama ini adalah bahwa ini adalah harga "palsu" bersyarat. Berbeda dengan harga "eksternal" dari 1 , dari 2 ..., dari n untuk produk, yang diketahui, sebagai aturan, sebelum dimulainya produksi, harga sumber daya y 1 , y 2 ..., y m bersifat internal , karena tidak ditetapkan dari luar, tetapi ditentukan langsung sebagai hasil pemecahan masalah, sehingga sering disebut estimasi sumber daya.
Hubungan antara masalah langsung dan ganda terutama terdiri dari fakta bahwa solusi salah satunya dapat diperoleh langsung dari solusi yang lain.

teorema dualitas

Dualitas adalah konsep dasar dalam teori pemrograman linier. Hasil utama teori dualitas terkandung dalam dua teorema yang disebut teorema dualitas.

teorema dualitas pertama.

Jika salah satu dari pasangan masalah ganda I dan II dapat diselesaikan, maka yang lainnya dapat diselesaikan, dan nilai fungsi tujuan pada rencana optimal adalah sama, F(X*) = G(y*), di mana x *, y * - solusi optimal dari masalah I dan II

Teorema dualitas kedua.

Rencana x * dan y * optimal dalam Soal I dan II jika dan hanya jika, ketika masing-masing disubstitusi ke dalam sistem kendala dari Soal I dan II, setidaknya salah satu dari pasangan ketidaksetaraan konjugat mana pun menjadi persamaan.
Ini teorema dualitas fundamental. Dengan kata lain, jika x * dan y * adalah solusi layak untuk masalah primal dan dual, dan jika c T x*=b T y*, maka x * dan y * adalah solusi optimal untuk sepasang masalah dual.

teorema dualitas ketiga. Nilai variabel y i dalam solusi optimal dari masalah ganda adalah perkiraan pengaruh anggota bebas b i dari sistem kendala - ketidaksetaraan masalah langsung pada nilai fungsi tujuan dari masalah ini:
Δf(x) = b i y i

Memecahkan LLP dengan metode simpleks, kami secara bersamaan menyelesaikan LLP ganda. Nilai variabel dari masalah ganda y i , dalam rencana optimal disebut ditentukan secara objektif, atau estimasi ganda. Dalam masalah terapan, perkiraan ganda y sering disebut tersembunyi, harga bayangan atau perkiraan sumber daya marjinal.

Properti masalah saling ganda

  1. Dalam satu soal, maksimum dari suatu fungsi linier dicari, dalam soal lain, minimum.
  2. Koefisien variabel dalam fungsi linear dari satu masalah adalah anggota bebas dari sistem kendala di masalah lain.
  3. Setiap soal diberikan dalam bentuk baku, dan dalam soal maksimisasi semua pertidaksamaan berbentuk ≤ , dan dalam soal minimisasi semua pertidaksamaan berbentuk ≥ .
  4. Matriks koefisien untuk variabel dalam sistem kendala dari kedua masalah dialihkan satu sama lain:
  5. Jumlah pertidaksamaan dalam sistem kendala dari satu soal sama dengan jumlah variabel dalam soal yang lain.
  6. Kondisi non-negatifitas variabel ada di kedua soal.

teorema kesetimbangan

Tugas 2
Buat soal ganda untuk soal 1. Temukan penyelesaian dengan teorema kesetimbangan.
3x1 +x2 ≥12
x1 +2x2 ≥14
4x1 +11x2 ≥68

teorema kesetimbangan . Misalkan X*=(x 1 *,...,x n *) dan Y*=(y 1 *,...,y n *) adalah desain yang dapat diterima dari sepasang masalah ganda dalam bentuk simetris. Rencana ini optimal jika dan hanya jika kondisi slackness komplementer berikut terpenuhi:


Teorema 4 memungkinkan kita menentukan solusi optimal untuk salah satu dari sepasang masalah ganda dengan menyelesaikan yang lain. Jika kendala dari satu masalah berubah menjadi pertidaksamaan ketat ketika solusi optimal diganti, maka variabel ganda yang sesuai dalam solusi optimal dari masalah ganda sama dengan 0. Jika ada variabel positif dalam rencana optimal dari satu masalah, maka kendala yang sesuai dari masalah ganda adalah persamaan.
Mari kita memberikan interpretasi ekonomi dari kondisi kelambanan komplementer. Jika dalam solusi optimal beberapa bahan baku memiliki perkiraan selain 0, maka bahan baku tersebut akan habis seluruhnya (sumber dayanya langka). Jika bahan baku tidak habis dikonsumsi (berlebihan), maka penaksirannya sama dengan 0. Dengan demikian, penaksiran ganda adalah ukuran kelangkaan bahan baku. Estimasi menunjukkan seberapa besar nilai fungsi tujuan akan meningkat dengan peningkatan stok bahan baku terkait sebesar 1 unit. Jika jenis produk tertentu termasuk dalam rencana produksi, maka biaya produksinya sama dengan biaya produk yang diproduksi. Jika biaya produksi suatu produk lebih besar dari biaya produk, maka produk tersebut tidak diproduksi.
Jika salah satu dari pasangan masalah ganda berisi dua variabel, itu dapat diselesaikan secara grafis, dan kemudian, temukan solusi untuk masalah ganda tersebut menggunakan Teorema 3 dan 4. Dalam kasus ini, 3 kasus dapat muncul: kedua masalah memiliki solusi yang layak, hanya satu masalah memiliki solusi yang layak, kedua masalah tidak memiliki solusi yang layak.

Contoh 2
Buatlah soal ganda dan temukan penyelesaiannya menggunakan teorema kesetimbangan
x 2 -2x 3 +2x 4 -2x 5 ≤4
-2x 1 -2x 2 +2x 3 +2x 4 +x 5 ≥2
x i ≥0, i = 1,5
Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → maks, jika solusi untuk masalah awal diketahui: Zmax=(3;4;0;0;0).
Mari kita membangun masalah ganda. Kami menyetujui tanda-tanda ketidaksetaraan dengan tujuan dari masalah awal.

Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → maks
Tugas ganda:

W=4y 1 -2y 2 → min
Mari kita temukan solusi optimal dari masalah ganda menggunakan teorema kesetimbangan. Mari kita tuliskan kondisi kelonggaran komplementer.
y 1 (4-(x 2 -2x 3 +2x 4 -2x 5))=0
y 2 (-2-(2x 1 -2x 2 -2x 3 -2x 4 -x 5))=0
x 1 (-2y 2 -10)=0
x 2 (y 1 -2y 2 +9)=0
x 3 (-2y 1 -2y 2 +19)=0
x 4 (2y 1 -2y 2 +13)=0
x 5 (-2y 1 -y 2 +11)=0
Mari kita gantikan solusi optimal dari masalah awal ke dalam sistem yang dikompilasi: x 1 =3, x 2 =4, x 3 =0, x 4 =0, x 5 =0.
y 1 (4-(4-2 0+2 0-2 0))=0
y 2 (-2-(2 3-2 4-2 0-2 0-0))=0 W(y 1 , y 2 , y 3)=12y 1 +31y 2 +18y 3 → maks. Berdasarkan Teorema 3 Zmax=Wmin=100000.
Terakhir, Wmin=W(0; 4000/7; 32000/21) = 100000

Dalam permainan antagonis, wajar untuk menganggap hasil optimal sebagai hasil yang tidak menguntungkan bagi salah satu pemain untuk menyimpang darinya. Hasil seperti itu (x*,y*) disebut situasi ekuilibrium, dan prinsip optimalitas yang didasarkan pada penemuan situasi ekuilibrium disebut prinsip ekuilibrium.

Definisi. Dalam permainan matriks dengan matriks dimensi, hasilnya adalah situasi keseimbangan atau titik pelana jika

Pada titik sadel, elemen matriks adalah nilai minimum pada barisnya dan nilai maksimum pada kolomnya. Dalam game dari contoh, elemen 2 33 adalah titik sadel. Optimal dalam game ini adalah strategi ketiga untuk kedua pemain. Jika pemain pertama menyimpang dari strategi ketiga, maka dia mulai menang kurang dari 33. Jika pemain kedua menyimpang dari strategi ketiga, maka dia mulai kehilangan lebih dari 33. Jadi, bagi kedua pemain, tidak ada yang lebih baik daripada secara konsisten berpegang pada strategi ketiga.

Prinsip perilaku optimal: jika ada titik pelana dalam permainan matriks, maka strategi optimal adalah pilihan yang sesuai dengan titik pelana tersebut. Apa yang terjadi jika ada lebih dari satu titik pelana dalam permainan?

Dalil. Membiarkan dua titik pelana sewenang-wenang dalam permainan matriks. Kemudian:

Bukti. Dari definisi situasi keseimbangan, kita memiliki:

Mari kita gantikan ke ruas kiri pertidaksamaan (2.8) , dan ke kanan - , ke ruas kiri pertidaksamaan (2.9) - , ke kanan - . Kemudian kita mendapatkan:

Dari mana datangnya persamaan:

Ini mengikuti dari teorema bahwa fungsi pembayaran mengambil nilai yang sama dalam semua situasi ekuilibrium. Itu sebabnya nomor itu disebut dengan biaya permainan. Dan strategi yang sesuai dengan salah satu titik sadel disebut strategi optimal pemain 1 dan 2 masing-masing. Berdasarkan (2.7), semua strategi optimal pemain dapat dipertukarkan.

Optimalitas perilaku pemain tidak akan berubah jika rangkaian strategi dalam permainan tetap sama, dan fungsi pembayaran dikalikan dengan konstanta positif (atau angka konstanta ditambahkan ke dalamnya).

Dalil. Agar titik sadel (i*,j*) ada dalam permainan matriks, perlu dan cukup bahwa maksimin sama dengan minimaks:

(2.10)

Bukti. Kebutuhan. Jika (i*,j*) adalah titik pelana, maka menurut (2.6) :

(2.11)

Namun, kami memiliki:

(2.12)

Dari (2.11) dan (2.12) kita dapatkan:

(2.13)

Berdebat sama, kita sampai pada persamaan:

Dengan demikian,

Sebaliknya, pertidaksamaan terbalik (2.5) selalu terpenuhi, sehingga (2.10) benar.

Kecukupan. Misalkan (2.10) benar. Mari kita buktikan keberadaan titik sadel. Kita punya:

Menurut persamaan (2.10), pertidaksamaan (2.15) dan (2.16) berubah menjadi persamaan. Setelah itu kami memiliki:

Teorema telah terbukti. Hal itu juga telah dibuktikan arti umum maximin dan minimax sama dengan harga permainan.

Ekspansi Game Campuran

Pertimbangkan permainan matriks G. Jika ada situasi keseimbangan di dalamnya, maka minimax sama dengan maximin. Selain itu, masing-masing pemain dapat memberi tahu pemain lain informasi tentang strategi optimalnya. Lawannya tidak akan dapat memperoleh manfaat tambahan apa pun dari informasi ini. Sekarang misalkan tidak ada situasi ekuilibrium dalam permainan G. Kemudian:

Dalam hal ini, strategi minimax dan maximin tidak stabil. Pemain mungkin memiliki insentif untuk menyimpang dari strategi hati-hati mereka terkait dengan kemungkinan mendapatkan lebih banyak hasil, tetapi juga risiko kehilangan, yaitu mendapatkan hasil lebih sedikit daripada menggunakan strategi yang bijaksana. Saat menggunakan strategi berisiko, transfer informasi tentang mereka ke lawan memiliki konsekuensi yang merugikan: pemain secara otomatis menerima hasil yang lebih kecil daripada saat menggunakan strategi hati-hati.

Contoh 3. Biarkan matriks permainan terlihat seperti:

Untuk matriks seperti itu, mis. kesetimbangan tidak ada. Strategi hati-hati para pemain adalah i*=1, j*=2. Biarkan pemain 2 mengikuti strategi j*=2, dan pemain 1 memilih strategi i=2. maka yang terakhir akan menerima pembayaran 3, yaitu dua unit lebih banyak dari maximin. Namun, jika pemain 2 menebak tentang rencana pemain 1, dia akan mengubah strateginya menjadi j = 1, dan yang pertama akan menerima hasil 0, yaitu kurang dari maximinnya. Penalaran serupa dapat dilakukan untuk pemain kedua. Secara umum, kita dapat menyimpulkan bahwa penggunaan strategi petualang dalam permainan terpisah dapat membawa hasil yang lebih besar dari yang dijamin, tetapi penggunaannya dikaitkan dengan risiko. Timbul pertanyaan, apakah mungkin menggabungkan strategi hati-hati yang andal dengan strategi petualang sedemikian rupa untuk meningkatkan hasil rata-rata Anda? Intinya, pertanyaannya adalah bagaimana membagi hasil (2.17) di antara para pemain?

Ternyata solusi yang masuk akal adalah dengan menggunakan strategi campuran, yaitu pilihan acak dari strategi murni. Ingat itu strategi pemain 1 disebut campuran, jika pilihan baris ke-i dibuat olehnya dengan probabilitas p i . Strategi seperti itu dapat diidentifikasi dengan distribusi probabilitas pada beberapa baris. Misalkan pemain pertama memiliki m strategi murni dan pemain kedua memiliki n strategi murni. Maka strategi campuran mereka adalah vektor probabilitas:

(2.18)

Pertimbangkan dua kemungkinan strategi campuran untuk pemain pertama dalam Contoh 3: . Strategi ini berbeda dalam distribusi probabilitas antara strategi murni. Jika dalam kasus pertama baris matriks dipilih oleh pemain dengan probabilitas yang sama, maka dalam kasus kedua - dengan yang berbeda. Ketika kita berbicara tentang strategi campuran, maksud kami pilihan acak bukan pilihan "secara acak", tetapi pilihan berdasarkan kerja mekanisme acak yang menyediakan distribusi probabilitas yang kita butuhkan. Jadi untuk penerapan strategi campuran pertama, lemparan koin sangat cocok. Pemain memilih baris pertama atau baris kedua, tergantung bagaimana koin jatuh. Rata-rata, pemain akan memilih baris pertama dan baris kedua sama seringnya, tetapi pilihan pada iterasi permainan tertentu tidak tunduk pada aturan tetap apa pun dan memiliki tingkat kerahasiaan maksimum: sebelum penerapan mekanisme acak , tidak diketahui bahkan oleh pemain pertama. Untuk menerapkan strategi campuran kedua, mekanisme pengundian sangat cocok. Pemain mengambil tujuh lembar kertas yang identik, menandai tiga di antaranya dengan salib, dan melemparkannya ke dalam topi. Kemudian, secara acak, dia mengekstrak salah satunya. Menurut teori probabilitas klasik, dia akan mengeluarkan selembar kertas dengan tanda silang dengan probabilitas 3/7, dan selembar kertas bersih dengan probabilitas 4/7. Mekanisme pengundian seperti itu mampu mewujudkan probabilitas rasional apa pun.

Biarkan para pemain mematuhi strategi campuran (2.18). Maka imbalan dari pemain pertama pada satu iterasi permainan adalah variabel acak: v(X,Y). Karena pemain memilih strategi secara independen satu sama lain, maka menurut teorema perkalian probabilitas, probabilitas memilih hasil (i, j) dengan kemenangan sama dengan produk probabilitas . Kemudian hukum distribusi variabel acak v(X,Y) diberikan oleh tabel berikut

Sekarang biarkan permainan dimainkan tanpa batas waktu. Maka hasil rata-rata dalam permainan seperti itu sama dengan ekspektasi matematis dari nilai tersebut v(X,Y).

(2.19)

Ketika final tapi cukup angka besar iterasi permainan, hasil rata-rata akan sedikit berbeda dari nilai (2.19).

Contoh 4. Hitung hasil rata-rata (2.19) untuk permainan dari contoh 3 ketika pemain menggunakan strategi berikut: . Matriks hasil dan matriks probabilitas adalah sebagai berikut:

Mari kita cari rata-ratanya:

Dengan demikian, hasil rata-rata (2,20) berada di antara maximin dan minimax.

Karena untuk setiap pasangan strategi campuran X dan Y dimungkinkan untuk menghitung nilai rata-rata permainan, maka muncul masalah untuk menemukan strategi optimal. Wajar untuk memulai dengan menjelajahi strategi yang hati-hati. Strategi hati-hati pemain pertama memberinya maximin. Strategi hati-hati pemain kedua tidak memungkinkan pemain pertama menang lebih dari minimax. Hasil paling signifikan dalam teori permainan dengan kepentingan yang berlawanan dapat dianggap sebagai berikut:

Dalil. Setiap permainan matriks memiliki situasi ekuilibrium dalam strategi campuran. Pembuktian teorema ini tidak mudah. Itu dihilangkan dalam kursus ini.

Konsekuensi: Keberadaan situasi ekuilibrium berarti maksimin sama dengan minimaks, dan oleh karena itu setiap permainan matriks memiliki harga. Strategi optimal untuk pemain pertama adalah strategi maximin. Strategi optimal yang kedua adalah minimax. Karena masalah menemukan strategi optimal telah diselesaikan, kami mengatakan bahwa permainan matriks apa pun larut pada serangkaian strategi campuran.

Solusi permainan 2x2

Contoh 5. Selesaikan permainan. Tidak sulit untuk memverifikasi bahwa tidak ada titik pelana. Tunjukkan strategi optimal dari pemain pertama (x, 1-x) adalah vektor kolom, tetapi untuk kenyamanan kita menulisnya sebagai string. Tunjukkan strategi optimal dari pemain kedua (y,1-y).

Imbalan dari pemain pertama adalah variabel acak dengan distribusi berikut:

v(x,y) 2 -1 -4 7
P xy x(1-y) (1x)y (1-x)(1-y)

Kami menemukan hasil rata-rata untuk iterasi pemain pertama - ekspektasi matematis dari variabel acak v(x,y):

Mari ubah ungkapan ini:

Ekspektasi matematis ini terdiri dari konstanta (5/7) dan bagian variabel: 14(x-11/14)(y-8/14). Jika nilainya y berbeda dengan 8/14, maka pemain pertama selalu dapat memilih X sedemikian rupa untuk membuat bagian variabel positif, meningkatkan kemenangan Anda. Jika nilainya X berbeda dengan 11/14, maka pemain kedua selalu dapat memilih y sehingga membuat bagian variabel menjadi negatif, mengurangi hasil dari pemain pertama. Jadi, titik pelana ditentukan oleh persamaan: x*=11/14, y*=8/14.

2.5 Pemecahan permainan

Sebuah contoh akan menunjukkan bagaimana menyelesaikan game semacam itu.

Contoh 6. Selesaikan permainan . Kami memastikan bahwa tidak ada titik pelana. Tunjukkan strategi campuran dari pemain pertama X=(x, 1-x) adalah vektor kolom, tetapi untuk kenyamanan kita menulisnya sebagai string.

Biarkan pemain pertama menerapkan strategi X, dan yang kedua - miliknya j-th bersih strategi. Mari kita nyatakan hasil rata-rata dari pemain pertama dalam situasi ini sebagai . Kita punya:

Mari kita gambarkan grafik fungsi (2.21) pada ruas .

Koordinat titik yang terletak di salah satu segmen garis sesuai dengan pembayaran pemain pertama dalam situasi di mana dia menggunakan strategi campuran. (x,(1-x)), dan pemain kedua strategi murni yang sesuai. Hasil yang dijamin dari pemain pertama adalah amplop yang lebih rendah dari keluarga garis (ABC yang rusak). titik tertinggi garis putus-putus ini (titik B) adalah hasil maksimal yang dijamin dari pemain 1. Absis poin B sesuai dengan strategi optimal pemain pertama.

Karena titik B yang diinginkan adalah persimpangan garis dan, maka absisnya dapat ditemukan sebagai solusi persamaan:

Dengan demikian, strategi gabungan yang optimal dari pemain pertama adalah (5/9, 4/9). Ordinat titik B adalah harga permainan. Itu sama dengan:

(2.22)

Perhatikan bahwa garis yang sesuai dengan strategi kedua pemain kedua lewat di atas titik B. Ini berarti bahwa jika pemain pertama menerapkan strategi optimalnya, dan pemain 2 menggunakan strategi kedua, maka kerugian pemain kedua bertambah dibandingkan dengan menerapkan strategi 1 atau 3. Dengan demikian, strategi kedua tidak boleh berpartisipasi dalam strategi optimal pemain kedua. Strategi optimal untuk pemain 2 adalah: . Strategi murni 1 dan 3 dari pemain kedua yang memiliki komponen bukan nol dalam strategi optimal biasanya disebut penting. Strategi 2 disebut tidak signifikan. Dari gambar di atas, serta dari persamaan (2.22), terlihat bahwa ketika pemain pertama menerapkan strategi optimalnya, imbalan pemain kedua tidak bergantung pada strategi esensial mana yang ia gunakan. Dia juga dapat menerapkan strategi campuran apa pun yang terdiri dari esensial (khususnya, optimal), hasilnya juga tidak akan berubah dalam kasus ini. Pernyataan yang sepenuhnya analog juga berlaku untuk kasus sebaliknya. Jika pemain kedua menggunakan strategi optimalnya, maka pembayaran pemain pertama tidak bergantung pada strategi esensial mana yang dia gunakan dan sama dengan biaya permainan. Dengan menggunakan pernyataan ini, kami menemukan strategi optimal untuk pemain kedua.

Strategi optimal dalam teori konflik adalah strategi yang mengarahkan para pemain ke keseimbangan yang stabil, yaitu. beberapa situasi yang memuaskan semua pemain.

Optimalitas solusi dalam teori permainan didasarkan pada konsep situasi keseimbangan:

1) tidak menguntungkan bagi salah satu pemain untuk menyimpang dari situasi ekuilibrium jika yang lainnya tetap di dalamnya,

2) arti keseimbangan - dengan pengulangan permainan yang berulang, para pemain akan mencapai situasi keseimbangan, memulai permainan dalam situasi strategis apa pun.

Dalam setiap interaksi, jenis kesetimbangan berikut dapat terjadi:

1. keseimbangan dalam strategi hati-hati . Ditentukan oleh strategi yang menyediakan pemain hasil terjamin;

2. keseimbangan dalam strategi dominan .

Strategi dominan adalah rencana tindakan yang memberi peserta keuntungan maksimal, terlepas dari tindakan peserta lain. Oleh karena itu, ekuilibrium dari strategi dominan akan menjadi persimpangan dari strategi dominan kedua peserta dalam permainan.

Jika strategi optimal para pemain mendominasi semua strategi mereka yang lain, maka permainan memiliki keseimbangan dalam strategi dominan tersebut. Dalam permainan dilema tahanan, rangkaian strategi ekuilibrium Nash adalah ("akui - akui"). Selain itu, penting untuk dicatat bahwa untuk pemain A dan pemain B "mengenali" adalah strategi dominan, sedangkan "tidak mengenali" adalah dominasi;

3. keseimbangan Nash . keseimbangan Nash adalah jenis keputusan permainan dua atau lebih pemain, di mana tidak ada peserta yang dapat meningkatkan hasil dengan mengubah keputusannya secara sepihak, ketika peserta lain tidak mengubah keputusannya.

Katakanlah permainan N wajah dalam bentuk normal, dimana adalah himpunan strategi murni dan adalah himpunan imbalan.

Saat setiap pemain memilih strategi di profil strategi, pemain menerima hadiah. Selain itu, imbalannya bergantung pada keseluruhan profil strategi: tidak hanya pada strategi yang dipilih oleh pemain itu sendiri, tetapi juga pada strategi orang lain. Profil strategi adalah ekuilibrium Nash jika perubahan dalam strateginya tidak menguntungkan pemain mana pun, yaitu siapa pun

Sebuah permainan dapat memiliki keseimbangan Nash baik dalam strategi murni maupun campuran.

Nash membuktikan itu jika diperbolehkan strategi campuran, lalu di setiap permainan N pemain akan memiliki setidaknya satu ekuilibrium Nash.

Dalam situasi ekuilibrium Nash, strategi setiap pemain memberinya respons terbaik terhadap strategi pemain lain;

4. Keseimbangan Stackelberg. Model Stackelberg– model teori permainan dari pasar oligopolistik dengan adanya asimetri informasi. Dalam model ini, perilaku perusahaan digambarkan dengan permainan dinamis dengan informasi sempurna yang lengkap, dimana perilaku perusahaan dimodelkan menggunakan statis game dengan informasi lengkap. Fitur utama permainan adalah kehadiran perusahaan terkemuka, yang pertama menetapkan volume output barang, dan perusahaan lainnya dipandu dalam perhitungannya olehnya. Prasyarat dasar permainan:


Industri menghasilkan produk yang homogen: perbedaan produk dari perusahaan yang berbeda dapat diabaikan, yang berarti bahwa pembeli, ketika memilih perusahaan mana yang akan dibeli, hanya berfokus pada harga;

Industri ini memiliki sejumlah kecil perusahaan.

perusahaan menetapkan jumlah produk yang diproduksi, dan harganya ditentukan berdasarkan permintaan;

Ada yang disebut perusahaan pemimpin, yang volume produksinya dipandu oleh perusahaan lain.

Dengan demikian, model Stackelberg digunakan untuk menemukan solusi optimal dalam permainan dinamis dan sesuai dengan pembayaran maksimum pemain, berdasarkan kondisi yang berkembang setelah pilihan dibuat oleh satu atau lebih pemain. keseimbangan Stackelberg.- situasi di mana tidak ada pemain yang dapat meningkatkan kemenangan mereka secara sepihak, dan keputusan dibuat terlebih dahulu oleh satu pemain dan menjadi diketahui kedua pemain. Dalam permainan dilema tahanan, keseimbangan Stackelberg akan tercapai di alun-alun (1; 1) - "mengaku bersalah" oleh kedua penjahat;

5. optimalitas Pareto- keadaan sistem yang demikian, di mana nilai setiap kriteria tertentu yang menggambarkan keadaan sistem tidak dapat diperbaiki tanpa memperburuk posisi pemain lain.

Prinsip Pareto menyatakan: “Setiap perubahan yang tidak menimbulkan kerugian, tetapi menguntungkan sebagian orang (menurut perkiraan mereka sendiri), adalah sebuah perbaikan.” Dengan demikian, diakui hak atas semua perubahan yang tidak membawa kerugian tambahan bagi siapa pun.

Himpunan status sistem yang optimal Pareto disebut "himpunan Pareto", "himpunan alternatif optimal dalam pengertian Pareto", atau "himpunan alternatif optimal".

Situasi di mana efisiensi Pareto telah tercapai adalah situasi di mana semua keuntungan dari pertukaran telah habis.

Efisiensi Pareto adalah salah satu konsep sentral untuk ekonomi modern. Berdasarkan konsep ini, dibangun teorema kesejahteraan fundamental pertama dan kedua.

Salah satu penerapan optimalitas Pareto adalah distribusi sumber daya (tenaga kerja dan modal) Pareto dalam integrasi ekonomi internasional, yaitu kesatuan ekonomi dari dua negara atau lebih. Menariknya, distribusi Pareto sebelum dan sesudah integrasi ekonomi internasional cukup dijelaskan secara matematis (Dalimov R.T., 2008). Analisis menunjukkan bahwa nilai tambah sektor dan pendapatan sumber daya tenaga kerja bergerak berlawanan arah sesuai dengan persamaan konduksi panas yang terkenal, mirip dengan gas atau cairan di ruang angkasa, yang memungkinkan untuk menerapkan teknik analisis yang digunakan. dalam fisika dalam kaitannya dengan masalah ekonomi migrasi parameter ekonomi.

Pareto optimal menyatakan bahwa kesejahteraan masyarakat mencapai maksimum, dan distribusi sumber daya menjadi optimal jika setiap perubahan dalam distribusi ini memperburuk kesejahteraan setidaknya satu subjek dari sistem ekonomi.

Keadaan pasar pareto-optimal- situasi di mana tidak mungkin untuk meningkatkan posisi salah satu peserta dalam proses ekonomi tanpa secara bersamaan mengurangi kesejahteraan setidaknya satu dari yang lain.

Menurut kriteria Pareto (kriteria pertumbuhan kesejahteraan sosial), gerakan menuju optimal hanya dimungkinkan dengan distribusi sumber daya yang meningkatkan kesejahteraan setidaknya satu orang tanpa merugikan orang lain.

Situasi S* dikatakan situasi dominan Pareto S jika:

untuk setiap pemain bayarannya di S<=S*

· Setidaknya ada satu pemain yang bayarannya dalam situasi S*>S

Dalam masalah "dilema tahanan", keseimbangan Pareto, ketika tidak mungkin memperbaiki posisi salah satu pemain tanpa memperburuk posisi pemain lain, sesuai dengan situasi kotak (2; 2).

Mempertimbangkan Contoh 1.

Strategi optimal dalam teori konflik adalah strategi yang mengarahkan para pemain ke keseimbangan yang stabil, yaitu. beberapa situasi yang memuaskan semua pemain.

Optimalitas solusi dalam teori permainan didasarkan pada konsep situasi keseimbangan:

1) tidak menguntungkan bagi salah satu pemain untuk menyimpang dari situasi ekuilibrium jika yang lainnya tetap di dalamnya,

2) arti keseimbangan - dengan pengulangan permainan yang berulang, para pemain akan mencapai situasi keseimbangan, memulai permainan dalam situasi strategis apa pun.

Dalam setiap interaksi, jenis kesetimbangan berikut dapat terjadi:

1. keseimbangan dalam strategi hati-hati . Ditentukan oleh strategi yang memberi pemain hasil yang terjamin;

2. keseimbangan dalam strategi dominan .

Strategi dominan adalah rencana tindakan yang memberi peserta keuntungan maksimal, terlepas dari tindakan peserta lain. Oleh karena itu, ekuilibrium dari strategi dominan akan menjadi persimpangan dari strategi dominan kedua peserta dalam permainan.

Jika strategi optimal para pemain mendominasi semua strategi mereka yang lain, maka permainan memiliki keseimbangan dalam strategi dominan tersebut. Dalam permainan dilema tahanan, rangkaian strategi ekuilibrium Nash adalah ("akui - akui"). Selain itu, penting untuk dicatat bahwa untuk pemain A dan pemain B "mengenali" adalah strategi dominan, sedangkan "tidak mengenali" adalah dominasi;

3. keseimbangan Nash . keseimbangan Nash adalah jenis keputusan permainan dua atau lebih pemain, di mana tidak ada peserta yang dapat meningkatkan hasil dengan mengubah keputusannya secara sepihak, ketika peserta lain tidak mengubah keputusannya.

Katakanlah permainan N wajah dalam bentuk normal, dimana adalah himpunan strategi murni dan adalah himpunan imbalan.

Saat setiap pemain memilih strategi di profil strategi, pemain menerima hadiah. Selain itu, imbalannya bergantung pada keseluruhan profil strategi: tidak hanya pada strategi yang dipilih oleh pemain itu sendiri, tetapi juga pada strategi orang lain. Profil strategi adalah ekuilibrium Nash jika perubahan dalam strateginya tidak menguntungkan pemain mana pun, yaitu siapa pun



Sebuah permainan dapat memiliki keseimbangan Nash baik dalam strategi murni maupun campuran.

Nash membuktikan itu jika diperbolehkan strategi campuran, lalu di setiap permainan N pemain akan memiliki setidaknya satu ekuilibrium Nash.

Dalam situasi ekuilibrium Nash, strategi setiap pemain memberinya respons terbaik terhadap strategi pemain lain;

4. Keseimbangan Stackelberg. Model Stackelberg– model teori permainan dari pasar oligopolistik dengan adanya asimetri informasi. Dalam model ini, perilaku perusahaan digambarkan dengan permainan dinamis dengan informasi sempurna yang lengkap, dimana perilaku perusahaan dimodelkan menggunakan statis game dengan informasi lengkap. Fitur utama dari permainan ini adalah kehadiran perusahaan terkemuka, yang pertama-tama menetapkan volume output barang, dan perusahaan lainnya dipandu dalam perhitungannya olehnya. Prasyarat dasar permainan:

Industri menghasilkan produk yang homogen: perbedaan produk dari perusahaan yang berbeda dapat diabaikan, yang berarti bahwa pembeli, ketika memilih perusahaan mana yang akan dibeli, hanya berfokus pada harga;

Industri ini memiliki sejumlah kecil perusahaan.

perusahaan menetapkan jumlah produk yang diproduksi, dan harganya ditentukan berdasarkan permintaan;

Ada yang disebut perusahaan pemimpin, yang volume produksinya dipandu oleh perusahaan lain.

Dengan demikian, model Stackelberg digunakan untuk menemukan solusi optimal dalam permainan dinamis dan sesuai dengan pembayaran maksimum pemain, berdasarkan kondisi yang berkembang setelah pilihan dibuat oleh satu atau lebih pemain. keseimbangan Stackelberg.- situasi di mana tidak ada pemain yang dapat meningkatkan kemenangan mereka secara sepihak, dan keputusan dibuat pertama kali oleh satu pemain dan diketahui oleh pemain kedua. Dalam permainan dilema tahanan, keseimbangan Stackelberg akan tercapai di alun-alun (1; 1) - "mengaku bersalah" oleh kedua penjahat;

5. optimalitas Pareto- keadaan sistem yang demikian, di mana nilai setiap kriteria tertentu yang menggambarkan keadaan sistem tidak dapat diperbaiki tanpa memperburuk posisi pemain lain.

Prinsip Pareto menyatakan: “Setiap perubahan yang tidak menimbulkan kerugian, tetapi menguntungkan sebagian orang (menurut perkiraan mereka sendiri), adalah sebuah perbaikan.” Dengan demikian, diakui hak atas semua perubahan yang tidak membawa kerugian tambahan bagi siapa pun.

Himpunan status sistem yang optimal Pareto disebut "himpunan Pareto", "himpunan alternatif optimal dalam pengertian Pareto", atau "himpunan alternatif optimal".

Situasi di mana efisiensi Pareto telah tercapai adalah situasi di mana semua keuntungan dari pertukaran telah habis.

Efisiensi Pareto adalah salah satu konsep sentral untuk ekonomi modern. Berdasarkan konsep ini, dibangun teorema kesejahteraan fundamental pertama dan kedua.

Salah satu penerapan optimalitas Pareto adalah distribusi sumber daya (tenaga kerja dan modal) Pareto dalam integrasi ekonomi internasional, yaitu kesatuan ekonomi dari dua negara atau lebih. Menariknya, distribusi Pareto sebelum dan sesudah integrasi ekonomi internasional cukup dijelaskan secara matematis (Dalimov R.T., 2008). Analisis menunjukkan bahwa nilai tambah sektor dan pendapatan sumber daya tenaga kerja bergerak berlawanan arah sesuai dengan persamaan konduksi panas yang terkenal, mirip dengan gas atau cairan di ruang angkasa, yang memungkinkan untuk menerapkan teknik analisis yang digunakan. dalam fisika dalam kaitannya dengan masalah ekonomi migrasi parameter ekonomi.

Pareto optimal menyatakan bahwa kesejahteraan masyarakat mencapai maksimum, dan distribusi sumber daya menjadi optimal jika setiap perubahan dalam distribusi ini memperburuk kesejahteraan setidaknya satu subjek dari sistem ekonomi.

Keadaan pasar pareto-optimal- situasi di mana tidak mungkin untuk meningkatkan posisi salah satu peserta dalam proses ekonomi tanpa secara bersamaan mengurangi kesejahteraan setidaknya satu dari yang lain.

Menurut kriteria Pareto (kriteria pertumbuhan kesejahteraan sosial), gerakan menuju optimal hanya dimungkinkan dengan distribusi sumber daya yang meningkatkan kesejahteraan setidaknya satu orang tanpa merugikan orang lain.

Situasi S* dikatakan situasi dominan Pareto S jika:

untuk setiap pemain bayarannya di S<=S*

· Setidaknya ada satu pemain yang bayarannya dalam situasi S*>S

Dalam masalah "dilema tahanan", keseimbangan Pareto, ketika tidak mungkin memperbaiki posisi salah satu pemain tanpa memperburuk posisi pemain lain, sesuai dengan situasi kotak (2; 2).

Mempertimbangkan Contoh 1:

Keseimbangan dalam strategi dominan TIDAK.

keseimbangan Nash. (5.5) dan (4.4). Karena tidak menguntungkan bagi salah satu pemain untuk menyimpang dari strategi yang dipilih secara individual.

Pareto optimal. (5.5). Karena pembayaran para pemain ketika memilih strategi ini lebih banyak kemenangan ketika memilih strategi lain.

keseimbangan Stackelberg:

Pemain A membuat langkah pertama.

Memilih strategi pertamanya. B memilih strategi pertama. A mendapat 5.

Memilih strategi keduanya. B memilih yang kedua. A mendapat 4.

5 > 4 =>

B membuat langkah pertama.

Memilih strategi pertamanya. A memilih strategi pertama. B mendapat 5.

Memilih strategi keduanya. Dan dia memilih yang kedua. B mendapat 4.

5 > 4 => Kesetimbangan Stackelberg (5, 5)

Contoh 2pemodelan duopoli.

Pertimbangkan inti dari model ini:

Biarlah ada industri dengan dua perusahaan, salah satunya adalah "perusahaan pemimpin" dan yang lainnya adalah "perusahaan pengikut". Biarkan harga produk fungsi linear pasokan total Q:

P(Q) = AbQ.

Mari kita asumsikan juga bahwa biaya perusahaan per unit output adalah konstan dan sama dengan Dengan 1 dan Dengan 2 masing-masing. Kemudian laba perusahaan pertama akan ditentukan oleh rumus

Π 1 = P(Q 1 + Q 2) * Q 1 − C 1 Q 1 ,

dan keuntungan yang kedua, masing-masing

Π 2 = P(Q 1 + Q 2) * Q 2 − C 2 Q 2 .

Sesuai dengan model Stackelberg, perusahaan pertama - perusahaan terkemuka - pada langkah pertama menetapkan outputnya Q 1 . Setelah itu, perusahaan kedua - perusahaan pengikut - dengan menganalisis tindakan perusahaan pemimpin menentukan outputnya Q 2. Tujuan kedua perusahaan adalah untuk memaksimalkan fungsi pembayaran mereka.

Ekuilibrium Nash dalam permainan ini ditentukan dengan induksi mundur. Pertimbangkan tahap terakhir dari permainan - langkah dari perusahaan kedua. Pada tahap ini, Perusahaan 2 mengetahui output optimal dari Perusahaan 1 Q 1 * . Kemudian masalah penentuan output yang optimal Q 2 * dikurangi untuk memecahkan masalah menemukan titik maksimum dari fungsi hasil dari perusahaan kedua. Memaksimalkan fungsi Π 2 terhadap variabel Q 2 menghitung Q 1 diberikan, kami menemukan bahwa output optimal dari perusahaan kedua

Ini adalah tanggapan terbaik dari perusahaan pengikut terhadap pilihan perusahaan pemimpin rilis Q 1 * . Perusahaan terkemuka dapat memaksimalkan fungsi pembayarannya mengingat bentuk fungsinya Q 2*. Titik maksimum fungsi Π 1 dalam variabel Q 1 saat mengganti Q 2 * akan

Mengganti ini ke dalam ekspresi untuk Q 2 * , kita dapatkan

Jadi, dalam ekuilibrium, perusahaan pemimpin menghasilkan output dua kali lebih banyak daripada perusahaan pengikut.

Menggabungkan garis penawaran dan permintaan dalam satu bagan, kita dapatkan gambar grafis kesetimbangan dalam koordinat P, Q(Gbr. 2.6). Titik potong garis memiliki koordinat (P* , Q*), Di mana R* - harga keseimbangan, Q*- keseimbangan volume produksi dan konsumsi.

Keseimbangan pasar- ini adalah keadaan pasar di mana, untuk tingkat harga tertentu, kuantitas yang diminta sama dengan kuantitas yang ditawarkan.

Hanya pada titik keseimbangan e pasar seimbang, tidak ada agen pasar yang memiliki insentif untuk mengubah situasi. Ini berarti bahwa keseimbangan pasar memiliki properti keberlanjutan - dalam keadaan non-ekuilibrium, pelaku pasar termotivasi untuk mengembalikan pasar ke ekuilibrium. Untuk membuktikan stabilitas biasanya digunakan logika L. Walras atau A. Marshall.

Menurut L. Walras, dengan harga yang terlalu tinggi, terjadi kelebihan pasokan - kelebihan produksi (segmen A-B dalam gambar. 2.6i), pasar seperti itu disebut pasar pembeli karena pembeli memiliki kesempatan untuk meminta pengurangan harga saat menyelesaikan transaksi. Dalam situasi seperti itu, pertama-tama penjual tidak tertarik, yang terpaksa menurunkan harga dan menurunkan volume produksi. Ketika harga turun, kuantitas yang diminta meningkat A-B menyusut sampai menjadi titik kesetimbangan e.

Pada Murah ada kelebihan permintaan - kekurangan (segmen CFna Gambar 2.6a), berkembang pasar penjual. Pembeli dipaksa


Jika konsumen memotong konsumsi dan membayar lebih untuk barang langka, saat harga naik, jumlah yang ditawarkan naik, dan kelangkaan menyusut hingga keseimbangan pasar.

Menurut A. Marshall (Gbr. 2.66), untuk volume produksi kecil, harga permintaan melebihi harga penjual, untuk volume besar - sebaliknya. Bagaimanapun, situasi ketidakseimbangan merangsang pergeseran harga atau volume penawaran dan permintaan menuju keseimbangan. Keseimbangan (A) menurut Walras - harga mengatur ketidakseimbangan penawaran dan permintaan, (B) menurut Marshall - harga pembeli dan penjual seimbang dengan perubahan volume.

Beras. 2.6. Pembentukan keseimbangan pasar: c) menurut L. Walras; b) menurut A. Marshall

Perubahan permintaan atau penawaran pasar menyebabkan perubahan ekuilibrium (Gambar 2.7). Jika, misalnya, permintaan pasar meningkat, maka garis permintaan bergeser ke kanan, maka harga dan volume ekuilibrium meningkat. Jika penawaran pasar berkurang, garis penawaran bergeser ke kiri, mengakibatkan kenaikan harga dan penurunan volume.

Model ini Pasar bersifat statis, karena waktu tidak muncul di dalamnya.

Model "laba-laba".

Sebagai contoh model keseimbangan pasar yang dinamis, kami menyajikan model "jaring laba-laba" yang paling sederhana. Misalkan kuantitas yang diminta tergantung pada tingkat harga periode saat ini T, dan volume penawaran - dari harga periode sebelumnya t-1:

Q d i = Q d i (P t) , Q s i = Q s i (P t -1) ,

di mana t = 0,1….T adalah nilai diskrit periode waktu.




Beras. 2.7. Perubahan keseimbangan pasar:

a) karena peningkatan permintaan; B) karena penurunan

penawaran

Harga pasar P t mungkin tidak sesuai dengan harga keseimbangan R*, dan ada tiga kemungkinan dinamika P t(Gbr. 2.8).

Varian lintasan pembangunan dalam model ini bergantung pada rasio kemiringan garis penawaran dan permintaan.

Beras. 2.8. Model keseimbangan pasar "laba-laba":

a) penyimpangan dari kesetimbangan berkurang; 5) penyimpangan

meningkat dari ekuilibrium (model “malapetaka”); c) pasar

berosilasi secara siklis di sekitar titik kesetimbangan, tetapi kesetimbangan



Atas