ലീനിയർ പ്രോഗ്രാമിംഗിലെ ഇരട്ടത്താപ്പ്. സന്തുലിതാവസ്ഥയുടെ തരങ്ങൾ: നാഷ് സന്തുലിതാവസ്ഥ, സ്റ്റീക്കൽബെർഗ്, പാരെറ്റോ-ഒപ്റ്റിമൽ സന്തുലിതാവസ്ഥ, ആധിപത്യ തന്ത്രങ്ങളുടെ സന്തുലിതാവസ്ഥ സന്തുലിതാവസ്ഥയ്ക്ക് പരിഹാരം കണ്ടെത്തുന്നതിനുള്ള ഒപ്റ്റിമൽ മെക്കാനിസം എന്താണ്
ദ്വൈത സിദ്ധാന്തത്തിന്റെ അടിസ്ഥാന നിർവചനങ്ങൾ.ഓരോ ലീനിയർ പ്രോഗ്രാമിംഗ് പ്രശ്നവും മറ്റൊരു ലീനിയർ പ്രോഗ്രാമിംഗ് പ്രശ്നവുമായി ബന്ധപ്പെടുത്താം. അവയിലൊന്ന് പരിഹരിക്കപ്പെടുമ്പോൾ, മറ്റൊന്ന് യാന്ത്രികമായി പരിഹരിക്കപ്പെടും. അത്തരം ജോലികളെ പരസ്പരം ഡ്യുവൽ എന്ന് വിളിക്കുന്നു. തന്നിരിക്കുന്ന ഒരു പ്രശ്നം (ഞങ്ങൾ അതിനെ ഒറിജിനൽ എന്ന് വിളിക്കും) നൽകിയാൽ, അതിന്റെ ദ്വിമുഖം എങ്ങനെ നിർമ്മിക്കാമെന്ന് നമുക്ക് കാണിക്കാം.
ആസൂത്രിത ഔട്ട്പുട്ടിന്റെ പ്രശ്നം പരിഗണിക്കുക.
F=3 എക്സ് 1 + 5എക്സ് 2 + 4എക്സ് 3 + 5എക്സ് 4 → പരമാവധി.
5x 1 +0.4x 2 +2x 3 +0.5x 4 ≤400
5x2 +x3 +x4 ≤300
x 1 + x 3 + x 4 ≤100
x 1 ≥0, x 2 ≥0, x 3 ≥0, x 4 ≥0
ഇരട്ട പ്രശ്നം കംപൈൽ ചെയ്യുന്നതിനുള്ള പൊതു നിയമങ്ങൾ:
ഋജുവായത് | ഇരട്ട |
ടാർഗെറ്റ് ഫംഗ്ഷൻ (പരമാവധി) | നിയന്ത്രണങ്ങളുടെ വലതുവശം |
നിയന്ത്രണങ്ങളുടെ വലതുവശം | ടാർഗെറ്റ് പ്രവർത്തനം (മിനിറ്റ്) |
എ - കൺസ്ട്രൈന്റ് മാട്രിക്സ് | ഒരു ടി - കൺസ്ട്രെയിന്റ് മാട്രിക്സ് |
i -th നിയന്ത്രണം: ≤ 0, (≥ 0) | വേരിയബിൾ y i ≥ 0, (≤ 0) |
i -th നിയന്ത്രണം: = 0 | വേരിയബിൾ y i ≠ 0 |
വേരിയബിൾ x j ≥ 0 (≤ 0) | |
വേരിയബിൾ x j ≠ 0 | j-th പരിമിതി: = 0 |
ഋജുവായത് | ഇരട്ട |
ടാർഗെറ്റ് പ്രവർത്തനം (മിനിറ്റ്) | നിയന്ത്രണങ്ങളുടെ വലതുവശം |
നിയന്ത്രണങ്ങളുടെ വലതുവശം | ടാർഗെറ്റ് ഫംഗ്ഷൻ (പരമാവധി) |
എ - കൺസ്ട്രൈന്റ് മാട്രിക്സ് | ഒരു ടി - കൺസ്ട്രെയിന്റ് മാട്രിക്സ് |
i -th നിയന്ത്രണം: ≥ 0, (≤ 0) | വേരിയബിൾ y i ≥ 0, (≤ 0) |
i -th നിയന്ത്രണം: = 0 | വേരിയബിൾ y i ≠ 0 |
വേരിയബിൾ x j ≥ 0 (≤ 0) | j -th നിയന്ത്രണം: ≤ 0 (≥ 0) |
വേരിയബിൾ x j ≠ 0 | j-th പരിമിതി: = 0 |
ഇനിപ്പറയുന്ന നിയമങ്ങൾ അനുസരിച്ച് നമുക്ക് അതിന്റെ ഇരട്ട പ്രശ്നം നിർമ്മിക്കാം.
- ഇരട്ട പ്രശ്നത്തിലെ വേരിയബിളുകളുടെ എണ്ണം യഥാർത്ഥ ഒന്നിലെ അസമത്വങ്ങളുടെ എണ്ണത്തിന് തുല്യമാണ്.
- ഇരട്ട പ്രശ്നത്തിന്റെ ഗുണകങ്ങളുടെ മാട്രിക്സ് യഥാർത്ഥ ഒന്നിന്റെ ഗുണകങ്ങളുടെ മാട്രിക്സിലേക്ക് മാറ്റുന്നു.
- ഒറിജിനൽ പ്രശ്നത്തിന്റെ സ്വതന്ത്ര നിബന്ധനകളുടെ നിര ഇരട്ട ഒബ്ജക്റ്റീവ് ഫംഗ്ഷനുള്ള ഗുണകങ്ങളുടെ ഒരു നിരയാണ്. വസ്തുനിഷ്ഠമായ പ്രവർത്തനം ഒരു പ്രശ്നത്തിൽ പരമാവധിയാക്കുകയും മറ്റൊന്നിൽ ചെറുതാക്കുകയും ചെയ്യുന്നു.
- യഥാർത്ഥ പ്രശ്നത്തിന്റെ വേരിയബിളുകളുടെ നോൺ-നെഗറ്റിവിറ്റിക്കുള്ള വ്യവസ്ഥകൾ മറ്റൊരു ദിശയിലേക്ക് നയിക്കുന്ന ഇരട്ട പ്രശ്നത്തിന്റെ അസമത്വങ്ങൾ-നിയന്ത്രണങ്ങളുമായി പൊരുത്തപ്പെടുന്നു. തിരിച്ചും, അസമത്വത്തിലെ അസമത്വങ്ങൾ-നിയന്ത്രണങ്ങൾ ദ്വൈതത്തിലെ നിഷേധാത്മകതയില്ലാത്ത അവസ്ഥകളുമായി പൊരുത്തപ്പെടുന്നു.
ടാസ്ക് I-ന്റെ മാട്രിക്സിന്റെ വരികൾ ടാസ്ക് II-ന്റെ മാട്രിക്സിന്റെ നിരകളാണെന്ന കാര്യം ശ്രദ്ധിക്കുക. അതിനാൽ, പ്രശ്നം II ലെ y i വേരിയബിളുകൾക്കുള്ള ഗുണകങ്ങൾ യഥാക്രമം, പ്രശ്നം I ലെ i -th അസമത്വത്തിന്റെ ഗുണകങ്ങളാണ്.
തത്ഫലമായുണ്ടാകുന്ന മാതൃക, നേരിട്ടുള്ള പ്രശ്നത്തിന് ഇരട്ട പ്രശ്നത്തിന്റെ സാമ്പത്തികവും ഗണിതപരവുമായ മാതൃകയാണ്.
അമ്പുകളാൽ ബന്ധിപ്പിച്ച അസമത്വങ്ങൾ ആയിരിക്കും കോൾ സംയോജിപ്പിക്കുക.
ഇരട്ട പ്രശ്നത്തിന്റെ അർത്ഥവത്തായ രൂപീകരണം: ഓരോ തരത്തിലുമുള്ള ഉൽപ്പാദനത്തിലെ വിഭവങ്ങളുടെ ചെലവ് നൽകിയാൽ, വിഭവങ്ങളുടെ മൊത്തത്തിലുള്ള ചിലവ് വളരെ കുറവായിരിക്കും Y = (y 1 , y 2 ..., y m) വിഭവങ്ങളുടെ അത്തരം ഒരു കൂട്ടം വിലകൾ (എസ്റ്റിമേറ്റ്സ്) കണ്ടെത്തുക. ഉൽപ്പന്നം ലാഭത്തേക്കാൾ കുറവായിരിക്കില്ല ( ഈ ഉൽപ്പന്നങ്ങളുടെ വിൽപ്പനയിൽ നിന്നുള്ള വരുമാനം.
ലഭിച്ച സാമ്പത്തിക സാഹിത്യത്തിലെ ഉറവിട വിലകൾ y 1, y 2 ..., y m വിവിധ തലക്കെട്ടുകൾ: അക്കൌണ്ടിംഗ്, അവ്യക്തമായ, നിഴൽ. ഈ പേരുകളുടെ അർത്ഥം ഇവ സോപാധികമായ, "വ്യാജ" വിലകളാണ് എന്നതാണ്. 1 മുതലുള്ള "ബാഹ്യ" വിലകളിൽ നിന്ന് വ്യത്യസ്തമായി, 2 മുതൽ ..., ഉൽപ്പന്നങ്ങൾക്ക് n മുതൽ, അറിയപ്പെടുന്നത്, ഒരു ചട്ടം പോലെ, ഉൽപാദനം ആരംഭിക്കുന്നതിന് മുമ്പ്, വിഭവങ്ങളുടെ വിലകൾ y 1 , y 2 ..., y m ആന്തരികമാണ് , കാരണം അവ പുറത്ത് നിന്ന് സജ്ജീകരിച്ചിട്ടില്ല, പക്ഷേ പ്രശ്നം പരിഹരിക്കുന്നതിന്റെ ഫലമായി നേരിട്ട് നിർണ്ണയിക്കപ്പെടുന്നു, അതിനാൽ അവ പലപ്പോഴും റിസോഴ്സ് എസ്റ്റിമേറ്റ് എന്ന് വിളിക്കപ്പെടുന്നു.
നേരിട്ടുള്ളതും ഇരട്ട പ്രശ്നങ്ങളും തമ്മിലുള്ള ബന്ധം, പ്രത്യേകിച്ച്, അവയിലൊന്നിന്റെ പരിഹാരം മറ്റൊന്നിന്റെ പരിഹാരത്തിൽ നിന്ന് നേരിട്ട് ലഭിക്കും എന്ന വസ്തുതയിൽ അടങ്ങിയിരിക്കുന്നു.
ദ്വിത്വ സിദ്ധാന്തങ്ങൾ
ലീനിയർ പ്രോഗ്രാമിംഗ് സിദ്ധാന്തത്തിലെ ഒരു അടിസ്ഥാന ആശയമാണ് ദ്വൈതത. ദ്വിത്വ സിദ്ധാന്തത്തിന്റെ പ്രധാന ഫലങ്ങൾ ദ്വന്ദ സിദ്ധാന്തങ്ങൾ എന്ന് വിളിക്കപ്പെടുന്ന രണ്ട് സിദ്ധാന്തങ്ങളിൽ അടങ്ങിയിരിക്കുന്നു.ആദ്യത്തെ ദ്വിത്വ സിദ്ധാന്തം.
I, II എന്നീ ഇരട്ട പ്രശ്നങ്ങളിൽ ഒന്ന് പരിഹരിക്കാവുന്നതാണെങ്കിൽ, മറ്റൊന്ന് പരിഹരിക്കാവുന്നതാണെങ്കിൽ, ഒപ്റ്റിമൽ പ്ലാനുകളിലെ വസ്തുനിഷ്ഠമായ പ്രവർത്തനങ്ങളുടെ മൂല്യങ്ങൾ ഒന്നുതന്നെയാണ്, എഫ്(x*) = ജി(വൈ*), ഇവിടെ x *, y * - I, II പ്രശ്നങ്ങൾക്കുള്ള ഒപ്റ്റിമൽ പരിഹാരങ്ങൾ
രണ്ടാമത്തെ ദ്വിത്വ സിദ്ധാന്തം.
യഥാക്രമം I, II എന്നീ പ്രശ്നങ്ങളുടെ നിയന്ത്രണ സംവിധാനത്തിലേക്ക് അവയെ മാറ്റിസ്ഥാപിക്കുമ്പോൾ, ഏതെങ്കിലും ജോഡി സംയോജിത അസമത്വങ്ങളിൽ ഒരെണ്ണമെങ്കിലും തുല്യതയായി മാറിയാൽ മാത്രം, I, II എന്നീ പ്രശ്നങ്ങളിൽ x *, y * എന്നിവ സമുചിതമാണ്.
ഈ അടിസ്ഥാന ദ്വൈത സിദ്ധാന്തം. മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ, x *, y * എന്നിവ പ്രൈമൽ, ഡ്യുവൽ പ്രശ്നങ്ങൾക്കുള്ള പ്രായോഗിക പരിഹാരങ്ങളാണെങ്കിൽ, c T x*=b T y* ആണെങ്കിൽ, x *, y * എന്നിവ ഒരു ജോടി ഇരട്ട പ്രശ്നങ്ങൾക്കുള്ള ഏറ്റവും മികച്ച പരിഹാരങ്ങളാണ്.
മൂന്നാമത്തെ ദ്വൈത സിദ്ധാന്തം. ഇരട്ട പ്രശ്നത്തിന്റെ ഒപ്റ്റിമൽ പരിഹാരത്തിലെ y i വേരിയബിളുകളുടെ മൂല്യങ്ങൾ, നിയന്ത്രണങ്ങളുടെ വ്യവസ്ഥയുടെ സ്വതന്ത്ര അംഗങ്ങളുടെ സ്വാധീനത്തിന്റെ ഏകദേശമാണ് b i - ഈ പ്രശ്നത്തിന്റെ വസ്തുനിഷ്ഠമായ പ്രവർത്തനത്തിന്റെ മൂല്യത്തിൽ നേരിട്ടുള്ള പ്രശ്നത്തിന്റെ അസമത്വങ്ങൾ:
Δf(x) = b i y i
സിംപ്ലക്സ് രീതി ഉപയോഗിച്ച് LLP പരിഹരിക്കുന്നു, ഞങ്ങൾ ഒരേസമയം ഡ്യുവൽ LLP പരിഹരിക്കുന്നു. ഒപ്റ്റിമൽ പ്ലാനിലെ ഡ്യുവൽ പ്രോബ്ലം y i യുടെ വേരിയബിളുകളുടെ മൂല്യങ്ങളെ വസ്തുനിഷ്ഠമായി നിർണ്ണയിച്ചിരിക്കുന്ന അല്ലെങ്കിൽ ഡ്യുവൽ എസ്റ്റിമേറ്റ് എന്ന് വിളിക്കുന്നു. പ്രായോഗിക പ്രശ്നങ്ങളിൽ, ഡ്യുവൽ എസ്റ്റിമേറ്റുകൾ y i പലപ്പോഴും മറഞ്ഞിരിക്കുന്ന, നിഴൽ വിലകൾ അല്ലെങ്കിൽ മാർജിനൽ റിസോഴ്സ് എസ്റ്റിമേറ്റുകൾ എന്ന് വിളിക്കുന്നു.
പരസ്പരമുള്ള ഇരട്ട പ്രശ്നങ്ങളുടെ സ്വത്ത്
- ഒരു പ്രശ്നത്തിൽ, ഒരു ലീനിയർ ഫംഗ്ഷന്റെ പരമാവധി ആവശ്യപ്പെടുന്നു, മറ്റൊന്നിൽ, ഏറ്റവും കുറഞ്ഞത്.
- ഒരു പ്രശ്നത്തിന്റെ ലീനിയർ ഫംഗ്ഷനിലെ വേരിയബിളുകൾക്കുള്ള ഗുണകങ്ങൾ മറ്റൊന്നിലെ നിയന്ത്രണ സംവിധാനത്തിലെ സ്വതന്ത്ര അംഗങ്ങളാണ്.
- ഓരോ പ്രശ്നങ്ങളും സ്റ്റാൻഡേർഡ് ഫോമിലും, മാക്സിമൈസേഷൻ പ്രശ്നത്തിൽ ഫോമിന്റെ എല്ലാ അസമത്വങ്ങളും ≤, മിനിമൈസേഷൻ പ്രശ്നത്തിൽ ഫോമിന്റെ എല്ലാ അസമത്വങ്ങളും നൽകിയിരിക്കുന്നു.
- രണ്ട് പ്രശ്നങ്ങളുടെയും കൺസ്ട്രൈന്റ് സിസ്റ്റങ്ങളിലെ വേരിയബിളുകൾക്കായുള്ള കോഫിഫിഷ്യന്റ് മെട്രിക്സ് പരസ്പരം ട്രാൻസ്പോസ് ചെയ്യുന്നു:
- ഒരു പ്രശ്നത്തിന്റെ നിയന്ത്രണ സംവിധാനത്തിലെ അസമത്വങ്ങളുടെ എണ്ണം മറ്റേ പ്രശ്നത്തിലെ വേരിയബിളുകളുടെ എണ്ണത്തിന് തുല്യമാണ്.
- രണ്ട് പ്രശ്നങ്ങളിലും വേരിയബിളുകളുടെ നെഗറ്റീവ് അല്ലാത്ത വ്യവസ്ഥകൾ ഉണ്ട്.
സന്തുലിത സിദ്ധാന്തം
ടാസ്ക് 2പ്രശ്നത്തിന് ഇരട്ട പ്രശ്നം രചിക്കുക 1. അത് കണ്ടെത്തുക സമതുലിത സിദ്ധാന്തം വഴിയുള്ള പരിഹാരം.
3x1 +x2 ≥12
x1 +2x2 ≥14
4x1 +11x2 ≥68
സന്തുലിത സിദ്ധാന്തം
. X*=(x 1 *,...,x n *), Y*=(y 1 *,...,y n *) എന്നിവ സമമിതി രൂപത്തിലുള്ള ഒരു ജോടി ഇരട്ട പ്രശ്നങ്ങളുടെ സ്വീകാര്യമായ ഡിസൈനുകളായിരിക്കട്ടെ. ഇനിപ്പറയുന്ന പൂരക മന്ദത വ്യവസ്ഥകൾ പാലിക്കുകയാണെങ്കിൽ മാത്രമേ ഈ പ്ലാനുകൾ അനുയോജ്യമാകൂ:
ഒരു ജോടി ഇരട്ട പ്രശ്നങ്ങളിൽ ഒന്നിന് മറ്റൊന്ന് പരിഹരിച്ച് ഏറ്റവും അനുയോജ്യമായ പരിഹാരം നിർണ്ണയിക്കാൻ സിദ്ധാന്തം 4 നമ്മെ അനുവദിക്കുന്നു. ഒപ്റ്റിമൽ സൊല്യൂഷൻ മാറ്റിസ്ഥാപിക്കുമ്പോൾ ഒരു പ്രശ്നത്തിന്റെ നിയന്ത്രണം കർശനമായ അസമത്വമായി മാറുകയാണെങ്കിൽ, ഇരട്ട പ്രശ്നത്തിന്റെ ഒപ്റ്റിമൽ സൊല്യൂഷനിലെ അനുബന്ധ ഡ്യുവൽ വേരിയബിൾ 0 ന് തുല്യമാണ്. ഒരു പ്രശ്നത്തിന്റെ ഒപ്റ്റിമൽ പ്ലാനിൽ ഏതെങ്കിലും വേരിയബിൾ പോസിറ്റീവ് ആണെങ്കിൽ, ഇരട്ട പ്രശ്നത്തിന്റെ അനുബന്ധ നിയന്ത്രണം ഒരു സമവാക്യമാണ്.
പരസ്പര പൂരകമായ മന്ദതയുടെ അവസ്ഥകളെക്കുറിച്ച് നമുക്ക് ഒരു സാമ്പത്തിക വ്യാഖ്യാനം നൽകാം. ഒപ്റ്റിമൽ സൊല്യൂഷനിൽ ചില അസംസ്കൃത വസ്തുക്കൾക്ക് 0 അല്ലാതെ ഒരു എസ്റ്റിമേറ്റ് ഉണ്ടെങ്കിൽ, അത് പൂർണ്ണമായും ഉപയോഗിക്കപ്പെടും (വിഭവം വിരളമാണ്). അസംസ്കൃത വസ്തുക്കൾ പൂർണ്ണമായി ഉപയോഗിക്കുന്നില്ലെങ്കിൽ (അധികമാണെങ്കിൽ), അതിന്റെ മൂല്യനിർണ്ണയം 0 ന് തുല്യമാണ്. അങ്ങനെ, ഇരട്ട വിലയിരുത്തലുകൾ അസംസ്കൃത വസ്തുക്കളുടെ ദൗർലഭ്യത്തിന്റെ അളവുകോലാണെന്ന് ഞങ്ങൾ മനസ്സിലാക്കുന്നു. അനുബന്ധ അസംസ്കൃത വസ്തുക്കളുടെ സ്റ്റോക്ക് 1 യൂണിറ്റ് വർദ്ധിക്കുന്നതോടെ ഒബ്ജക്റ്റീവ് ഫംഗ്ഷന്റെ മൂല്യം എത്രത്തോളം വർദ്ധിക്കുമെന്ന് എസ്റ്റിമേറ്റ് കാണിക്കുന്നു. ഉൽപ്പാദന പദ്ധതിയിൽ ഒരു പ്രത്യേക തരം ഉൽപ്പന്നം ഉൾപ്പെടുത്തിയിട്ടുണ്ടെങ്കിൽ, അതിന്റെ ഉൽപാദനച്ചെലവ് ഉൽപ്പാദിപ്പിക്കുന്ന ഉൽപ്പന്നത്തിന്റെ വിലയുമായി പൊരുത്തപ്പെടുന്നു. ഒരു ഉൽപ്പന്നം ഉൽപ്പാദിപ്പിക്കുന്നതിനുള്ള ചെലവ് ഉൽപ്പന്നത്തിന്റെ വിലയേക്കാൾ കൂടുതലാണെങ്കിൽ, ഉൽപ്പന്നം ഉൽപ്പാദിപ്പിക്കപ്പെടുന്നില്ല.
ഒരു ജോടി ഇരട്ട പ്രശ്നങ്ങളിൽ ഒന്നിൽ രണ്ട് വേരിയബിളുകൾ അടങ്ങിയിട്ടുണ്ടെങ്കിൽ, അത് ഗ്രാഫിക്കലായി പരിഹരിക്കാവുന്നതാണ്, തുടർന്ന്, സിദ്ധാന്തങ്ങൾ 3 ഉം 4 ഉം ഉപയോഗിച്ച് ഇരട്ട പ്രശ്നത്തിന് പരിഹാരം കണ്ടെത്താനാകും. ഈ സാഹചര്യത്തിൽ, 3 കേസുകൾ ഉണ്ടാകാം: രണ്ട് പ്രശ്നങ്ങൾക്കും പ്രായോഗികമായ പരിഹാരങ്ങളുണ്ട്, മാത്രം ഒരാൾക്ക് സാധ്യമായ പരിഹാര പ്രശ്നമുണ്ട്, രണ്ട് പ്രശ്നങ്ങൾക്കും പ്രായോഗികമായ പരിഹാരങ്ങളില്ല.
ഉദാഹരണം 2
ഒരു ഇരട്ട പ്രശ്നം രചിക്കുകയും സന്തുലിത സിദ്ധാന്തം ഉപയോഗിച്ച് അതിന്റെ പരിഹാരം കണ്ടെത്തുകയും ചെയ്യുക
x 2 -2x 3 +2x 4 -2x 5 ≤4
-2x 1 -2x 2 +2x 3 +2x 4 +x 5 ≥2
x i ≥0, i=1.5
Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → max, യഥാർത്ഥ പ്രശ്നത്തിനുള്ള പരിഹാരം അറിയാമെങ്കിൽ: Zmax=(3;4;0;0;0).
നമുക്ക് ഒരു ഇരട്ട പ്രശ്നം നിർമ്മിക്കാം. യഥാർത്ഥ പ്രശ്നത്തിന്റെ ലക്ഷ്യവുമായി അസമത്വങ്ങളുടെ അടയാളങ്ങൾ ഞങ്ങൾ അംഗീകരിക്കുന്നു.
Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → പരമാവധി
ഇരട്ട ചുമതല:
W=4y 1 -2y 2 → മിനിറ്റ്
സന്തുലിത സിദ്ധാന്തം ഉപയോഗിച്ച് ഇരട്ട പ്രശ്നത്തിനുള്ള ഏറ്റവും മികച്ച പരിഹാരം നമുക്ക് കണ്ടെത്താം. പരസ്പര പൂരകമായ മന്ദതയുടെ വ്യവസ്ഥകൾ നമുക്ക് എഴുതാം.
y 1 (4-(x 2 -2x 3 +2x 4 -2x 5))=0
y 2 (-2-(2x 1 -2x 2 -2x 3 -2x 4 -x 5))=0
x 1 (-2y 2 -10)=0
x 2 (y 1 -2y 2 +9)=0
x 3 (-2y 1 -2y 2 +19)=0
x 4 (2y 1 -2y 2 +13)=0
x 5 (-2y 1 -y 2 +11)=0
കംപൈൽ ചെയ്ത സിസ്റ്റത്തിലേക്ക് യഥാർത്ഥ പ്രശ്നത്തിന്റെ ഒപ്റ്റിമൽ സൊല്യൂഷൻ മാറ്റിസ്ഥാപിക്കാം: x 1 =3, x 2 =4, x 3 =0, x 4 =0, x 5 =0.
y 1 (4-(4-2 0+2 0-2 0))=0
y 2 (-2-(2 3-2 4-2 0-2 0-0))=0 W(y 1, y 2, y 3)=12y 1 +31y 2 +18y 3 → പരമാവധി . സിദ്ധാന്തം 3 Zmax=Wmin=100000 പ്രകാരം.
അവസാനമായി, Wmin=W(0; 4000/7; 32000/21) = 100000
ഒരു വിരുദ്ധ ഗെയിമിൽ, ഏതൊരു കളിക്കാരനും അതിൽ നിന്ന് വ്യതിചലിക്കുന്നത് ലാഭകരമല്ലാത്ത ഒന്നായി ഒപ്റ്റിമൽ ഫലം പരിഗണിക്കുന്നത് സ്വാഭാവികമാണ്. അത്തരമൊരു ഫലത്തെ (x*,y*) ഒരു സന്തുലിതാവസ്ഥ എന്ന് വിളിക്കുന്നു, ഒരു സന്തുലിതാവസ്ഥ കണ്ടെത്തുന്നതിനെ അടിസ്ഥാനമാക്കിയുള്ള ഒപ്റ്റിമലിറ്റി തത്വത്തെ സന്തുലിത തത്വം എന്ന് വിളിക്കുന്നു.
നിർവ്വചനം. അളവുകളുടെ മാട്രിക്സ് ഉള്ള ഒരു മാട്രിക്സ് ഗെയിമിൽ, ഫലം സന്തുലിതാവസ്ഥഅല്ലെങ്കിൽ ഒരു സാഡിൽ പോയിന്റ് എങ്കിൽ
ഒരു സാഡിൽ പോയിന്റിൽ, ഒരു മാട്രിക്സ് ഘടകം അതിന്റെ വരിയിലെ ഏറ്റവും കുറഞ്ഞതും നിരയിലെ പരമാവധിയുമാണ്. ഉദാഹരണത്തിൽ നിന്നുള്ള ഗെയിമിൽ, ഘടകം 2 ഒരു 33ഒരു സാഡിൽ പോയിന്റാണ്. രണ്ട് കളിക്കാർക്കുമുള്ള മൂന്നാമത്തെ തന്ത്രങ്ങളാണ് ഈ ഗെയിമിലെ ഒപ്റ്റിമൽ. ആദ്യത്തെ കളിക്കാരൻ മൂന്നാമത്തെ തന്ത്രത്തിൽ നിന്ന് വ്യതിചലിച്ചാൽ, അവൻ അതിൽ കുറവ് ജയിക്കാൻ തുടങ്ങുന്നു ഒരു 33. രണ്ടാമത്തെ കളിക്കാരൻ മൂന്നാമത്തെ തന്ത്രത്തിൽ നിന്ന് വ്യതിചലിച്ചാൽ, അയാൾക്ക് കൂടുതൽ നഷ്ടപ്പെടാൻ തുടങ്ങും ഒരു 33. അതിനാൽ, രണ്ട് കളിക്കാർക്കും, മൂന്നാം തന്ത്രത്തിൽ സ്ഥിരമായി പറ്റിനിൽക്കുന്നതിനേക്കാൾ മികച്ചതായി ഒന്നുമില്ല.
ഒപ്റ്റിമൽ പെരുമാറ്റത്തിന്റെ തത്വം: ഒരു മാട്രിക്സ് ഗെയിമിൽ ഒരു സാഡിൽ പോയിന്റ് ഉണ്ടെങ്കിൽ, സാഡിൽ പോയിന്റുമായി ബന്ധപ്പെട്ട തിരഞ്ഞെടുപ്പാണ് ഒപ്റ്റിമൽ സ്ട്രാറ്റജി. ഗെയിമിൽ ഒന്നിൽ കൂടുതൽ സാഡിൽ പോയിന്റുകൾ ഉണ്ടെങ്കിൽ എന്ത് സംഭവിക്കും?
സിദ്ധാന്തം. അനുവദിക്കുക ഒരു മാട്രിക്സ് ഗെയിമിൽ രണ്ട് അനിയന്ത്രിതമായ സാഡിൽ പോയിന്റുകൾ. അപ്പോൾ:
തെളിവ്. സന്തുലിതാവസ്ഥയുടെ നിർവചനത്തിൽ നിന്ന്, ഞങ്ങൾക്ക് ഉണ്ട്:
നമുക്ക് അസമത്വത്തിന്റെ ഇടതുവശത്തേക്കും (2.8) വലത്തിലേക്കും - , അസമത്വത്തിന്റെ ഇടതുവശത്തേക്കും (2.9) - , വലത്തേക്ക് - മാറ്റിസ്ഥാപിക്കാം. അപ്പോൾ നമുക്ക് ലഭിക്കുന്നു:
സമത്വം എവിടെ നിന്ന് വരുന്നു:
എല്ലാ സന്തുലിതാവസ്ഥകളിലും പേഓഫ് ഫംഗ്ഷൻ ഒരേ മൂല്യം എടുക്കുന്നുവെന്ന് സിദ്ധാന്തത്തിൽ നിന്ന് ഇത് പിന്തുടരുന്നു. അതുകൊണ്ടാണ് നമ്പർ വിളിക്കുന്നത് കളിയുടെ ചിലവിൽ. ഏതെങ്കിലും സാഡിൽ പോയിന്റുമായി ബന്ധപ്പെട്ട തന്ത്രങ്ങളെ വിളിക്കുന്നു ഒപ്റ്റിമൽ തന്ത്രങ്ങൾകളിക്കാർ യഥാക്രമം 1 ഉം 2 ഉം. (2.7) പ്രകാരം, കളിക്കാരന്റെ എല്ലാ ഒപ്റ്റിമൽ തന്ത്രങ്ങളും പരസ്പരം മാറ്റാവുന്നതാണ്.
ഗെയിമിലെ തന്ത്രങ്ങളുടെ കൂട്ടം അതേപടി നിലനിൽക്കുകയാണെങ്കിൽ, പേഓഫ് ഫംഗ്ഷൻ ഒരു പോസിറ്റീവ് സ്ഥിരാങ്കം കൊണ്ട് ഗുണിച്ചാൽ (അല്ലെങ്കിൽ അതിലേക്ക് ഒരു സ്ഥിരമായ സംഖ്യ ചേർത്താൽ) കളിക്കാരുടെ പെരുമാറ്റത്തിന്റെ ഒപ്റ്റിമാലിറ്റി മാറില്ല.
സിദ്ധാന്തം. മാട്രിക്സ് ഗെയിമിൽ ഒരു സാഡിൽ പോയിന്റ് (i*,j*) നിലനിൽക്കണമെങ്കിൽ, മാക്സിമിൻ മിനിമാക്സിന് തുല്യമായിരിക്കണം:
(2.10)
തെളിവ്. ആവശ്യം.(i*,j*) ഒരു സാഡിൽ പോയിന്റാണെങ്കിൽ, (2.6) പ്രകാരം:
(2.11)
എന്നിരുന്നാലും, ഞങ്ങൾക്ക് ഉണ്ട്:
(2.12)
(2.11), (2.12) എന്നിവയിൽ നിന്ന് നമുക്ക് ലഭിക്കുന്നത്:
(2.13)
സമാനമായി വാദിച്ചുകൊണ്ട്, ഞങ്ങൾ തുല്യതയിൽ എത്തിച്ചേരുന്നു:
അങ്ങനെ,
മറുവശത്ത്, വിപരീത അസമത്വം (2.5) എല്ലായ്പ്പോഴും സംതൃപ്തമാണ്, അതിനാൽ (2.10) ശരിയാണ്.
പര്യാപ്തത. (2.10) സത്യമാകട്ടെ. ഒരു സാഡിൽ പോയിന്റിന്റെ അസ്തിത്വം നമുക്ക് തെളിയിക്കാം. നമുക്ക് ഉണ്ട്:
സമത്വം (2.10) അനുസരിച്ച്, അസമത്വങ്ങൾ (2.15), (2.16) എന്നിവ തുല്യതകളായി മാറുന്നു. അതിനുശേഷം നമുക്ക്:
സിദ്ധാന്തം തെളിയിക്കപ്പെട്ടു. എന്നും തെളിയിക്കപ്പെട്ടിട്ടുണ്ട് പൊതുവായ അർത്ഥം maximin ഉം minimax ഉം ഗെയിമിന്റെ വിലയ്ക്ക് തുല്യമാണ്.
മിക്സഡ് ഗെയിം വിപുലീകരണം
ഒരു മാട്രിക്സ് ഗെയിം ജി പരിഗണിക്കുക. അതിൽ ഒരു സന്തുലിതാവസ്ഥ ഉണ്ടെങ്കിൽ, മിനിമാക്സ് മാക്സിമിന് തുല്യമാണ്. മാത്രമല്ല, ഓരോ കളിക്കാരനും തന്റെ ഒപ്റ്റിമൽ തന്ത്രത്തെക്കുറിച്ചുള്ള വിവരങ്ങൾ മറ്റ് കളിക്കാരനോട് പറയാൻ കഴിയും. അവന്റെ എതിരാളിക്ക് ഈ വിവരങ്ങളിൽ നിന്ന് അധിക പ്രയോജനം നേടാൻ കഴിയില്ല. ഇപ്പോൾ ഗെയിം ജിയിൽ സന്തുലിതാവസ്ഥ ഇല്ലെന്ന് കരുതുക. അപ്പോൾ:
ഈ സാഹചര്യത്തിൽ, മിനിമാക്സ്, മാക്സിമിൻ തന്ത്രങ്ങൾ സ്ഥിരതയുള്ളതല്ല. കൂടുതൽ പ്രതിഫലം നേടാനുള്ള സാധ്യതയുമായി ബന്ധപ്പെട്ട അവരുടെ വിവേകപൂർണ്ണമായ തന്ത്രങ്ങളിൽ നിന്ന് വ്യതിചലിക്കുന്നതിന് കളിക്കാർക്ക് പ്രോത്സാഹനങ്ങൾ ഉണ്ടായിരിക്കാം, മാത്രമല്ല നഷ്ടപ്പെടാനുള്ള സാധ്യതയും, അതായത്, വിവേകപൂർണ്ണമായ തന്ത്രം ഉപയോഗിക്കുന്നതിനേക്കാൾ കുറഞ്ഞ പ്രതിഫലം ലഭിക്കുന്നു. അപകടകരമായ തന്ത്രങ്ങൾ ഉപയോഗിക്കുമ്പോൾ, അവയെക്കുറിച്ചുള്ള വിവരങ്ങൾ എതിരാളിക്ക് കൈമാറുന്നത് ദോഷകരമായ പ്രത്യാഘാതങ്ങൾ ഉണ്ടാക്കുന്നു: ജാഗ്രതയോടെയുള്ള തന്ത്രം ഉപയോഗിക്കുന്നതിനേക്കാൾ ചെറിയ പ്രതിഫലം കളിക്കാരന് സ്വയമേവ ലഭിക്കും.
ഉദാഹരണം 3. ഗെയിം മാട്രിക്സ് ഇതുപോലെ കാണട്ടെ:
അത്തരമൊരു മാട്രിക്സിന്, അതായത്. സന്തുലിതാവസ്ഥ നിലവിലില്ല. കളിക്കാരുടെ ജാഗ്രതാ തന്ത്രങ്ങൾ i*=1, j*=2 എന്നിവയാണ്. പ്ലെയർ 2 തന്ത്രം j*=2 പിന്തുടരട്ടെ, ഒപ്പം പ്ലെയർ 1 സ്ട്രാറ്റജി i=2 തിരഞ്ഞെടുക്കട്ടെ. അപ്പോൾ രണ്ടാമത്തേതിന് 3-ന്റെ പ്രതിഫലം ലഭിക്കും, ഇത് മാക്സിമിനേക്കാൾ രണ്ട് യൂണിറ്റ് കൂടുതലാണ്. എന്നിരുന്നാലും, പ്ലെയർ 1-ന്റെ പ്ലാനുകളെ കുറിച്ച് പ്ലെയർ 2 ഊഹിച്ചാൽ, അവൻ തന്റെ തന്ത്രം j=1 ആയി മാറ്റും, തുടർന്ന് ആദ്യത്തെയാൾക്ക് 0-ന്റെ പ്രതിഫലം ലഭിക്കും, അതായത്, അവന്റെ മാക്സിമിനേക്കാൾ കുറവ്. രണ്ടാമത്തെ കളിക്കാരന് സമാനമായ ന്യായവാദം നടത്താം. പൊതുവേ, ഗെയിമിന്റെ ഒരു പ്രത്യേക ഗെയിമിൽ ഒരു സാഹസിക തന്ത്രം ഉപയോഗിക്കുന്നത് ഗ്യാരണ്ടിയേക്കാൾ വലിയ ഫലം കൊണ്ടുവരുമെന്ന് നമുക്ക് നിഗമനം ചെയ്യാം, എന്നാൽ അതിന്റെ ഉപയോഗം അപകടസാധ്യതയുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു. ചോദ്യം ഉയർന്നുവരുന്നു, നിങ്ങളുടെ ശരാശരി പ്രതിഫലം വർദ്ധിപ്പിക്കുന്ന തരത്തിൽ വിശ്വസനീയമായ ജാഗ്രതയുള്ള തന്ത്രത്തെ സാഹസികതയുമായി സംയോജിപ്പിക്കാൻ കഴിയുമോ? അടിസ്ഥാനപരമായി, കളിക്കാർക്കിടയിൽ പ്രതിഫലം (2.17) എങ്ങനെ വിഭജിക്കാം എന്നതാണ് ചോദ്യം?
ഒരു മിക്സഡ് തന്ത്രം ഉപയോഗിക്കുന്നതാണ് ന്യായമായ പരിഹാരം, അതായത് ശുദ്ധമായ തന്ത്രങ്ങളുടെ ക്രമരഹിതമായ തിരഞ്ഞെടുപ്പ്. അത് ഓർക്കുക പ്ലെയർ 1 ന്റെ തന്ത്രത്തെ മിക്സഡ് എന്ന് വിളിക്കുന്നു, i-th row തിരഞ്ഞെടുക്കുന്നത് ചില സാധ്യതകളോടെയാണെങ്കിൽ p i .പ്രോബബിലിറ്റി ഡിസ്ട്രിബ്യൂഷൻ ഉപയോഗിച്ച് അത്തരമൊരു തന്ത്രം തിരിച്ചറിയാൻ കഴിയും ഒന്നിലധികം വരികളിൽ. ആദ്യത്തെ കളിക്കാരന് m pure തന്ത്രങ്ങളും രണ്ടാമത്തെ കളിക്കാരന് n ശുദ്ധമായ തന്ത്രങ്ങളുമുണ്ടെന്ന് കരുതുക. അപ്പോൾ അവയുടെ സമ്മിശ്ര തന്ത്രങ്ങൾ പ്രോബബിലിറ്റി വെക്റ്ററുകളാണ്:
(2.18)
ഉദാഹരണം 3-ലെ ആദ്യ കളിക്കാരന് സാധ്യമായ രണ്ട് സമ്മിശ്ര തന്ത്രങ്ങൾ പരിഗണിക്കുക: . ശുദ്ധമായ തന്ത്രങ്ങൾ തമ്മിലുള്ള പ്രോബബിലിറ്റി ഡിസ്ട്രിബ്യൂഷനുകളിൽ ഈ തന്ത്രങ്ങൾ വ്യത്യാസപ്പെട്ടിരിക്കുന്നു. ആദ്യ കേസിൽ മാട്രിക്സിന്റെ വരികൾ തുല്യ സാധ്യതകളുള്ള കളിക്കാരൻ തിരഞ്ഞെടുക്കുകയാണെങ്കിൽ, രണ്ടാമത്തെ കേസിൽ - വ്യത്യസ്തമായവ ഉപയോഗിച്ച്. സമ്മിശ്ര തന്ത്രത്തെക്കുറിച്ച് സംസാരിക്കുമ്പോൾ, ഞങ്ങൾ അർത്ഥമാക്കുന്നത് ക്രമരഹിതമായ തിരഞ്ഞെടുപ്പ്"റാൻഡം" എന്ന ചോയ്സ് അല്ല, മറിച്ച് നമുക്ക് ആവശ്യമായ പ്രോബബിലിറ്റി ഡിസ്ട്രിബ്യൂഷൻ നൽകുന്ന ഒരു റാൻഡം മെക്കാനിസത്തിന്റെ പ്രവർത്തനത്തെ അടിസ്ഥാനമാക്കിയുള്ള ഒരു തിരഞ്ഞെടുപ്പ്. അതിനാൽ, സമ്മിശ്ര തന്ത്രങ്ങളിൽ ആദ്യത്തേത് നടപ്പിലാക്കുന്നതിന്, ഒരു നാണയം ടോസ് അനുയോജ്യമാണ്. നാണയം എങ്ങനെ വീഴുന്നു എന്നതിനെ ആശ്രയിച്ച് കളിക്കാരൻ ആദ്യ വരി അല്ലെങ്കിൽ രണ്ടാമത്തേത് തിരഞ്ഞെടുക്കുന്നു. ശരാശരി, കളിക്കാരൻ ആദ്യ വരിയും രണ്ടാമത്തെ വരിയും ഒരേപോലെ തിരഞ്ഞെടുക്കും, എന്നാൽ ഗെയിമിന്റെ ഒരു പ്രത്യേക ആവർത്തനത്തിലെ തിരഞ്ഞെടുപ്പ് ഒരു നിശ്ചിത നിയമത്തിനും വിധേയമല്ല കൂടാതെ പരമാവധി രഹസ്യാത്മകതയുണ്ട്: ക്രമരഹിതമായ സംവിധാനം നടപ്പിലാക്കുന്നതിന് മുമ്പ് , ആദ്യ കളിക്കാരന് പോലും ഇത് അജ്ഞാതമാണ്. രണ്ടാമത്തെ മിക്സഡ് തന്ത്രം നടപ്പിലാക്കാൻ, ഡ്രോ മെക്കാനിസം നന്നായി യോജിക്കുന്നു. കളിക്കാരൻ സമാനമായ ഏഴ് കടലാസ് കഷണങ്ങൾ എടുത്ത് അവയിൽ മൂന്നെണ്ണം കുരിശുകൊണ്ട് അടയാളപ്പെടുത്തി തൊപ്പിയിലേക്ക് എറിയുന്നു. പിന്നെ, ക്രമരഹിതമായി, അവൻ അവയിലൊന്ന് വേർതിരിച്ചെടുക്കുന്നു. ക്ലാസിക്കൽ പ്രോബബിലിറ്റി സിദ്ധാന്തമനുസരിച്ച്, 3/7 പ്രോബബിലിറ്റിയുള്ള കുരിശുള്ള ഒരു കടലാസ് കഷണം, 4/7 പ്രോബബിലിറ്റി ഉള്ള ഒരു വൃത്തിയുള്ള കടലാസ് അവൻ പുറത്തെടുക്കും. അത്തരമൊരു സമനില സംവിധാനം ഏതെങ്കിലും യുക്തിസഹമായ സാധ്യതകൾ തിരിച്ചറിയാൻ പ്രാപ്തമാണ്.
കളിക്കാർ സമ്മിശ്ര തന്ത്രങ്ങൾ പാലിക്കട്ടെ (2.18). ഗെയിമിന്റെ ഒരൊറ്റ ആവർത്തനത്തിൽ ആദ്യ കളിക്കാരന്റെ പ്രതിഫലം ഒരു റാൻഡം വേരിയബിളാണ്: v(X,Y). കളിക്കാർ പരസ്പരം സ്വതന്ത്രമായി തന്ത്രങ്ങൾ തിരഞ്ഞെടുക്കുന്നതിനാൽ, പ്രോബബിലിറ്റി ഗുണന സിദ്ധാന്തമനുസരിച്ച്, വിജയത്തിനൊപ്പം ഒരു ഫലം (i, j) തിരഞ്ഞെടുക്കുന്നതിനുള്ള സാധ്യത പ്രോബബിലിറ്റികളുടെ ഉൽപ്പന്നത്തിന് തുല്യമാണ്. അപ്പോൾ റാൻഡം വേരിയബിളിന്റെ വിതരണ നിയമം v(X,Y)ഇനിപ്പറയുന്ന പട്ടിക നൽകിയിരിക്കുന്നു
ഇപ്പോൾ ഗെയിം അനിശ്ചിതമായി കളിക്കാൻ അനുവദിക്കുക. അത്തരമൊരു ഗെയിമിലെ ശരാശരി പ്രതിഫലം മൂല്യത്തിന്റെ ഗണിതശാസ്ത്ര പ്രതീക്ഷയ്ക്ക് തുല്യമാണ് v(X,Y).
(2.19)
അന്തിമമാകുമ്പോൾ, പക്ഷേ മതി വലിയ സംഖ്യകൾഗെയിമിന്റെ ആവർത്തനങ്ങൾ, ശരാശരി പ്രതിഫലം മൂല്യത്തിൽ നിന്ന് അല്പം വ്യത്യാസപ്പെട്ടിരിക്കും (2.19).
ഉദാഹരണം 4. കളിക്കാർ ഇനിപ്പറയുന്ന തന്ത്രങ്ങൾ ഉപയോഗിക്കുമ്പോൾ, ഉദാഹരണം 3-ൽ നിന്ന് ഗെയിമിന്റെ ശരാശരി പ്രതിഫലം (2.19) കണക്കാക്കുക: . പേഓഫ് മെട്രിക്സും പ്രോബബിലിറ്റി മെട്രിക്സും ഇപ്രകാരമാണ്:
നമുക്ക് ശരാശരി കണ്ടെത്താം:
അങ്ങനെ, ശരാശരി പേഓഫ് (2.20) മാക്സിമിനും മിനിമാക്സിനും ഇടയിലാണ്.
X, Y എന്നീ സമ്മിശ്ര തന്ത്രങ്ങളുടെ ഏത് ജോഡിക്കും ഗെയിമിന്റെ ശരാശരി മൂല്യം കണക്കാക്കാൻ കഴിയുമെന്നതിനാൽ, ഒപ്റ്റിമൽ തന്ത്രം കണ്ടെത്തുന്നതിനുള്ള പ്രശ്നം ഉയർന്നുവരുന്നു. ജാഗ്രതയോടെയുള്ള തന്ത്രങ്ങൾ പര്യവേക്ഷണം ചെയ്തുകൊണ്ട് ആരംഭിക്കുന്നത് സ്വാഭാവികമാണ്. ആദ്യ കളിക്കാരന്റെ ജാഗ്രതയുള്ള തന്ത്രം അയാൾക്ക് ഒരു മാക്സിമിൻ നൽകുന്നു. രണ്ടാമത്തെ കളിക്കാരന്റെ ജാഗ്രതയോടെയുള്ള തന്ത്രം മിനിമാക്സിനേക്കാൾ കൂടുതൽ വിജയിക്കാൻ ആദ്യത്തേതിനെ അനുവദിക്കുന്നില്ല. വിപരീത താൽപ്പര്യങ്ങളുള്ള ഗെയിമുകളുടെ സിദ്ധാന്തത്തിലെ ഏറ്റവും പ്രധാനപ്പെട്ട ഫലം ഇനിപ്പറയുന്നതായി കണക്കാക്കാം:
സിദ്ധാന്തം. ഓരോ മാട്രിക്സ് ഗെയിമിനും സമ്മിശ്ര തന്ത്രങ്ങളിൽ ഒരു സന്തുലിതാവസ്ഥയുണ്ട്. ഈ സിദ്ധാന്തത്തിന്റെ തെളിവ് എളുപ്പമല്ല. ഈ കോഴ്സിൽ അത് ഒഴിവാക്കിയിരിക്കുന്നു.
അനന്തരഫലങ്ങൾ: ഒരു സന്തുലിതാവസ്ഥയുടെ അസ്തിത്വം അർത്ഥമാക്കുന്നത് മാക്സിമിൻ മിനിമാക്സിന് തുല്യമാണ്, അതിനാൽ ഏത് മാട്രിക്സ് ഗെയിമിനും വിലയുണ്ട്. ആദ്യ കളിക്കാരനുള്ള ഒപ്റ്റിമൽ തന്ത്രം മാക്സിമിൻ തന്ത്രമാണ്. രണ്ടാമത്തേതിന്റെ ഒപ്റ്റിമൽ തന്ത്രം മിനിമാക്സ് ആണ്. ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ കണ്ടെത്തുന്നതിനുള്ള പ്രശ്നം പരിഹരിച്ചതിനാൽ, ഏതെങ്കിലും മാട്രിക്സ് ഗെയിം എന്ന് ഞങ്ങൾ പറയുന്നു പരിഹരിക്കാവുന്നഒരു കൂട്ടം സമ്മിശ്ര തന്ത്രങ്ങളിൽ.
കളിയുടെ പരിഹാരം 2x2
ഉദാഹരണം 5. ഗെയിം പരിഹരിക്കുക. സാഡിൽ പോയിന്റ് ഇല്ലെന്ന് പരിശോധിക്കുന്നത് ബുദ്ധിമുട്ടുള്ള കാര്യമല്ല. ആദ്യ കളിക്കാരന്റെ ഒപ്റ്റിമൽ തന്ത്രം സൂചിപ്പിക്കുക (x, 1-x)ഒരു കോളം വെക്റ്റർ ആണ്, എന്നാൽ സൗകര്യാർത്ഥം ഞങ്ങൾ ഇത് ഒരു സ്ട്രിംഗ് ആയി എഴുതുന്നു. രണ്ടാമത്തെ കളിക്കാരന്റെ ഒപ്റ്റിമൽ തന്ത്രം സൂചിപ്പിക്കുക (y,1-y).
ആദ്യ കളിക്കാരന്റെ പ്രതിഫലം ഇനിപ്പറയുന്ന വിതരണത്തോടുകൂടിയ ഒരു റാൻഡം വേരിയബിളാണ്:
v(x,y) | 2 | -1 | -4 | 7 |
പി | xy | x(1-y) | (1x) വൈ | (1-x)(1-y) |
ആദ്യത്തെ കളിക്കാരന്റെ ആവർത്തനത്തിന്റെ ശരാശരി പ്രതിഫലം ഞങ്ങൾ കണ്ടെത്തുന്നു - ഒരു റാൻഡം വേരിയബിളിന്റെ ഗണിതശാസ്ത്ര പ്രതീക്ഷ v(x,y):
നമുക്ക് ഈ പദപ്രയോഗം രൂപാന്തരപ്പെടുത്താം:
ഈ ഗണിതശാസ്ത്ര പ്രതീക്ഷയിൽ ഒരു സ്ഥിരാങ്കവും (5/7) ഒരു വേരിയബിൾ ഭാഗവും അടങ്ങിയിരിക്കുന്നു: 14(x-11/14)(y-8/14). മൂല്യമാണെങ്കിൽ വൈ 8/14-ൽ നിന്ന് വ്യത്യസ്തമാണ്, അപ്പോൾ ആദ്യ കളിക്കാരന് എപ്പോഴും തിരഞ്ഞെടുക്കാനാകും എക്സ്വേരിയബിൾ ഭാഗം പോസിറ്റീവ് ആക്കുന്ന തരത്തിൽ, നിങ്ങളുടെ വിജയങ്ങൾ വർദ്ധിപ്പിക്കുക. മൂല്യമാണെങ്കിൽ എക്സ് 11/14-ൽ നിന്ന് വ്യത്യസ്തമാണ്, രണ്ടാമത്തെ കളിക്കാരന് എപ്പോഴും തിരഞ്ഞെടുക്കാനാകും വൈവേരിയബിൾ ഭാഗം നെഗറ്റീവ് ആക്കുന്നതിന്, ആദ്യ കളിക്കാരന്റെ പ്രതിഫലം കുറയ്ക്കുന്നു. അങ്ങനെ, സാഡിൽ പോയിന്റ് തുല്യതകളാൽ നിർവചിക്കപ്പെടുന്നു: x*=11/14, y*=8/14.
2.5 ഗെയിം സോൾവിംഗ്
അത്തരം ഗെയിമുകൾ എങ്ങനെ പരിഹരിക്കാമെന്ന് ഒരു ഉദാഹരണം കാണിക്കും.
ഉദാഹരണം 6. ഗെയിം പരിഹരിക്കുക . സാഡിൽ പോയിന്റ് ഇല്ലെന്ന് ഞങ്ങൾ ഉറപ്പാക്കുന്നു. ആദ്യ കളിക്കാരന്റെ സമ്മിശ്ര തന്ത്രത്തെ സൂചിപ്പിക്കുക X=(x, 1-x)ഒരു കോളം വെക്റ്റർ ആണ്, എന്നാൽ സൗകര്യാർത്ഥം ഞങ്ങൾ ഇത് ഒരു സ്ട്രിംഗ് ആയി എഴുതുന്നു.
ആദ്യ കളിക്കാരൻ തന്ത്രം X പ്രയോഗിക്കട്ടെ, രണ്ടാമത്തേത് - അവന്റെ j-th ക്ലീൻതന്ത്രം. ഈ സാഹചര്യത്തിൽ ആദ്യ കളിക്കാരന്റെ ശരാശരി പ്രതിഫലം നമുക്ക് സൂചിപ്പിക്കാം. നമുക്ക് ഉണ്ട്:
സെഗ്മെന്റിൽ ഫംഗ്ഷനുകളുടെ ഗ്രാഫ് (2.21) വരയ്ക്കാം.
ഏതെങ്കിലും ലൈൻ സെഗ്മെന്റിൽ സ്ഥിതി ചെയ്യുന്ന ഒരു പോയിന്റിന്റെ ഓർഡിനേറ്റ്, ഒരു സമ്മിശ്ര തന്ത്രം ഉപയോഗിക്കുന്ന സാഹചര്യത്തിൽ ആദ്യ കളിക്കാരന്റെ പ്രതിഫലവുമായി പൊരുത്തപ്പെടുന്നു. (x,(1-x)), രണ്ടാമത്തെ കളിക്കാരൻ അനുയോജ്യമായ ശുദ്ധമായ തന്ത്രം. ആദ്യ കളിക്കാരന്റെ ഗ്യാരണ്ടീഡ് ഫലം ലൈനുകളുടെ കുടുംബത്തിന്റെ (തകർന്ന എബിസി) താഴ്ന്ന എൻവലപ്പ് ആണ്. ഏറ്റവും ഉയർന്ന പോയിന്റ്ഈ തകർന്ന ലൈൻ (പോയിന്റ് ബി) എന്നത് പ്ലെയർ 1 ന്റെ പരമാവധി ഗ്യാരണ്ടീഡ് ഫലമാണ്. പോയിന്റ് ബിയുടെ അബ്സിസ്സ ആദ്യ കളിക്കാരന്റെ ഒപ്റ്റിമൽ സ്ട്രാറ്റജിയുമായി യോജിക്കുന്നു.
ആവശ്യമുള്ള പോയിന്റ് ബി വരികളുടെ വിഭജനം ആയതിനാൽ, സമവാക്യത്തിനുള്ള പരിഹാരമായി അതിന്റെ അബ്സിസ്സ കണ്ടെത്താം:
അങ്ങനെ, ആദ്യ കളിക്കാരന്റെ ഒപ്റ്റിമൽ മിക്സഡ് തന്ത്രം (5/9, 4/9) ആണ്. ബി പോയിന്റിന്റെ ഓർഡിനേറ്റ് ഗെയിമിന്റെ വിലയാണ്. ഇത് ഇതിന് തുല്യമാണ്:
(2.22)
രണ്ടാമത്തെ കളിക്കാരന്റെ രണ്ടാമത്തെ സ്ട്രാറ്റജിയുമായി ബന്ധപ്പെട്ട ലൈൻ പോയിന്റ് B-ന് മുകളിൽ കടന്നുപോകുന്നുവെന്നത് ശ്രദ്ധിക്കുക. ഇതിനർത്ഥം ആദ്യ കളിക്കാരൻ തന്റെ ഒപ്റ്റിമൽ തന്ത്രം പ്രയോഗിക്കുകയും പ്ലെയർ 2 രണ്ടാമത്തേത് ഉപയോഗിക്കുകയും ചെയ്യുന്നുവെങ്കിൽ, തന്ത്രങ്ങൾ പ്രയോഗിക്കുന്നതിനെ അപേക്ഷിച്ച് രണ്ടാമത്തെ കളിക്കാരന്റെ നഷ്ടം വർദ്ധിക്കുന്നു. 1 അല്ലെങ്കിൽ 3. അങ്ങനെ, രണ്ടാമത്തെ തന്ത്രം രണ്ടാമത്തെ കളിക്കാരന്റെ ഒപ്റ്റിമൽ തന്ത്രത്തിൽ പങ്കെടുക്കരുത്. പ്ലെയർ 2-നുള്ള ഒപ്റ്റിമൽ തന്ത്രം ഇതായിരിക്കണം: . ഒപ്റ്റിമൽ സ്ട്രാറ്റജിയിൽ പൂജ്യമല്ലാത്ത ഘടകങ്ങളുള്ള രണ്ടാമത്തെ കളിക്കാരന്റെ ശുദ്ധമായ തന്ത്രങ്ങൾ 1 ഉം 3 ഉം സാധാരണയായി വിളിക്കപ്പെടുന്നു കാര്യമായ. തന്ത്രം 2 എന്ന് വിളിക്കുന്നു നിസ്സാരമായ. മുകളിലെ ചിത്രത്തിൽ നിന്നും, തുല്യതയിൽ നിന്നും (2.22), ആദ്യ കളിക്കാരൻ തന്റെ ഒപ്റ്റിമൽ തന്ത്രം പ്രയോഗിക്കുമ്പോൾ, രണ്ടാമത്തെ കളിക്കാരന്റെ പ്രതിഫലം അവൻ ഉപയോഗിക്കുന്ന അവശ്യ തന്ത്രങ്ങളെ ആശ്രയിക്കുന്നില്ലെന്ന് കാണാൻ കഴിയും. അത്യാവശ്യം (പ്രത്യേകിച്ച്, ഒപ്റ്റിമൽ) അടങ്ങുന്ന ഏത് സമ്മിശ്ര തന്ത്രവും അദ്ദേഹത്തിന് പ്രയോഗിക്കാൻ കഴിയും, ഈ സാഹചര്യത്തിലും പ്രതിഫലം മാറില്ല. തികച്ചും സാമ്യമുള്ള ഒരു പ്രസ്താവന വിപരീത കേസിലും ശരിയാണ്. രണ്ടാമത്തെ കളിക്കാരൻ തന്റെ ഒപ്റ്റിമൽ സ്ട്രാറ്റജി ഉപയോഗിക്കുകയാണെങ്കിൽ, ആദ്യ കളിക്കാരന്റെ പ്രതിഫലം അവൻ ഉപയോഗിക്കുന്ന അവശ്യ തന്ത്രങ്ങളെ ആശ്രയിക്കുന്നില്ല, അത് ഗെയിമിന്റെ വിലയ്ക്ക് തുല്യമാണ്. ഈ പ്രസ്താവന ഉപയോഗിച്ച്, രണ്ടാമത്തെ കളിക്കാരനുള്ള ഒപ്റ്റിമൽ തന്ത്രം ഞങ്ങൾ കണ്ടെത്തുന്നു.
സംഘട്ടനങ്ങളുടെ സിദ്ധാന്തത്തിലെ ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ കളിക്കാരെ സ്ഥിരമായ സന്തുലിതാവസ്ഥയിലേക്ക് നയിക്കുന്ന തന്ത്രങ്ങളാണ്, അതായത്. എല്ലാ കളിക്കാരെയും തൃപ്തിപ്പെടുത്തുന്ന ചില സാഹചര്യങ്ങൾ.
ഗെയിം തിയറിയിലെ ഒരു പരിഹാരത്തിന്റെ ഒപ്റ്റിമലിറ്റി ആശയത്തെ അടിസ്ഥാനമാക്കിയുള്ളതാണ് സന്തുലിതാവസ്ഥ:
1) സന്തുലിതാവസ്ഥയിൽ നിന്ന് വ്യതിചലിക്കുന്നത് ഒരു കളിക്കാരനും ലാഭകരമല്ല, മറ്റുള്ളവരെല്ലാം അതിൽ തുടരുകയാണെങ്കിൽ,
2) സന്തുലിതാവസ്ഥയുടെ അർത്ഥം - കളിയുടെ ആവർത്തിച്ചുള്ള ആവർത്തനത്തോടെ, കളിക്കാർ സന്തുലിതാവസ്ഥയിലെത്തും, ഏത് തന്ത്രപരമായ സാഹചര്യത്തിലും ഗെയിം ആരംഭിക്കും.
ഓരോ ഇടപെടലിലും, ഇനിപ്പറയുന്ന തരത്തിലുള്ള സന്തുലിതാവസ്ഥ നിലനിൽക്കും:
1. സന്തുലിതാവസ്ഥ ജാഗ്രതയുള്ള തന്ത്രങ്ങളിൽ . കളിക്കാരെ നൽകുന്ന തന്ത്രങ്ങളാൽ നിർണ്ണയിക്കപ്പെടുന്നു ഉറപ്പായ ഫലം;
2. സന്തുലിതാവസ്ഥ പ്രബലമായ തന്ത്രങ്ങളിൽ .
ആധിപത്യ തന്ത്രംമറ്റ് പങ്കാളിയുടെ പ്രവർത്തനങ്ങൾ പരിഗണിക്കാതെ തന്നെ പങ്കാളിക്ക് പരമാവധി നേട്ടം നൽകുന്ന പ്രവർത്തന പദ്ധതിയാണിത്. അതിനാൽ, ആധിപത്യ തന്ത്രങ്ങളുടെ സന്തുലിതാവസ്ഥ ഗെയിമിലെ രണ്ട് പങ്കാളികളുടെയും ആധിപത്യ തന്ത്രങ്ങളുടെ കവലയായിരിക്കും.
കളിക്കാരുടെ ഒപ്റ്റിമൽ സ്ട്രാറ്റജികൾ അവരുടെ മറ്റെല്ലാ തന്ത്രങ്ങളിലും ആധിപത്യം പുലർത്തുന്നുവെങ്കിൽ, ആധിപത്യ തന്ത്രങ്ങളിൽ ഗെയിമിന് ഒരു സന്തുലിതാവസ്ഥയുണ്ട്. തടവുകാരന്റെ ഡിലമ ഗെയിമിൽ, നാഷ് സന്തുലിത തന്ത്രങ്ങൾ ("സമ്മതം - സമ്മതിക്കുക") ആയിരിക്കും. മാത്രമല്ല, എ, പ്ലെയർ ബി എന്നിവരെ സംബന്ധിച്ചിടത്തോളം "തിരിച്ചറിയുക" എന്നത് പ്രബലമായ തന്ത്രമാണ്, അതേസമയം "തിരിച്ചറിയില്ല" എന്നത് ആധിപത്യം പുലർത്തുന്നു എന്നത് ശ്രദ്ധിക്കേണ്ടതാണ്.
3. സന്തുലിതാവസ്ഥ നാഷ് . നാഷ് സന്തുലിതാവസ്ഥരണ്ടോ അതിലധികമോ കളിക്കാരുടെ ഗെയിമിന്റെ ഒരു തരം തീരുമാനമാണ്, മറ്റ് പങ്കാളികൾ അവരുടെ തീരുമാനം മാറ്റാത്തപ്പോൾ, ഒരു പങ്കാളിക്കും ഏകപക്ഷീയമായി തന്റെ തീരുമാനം മാറ്റുന്നതിലൂടെ പ്രതിഫലം വർദ്ധിപ്പിക്കാൻ കഴിയില്ല.
കളി പറയാം എൻസാധാരണ രൂപത്തിലുള്ള മുഖങ്ങൾ, ശുദ്ധമായ തന്ത്രങ്ങളുടെ കൂട്ടം എവിടെയാണ്, അത് പ്രതിഫലങ്ങളുടെ കൂട്ടമാണ്.
ഓരോ കളിക്കാരനും സ്ട്രാറ്റജീസ് പ്രൊഫൈലിൽ ഒരു തന്ത്രം തിരഞ്ഞെടുക്കുമ്പോൾ, കളിക്കാരന് ഒരു പ്രതിഫലം ലഭിക്കും. മാത്രമല്ല, പ്രതിഫലം തന്ത്രങ്ങളുടെ മുഴുവൻ പ്രൊഫൈലിനെയും ആശ്രയിച്ചിരിക്കുന്നു: കളിക്കാരൻ സ്വയം തിരഞ്ഞെടുത്ത തന്ത്രത്തിൽ മാത്രമല്ല, മറ്റുള്ളവരുടെ തന്ത്രങ്ങളിലും. സ്ട്രാറ്റജി പ്രൊഫൈൽ ഒരു നാഷ് സന്തുലിതാവസ്ഥയാണ്, അതിന്റെ തന്ത്രത്തിലെ മാറ്റം ഏതെങ്കിലും കളിക്കാരന്, അതായത്, ആർക്കും ഗുണകരമല്ല.
ഒരു ഗെയിമിന് ശുദ്ധവും സമ്മിശ്രവുമായ തന്ത്രങ്ങളിൽ ഒരു നാഷ് സന്തുലിതാവസ്ഥ ഉണ്ടായിരിക്കാം.
അനുവദിച്ചാൽ നാഷ് തെളിയിച്ചു സമ്മിശ്ര തന്ത്രങ്ങൾ, പിന്നെ ഓരോ കളിയിലും എൻകളിക്കാർക്ക് ഒരു നാഷ് സന്തുലിതാവസ്ഥയെങ്കിലും ഉണ്ടായിരിക്കും.
ഒരു നാഷ് സന്തുലിതാവസ്ഥയിൽ, ഓരോ കളിക്കാരന്റെയും തന്ത്രം മറ്റ് കളിക്കാരുടെ തന്ത്രങ്ങളോട് മികച്ച പ്രതികരണം നൽകുന്നു;
4. ബാലൻസ് സ്റ്റാക്കൽബർഗ്. സ്റ്റാക്കൽബർഗ് മോഡൽ- വിവര അസമമിതിയുടെ സാന്നിധ്യത്തിൽ ഒളിഗോപോളിസ്റ്റിക് മാർക്കറ്റിന്റെ ഗെയിം-തിയറിറ്റിക് മോഡൽ. ഈ മാതൃകയിൽ, സ്ഥാപനങ്ങളുടെ പെരുമാറ്റം പൂർണ്ണമായ വിവരങ്ങളുള്ള ഒരു ഡൈനാമിക് ഗെയിം വിവരിക്കുന്നു, അതിൽ സ്ഥാപനങ്ങളുടെ പെരുമാറ്റം മാതൃകയാക്കുന്നു നിശ്ചലമായകൂടെ ഗെയിമുകൾ പൂർണ്ണമായ വിവരങ്ങൾ. പ്രധാന ഗുണംഗെയിം എന്നത് ഒരു മുൻനിര സ്ഥാപനത്തിന്റെ സാന്നിധ്യമാണ്, അത് ചരക്കുകളുടെ ഉൽപാദനത്തിന്റെ അളവ് ആദ്യമായി സ്ഥാപിക്കുന്നു, ബാക്കിയുള്ള സ്ഥാപനങ്ങൾ അവരുടെ കണക്കുകൂട്ടലുകളിൽ അത് വഴി നയിക്കപ്പെടുന്നു. കളിയുടെ അടിസ്ഥാന ആവശ്യകതകൾ:
വ്യവസായം ഒരു ഏകീകൃത ഉൽപ്പന്നം ഉത്പാദിപ്പിക്കുന്നു: വ്യത്യസ്ത സ്ഥാപനങ്ങളുടെ ഉൽപ്പന്നങ്ങളിലെ വ്യത്യാസങ്ങൾ നിസ്സാരമാണ്, അതായത് വാങ്ങുന്നയാൾ, ഏത് സ്ഥാപനത്തിൽ നിന്ന് വാങ്ങണമെന്ന് തിരഞ്ഞെടുക്കുമ്പോൾ, വിലയിൽ മാത്രം ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു;
വ്യവസായത്തിന് വളരെ കുറച്ച് സ്ഥാപനങ്ങളുണ്ട്.
കമ്പനികൾ ഉൽപ്പാദിപ്പിക്കുന്ന ഉൽപ്പന്നങ്ങളുടെ അളവ് നിശ്ചയിക്കുന്നു, ഡിമാൻഡിനെ അടിസ്ഥാനമാക്കിയാണ് അതിന്റെ വില നിശ്ചയിക്കുന്നത്;
ലീഡർ ഫേം എന്ന് വിളിക്കപ്പെടുന്ന ഒരു സ്ഥാപനമുണ്ട്, ഉൽപ്പാദനത്തിന്റെ അളവിൽ മറ്റ് സ്ഥാപനങ്ങൾ നയിക്കപ്പെടുന്നു.
അതിനാൽ, ഒന്നോ അതിലധികമോ കളിക്കാർ ഇതിനകം നടത്തിയ തിരഞ്ഞെടുപ്പിന് ശേഷം വികസിപ്പിച്ച വ്യവസ്ഥകളെ അടിസ്ഥാനമാക്കി, ഡൈനാമിക് ഗെയിമുകളിൽ ഒപ്റ്റിമൽ പരിഹാരം കണ്ടെത്താൻ സ്റ്റാക്കൽബെർഗ് മോഡൽ ഉപയോഗിക്കുന്നു, കൂടാതെ കളിക്കാരുടെ പരമാവധി പ്രതിഫലവുമായി പൊരുത്തപ്പെടുന്നു. സ്റ്റാക്കൽബെർഗ് സന്തുലിതാവസ്ഥ.- ഒരു കളിക്കാർക്കും അവരുടെ വിജയങ്ങൾ ഏകപക്ഷീയമായി വർദ്ധിപ്പിക്കാൻ കഴിയാത്ത സാഹചര്യം, തീരുമാനങ്ങൾ ആദ്യം ഒരു കളിക്കാരൻ എടുക്കുകയും ആകുകയും ചെയ്യുന്നു രണ്ടാമത്തേതിന് അറിയാംകളിക്കാരൻ. തടവുകാരന്റെ ഡിലെമ ഗെയിമിൽ, സ്ക്വയർ (1; 1) - രണ്ട് കുറ്റവാളികളും "കുറ്റം സമ്മതിക്കുക" - സ്റ്റാക്കൽബെർഗ് സന്തുലിതാവസ്ഥയിൽ എത്തും;
5. പാരേറ്റോ ഒപ്റ്റിമലിറ്റി- സിസ്റ്റത്തിന്റെ അത്തരമൊരു അവസ്ഥ, മറ്റ് കളിക്കാരുടെ സ്ഥാനം വഷളാക്കാതെ സിസ്റ്റത്തിന്റെ അവസ്ഥ വിവരിക്കുന്ന ഓരോ പ്രത്യേക മാനദണ്ഡത്തിന്റെയും മൂല്യം മെച്ചപ്പെടുത്താൻ കഴിയില്ല.
പാരെറ്റോ തത്വം പ്രസ്താവിക്കുന്നു: "നഷ്ടം വരുത്താത്ത, എന്നാൽ ചില ആളുകൾക്ക് (അവരുടെ സ്വന്തം അനുമാനത്തിൽ) പ്രയോജനം ചെയ്യുന്ന ഏതൊരു മാറ്റവും ഒരു പുരോഗതിയാണ്." അങ്ങനെ, ആർക്കും കൂടുതൽ ദോഷം വരുത്താത്ത എല്ലാ മാറ്റങ്ങളുടെയും അവകാശം അംഗീകരിക്കപ്പെടുന്നു.
പാരെറ്റോ ഒപ്റ്റിമൽ ആയ സിസ്റ്റം സ്റ്റേറ്റുകളെ "പാരെറ്റോ സെറ്റ്", "പാരെറ്റോ എന്ന അർത്ഥത്തിൽ ഒപ്റ്റിമൽ ബദലുകളുടെ കൂട്ടം" അല്ലെങ്കിൽ "ഒപ്റ്റിമൽ ബദലുകളുടെ സെറ്റ്" എന്ന് വിളിക്കുന്നു.
എക്സ്ചേഞ്ചിൽ നിന്നുള്ള എല്ലാ ആനുകൂല്യങ്ങളും തീർന്നുപോയ അവസ്ഥയാണ് പാരെറ്റോ കാര്യക്ഷമത കൈവരിച്ച ഒരു സാഹചര്യം.
ആധുനിക സാമ്പത്തിക ശാസ്ത്രത്തിന്റെ കേന്ദ്ര ആശയങ്ങളിലൊന്നാണ് പാരെറ്റോ കാര്യക്ഷമത. ഈ ആശയത്തെ അടിസ്ഥാനമാക്കി, ഒന്നും രണ്ടും അടിസ്ഥാന ക്ഷേമ സിദ്ധാന്തങ്ങൾ നിർമ്മിക്കപ്പെടുന്നു.
പാരേറ്റോ ഒപ്റ്റിമലിറ്റിയുടെ പ്രയോഗങ്ങളിലൊന്നാണ് അന്താരാഷ്ട്ര സാമ്പത്തിക സംയോജനത്തിൽ വിഭവങ്ങളുടെ (തൊഴിൽ, മൂലധനം) പാരെറ്റോ വിതരണം, അതായത്. രണ്ടോ അതിലധികമോ സംസ്ഥാനങ്ങളുടെ സാമ്പത്തിക യൂണിയൻ. കൗതുകകരമെന്നു പറയട്ടെ, അന്താരാഷ്ട്ര സാമ്പത്തിക സംയോജനത്തിന് മുമ്പും ശേഷവും പാരെറ്റോ വിതരണം ഗണിതശാസ്ത്രപരമായി വേണ്ടത്ര വിവരിച്ചിട്ടുണ്ട് (ഡലിമോവ് ആർ.ടി., 2008). ബഹിരാകാശത്തെ വാതകമോ ദ്രാവകമോ പോലെ അറിയപ്പെടുന്ന താപ ചാലക സമവാക്യത്തിന് അനുസൃതമായി മേഖലകളുടെ അധിക മൂല്യവും തൊഴിൽ വിഭവങ്ങളുടെ വരുമാനവും വിപരീത ദിശകളിലേക്ക് നീങ്ങുന്നുവെന്ന് വിശകലനം കാണിക്കുന്നു, ഇത് ഉപയോഗിച്ച വിശകലന സാങ്കേതികത പ്രയോഗിക്കുന്നത് സാധ്യമാക്കുന്നു. സാമ്പത്തിക പരാമീറ്ററുകളുടെ കുടിയേറ്റത്തിന്റെ സാമ്പത്തിക പ്രശ്നങ്ങളുമായി ബന്ധപ്പെട്ട് ഭൗതികശാസ്ത്രത്തിൽ.
പാരേറ്റോ ഒപ്റ്റിമംസമൂഹത്തിന്റെ ക്ഷേമം അതിന്റെ പരമാവധിയിലെത്തുന്നു, ഈ വിതരണത്തിലെ എന്തെങ്കിലും മാറ്റം സാമ്പത്തിക വ്യവസ്ഥയുടെ ഒരു വിഷയത്തിന്റെയെങ്കിലും ക്ഷേമത്തെ വഷളാക്കുകയാണെങ്കിൽ വിഭവങ്ങളുടെ വിതരണം സമുചിതമായിത്തീരുന്നു.
വിപണിയുടെ പാരീറ്റോ-ഒപ്റ്റിമൽ അവസ്ഥ- മറ്റുള്ളവരിൽ ഒരാളുടെയെങ്കിലും ക്ഷേമം ഒരേസമയം കുറയ്ക്കാതെ സാമ്പത്തിക പ്രക്രിയയിൽ ഏതെങ്കിലും പങ്കാളിയുടെ സ്ഥാനം മെച്ചപ്പെടുത്തുന്നത് അസാധ്യമായ ഒരു സാഹചര്യം.
പാരെറ്റോ മാനദണ്ഡം (സാമൂഹിക ക്ഷേമത്തിന്റെ വളർച്ചയുടെ മാനദണ്ഡം) അനുസരിച്ച്, മറ്റാർക്കും ദോഷം വരുത്താതെ ഒരു വ്യക്തിയുടെയെങ്കിലും ക്ഷേമം വർദ്ധിപ്പിക്കുന്ന വിഭവങ്ങളുടെ അത്തരമൊരു വിതരണത്തിലൂടെ മാത്രമേ ഒപ്റ്റിമിയിലേക്കുള്ള ചലനം സാധ്യമാകൂ.
സാഹചര്യം S* എന്ന് പറയുമ്പോൾ പാരെറ്റോ ആധിപത്യ സാഹചര്യം S
ഏതൊരു കളിക്കാരനും അവന്റെ പ്രതിഫലം എസ്<=S*
· S*>S സാഹചര്യത്തിൽ പ്രതിഫലം ലഭിക്കുന്ന ഒരു കളിക്കാരനെങ്കിലും ഉണ്ട്
"തടവുകാരുടെ ആശയക്കുഴപ്പം" എന്ന പ്രശ്നത്തിൽ, പരേറ്റോ സന്തുലിതാവസ്ഥ, മറ്റേയാളുടെ സ്ഥാനം മോശമാക്കാതെ ഏതെങ്കിലും കളിക്കാരന്റെ സ്ഥാനം മെച്ചപ്പെടുത്തുന്നത് അസാധ്യമാകുമ്പോൾ, ചതുരത്തിന്റെ അവസ്ഥയുമായി പൊരുത്തപ്പെടുന്നു (2; 2).
പരിഗണിക്കുക ഉദാഹരണം 1.
സംഘട്ടനങ്ങളുടെ സിദ്ധാന്തത്തിലെ ഒപ്റ്റിമൽ തന്ത്രങ്ങൾ കളിക്കാരെ സ്ഥിരമായ സന്തുലിതാവസ്ഥയിലേക്ക് നയിക്കുന്ന തന്ത്രങ്ങളാണ്, അതായത്. എല്ലാ കളിക്കാരെയും തൃപ്തിപ്പെടുത്തുന്ന ചില സാഹചര്യങ്ങൾ.
ഗെയിം തിയറിയിലെ ഒരു പരിഹാരത്തിന്റെ ഒപ്റ്റിമലിറ്റി ആശയത്തെ അടിസ്ഥാനമാക്കിയുള്ളതാണ് സന്തുലിതാവസ്ഥ:
1) സന്തുലിതാവസ്ഥയിൽ നിന്ന് വ്യതിചലിക്കുന്നത് ഒരു കളിക്കാരനും ലാഭകരമല്ല, മറ്റുള്ളവരെല്ലാം അതിൽ തുടരുകയാണെങ്കിൽ,
2) സന്തുലിതാവസ്ഥയുടെ അർത്ഥം - കളിയുടെ ആവർത്തിച്ചുള്ള ആവർത്തനത്തോടെ, കളിക്കാർ സന്തുലിതാവസ്ഥയിലെത്തും, ഏത് തന്ത്രപരമായ സാഹചര്യത്തിലും ഗെയിം ആരംഭിക്കും.
ഓരോ ഇടപെടലിലും, ഇനിപ്പറയുന്ന തരത്തിലുള്ള സന്തുലിതാവസ്ഥ നിലനിൽക്കും:
1. സന്തുലിതാവസ്ഥ ജാഗ്രതയുള്ള തന്ത്രങ്ങളിൽ . കളിക്കാർക്ക് ഉറപ്പുള്ള ഫലം നൽകുന്ന തന്ത്രങ്ങളാൽ നിർണ്ണയിക്കപ്പെടുന്നു;
2. സന്തുലിതാവസ്ഥ പ്രബലമായ തന്ത്രങ്ങളിൽ .
ആധിപത്യ തന്ത്രംമറ്റ് പങ്കാളിയുടെ പ്രവർത്തനങ്ങൾ പരിഗണിക്കാതെ തന്നെ പങ്കാളിക്ക് പരമാവധി നേട്ടം നൽകുന്ന പ്രവർത്തന പദ്ധതിയാണിത്. അതിനാൽ, ആധിപത്യ തന്ത്രങ്ങളുടെ സന്തുലിതാവസ്ഥ ഗെയിമിലെ രണ്ട് പങ്കാളികളുടെയും ആധിപത്യ തന്ത്രങ്ങളുടെ കവലയായിരിക്കും.
കളിക്കാരുടെ ഒപ്റ്റിമൽ സ്ട്രാറ്റജികൾ അവരുടെ മറ്റെല്ലാ തന്ത്രങ്ങളിലും ആധിപത്യം പുലർത്തുന്നുവെങ്കിൽ, ആധിപത്യ തന്ത്രങ്ങളിൽ ഗെയിമിന് ഒരു സന്തുലിതാവസ്ഥയുണ്ട്. തടവുകാരന്റെ ഡിലമ ഗെയിമിൽ, നാഷ് സന്തുലിത തന്ത്രങ്ങൾ ("സമ്മതം - സമ്മതിക്കുക") ആയിരിക്കും. മാത്രമല്ല, എ, പ്ലെയർ ബി എന്നിവരെ സംബന്ധിച്ചിടത്തോളം "തിരിച്ചറിയുക" എന്നത് പ്രബലമായ തന്ത്രമാണ്, അതേസമയം "തിരിച്ചറിയില്ല" എന്നത് ആധിപത്യം പുലർത്തുന്നു എന്നത് ശ്രദ്ധിക്കേണ്ടതാണ്.
3. സന്തുലിതാവസ്ഥ നാഷ് . നാഷ് സന്തുലിതാവസ്ഥരണ്ടോ അതിലധികമോ കളിക്കാരുടെ ഗെയിമിന്റെ ഒരു തരം തീരുമാനമാണ്, മറ്റ് പങ്കാളികൾ അവരുടെ തീരുമാനം മാറ്റാത്തപ്പോൾ, ഒരു പങ്കാളിക്കും ഏകപക്ഷീയമായി തന്റെ തീരുമാനം മാറ്റുന്നതിലൂടെ പ്രതിഫലം വർദ്ധിപ്പിക്കാൻ കഴിയില്ല.
കളി പറയാം എൻസാധാരണ രൂപത്തിലുള്ള മുഖങ്ങൾ, ശുദ്ധമായ തന്ത്രങ്ങളുടെ കൂട്ടം എവിടെയാണ്, അത് പ്രതിഫലങ്ങളുടെ കൂട്ടമാണ്.
ഓരോ കളിക്കാരനും സ്ട്രാറ്റജീസ് പ്രൊഫൈലിൽ ഒരു തന്ത്രം തിരഞ്ഞെടുക്കുമ്പോൾ, കളിക്കാരന് ഒരു പ്രതിഫലം ലഭിക്കും. മാത്രമല്ല, പ്രതിഫലം തന്ത്രങ്ങളുടെ മുഴുവൻ പ്രൊഫൈലിനെയും ആശ്രയിച്ചിരിക്കുന്നു: കളിക്കാരൻ സ്വയം തിരഞ്ഞെടുത്ത തന്ത്രത്തിൽ മാത്രമല്ല, മറ്റുള്ളവരുടെ തന്ത്രങ്ങളിലും. സ്ട്രാറ്റജി പ്രൊഫൈൽ ഒരു നാഷ് സന്തുലിതാവസ്ഥയാണ്, അതിന്റെ തന്ത്രത്തിലെ മാറ്റം ഏതെങ്കിലും കളിക്കാരന്, അതായത്, ആർക്കും ഗുണകരമല്ല.
ഒരു ഗെയിമിന് ശുദ്ധവും സമ്മിശ്രവുമായ തന്ത്രങ്ങളിൽ ഒരു നാഷ് സന്തുലിതാവസ്ഥ ഉണ്ടായിരിക്കാം.
അനുവദിച്ചാൽ നാഷ് തെളിയിച്ചു സമ്മിശ്ര തന്ത്രങ്ങൾ, പിന്നെ ഓരോ കളിയിലും എൻകളിക്കാർക്ക് ഒരു നാഷ് സന്തുലിതാവസ്ഥയെങ്കിലും ഉണ്ടായിരിക്കും.
ഒരു നാഷ് സന്തുലിതാവസ്ഥയിൽ, ഓരോ കളിക്കാരന്റെയും തന്ത്രം മറ്റ് കളിക്കാരുടെ തന്ത്രങ്ങളോട് മികച്ച പ്രതികരണം നൽകുന്നു;
4. ബാലൻസ് സ്റ്റാക്കൽബർഗ്. സ്റ്റാക്കൽബർഗ് മോഡൽ- വിവര അസമമിതിയുടെ സാന്നിധ്യത്തിൽ ഒളിഗോപോളിസ്റ്റിക് മാർക്കറ്റിന്റെ ഗെയിം-തിയറിറ്റിക് മോഡൽ. ഈ മാതൃകയിൽ, സ്ഥാപനങ്ങളുടെ പെരുമാറ്റം പൂർണ്ണമായ വിവരങ്ങളുള്ള ഒരു ഡൈനാമിക് ഗെയിം വിവരിക്കുന്നു, അതിൽ സ്ഥാപനങ്ങളുടെ പെരുമാറ്റം മാതൃകയാക്കുന്നു നിശ്ചലമായസമ്പൂർണ്ണ വിവരങ്ങളുള്ള ഗെയിമുകൾ. ഗെയിമിന്റെ പ്രധാന സവിശേഷത ഒരു പ്രമുഖ സ്ഥാപനത്തിന്റെ സാന്നിധ്യമാണ്, അത് ആദ്യം ചരക്കുകളുടെ ഔട്ട്പുട്ടിന്റെ അളവ് സജ്ജീകരിക്കുന്നു, ബാക്കിയുള്ള സ്ഥാപനങ്ങൾ അവരുടെ കണക്കുകൂട്ടലുകളിൽ അത് വഴി നയിക്കപ്പെടുന്നു. കളിയുടെ അടിസ്ഥാന ആവശ്യകതകൾ:
വ്യവസായം ഒരു ഏകീകൃത ഉൽപ്പന്നം ഉത്പാദിപ്പിക്കുന്നു: വ്യത്യസ്ത സ്ഥാപനങ്ങളുടെ ഉൽപ്പന്നങ്ങളിലെ വ്യത്യാസങ്ങൾ നിസ്സാരമാണ്, അതായത് വാങ്ങുന്നയാൾ, ഏത് സ്ഥാപനത്തിൽ നിന്ന് വാങ്ങണമെന്ന് തിരഞ്ഞെടുക്കുമ്പോൾ, വിലയിൽ മാത്രം ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു;
വ്യവസായത്തിന് വളരെ കുറച്ച് സ്ഥാപനങ്ങളുണ്ട്.
കമ്പനികൾ ഉൽപ്പാദിപ്പിക്കുന്ന ഉൽപ്പന്നങ്ങളുടെ അളവ് നിശ്ചയിക്കുന്നു, ഡിമാൻഡിനെ അടിസ്ഥാനമാക്കിയാണ് അതിന്റെ വില നിശ്ചയിക്കുന്നത്;
ലീഡർ ഫേം എന്ന് വിളിക്കപ്പെടുന്ന ഒരു സ്ഥാപനമുണ്ട്, ഉൽപ്പാദനത്തിന്റെ അളവിൽ മറ്റ് സ്ഥാപനങ്ങൾ നയിക്കപ്പെടുന്നു.
അതിനാൽ, ഒന്നോ അതിലധികമോ കളിക്കാർ ഇതിനകം നടത്തിയ തിരഞ്ഞെടുപ്പിന് ശേഷം വികസിപ്പിച്ച വ്യവസ്ഥകളെ അടിസ്ഥാനമാക്കി, ഡൈനാമിക് ഗെയിമുകളിൽ ഒപ്റ്റിമൽ പരിഹാരം കണ്ടെത്താൻ സ്റ്റാക്കൽബെർഗ് മോഡൽ ഉപയോഗിക്കുന്നു, കൂടാതെ കളിക്കാരുടെ പരമാവധി പ്രതിഫലവുമായി പൊരുത്തപ്പെടുന്നു. സ്റ്റാക്കൽബെർഗ് സന്തുലിതാവസ്ഥ.- ഒരു കളിക്കാർക്കും അവരുടെ വിജയങ്ങൾ ഏകപക്ഷീയമായി വർദ്ധിപ്പിക്കാൻ കഴിയാത്ത സാഹചര്യം, തീരുമാനങ്ങൾ ആദ്യം ഒരു കളിക്കാരൻ എടുക്കുകയും രണ്ടാമത്തെ കളിക്കാരന് അറിയുകയും ചെയ്യുന്നു. തടവുകാരന്റെ ഡിലെമ ഗെയിമിൽ, സ്ക്വയർ (1; 1) - രണ്ട് കുറ്റവാളികളും "കുറ്റം സമ്മതിക്കുക" - സ്റ്റാക്കൽബെർഗ് സന്തുലിതാവസ്ഥയിൽ എത്തും;
5. പാരേറ്റോ ഒപ്റ്റിമലിറ്റി- സിസ്റ്റത്തിന്റെ അത്തരമൊരു അവസ്ഥ, മറ്റ് കളിക്കാരുടെ സ്ഥാനം വഷളാക്കാതെ സിസ്റ്റത്തിന്റെ അവസ്ഥ വിവരിക്കുന്ന ഓരോ പ്രത്യേക മാനദണ്ഡത്തിന്റെയും മൂല്യം മെച്ചപ്പെടുത്താൻ കഴിയില്ല.
പാരെറ്റോ തത്വം പ്രസ്താവിക്കുന്നു: "നഷ്ടം വരുത്താത്ത, എന്നാൽ ചില ആളുകൾക്ക് (അവരുടെ സ്വന്തം അനുമാനത്തിൽ) പ്രയോജനം ചെയ്യുന്ന ഏതൊരു മാറ്റവും ഒരു പുരോഗതിയാണ്." അങ്ങനെ, ആർക്കും കൂടുതൽ ദോഷം വരുത്താത്ത എല്ലാ മാറ്റങ്ങളുടെയും അവകാശം അംഗീകരിക്കപ്പെടുന്നു.
പാരെറ്റോ ഒപ്റ്റിമൽ ആയ സിസ്റ്റം സ്റ്റേറ്റുകളെ "പാരെറ്റോ സെറ്റ്", "പാരെറ്റോ എന്ന അർത്ഥത്തിൽ ഒപ്റ്റിമൽ ബദലുകളുടെ കൂട്ടം" അല്ലെങ്കിൽ "ഒപ്റ്റിമൽ ബദലുകളുടെ സെറ്റ്" എന്ന് വിളിക്കുന്നു.
എക്സ്ചേഞ്ചിൽ നിന്നുള്ള എല്ലാ ആനുകൂല്യങ്ങളും തീർന്നുപോയ അവസ്ഥയാണ് പാരെറ്റോ കാര്യക്ഷമത കൈവരിച്ച ഒരു സാഹചര്യം.
ആധുനിക സാമ്പത്തിക ശാസ്ത്രത്തിന്റെ കേന്ദ്ര ആശയങ്ങളിലൊന്നാണ് പാരെറ്റോ കാര്യക്ഷമത. ഈ ആശയത്തെ അടിസ്ഥാനമാക്കി, ഒന്നും രണ്ടും അടിസ്ഥാന ക്ഷേമ സിദ്ധാന്തങ്ങൾ നിർമ്മിക്കപ്പെടുന്നു.
പാരേറ്റോ ഒപ്റ്റിമലിറ്റിയുടെ പ്രയോഗങ്ങളിലൊന്നാണ് അന്താരാഷ്ട്ര സാമ്പത്തിക സംയോജനത്തിൽ വിഭവങ്ങളുടെ (തൊഴിൽ, മൂലധനം) പാരെറ്റോ വിതരണം, അതായത്. രണ്ടോ അതിലധികമോ സംസ്ഥാനങ്ങളുടെ സാമ്പത്തിക യൂണിയൻ. കൗതുകകരമെന്നു പറയട്ടെ, അന്താരാഷ്ട്ര സാമ്പത്തിക സംയോജനത്തിന് മുമ്പും ശേഷവും പാരെറ്റോ വിതരണം ഗണിതശാസ്ത്രപരമായി വേണ്ടത്ര വിവരിച്ചിട്ടുണ്ട് (ഡലിമോവ് ആർ.ടി., 2008). ബഹിരാകാശത്തെ വാതകമോ ദ്രാവകമോ പോലെ അറിയപ്പെടുന്ന താപ ചാലക സമവാക്യത്തിന് അനുസൃതമായി മേഖലകളുടെ അധിക മൂല്യവും തൊഴിൽ വിഭവങ്ങളുടെ വരുമാനവും വിപരീത ദിശകളിലേക്ക് നീങ്ങുന്നുവെന്ന് വിശകലനം കാണിക്കുന്നു, ഇത് ഉപയോഗിച്ച വിശകലന സാങ്കേതികത പ്രയോഗിക്കുന്നത് സാധ്യമാക്കുന്നു. സാമ്പത്തിക പരാമീറ്ററുകളുടെ കുടിയേറ്റത്തിന്റെ സാമ്പത്തിക പ്രശ്നങ്ങളുമായി ബന്ധപ്പെട്ട് ഭൗതികശാസ്ത്രത്തിൽ.
പാരേറ്റോ ഒപ്റ്റിമംസമൂഹത്തിന്റെ ക്ഷേമം അതിന്റെ പരമാവധിയിലെത്തുന്നു, ഈ വിതരണത്തിലെ എന്തെങ്കിലും മാറ്റം സാമ്പത്തിക വ്യവസ്ഥയുടെ ഒരു വിഷയത്തിന്റെയെങ്കിലും ക്ഷേമത്തെ വഷളാക്കുകയാണെങ്കിൽ വിഭവങ്ങളുടെ വിതരണം സമുചിതമായിത്തീരുന്നു.
വിപണിയുടെ പാരീറ്റോ-ഒപ്റ്റിമൽ അവസ്ഥ- മറ്റുള്ളവരിൽ ഒരാളുടെയെങ്കിലും ക്ഷേമം ഒരേസമയം കുറയ്ക്കാതെ സാമ്പത്തിക പ്രക്രിയയിൽ ഏതെങ്കിലും പങ്കാളിയുടെ സ്ഥാനം മെച്ചപ്പെടുത്തുന്നത് അസാധ്യമായ ഒരു സാഹചര്യം.
പാരെറ്റോ മാനദണ്ഡം (സാമൂഹിക ക്ഷേമത്തിന്റെ വളർച്ചയുടെ മാനദണ്ഡം) അനുസരിച്ച്, മറ്റാർക്കും ദോഷം വരുത്താതെ ഒരു വ്യക്തിയുടെയെങ്കിലും ക്ഷേമം വർദ്ധിപ്പിക്കുന്ന വിഭവങ്ങളുടെ അത്തരമൊരു വിതരണത്തിലൂടെ മാത്രമേ ഒപ്റ്റിമിയിലേക്കുള്ള ചലനം സാധ്യമാകൂ.
സാഹചര്യം S* എന്ന് പറയുമ്പോൾ പാരെറ്റോ ആധിപത്യ സാഹചര്യം S
ഏതൊരു കളിക്കാരനും അവന്റെ പ്രതിഫലം എസ്<=S*
· S*>S സാഹചര്യത്തിൽ പ്രതിഫലം ലഭിക്കുന്ന ഒരു കളിക്കാരനെങ്കിലും ഉണ്ട്
"തടവുകാരുടെ ആശയക്കുഴപ്പം" എന്ന പ്രശ്നത്തിൽ, പരേറ്റോ സന്തുലിതാവസ്ഥ, മറ്റേയാളുടെ സ്ഥാനം മോശമാക്കാതെ ഏതെങ്കിലും കളിക്കാരന്റെ സ്ഥാനം മെച്ചപ്പെടുത്തുന്നത് അസാധ്യമാകുമ്പോൾ, ചതുരത്തിന്റെ അവസ്ഥയുമായി പൊരുത്തപ്പെടുന്നു (2; 2).
പരിഗണിക്കുക ഉദാഹരണം 1:
പ്രബലമായ തന്ത്രങ്ങളിലെ സന്തുലിതാവസ്ഥഇല്ല.
നാഷ് സന്തുലിതാവസ്ഥ. (5.5) കൂടാതെ (4.4). തിരഞ്ഞെടുത്ത തന്ത്രത്തിൽ നിന്ന് വ്യക്തിഗതമായി വ്യതിചലിക്കുന്നത് ഒരു കളിക്കാരനും ലാഭകരമല്ലാത്തതിനാൽ.
പാരേറ്റോ ഒപ്റ്റിമം. (5.5) ഈ തന്ത്രങ്ങൾ തിരഞ്ഞെടുക്കുമ്പോൾ കളിക്കാരുടെ പ്രതിഫലം മുതൽ കൂടുതൽ വിജയങ്ങൾമറ്റ് തന്ത്രങ്ങൾ തിരഞ്ഞെടുക്കുമ്പോൾ.
സ്റ്റാക്കൽബെർഗ് സന്തുലിതാവസ്ഥ:
എ കളിക്കാരൻ ആദ്യ നീക്കം നടത്തുന്നു.
തന്റെ ആദ്യ തന്ത്രം തിരഞ്ഞെടുക്കുന്നു. ബി ആദ്യ തന്ത്രം തിരഞ്ഞെടുക്കുന്നു. എയ്ക്ക് 5 ലഭിക്കുന്നു.
തന്റെ രണ്ടാമത്തെ തന്ത്രം തിരഞ്ഞെടുക്കുന്നു. ബി രണ്ടാമത്തേത് തിരഞ്ഞെടുക്കുന്നു. എയ്ക്ക് 4 ലഭിക്കുന്നു.
5 > 4 =>
ബി ആദ്യ നീക്കം നടത്തുന്നു.
തന്റെ ആദ്യ തന്ത്രം തിരഞ്ഞെടുക്കുന്നു. എ ആദ്യ തന്ത്രം തിരഞ്ഞെടുക്കുന്നു. ബിക്ക് 5 ലഭിക്കുന്നു.
തന്റെ രണ്ടാമത്തെ തന്ത്രം തിരഞ്ഞെടുക്കുന്നു. അവൻ രണ്ടാമത്തേത് തിരഞ്ഞെടുക്കുന്നു. ബിക്ക് 4 ലഭിക്കുന്നു.
5 > 4 => സ്റ്റാക്കൽബർഗ് സന്തുലിതാവസ്ഥ (5, 5)
ഉദാഹരണം 2ഡ്യുപ്പോളി മോഡലിംഗ്.
ഈ മോഡലിന്റെ സാരാംശം പരിഗണിക്കുക:
രണ്ട് സ്ഥാപനങ്ങളുള്ള ഒരു വ്യവസായം ഉണ്ടാകട്ടെ, അതിലൊന്ന് "ലീഡർ ഫേം", മറ്റൊന്ന് "ഫോളോവർ ഫേം". ഉല്പന്നത്തിന്റെ വില ആയിരിക്കട്ടെ രേഖീയ പ്രവർത്തനംമൊത്തം വിതരണം ക്യു:
പി(ക്യു) = എ − bQ.
ഔട്ട്പുട്ടിന്റെ യൂണിറ്റിന് കമ്പനികളുടെ ചെലവ് സ്ഥിരവും തുല്യവുമാണെന്ന് നമുക്ക് അനുമാനിക്കാം കൂടെ 1 ഒപ്പം കൂടെയഥാക്രമം 2. അപ്പോൾ ആദ്യത്തെ സ്ഥാപനത്തിന്റെ ലാഭം നിർണ്ണയിക്കപ്പെടും ഫോർമുല
Π 1 = പി(ക്യു 1 + ക്യു 2) * ക്യു 1 − സി 1 ക്യു 1 ,
രണ്ടാമത്തേതിന്റെ ലാഭവും യഥാക്രമം
Π 2 = പി(ക്യു 1 + ക്യു 2) * ക്യു 2 − സി 2 ക്യു 2 .
സ്റ്റാക്കൽബർഗ് മോഡലിന് അനുസൃതമായി, ആദ്യത്തെ സ്ഥാപനം - മുൻനിര സ്ഥാപനം - ആദ്യ ഘട്ടത്തിൽ അതിന്റെ ഔട്ട്പുട്ട് നൽകുന്നു ക്യു 1 . അതിനുശേഷം, രണ്ടാമത്തെ സ്ഥാപനം - പിന്തുടരുന്ന സ്ഥാപനം - ലീഡർ സ്ഥാപനത്തിന്റെ പ്രവർത്തനങ്ങൾ വിശകലനം ചെയ്തുകൊണ്ട് അതിന്റെ ഔട്ട്പുട്ട് നിർണ്ണയിക്കുന്നു. ക്യു 2. രണ്ട് സ്ഥാപനങ്ങളുടെയും ലക്ഷ്യം അവരുടെ പേയ്മെന്റ് പ്രവർത്തനങ്ങൾ പരമാവധിയാക്കുക എന്നതാണ്.
ഈ ഗെയിമിലെ നാഷ് സന്തുലിതാവസ്ഥ നിർണ്ണയിക്കുന്നത് ബാക്ക്വേർഡ് ഇൻഡക്ഷൻ ആണ്. കളിയുടെ അവസാന ഘട്ടം പരിഗണിക്കുക - രണ്ടാമത്തെ സ്ഥാപനത്തിന്റെ നീക്കം. ഈ ഘട്ടത്തിൽ, ഫേം 1-ന്റെ ഒപ്റ്റിമൽ ഔട്ട്പുട്ട് ഫേം 2-ന് അറിയാം ക്യു 1 * . അപ്പോൾ ഒപ്റ്റിമൽ ഔട്ട്പുട്ട് നിർണ്ണയിക്കുന്നതിനുള്ള പ്രശ്നം ക്യുരണ്ടാമത്തെ സ്ഥാപനത്തിന്റെ പേഓഫ് ഫംഗ്ഷന്റെ പരമാവധി പോയിന്റ് കണ്ടെത്തുന്നതിനുള്ള പ്രശ്നം പരിഹരിക്കുന്നതിന് 2 * ചുരുക്കിയിരിക്കുന്നു. വേരിയബിളുമായി ബന്ധപ്പെട്ട് ഫംഗ്ഷൻ Π 2 പരമാവധിയാക്കുന്നു ക്യു 2 എണ്ണുന്നു ക്യു 1 നൽകിയിരിക്കുന്നു, രണ്ടാമത്തെ സ്ഥാപനത്തിന്റെ ഒപ്റ്റിമൽ ഔട്ട്പുട്ട് ഞങ്ങൾ കണ്ടെത്തുന്നു
റിലീസിന്റെ ലീഡർ ഫേം തിരഞ്ഞെടുത്തതിന് പിന്തുടരുന്ന സ്ഥാപനത്തിന്റെ ഏറ്റവും മികച്ച പ്രതികരണമാണിത് ക്യു 1 * . ഫംഗ്ഷന്റെ രൂപമനുസരിച്ച് മുൻനിര സ്ഥാപനത്തിന് അതിന്റെ പേഓഫ് ഫംഗ്ഷൻ പരമാവധിയാക്കാനാകും ക്യു 2*. വേരിയബിളിലെ ഫംഗ്ഷന്റെ പരമാവധി പോയിന്റ് Π 1 ക്യു 1 മാറ്റിസ്ഥാപിക്കുമ്പോൾ ക്യു 2 * ചെയ്യും
എന്ന പദപ്രയോഗത്തിലേക്ക് ഇത് മാറ്റിസ്ഥാപിക്കുന്നു ക്യു 2 * , നമുക്ക് ലഭിക്കുന്നു
അങ്ങനെ, സന്തുലിതാവസ്ഥയിൽ, ലീഡർ സ്ഥാപനം പിന്തുടരുന്ന സ്ഥാപനത്തിന്റെ ഇരട്ടി ഉൽപ്പാദനം ഉത്പാദിപ്പിക്കുന്നു.
ഒരൊറ്റ ചാർട്ടിൽ വിതരണ, ഡിമാൻഡ് ലൈനുകൾ സംയോജിപ്പിച്ച്, നമുക്ക് ലഭിക്കും ഗ്രാഫിക് ചിത്രംകോർഡിനേറ്റുകളിലെ സന്തുലിതാവസ്ഥ പി, ക്യു(ചിത്രം 2.6). വരികളുടെ വിഭജന പോയിന്റിന് കോർഡിനേറ്റുകൾ ഉണ്ട് (P * , Q*),എവിടെ R* -സന്തുലിത വില, ചോദ്യം*- ഉൽപാദനത്തിന്റെയും ഉപഭോഗത്തിന്റെയും സന്തുലിത അളവ്.
വിപണി സന്തുലിതാവസ്ഥ- ഇത് വിപണിയുടെ ഒരു അവസ്ഥയാണ്, ഒരു നിശ്ചിത വില നിലവാരത്തിന്, ആവശ്യപ്പെടുന്ന അളവ് വിതരണം ചെയ്ത അളവിന് തുല്യമാണ്.
ബാലൻസ് പോയിന്റിൽ മാത്രം ഇവിപണി സന്തുലിതമാണ്, മാർക്കറ്റ് ഏജന്റുമാർക്കൊന്നും സാഹചര്യം മാറ്റാൻ പ്രോത്സാഹനമില്ല. ഇതിനർത്ഥം മാർക്കറ്റ് സന്തുലിതാവസ്ഥയ്ക്ക് പ്രോപ്പർട്ടി ഉണ്ടെന്നാണ് സുസ്ഥിരത -സന്തുലിതാവസ്ഥയില്ലാത്ത അവസ്ഥയിൽ, വിപണിയെ സന്തുലിതാവസ്ഥയിലേക്ക് തിരികെ കൊണ്ടുവരാൻ മാർക്കറ്റ് ഏജന്റുമാരെ പ്രേരിപ്പിക്കുന്നു. സ്ഥിരത തെളിയിക്കാൻ, എൽ. വാൽറാസിന്റെയോ എ. മാർഷലിന്റെയോ യുക്തിയാണ് സാധാരണയായി ഉപയോഗിക്കുന്നത്.
എൽ. വാൽറാസിന്റെ അഭിപ്രായത്തിൽ, വളരെ ഉയർന്ന വിലയിൽ, അധിക വിതരണമുണ്ട് - അമിത ഉൽപാദനം (വിഭാഗം എ-ബിഅത്തിപ്പഴത്തിൽ. 2.6i), അത്തരമൊരു മാർക്കറ്റിനെ വിളിക്കുന്നു വാങ്ങുന്നയാളുടെ വിപണിഇടപാടുകൾ അവസാനിപ്പിക്കുമ്പോൾ വിലകുറവ് ആവശ്യപ്പെടാൻ വാങ്ങുന്നയാൾക്ക് അവസരമുണ്ട്. അത്തരമൊരു സാഹചര്യത്തിൽ, ഒന്നാമതായി, വിൽപ്പനക്കാരന് താൽപ്പര്യമില്ല, ആരാണ് വില കുറയ്ക്കാനും ഉൽപ്പാദന അളവ് കുറയ്ക്കാനും നിർബന്ധിതരായത്. വില കുറയുമ്പോൾ, ഡിമാൻഡ് അളവ് വർദ്ധിക്കുന്നു എ-ബിഒരു സന്തുലിത ബിന്ദു ആകുന്നതുവരെ ചുരുങ്ങുന്നു ഇ.
ചെയ്തത് കുറഞ്ഞ വിലആവശ്യത്തിന് അധികമുണ്ട് - ഒരു കുറവ് (സെഗ്മെന്റ് CFna ചിത്രം. 2.6a), വികസിക്കുന്നു വിൽപ്പനക്കാരന്റെ വിപണി.വാങ്ങുന്നയാൾ നിർബന്ധിതനാണ്
ഒരു ഉപഭോക്താവ് ഉപഭോഗം വെട്ടിക്കുറയ്ക്കുകയും ഒരു തുച്ഛമായ സാധനത്തിന് അമിതമായി പണം നൽകുകയും ചെയ്താൽ, വില ഉയരുന്നതിനനുസരിച്ച്, വിതരണം ചെയ്യുന്ന അളവ് വർദ്ധിക്കുകയും, വിപണി സന്തുലിതമാകുന്നതുവരെ ക്ഷാമം ചുരുങ്ങുകയും ചെയ്യും.
എ. മാർഷലിന്റെ അഭിപ്രായത്തിൽ (ചിത്രം. 2.66), ചെറിയ അളവിലുള്ള ഉൽപാദനത്തിന്, ഡിമാൻഡ് വില വിൽപ്പനക്കാരന്റെ വിലയേക്കാൾ കൂടുതലാണ്, വലിയ അളവുകൾക്ക് - തിരിച്ചും. ഏത് സാഹചര്യത്തിലും, അസന്തുലിതാവസ്ഥ സന്തുലിതാവസ്ഥയിലേക്ക് വിതരണത്തിന്റെയും ഡിമാൻഡിന്റെയും വിലയിലോ വോളിയത്തിലോ മാറ്റത്തെ ഉത്തേജിപ്പിക്കുന്നു. സന്തുലിതാവസ്ഥ (എ)വാൽറാസിന്റെ അഭിപ്രായത്തിൽ - വില വിതരണത്തിന്റെയും ഡിമാൻഡിന്റെയും അസന്തുലിതാവസ്ഥയെ നിയന്ത്രിക്കുന്നു, (ബി)മാർഷലിന്റെ അഭിപ്രായത്തിൽ - വാങ്ങുന്നയാളുടെയും വിൽപ്പനക്കാരന്റെയും വിലകൾ വോള്യങ്ങളിലെ മാറ്റത്താൽ സന്തുലിതമാണ്.
അരി. 2.6 വിപണി സന്തുലിതാവസ്ഥ സ്ഥാപിക്കൽ: സി) എൽ വാൽറാസ് അനുസരിച്ച്; ബി) എ മാർഷലിന്റെ അഭിപ്രായത്തിൽ
വിപണിയിലെ ഡിമാൻഡിലോ വിതരണത്തിലോ ഉള്ള മാറ്റം സന്തുലിതാവസ്ഥയിലെ മാറ്റത്തിലേക്ക് നയിക്കുന്നു (ചിത്രം 2.7). ഉദാഹരണത്തിന്, മാർക്കറ്റ് ഡിമാൻഡ് വർദ്ധിക്കുകയാണെങ്കിൽ, ഡിമാൻഡ് ലൈൻ വലത്തേക്ക് മാറുകയാണെങ്കിൽ, സന്തുലിത വിലയും അളവും വർദ്ധിക്കുന്നു. മാർക്കറ്റ് സപ്ലൈ കുറയുകയാണെങ്കിൽ, വിതരണ ലൈൻ ഇടതുവശത്തേക്ക് മാറുന്നു, അതിന്റെ ഫലമായി വിലയിൽ വർദ്ധനവും അളവ് കുറയുന്നു.
ഈ മോഡൽസമയം അതിൽ ദൃശ്യമാകാത്തതിനാൽ വിപണി നിശ്ചലമാണ്.
"സ്പൈഡർ" മോഡൽ
മാർക്കറ്റ് സന്തുലിതാവസ്ഥയുടെ ചലനാത്മക മാതൃകയുടെ ഉദാഹരണമായി, ഞങ്ങൾ ഏറ്റവും ലളിതമായ "കോബ്വെബ്" മോഡൽ അവതരിപ്പിക്കുന്നു. ആവശ്യപ്പെടുന്ന അളവ് നിലവിലെ കാലയളവിലെ വിലനിലവാരത്തെ ആശ്രയിച്ചിരിക്കുന്നുവെന്ന് കരുതുക ടി,കൂടാതെ വിതരണ അളവ് - മുൻ കാലയളവിലെ t-1 വിലയിൽ നിന്ന്:
Q d i = Q d i (P t) , Q s i = Q s i (P t -1) ,
ഇവിടെ t = 0.1….T എന്നത് സമയ കാലയളവിന്റെ പ്രത്യേക മൂല്യമാണ്.
അരി. 2.7 വിപണി സന്തുലിതാവസ്ഥയിലെ മാറ്റം:
a) ഡിമാൻഡിലെ വർദ്ധനവ് കാരണം; b)കുറവ് കാരണം
ഓഫറുകൾ
കമ്പോള വില പി ടിസന്തുലിത വിലയുമായി പൊരുത്തപ്പെടുന്നില്ലായിരിക്കാം R*,കൂടാതെ മൂന്ന് സാധ്യമായ ചലനാത്മകതകൾ ഉണ്ട് പി ടി(ചിത്രം 2.8).
ഈ മോഡലിലെ വികസന പാതയുടെ വകഭേദം വിതരണ, ഡിമാൻഡ് ലൈനുകളുടെ ചരിവുകളുടെ അനുപാതത്തെ ആശ്രയിച്ചിരിക്കുന്നു.
അരി. 2.8 വിപണി സന്തുലിതാവസ്ഥയുടെ "സ്പൈഡർ" മോഡൽ:
a) സന്തുലിതാവസ്ഥയിൽ നിന്നുള്ള വ്യതിയാനം കുറയുന്നു; 5) വ്യതിയാനം
സന്തുലിതാവസ്ഥയിൽ നിന്ന് വർദ്ധിക്കുന്നു ("ദുരന്തം" മാതൃക); സി) വിപണി
സന്തുലിത പോയിന്റിന് ചുറ്റും ചാക്രികമായി ആന്ദോളനം ചെയ്യുന്നു, എന്നാൽ സന്തുലിതാവസ്ഥ