रैखिक प्रोग्रामिंग में द्वंद्व। संतुलन के प्रकार: नैश संतुलन, स्टेकेलबर्ग, पारेतो-इष्टतम संतुलन, प्रमुख रणनीतियों का संतुलन संतुलन का समाधान खोजने के लिए इष्टतम तंत्र क्या है

द्वैत सिद्धांत की मूल परिभाषाएँ.

प्रत्येक रैखिक प्रोग्रामन समस्या को अन्य रैखिक प्रोग्रामन समस्या से जोड़ा जा सकता है। इनमें से एक का समाधान होने पर दूसरी समस्या का स्वत: ही समाधान हो जाता है। ऐसे कार्यों को परस्पर द्वैत कहा जाता है। आइए देखें कि किसी दी गई समस्या (हम इसे मूल समस्या कहेंगे) में हम इसकी दोहरी रचना कैसे कर सकते हैं।

नियोजित आउटपुट की समस्या पर विचार करें।

एफ = 3 एक्स 1 + 5एक्स 2 + 4एक्स 3 + 5एक्स 4 → अधिकतम।
5x 1 +0.4x 2 +2x 3 +0.5x 4 ≤400
5x2 +x3 +x4 ≤300
एक्स 1 + एक्स 3 + एक्स 4 ≤100
x 1 ≥0, x 2 ≥0, x 3 ≥0, x 4 ≥0

दोहरी समस्या के संकलन के लिए सामान्य नियम:

सीधा दोहरी
लक्ष्य समारोह (अधिकतम) बाधाओं का दाहिना हाथ
बाधाओं का दाहिना हाथ लक्ष्य समारोह (न्यूनतम)
ए - बाधा मैट्रिक्स ए टी - बाधा मैट्रिक्स
मैं -वें बाधा: ≤ 0, (≥ 0) चर y i ≥ 0, (≤ 0)
मैं -वाँ बाधा: = 0 चर y मैं ≠ 0
चर x j ≥ 0 (≤ 0)
चर x j ≠ 0 जे-वें बाधा: = 0
अधिकतम → न्यूनतम
सीधा दोहरी
लक्ष्य समारोह (न्यूनतम) बाधाओं का दाहिना हाथ
बाधाओं का दाहिना हाथ लक्ष्य समारोह (अधिकतम)
ए - बाधा मैट्रिक्स ए टी - बाधा मैट्रिक्स
मैं -वें बाधा: ≥ 0, (≤ 0) चर y i ≥ 0, (≤ 0)
मैं -वाँ बाधा: = 0 चर y मैं ≠ 0
चर x j ≥ 0 (≤ 0) जे -थ बाधा: ≤ 0 (≥ 0)
चर x j ≠ 0 जे-वें बाधा: = 0

आइए निम्नलिखित नियमों के अनुसार इसकी दोहरी समस्या का निर्माण करें।

  1. दोहरी समस्या में चरों की संख्या मूल समस्या में असमानताओं की संख्या के बराबर है।
  2. दोहरी समस्या के गुणांकों के मैट्रिक्स को मूल एक के गुणांकों के मैट्रिक्स में स्थानांतरित किया जाता है।
  3. मूल समस्या की मुक्त शर्तों का स्तंभ दोहरे उद्देश्य समारोह के लिए गुणांक की एक पंक्ति है। उद्देश्य फलन एक समस्या में अधिकतम होता है और दूसरी में न्यूनतम होता है।
  4. मूल समस्या के चरों की गैर-नकारात्मकता के लिए शर्तें दूसरी दिशा में निर्देशित दोहरी समस्या की असमानताओं-प्रतिबंधों के अनुरूप हैं। और इसके विपरीत, मूल में असमानताएं-प्रतिबंध द्वैत में गैर-नकारात्मकता की स्थितियों के अनुरूप हैं।

ध्यान दें कि कार्य I के मैट्रिक्स की पंक्तियाँ कार्य II के मैट्रिक्स के स्तंभ हैं। इसलिए, समस्या II में चर y i के गुणांक क्रमशः समस्या I में i -th असमानता के गुणांक हैं।
परिणामी मॉडल प्रत्यक्ष समस्या से दोहरी समस्या का आर्थिक और गणितीय मॉडल है।

तीरों से जुड़ी असमानताएँ होंगी कॉल संयुग्म.
द्वैत समस्या का अर्थपूर्ण निरूपण: संसाधनों Y = (y 1 , y 2 ..., y m) की कीमतों (अनुमान) का ऐसा सेट खोजें, जिस पर संसाधनों की कुल लागत न्यूनतम होगी, बशर्ते कि प्रत्येक प्रकार के उत्पादन में संसाधनों की लागत उत्पाद का लाभ लाभ से कम नहीं होगा (इन उत्पादों की बिक्री से आय।
संसाधन मूल्य y 1 , y 2 ..., y m प्राप्त आर्थिक साहित्य में विभिन्न शीर्षक: लेखांकन, निहित, छाया। इन नामों का अर्थ यह है कि ये सशर्त, "नकली" मूल्य हैं। 1 से "बाहरी" कीमतों के विपरीत, 2 से ..., एन से उत्पादों के लिए, ज्ञात, एक नियम के रूप में, उत्पादन शुरू होने से पहले, संसाधनों की कीमतें y 1 , y 2 ..., y m आंतरिक हैं , क्योंकि वे बाहर से सेट नहीं होते हैं, लेकिन समस्या को हल करने के परिणामस्वरूप सीधे निर्धारित होते हैं, इसलिए उन्हें अक्सर संसाधन अनुमान कहा जाता है।
प्रत्यक्ष और दोहरी समस्याओं के बीच संबंध, विशेष रूप से, इस तथ्य में निहित है कि उनमें से एक का समाधान सीधे दूसरे के समाधान से प्राप्त किया जा सकता है।

द्वैत प्रमेय

रैखिक प्रोग्रामिंग सिद्धांत में द्वैत एक मौलिक अवधारणा है। द्वैत सिद्धांत के मुख्य परिणाम दो प्रमेयों में समाहित हैं जिन्हें द्वैत प्रमेय कहा जाता है।

पहला द्वैत प्रमेय.

यदि दोहरी समस्याओं I और II की जोड़ी में से एक हल करने योग्य है, तो दूसरी हल करने योग्य है, और इष्टतम योजनाओं पर उद्देश्य कार्यों के मान समान हैं, एफ(एक्स*) = जी(वाई*), जहाँ x *, y * - समस्याओं I और II का इष्टतम समाधान

दूसरा द्वैत प्रमेय.

योजनाएँ x * और y * समस्या I और II में इष्टतम हैं यदि और केवल तभी, जब उन्हें क्रमशः I और II की समस्याओं की व्यवस्था में प्रतिस्थापित किया जाता है, कम से कम संयुग्मित असमानताओं की किसी भी जोड़ी में से एक समानता बन जाती है।
यह मौलिक द्वैत प्रमेय. दूसरे शब्दों में, यदि x * और y * मौलिक और दोहरी समस्याओं के व्यवहार्य समाधान हैं, और यदि c T x*=b T y*, तो x * और y * दोहरी समस्याओं की एक जोड़ी के इष्टतम समाधान हैं।

तीसरा द्वैत प्रमेय. दोहरी समस्या के इष्टतम समाधान में चर y i के मान बाधाओं की प्रणाली के मुक्त सदस्यों b i के प्रभाव का अनुमान हैं - इस समस्या के उद्देश्य समारोह के मूल्य पर प्रत्यक्ष समस्या की असमानताएं:
Δf(x) = b i y i

एलएलपी को सरल विधि द्वारा हल करते हुए, हम एक साथ दोहरी एलएलपी को हल करते हैं। इष्टतम योजना में दोहरी समस्या y i के चर के मूल्यों को वस्तुनिष्ठ रूप से निर्धारित या दोहरे अनुमान कहा जाता है। लागू समस्याओं में, दोहरे अनुमान y i को अक्सर छुपा हुआ, छाया मूल्य या सीमांत संसाधन अनुमान कहा जाता है।

पारस्परिक रूप से दोहरी समस्याओं की संपत्ति

  1. एक समस्या में, एक रैखिक फलन का अधिकतम मांगा जाता है, दूसरी में, न्यूनतम।
  2. एक समस्या के रैखिक फलन में चरों के गुणांक दूसरी समस्या में व्यवरोधों की व्यवस्था के मुक्त सदस्य होते हैं।
  3. प्रत्येक समस्या को मानक रूप में दिया गया है, और अधिकतमकरण समस्या में सभी असमानताओं को ≤ के रूप में दिया गया है, और न्यूनीकरण की समस्या में सभी असमानताओं को ≥ के रूप में दिया गया है।
  4. दोनों समस्याओं की बाधा प्रणालियों में चर के लिए गुणांक मैट्रिसेस एक दूसरे के लिए स्थानांतरित किए जाते हैं:
  5. एक समस्या की बाधा प्रणाली में असमानताओं की संख्या दूसरी समस्या में चरों की संख्या के समान है।
  6. चरों की गैर-नकारात्मकता के लिए शर्तें दोनों समस्याओं में मौजूद हैं।

संतुलन प्रमेय

कार्य 2
समस्या 1 के लिए दोहरी समस्या लिखें। इसे खोजें संतुलन प्रमेय द्वारा समाधान.
3x1 +x2 ≥12
एक्स1 +2x2 ≥14
4x1 +11x2 ≥68

संतुलन प्रमेय . चलो X*=(x 1 *,...,x n *) और Y*=(y 1 *,...,y n *) सममित रूप में दोहरी समस्याओं की एक जोड़ी के स्वीकार्य डिजाइन हो। ये योजनाएँ इष्टतम हैं यदि और केवल यदि निम्नलिखित पूरक ढिलाई की शर्तें पूरी होती हैं:


प्रमेय 4 हमें दोहरी समस्याओं की एक जोड़ी को दूसरे को हल करके इष्टतम समाधान निर्धारित करने की अनुमति देता है। यदि इष्टतम समाधान को प्रतिस्थापित करने पर एक समस्या की बाधा सख्त असमानता में बदल जाती है, तो दोहरी समस्या के इष्टतम समाधान में संबंधित दोहरा चर 0 के बराबर होता है। यदि कोई चर एक समस्या की इष्टतम योजना में सकारात्मक है, तो द्वैत समस्या का संगत व्यवरोध एक समीकरण है।
आइए हम पूरक सुस्ती की स्थितियों की आर्थिक व्याख्या करें। यदि इष्टतम समाधान में कुछ कच्चे माल का अनुमान 0 के अलावा है, तो इसका पूरी तरह से उपयोग किया जाएगा (संसाधन दुर्लभ है)। यदि कच्चा माल पूरी तरह से उपभोग नहीं किया गया है (अधिक मात्रा में है), तो इसका मूल्यांकन 0 के बराबर है। इस प्रकार, हम प्राप्त करते हैं कि दोहरे आकलन कच्चे माल की कमी का एक उपाय हैं। अनुमान से पता चलता है कि संबंधित कच्चे माल के स्टॉक में 1 यूनिट की वृद्धि के साथ उद्देश्य फ़ंक्शन का मूल्य कितना बढ़ जाएगा। यदि एक निश्चित प्रकार के उत्पाद को उत्पादन योजना में शामिल किया जाता है, तो इसके उत्पादन की लागत उत्पादित उत्पाद की लागत के साथ मेल खाती है। यदि किसी उत्पाद के उत्पादन की लागत उत्पाद की लागत से अधिक है, तो उत्पाद का उत्पादन नहीं होता है।
यदि दोहरी समस्याओं की जोड़ी में से एक में दो चर होते हैं, तो इसे ग्राफिकल रूप से हल किया जा सकता है, और फिर, प्रमेय 3 और 4 का उपयोग करके दोहरी समस्या का समाधान ढूंढ सकते हैं। इस मामले में, 3 मामले उत्पन्न हो सकते हैं: दोनों समस्याओं का संभव समाधान है, केवल one के पास व्यवहार्य समाधान समस्या है, दोनों समस्याओं का कोई व्यवहार्य समाधान नहीं है।

उदाहरण 2
एक दोहरी समस्या की रचना करें और संतुलन प्रमेय का उपयोग करके इसका समाधान खोजें
एक्स 2 -2x 3 +2x 4 -2x 5 ≤4
-2x 1 -2x 2 +2x 3 +2x 4 +x 5 ≥2
एक्स मैं ≥0, मैं = 1.5
Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → अधिकतम, यदि मूल समस्या का समाधान ज्ञात है: Zmax=(3;4;0;0;0).
आइए एक दोहरी समस्या का निर्माण करें। हम मूल समस्या के लक्ष्य के साथ असमानताओं के संकेतों से सहमत हैं।

Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → अधिकतम
दोहरा कार्य:

W=4y 1 -2y 2 → मिनट
आइए हम संतुलन प्रमेय का उपयोग करके दोहरी समस्या का इष्टतम समाधान खोजें। आइए हम पूरक सुस्ती की शर्तों को लिखें।
y 1 (4-(x 2 -2x 3 +2x 4 -2x 5))=0
y 2 (-2-(2x 1 -2x 2 -2x 3 -2x 4 -x 5))=0
x 1 (-2y 2 -10)=0
x 2 (y 1 -2y 2 +9)=0
x 3 (-2y 1 -2y 2 +19)=0
x 4 (2y 1 -2y 2 +13)=0
x 5 (-2y 1 -y 2 +11)=0
संकलित प्रणाली में मूल समस्या के इष्टतम समाधान को प्रतिस्थापित करते हैं: x 1 =3, x 2 =4, x 3 =0, x 4 =0, x 5 =0।
y 1 (4-(4-2 0+2 0-2 0))=0
y 2 (-2-(2 3-2 4-2 0-2 0-0))=0 W(y 1 , y 2 , y 3)=12y 1 +31y 2 +18y 3 → मैक्स । प्रमेय 3 द्वारा Zmax=Wmin=100000।
अंत में, Wmin=W(0; 4000/7; 32000/21) = 100000

एक विरोधी खेल में, इष्टतम परिणाम पर विचार करना स्वाभाविक है जिसमें किसी भी खिलाड़ी के लिए इससे विचलित होना लाभहीन है। इस तरह के परिणाम (x*,y*) को संतुलन की स्थिति कहा जाता है, और संतुलन की स्थिति खोजने के आधार पर इष्टतमता के सिद्धांत को संतुलन सिद्धांत कहा जाता है।

परिभाषा. मैट्रिक्स गेम में आयामों के मैट्रिक्स के साथ, परिणाम है संतुलन की स्थितिया एक काठी बिंदु अगर

एक काठी बिंदु पर, एक मैट्रिक्स तत्व इसकी पंक्ति में न्यूनतम और उसके स्तंभ में अधिकतम दोनों होता है। उदाहरण से खेल में, तत्व 2 एक 33एक काठी बिंदु है। इस खेल में इष्टतम दोनों खिलाड़ियों के लिए तीसरी रणनीति है। यदि पहला खिलाड़ी तीसरी रणनीति से भटक जाता है, तो वह कम से कम जीतना शुरू कर देता है एक 33. यदि दूसरा खिलाड़ी तीसरी रणनीति से भटक जाता है, तो वह अधिक से अधिक खोने लगता है एक 33. इस प्रकार, दोनों खिलाड़ियों के लिए, तीसरी रणनीति पर लगातार टिके रहने से बेहतर कुछ नहीं है।

इष्टतम व्यवहार का सिद्धांत: यदि मैट्रिक्स गेम में एक काठी बिंदु है, तो इष्टतम रणनीति काठी बिंदु के अनुरूप विकल्प है। यदि गेम में एक से अधिक सैडल पॉइंट हों तो क्या होगा?

प्रमेय. होने देना एक मैट्रिक्स गेम में दो मनमाना काठी बिंदु। तब:

सबूत. संतुलन की स्थिति की परिभाषा से, हमारे पास:

आइए असमानता के बाएँ पक्ष में (2.8), और दाएँ पक्ष में - , असमानता के बाएँ पक्ष में (2.9) - , दाएँ पक्ष में - . तब हमें मिलता है:

समानता कहां से आती है:

यह प्रमेय से अनुसरण करता है कि अदायगी फ़ंक्शन सभी संतुलन स्थितियों में समान मान लेता है। इसलिए नंबर कहा जाता है खेल की कीमत पर. और किसी भी काठी बिंदु से संबंधित रणनीतियों को कहा जाता है इष्टतम रणनीतियाँखिलाड़ी 1 और 2, क्रमशः। (2.7) के आधार पर, खिलाड़ी की सभी इष्टतम रणनीतियाँ विनिमेय हैं।

खिलाड़ियों के व्यवहार की इष्टतमता नहीं बदलेगी यदि खेल में रणनीतियों का सेट समान रहता है, और अदायगी समारोह को एक सकारात्मक स्थिरांक से गुणा किया जाता है (या इसमें एक स्थिर संख्या जोड़ी जाती है)।

प्रमेय. मैट्रिक्स गेम में एक काठी बिंदु (i*,j*) के अस्तित्व के लिए, यह आवश्यक और पर्याप्त है कि अधिकतम न्यूनतम न्यूनतम के बराबर हो:

(2.10)

सबूत. आवश्यकता।अगर (i*,j*) एक काठी बिंदु है, तो, (2.6) के अनुसार:

(2.11)

हालाँकि, हमारे पास है:

(2.12)

(2.11) और (2.12) से हम पाते हैं:

(2.13)

इसी तरह तर्क करते हुए, हम समानता पर पहुँचते हैं:

इस प्रकार,

दूसरी ओर, विपरीत असमानता (2.5) हमेशा संतुष्ट होती है, इसलिए (2.10) सत्य है।

पर्याप्तता. माना (2.10) सत्य है। आइए हम एक काठी बिंदु के अस्तित्व को सिद्ध करें। अपने पास:

समानता (2.10) के अनुसार, असमानताएं (2.15) और (2.16) समानता में बदल जाती हैं। जिसके बाद हमारे पास है:

प्रमेय सिद्ध हो चुका है। यह भी सिद्ध हो चुका है सामान्य अर्थमैक्सिमिन और मिनिमैक्स गेम की कीमत के बराबर है।

मिश्रित खेल विस्तार

एक मैट्रिक्स गेम जी पर विचार करें। यदि इसमें संतुलन की स्थिति है, तो मिनिमैक्स मैक्सिमम के बराबर है। इसके अलावा, प्रत्येक खिलाड़ी दूसरे खिलाड़ी को उसकी इष्टतम रणनीति के बारे में जानकारी बता सकता है। उसका विरोधी इस जानकारी से कोई अतिरिक्त लाभ प्राप्त नहीं कर पाएगा। अब मान लीजिए कि खेल G में संतुलन की कोई स्थिति नहीं है। तब:

इस मामले में, न्यूनतम और अधिकतम रणनीतियाँ स्थिर नहीं हैं। खिलाड़ियों को अधिक भुगतान प्राप्त करने की संभावना से संबंधित अपनी विवेकपूर्ण रणनीतियों से विचलित होने के लिए प्रोत्साहन मिल सकता है, लेकिन हारने का जोखिम भी हो सकता है, यानी विवेकपूर्ण रणनीति का उपयोग करने से कम भुगतान प्राप्त करना। जोखिम भरी रणनीतियों का उपयोग करते समय, प्रतिद्वंद्वी को उनके बारे में जानकारी के हस्तांतरण के हानिकारक परिणाम होते हैं: सतर्क रणनीति का उपयोग करने की तुलना में खिलाड़ी को स्वचालित रूप से कम भुगतान प्राप्त होता है।

उदाहरण 3. गेम मैट्रिक्स को इस तरह दिखने दें:

ऐसे मैट्रिक्स के लिए, यानी संतुलन मौजूद नहीं है। खिलाड़ियों की सतर्क रणनीतियाँ i*=1, j*=2 हैं। खिलाड़ी 2 को रणनीति j*=2 का पालन करने दें, और खिलाड़ी 1 को रणनीति i=2 चुनने दें। तो बाद वाले को 3 का भुगतान प्राप्त होगा, जो अधिकतम से दो यूनिट अधिक है। यदि, हालांकि, खिलाड़ी 2 खिलाड़ी 1 की योजनाओं के बारे में अनुमान लगाता है, तो वह अपनी रणनीति को j=1 में बदल देगा, और फिर पहले वाले को 0 का भुगतान प्राप्त होगा, जो कि उसकी अधिकतम सीमा से कम है। दूसरे खिलाड़ी के लिए भी इसी तरह का तर्क दिया जा सकता है। सामान्य तौर पर, हम यह निष्कर्ष निकाल सकते हैं कि खेल के एक अलग खेल में एक साहसिक रणनीति का उपयोग गारंटी से अधिक परिणाम ला सकता है, लेकिन इसका उपयोग जोखिम से जुड़ा है। सवाल उठता है, क्या एक विश्वसनीय सतर्क रणनीति को एक साहसिक रणनीति के साथ जोड़ना संभव है ताकि आपके औसत भुगतान में वृद्धि हो सके? अनिवार्य रूप से, सवाल यह है कि खिलाड़ियों के बीच अदायगी (2.17) को कैसे विभाजित किया जाए?

यह पता चला है कि मिश्रित रणनीति का उपयोग करना एक उचित समाधान है, यानी शुद्ध रणनीतियों का एक यादृच्छिक विकल्प। याद करें कि खिलाड़ी 1 की रणनीति मिश्रित कहलाती है, अगर i-th पंक्ति का चुनाव उसके द्वारा कुछ प्रायिकता p i के साथ किया जाता है।संभाव्यता वितरण के साथ ऐसी रणनीति की पहचान की जा सकती है एकाधिक लाइनों पर। मान लीजिए कि पहले खिलाड़ी के पास m शुद्ध रणनीतियाँ हैं और दूसरे खिलाड़ी के पास n शुद्ध रणनीतियाँ हैं। फिर उनकी मिश्रित रणनीतियाँ प्रायिकता वैक्टर हैं:

(2.18)

उदाहरण 3 में पहले खिलाड़ी के लिए दो संभावित मिश्रित रणनीतियों पर विचार करें: . ये रणनीतियाँ शुद्ध रणनीतियों के बीच संभाव्यता वितरण में भिन्न होती हैं। यदि पहले मामले में मैट्रिक्स की पंक्तियों को खिलाड़ी द्वारा समान संभावनाओं के साथ चुना जाता है, तो दूसरे मामले में - अलग-अलग लोगों के साथ। जब हम मिश्रित रणनीति की बात करते हैं, तो हमारा मतलब होता है यादृच्छिक पसंद"यादृच्छिक रूप से" विकल्प नहीं, बल्कि एक यादृच्छिक तंत्र के काम के आधार पर एक विकल्प जो हमें आवश्यक संभाव्यता वितरण प्रदान करता है। तो मिश्रित रणनीतियों में से पहली के कार्यान्वयन के लिए, एक सिक्का टॉस अच्छी तरह से अनुकूल है। सिक्का कैसे गिरता है इसके आधार पर खिलाड़ी पहली पंक्ति या दूसरी पंक्ति चुनता है। औसतन, खिलाड़ी पहली पंक्ति और दूसरी पंक्ति दोनों को समान रूप से अक्सर चुनता है, लेकिन खेल के एक विशेष पुनरावृत्ति पर चुनाव किसी निश्चित नियम के अधीन नहीं होता है और गोपनीयता की अधिकतम डिग्री होती है: यादृच्छिक तंत्र के कार्यान्वयन से पहले , यह पहले खिलाड़ी के लिए भी अज्ञात है। दूसरी मिश्रित रणनीति को लागू करने के लिए, ड्रा तंत्र उपयुक्त है। खिलाड़ी कागज के सात समान टुकड़े लेता है, उनमें से तीन को एक क्रॉस के साथ चिह्नित करता है, और उन्हें टोपी में फेंक देता है। फिर, बेतरतीब ढंग से, वह उनमें से एक को निकालता है। शास्त्रीय संभाव्यता सिद्धांत के अनुसार, वह 3/7 की संभावना के साथ एक क्रॉस के साथ कागज का एक टुकड़ा और 4/7 की संभावना के साथ एक साफ कागज का टुकड़ा निकालेगा। ऐसा ड्रा मैकेनिज्म किसी भी तर्कसंगत संभावनाओं को साकार करने में सक्षम है।

खिलाड़ियों को मिश्रित रणनीतियों (2.18) का पालन करने दें। फिर खेल के एकल पुनरावृत्ति में पहले खिलाड़ी का भुगतान एक यादृच्छिक चर है: वी (एक्स, वाई). चूंकि खिलाड़ी एक-दूसरे से स्वतंत्र रूप से रणनीतियों का चयन करते हैं, इसलिए प्रायिकता गुणन प्रमेय के अनुसार, एक जीत के साथ एक परिणाम (i, j) चुनने की संभावना संभावनाओं के उत्पाद के बराबर होती है। फिर यादृच्छिक चर का वितरण नियम वी (एक्स, वाई)निम्न तालिका द्वारा दिया गया

अब खेल को अनिश्चित काल तक चलने दें। फिर ऐसे खेल में औसत अदायगी मूल्य की गणितीय अपेक्षा के बराबर होती है वी (एक्स, वाई).

(2.19)

जब अंतिम लेकिन पर्याप्त बड़ी संख्याखेल के पुनरावृत्तियों, औसत भुगतान मूल्य (2.19) से थोड़ा अलग होगा।

उदाहरण 4. उदाहरण 3 से खेल के लिए औसत अदायगी (2.19) की गणना करें जब खिलाड़ी निम्नलिखित रणनीतियों का उपयोग करते हैं: . अदायगी मैट्रिक्स और प्रायिकता मैट्रिक्स इस प्रकार हैं:

आइए औसत खोजें:

इस प्रकार, औसत अदायगी (2.20) अधिकतम और न्यूनतम के बीच मध्यवर्ती है।

चूंकि मिश्रित रणनीतियों X और Y की किसी भी जोड़ी के लिए खेल के औसत मूल्य की गणना करना संभव है, तो इष्टतम रणनीति खोजने की समस्या उत्पन्न होती है। सतर्क रणनीतियों की खोज करके शुरुआत करना स्वाभाविक है। पहले खिलाड़ी की सतर्क रणनीति उसे अधिकतम प्रदान करती है। दूसरे खिलाड़ी की सतर्क रणनीति पहले को मिनिमैक्स से अधिक जीतने की अनुमति नहीं देती है। विपरीत रुचियों वाले खेलों के सिद्धांत में सबसे महत्वपूर्ण परिणाम निम्नलिखित माना जा सकता है:

प्रमेय. प्रत्येक मैट्रिक्स गेम में मिश्रित रणनीतियों में संतुलन की स्थिति होती है. इस प्रमेय का प्रमाण आसान नहीं है। इस पाठ्यक्रम में इसे छोड़ दिया गया है।

नतीजे: एक संतुलन स्थिति के अस्तित्व का मतलब है कि अधिकतम न्यूनतम न्यूनतम के बराबर है, और इसलिए किसी भी मैट्रिक्स गेम की कीमत होती है। पहले खिलाड़ी के लिए इष्टतम रणनीति अधिकतम रणनीति है। दूसरे की इष्टतम रणनीति न्यूनतम है। चूंकि इष्टतम रणनीतियों को खोजने की समस्या हल हो गई है, हम कहते हैं कि कोई भी मैट्रिक्स गेम व्याख्या करने योग्यमिश्रित रणनीतियों के एक सेट पर।

खेल 2x2 का समाधान

उदाहरण 5. खेल को हल करें। यह सत्यापित करना कठिन नहीं है कि कोई काठी बिंदु नहीं है। पहले खिलाड़ी की इष्टतम रणनीति को निरूपित करें (एक्स, 1-एक्स)एक कॉलम वेक्टर है, लेकिन सुविधा के लिए हम इसे एक स्ट्रिंग के रूप में लिखते हैं। दूसरे खिलाड़ी की इष्टतम रणनीति को निरूपित करें (वाई, 1-वाई).

निम्नलिखित वितरण के साथ पहले खिलाड़ी का भुगतान एक यादृच्छिक चर है:

वी (एक्स, वाई) 2 -1 -4 7
पी xy एक्स (1-वाई) (1x)वाई (1-एक्स)(1-वाई)

हम पहले खिलाड़ी के पुनरावृत्ति के लिए औसत अदायगी पाते हैं - एक यादृच्छिक चर की गणितीय अपेक्षा वी (एक्स, वाई):

आइए इस अभिव्यक्ति को रूपांतरित करें:

इस गणितीय अपेक्षा में एक स्थिरांक (5/7) और एक परिवर्तनशील भाग होता है: 14(x-11/14)(y-8/14). यदि मान वाई 8/14 से अलग, तो पहला खिलाड़ी हमेशा चुन सकता है एक्सइस तरह से परिवर्तनशील भाग को सकारात्मक बनाने के लिए, अपनी जीत को बढ़ाते हुए। यदि मान एक्स 11/14 से अलग, तो दूसरा खिलाड़ी हमेशा चुन सकता है वाईताकि चर भाग को नकारात्मक बनाया जा सके, पहले खिलाड़ी के भुगतान को कम किया जा सके। इस प्रकार, काठी बिंदु समानता द्वारा परिभाषित किया गया है: x*=11/14, y*=8/14।

2.5 गेम सॉल्विंग

एक उदाहरण दिखाएगा कि ऐसे खेलों को कैसे हल किया जाए।

उदाहरण 6. खेल को हल करें . हम सुनिश्चित करते हैं कि कोई सैडल पॉइंट नहीं है. पहले खिलाड़ी की मिश्रित रणनीति को निरूपित करें एक्स = (एक्स, 1-एक्स)एक कॉलम वेक्टर है, लेकिन सुविधा के लिए हम इसे एक स्ट्रिंग के रूप में लिखते हैं।

पहले खिलाड़ी को एक्स रणनीति लागू करने दें, और दूसरा - उसका जे-वें साफरणनीति। आइए हम इस स्थिति में पहले खिलाड़ी के औसत अदायगी को इस रूप में निरूपित करें। अपने पास:

आइए सेगमेंट पर फ़ंक्शंस (2.21) के ग्राफ़ बनाएं।

किसी भी रेखा खंड पर स्थित एक बिंदु का समन्वय पहले खिलाड़ी के भुगतान से उस स्थिति में मेल खाता है जहां वह एक मिश्रित रणनीति का उपयोग करता है (एक्स, (1-एक्स)), और दूसरा खिलाड़ी इसी शुद्ध रणनीति। पहले खिलाड़ी का गारंटीकृत परिणाम लाइनों के परिवार (टूटा एबीसी) का निचला लिफाफा है। सबसे ऊंचा स्थानयह टूटी हुई रेखा (बिंदु B) खिलाड़ी 1 का अधिकतम गारंटीकृत परिणाम है। बिंदु B का भुज पहले खिलाड़ी की इष्टतम रणनीति से मेल खाता है।

चूँकि वांछित बिंदु B रेखाओं का प्रतिच्छेदन है और, उसके भुज को समीकरण के हल के रूप में पाया जा सकता है:

इस प्रकार, पहले खिलाड़ी की इष्टतम मिश्रित रणनीति (5/9, 4/9) है। बिंदु B का समन्वय खेल का मूल्य है। यह इसके बराबर है:

(2.22)

ध्यान दें कि दूसरे खिलाड़ी की दूसरी रणनीति से संबंधित रेखा बिंदु B के ऊपर से गुजरती है। इसका मतलब है कि यदि पहला खिलाड़ी अपनी इष्टतम रणनीति लागू करता है, और खिलाड़ी 2 दूसरी रणनीति का उपयोग करता है, तो रणनीति लागू करने की तुलना में दूसरे खिलाड़ी की हानि बढ़ जाती है। 1 या 3। इस प्रकार, दूसरी रणनीति को दूसरे खिलाड़ी की इष्टतम रणनीति में भाग नहीं लेना चाहिए। खिलाड़ी 2 के लिए इष्टतम रणनीति होनी चाहिए: . दूसरे खिलाड़ी की शुद्ध रणनीति 1 और 3 जिसमें इष्टतम रणनीति में गैर-शून्य घटक होते हैं, आमतौर पर कहलाते हैं महत्वपूर्ण. रणनीति 2 कहा जाता है तुच्छ. ऊपर दिए गए आंकड़े के साथ-साथ समानता (2.22) से यह देखा जा सकता है कि जब पहला खिलाड़ी अपनी इष्टतम रणनीति लागू करता है, तो दूसरे खिलाड़ी का भुगतान इस बात पर निर्भर नहीं करता है कि वह किस आवश्यक रणनीति का उपयोग करता है। वह आवश्यक (विशेष रूप से, इष्टतम) वाली किसी भी मिश्रित रणनीति को भी लागू कर सकता है, इस मामले में अदायगी भी नहीं बदलेगी। विपरीत मामले के लिए एक पूरी तरह से समान कथन भी सत्य है। यदि दूसरा खिलाड़ी अपनी इष्टतम रणनीति का उपयोग करता है, तो पहले खिलाड़ी का भुगतान इस बात पर निर्भर नहीं करता है कि वह अपनी कौन सी आवश्यक रणनीति का उपयोग करता है और खेल की लागत के बराबर है। इस कथन का उपयोग करते हुए, हम दूसरे खिलाड़ी के लिए इष्टतम रणनीति पाते हैं।

संघर्ष के सिद्धांत में इष्टतम रणनीतियाँ वे रणनीतियाँ हैं जो खिलाड़ियों को स्थिर संतुलन की ओर ले जाती हैं, अर्थात। कुछ स्थितियाँ जो सभी खिलाड़ियों को संतुष्ट करती हैं।

गेम थ्योरी में एक समाधान की इष्टतमता अवधारणा पर आधारित है संतुलन की स्थिति:

1) किसी भी खिलाड़ी के लिए संतुलन की स्थिति से हटना लाभदायक नहीं है यदि अन्य सभी उसमें बने रहते हैं,

2) संतुलन का अर्थ - खेल की बार-बार पुनरावृत्ति के साथ, खिलाड़ी किसी भी रणनीतिक स्थिति में खेल शुरू करते हुए संतुलन की स्थिति में पहुंच जाएंगे।

प्रत्येक अंतःक्रिया में, निम्न प्रकार के संतुलन मौजूद हो सकते हैं:

1. संतुलन सतर्क रणनीतियों में . खिलाड़ियों को प्रदान करने वाली रणनीतियों द्वारा निर्धारित गारंटीकृत परिणाम;

2. संतुलन प्रमुख रणनीतियों में .

हावी रणनीतिएक ऐसी कार्य योजना है जो दूसरे प्रतिभागी के कार्यों की परवाह किए बिना प्रतिभागी को अधिकतम लाभ प्रदान करती है। इसलिए, प्रमुख रणनीतियों का संतुलन खेल में दोनों प्रतिभागियों की प्रमुख रणनीतियों का प्रतिच्छेदन होगा।

यदि खिलाड़ियों की इष्टतम रणनीतियाँ उनकी अन्य सभी रणनीतियों पर हावी हो जाती हैं, तो खेल में प्रमुख रणनीतियों में एक संतुलन होता है। कैदी की दुविधा के खेल में, रणनीतियों का नैश संतुलन सेट होगा ("स्वीकार करें - स्वीकार करें")। इसके अलावा, यह ध्यान रखना महत्वपूर्ण है कि खिलाड़ी A और खिलाड़ी B दोनों के लिए "पहचानना" प्रमुख रणनीति है, जबकि "पहचानना नहीं" हावी है;

3. संतुलन नैश . नैश संतुलनदो या दो से अधिक खिलाड़ियों के खेल का एक प्रकार का निर्णय है, जिसमें कोई भी प्रतिभागी अपने निर्णय को एकतरफा बदलकर अदायगी में वृद्धि नहीं कर सकता है, जब अन्य प्रतिभागी अपना निर्णय नहीं बदलते हैं।

खेल कहते हैं एनसामान्य रूप में चेहरे, जहां शुद्ध रणनीतियों का सेट है और अदायगी का सेट है।

जब प्रत्येक खिलाड़ी रणनीति प्रोफाइल में एक रणनीति का चयन करता है, तो खिलाड़ी को भुगतान प्राप्त होता है। इसके अलावा, अदायगी रणनीतियों के पूरे प्रोफाइल पर निर्भर करती है: न केवल खिलाड़ी द्वारा चुनी गई रणनीति पर, बल्कि अन्य लोगों की रणनीतियों पर भी। रणनीति प्रोफ़ाइल एक नैश संतुलन है अगर इसकी रणनीति में बदलाव किसी भी खिलाड़ी के लिए फायदेमंद नहीं है, यानी किसी के लिए

एक खेल में शुद्ध और मिश्रित दोनों रणनीतियों में नैश संतुलन हो सकता है।

नैश ने साबित कर दिया कि अगर अनुमति दी जाए मिश्रित रणनीतियाँ, फिर प्रत्येक खेल में एनखिलाड़ियों के पास कम से कम एक नैश संतुलन होगा।

नैश संतुलन की स्थिति में, प्रत्येक खिलाड़ी की रणनीति उसे अन्य खिलाड़ियों की रणनीतियों के लिए सर्वश्रेष्ठ प्रतिक्रिया प्रदान करती है;

4. संतुलन स्टैकेलबर्ग. स्टैकेलबर्ग मॉडल- सूचना विषमता की उपस्थिति में एक ओलिगोपॉलिस्टिक बाजार का गेम-सैद्धांतिक मॉडल। इस मॉडल में, फर्मों के व्यवहार को पूरी जानकारी के साथ एक गतिशील गेम द्वारा वर्णित किया जाता है, जिसमें फर्मों के व्यवहार का उपयोग करके मॉडलिंग की जाती है। स्थिरके साथ खेल पूरी जानकारी. मुख्य विशेषताखेल एक अग्रणी फर्म की उपस्थिति है, जो माल के उत्पादन की मात्रा को स्थापित करने के लिए सबसे पहले है, और बाकी फर्मों को इसके द्वारा उनकी गणना में निर्देशित किया जाता है। खेल की बुनियादी पूर्वापेक्षाएँ:


उद्योग एक समान उत्पाद का उत्पादन करता है: विभिन्न फर्मों के उत्पादों में अंतर नगण्य है, जिसका अर्थ है कि खरीदार, जब किस फर्म से खरीदना है, केवल कीमत पर ध्यान केंद्रित करता है;

उद्योग में फर्मों की संख्या बहुत कम है।

कंपनियां उत्पादित उत्पादों की मात्रा निर्धारित करती हैं, और इसके लिए कीमत मांग के आधार पर निर्धारित होती है;

एक तथाकथित नेता फर्म है, जिसके उत्पादन की मात्रा पर अन्य फर्मों को निर्देशित किया जाता है।

इस प्रकार, स्टैकेलबर्ग मॉडल का उपयोग गतिशील खेलों में इष्टतम समाधान खोजने के लिए किया जाता है और खिलाड़ियों के अधिकतम भुगतान के अनुरूप होता है, जो उन स्थितियों पर आधारित होता है जो पहले से ही एक या अधिक खिलाड़ियों द्वारा की गई पसंद के बाद विकसित हुई हैं। स्टैकेलबर्ग संतुलन।- एक ऐसी स्थिति जहां कोई भी खिलाड़ी अपनी जीत को एकतरफा नहीं बढ़ा सकता है, और निर्णय पहले एक खिलाड़ी द्वारा किया जाता है और बन जाता है दूसरे के लिए जाना जाता हैखिलाड़ी। कैदी की दुविधा के खेल में, स्टैकेलबर्ग संतुलन वर्ग (1; 1) में पहुंच जाएगा - दोनों अपराधियों द्वारा "अपराध स्वीकार करें";

5. पारेटो इष्टतमता- सिस्टम की ऐसी स्थिति, जिसमें अन्य खिलाड़ियों की स्थिति को खराब किए बिना सिस्टम की स्थिति का वर्णन करने वाले प्रत्येक विशेष मानदंड के मूल्य में सुधार नहीं किया जा सकता है।

पेरेटो सिद्धांत कहता है: "कोई भी परिवर्तन जो हानि का कारण नहीं बनता है, लेकिन कुछ लोगों को (उनके अपने अनुमान में) लाभ होता है, एक सुधार है।" इस प्रकार, सभी परिवर्तनों का अधिकार जो किसी को अतिरिक्त नुकसान नहीं पहुँचाता है, को मान्यता दी जाती है।

सिस्टम का सेट बताता है कि पेरेटो इष्टतम हैं जिसे "पेरेटो सेट", "पेरेटो के अर्थ में इष्टतम विकल्पों का सेट" या "इष्टतम विकल्पों का सेट" कहा जाता है।

ऐसी स्थिति जहां पारेटो दक्षता हासिल की गई है वह ऐसी स्थिति है जहां विनिमय से सभी लाभ समाप्त हो गए हैं।

पारेतो दक्षता आधुनिक अर्थशास्त्र के लिए केंद्रीय अवधारणाओं में से एक है। इस अवधारणा के आधार पर, पहले और दूसरे मौलिक कल्याणकारी प्रमेयों का निर्माण किया जाता है।

पारेतो इष्टतमता के अनुप्रयोगों में से एक अंतर्राष्ट्रीय आर्थिक एकीकरण में संसाधनों (श्रम और पूंजी) का पारेटो वितरण है, अर्थात दो या दो से अधिक राज्यों का आर्थिक संघ। दिलचस्प बात यह है कि अंतरराष्ट्रीय आर्थिक एकीकरण से पहले और बाद में पारेतो वितरण को गणितीय रूप से पर्याप्त रूप से वर्णित किया गया था (डेलिमोव आरटी, 2008)। विश्लेषण से पता चला है कि क्षेत्रों के अतिरिक्त मूल्य और श्रम संसाधनों की आय अंतरिक्ष में गैस या तरल के समान प्रसिद्ध गर्मी चालन समीकरण के अनुसार विपरीत दिशाओं में चलती है, जो उपयोग की गई विश्लेषण तकनीक को लागू करना संभव बनाती है। भौतिकी में आर्थिक मापदंडों के प्रवासन की आर्थिक समस्याओं के संबंध में।

पारेटो इष्टतमबताता है कि समाज का कल्याण अपनी अधिकतम सीमा तक पहुँच जाता है, और संसाधनों का वितरण इष्टतम हो जाता है यदि इस वितरण में कोई भी परिवर्तन आर्थिक व्यवस्था के कम से कम एक विषय के कल्याण को बिगाड़ देता है।

बाजार की पेरेटो-इष्टतम स्थिति- एक ऐसी स्थिति जहां आर्थिक प्रक्रिया में किसी भी भागीदार की स्थिति में सुधार करना असंभव है, साथ ही कम से कम एक की भलाई को कम किए बिना।

पेरेटो कसौटी (सामाजिक कल्याण के विकास के लिए मानदंड) के अनुसार, संसाधनों के ऐसे वितरण से ही इष्टतम की ओर बढ़ना संभव है जो किसी और को नुकसान पहुंचाए बिना कम से कम एक व्यक्ति के कल्याण को बढ़ाता है।

स्थिति S* को पारेटो प्रभावी स्थिति S कहा जाता है यदि:

किसी भी खिलाड़ी के लिए एस में उसका भुगतान<=S*

· कम से कम एक खिलाड़ी ऐसा है जिसके लिए S*>S स्थिति में उसका भुगतान है

"कैदियों की दुविधा" समस्या में, पारेतो संतुलन, जब दूसरे की स्थिति को खराब किए बिना किसी भी खिलाड़ी की स्थिति में सुधार करना असंभव है, वर्ग (2; 2) की स्थिति से मेल खाती है।

विचार करना उदाहरण 1.

संघर्ष के सिद्धांत में इष्टतम रणनीतियाँ वे रणनीतियाँ हैं जो खिलाड़ियों को स्थिर संतुलन की ओर ले जाती हैं, अर्थात। कुछ स्थितियाँ जो सभी खिलाड़ियों को संतुष्ट करती हैं।

गेम थ्योरी में एक समाधान की इष्टतमता अवधारणा पर आधारित है संतुलन की स्थिति:

1) किसी भी खिलाड़ी के लिए संतुलन की स्थिति से हटना लाभदायक नहीं है यदि अन्य सभी उसमें बने रहते हैं,

2) संतुलन का अर्थ - खेल की बार-बार पुनरावृत्ति के साथ, खिलाड़ी किसी भी रणनीतिक स्थिति में खेल शुरू करते हुए संतुलन की स्थिति में पहुंच जाएंगे।

प्रत्येक अंतःक्रिया में, निम्न प्रकार के संतुलन मौजूद हो सकते हैं:

1. संतुलन सतर्क रणनीतियों में . उन रणनीतियों द्वारा निर्धारित किया जाता है जो खिलाड़ियों को गारंटीकृत परिणाम प्रदान करते हैं;

2. संतुलन प्रमुख रणनीतियों में .

हावी रणनीतिएक ऐसी कार्य योजना है जो दूसरे प्रतिभागी के कार्यों की परवाह किए बिना प्रतिभागी को अधिकतम लाभ प्रदान करती है। इसलिए, प्रमुख रणनीतियों का संतुलन खेल में दोनों प्रतिभागियों की प्रमुख रणनीतियों का प्रतिच्छेदन होगा।

यदि खिलाड़ियों की इष्टतम रणनीतियाँ उनकी अन्य सभी रणनीतियों पर हावी हो जाती हैं, तो खेल में प्रमुख रणनीतियों में एक संतुलन होता है। कैदी की दुविधा के खेल में, रणनीतियों का नैश संतुलन सेट होगा ("स्वीकार करें - स्वीकार करें")। इसके अलावा, यह ध्यान रखना महत्वपूर्ण है कि खिलाड़ी A और खिलाड़ी B दोनों के लिए "पहचानना" प्रमुख रणनीति है, जबकि "पहचानना नहीं" हावी है;

3. संतुलन नैश . नैश संतुलनदो या दो से अधिक खिलाड़ियों के खेल का एक प्रकार का निर्णय है, जिसमें कोई भी प्रतिभागी अपने निर्णय को एकतरफा बदलकर अदायगी में वृद्धि नहीं कर सकता है, जब अन्य प्रतिभागी अपना निर्णय नहीं बदलते हैं।

खेल कहते हैं एनसामान्य रूप में चेहरे, जहां शुद्ध रणनीतियों का सेट है और अदायगी का सेट है।

जब प्रत्येक खिलाड़ी रणनीति प्रोफाइल में एक रणनीति का चयन करता है, तो खिलाड़ी को भुगतान प्राप्त होता है। इसके अलावा, अदायगी रणनीतियों के पूरे प्रोफाइल पर निर्भर करती है: न केवल खिलाड़ी द्वारा चुनी गई रणनीति पर, बल्कि अन्य लोगों की रणनीतियों पर भी। रणनीति प्रोफ़ाइल एक नैश संतुलन है अगर इसकी रणनीति में बदलाव किसी भी खिलाड़ी के लिए फायदेमंद नहीं है, यानी किसी के लिए



एक खेल में शुद्ध और मिश्रित दोनों रणनीतियों में नैश संतुलन हो सकता है।

नैश ने साबित कर दिया कि अगर अनुमति दी जाए मिश्रित रणनीतियाँ, फिर प्रत्येक खेल में एनखिलाड़ियों के पास कम से कम एक नैश संतुलन होगा।

नैश संतुलन की स्थिति में, प्रत्येक खिलाड़ी की रणनीति उसे अन्य खिलाड़ियों की रणनीतियों के लिए सर्वश्रेष्ठ प्रतिक्रिया प्रदान करती है;

4. संतुलन स्टैकेलबर्ग. स्टैकेलबर्ग मॉडल- सूचना विषमता की उपस्थिति में एक ओलिगोपॉलिस्टिक बाजार का गेम-सैद्धांतिक मॉडल। इस मॉडल में, फर्मों के व्यवहार को पूरी जानकारी के साथ एक गतिशील गेम द्वारा वर्णित किया जाता है, जिसमें फर्मों के व्यवहार का उपयोग करके मॉडलिंग की जाती है। स्थिरपूरी जानकारी के साथ खेल। खेल की मुख्य विशेषता एक अग्रणी फर्म की उपस्थिति है, जो पहले माल के उत्पादन की मात्रा निर्धारित करती है, और बाकी फर्मों को इसके द्वारा उनकी गणना में निर्देशित किया जाता है। खेल की बुनियादी पूर्वापेक्षाएँ:

उद्योग एक समान उत्पाद का उत्पादन करता है: विभिन्न फर्मों के उत्पादों में अंतर नगण्य है, जिसका अर्थ है कि खरीदार, जब किस फर्म से खरीदना है, केवल कीमत पर ध्यान केंद्रित करता है;

उद्योग में फर्मों की संख्या बहुत कम है।

कंपनियां उत्पादित उत्पादों की मात्रा निर्धारित करती हैं, और इसके लिए कीमत मांग के आधार पर निर्धारित होती है;

एक तथाकथित नेता फर्म है, जिसके उत्पादन की मात्रा पर अन्य फर्मों को निर्देशित किया जाता है।

इस प्रकार, स्टैकेलबर्ग मॉडल का उपयोग गतिशील खेलों में इष्टतम समाधान खोजने के लिए किया जाता है और खिलाड़ियों के अधिकतम भुगतान के अनुरूप होता है, जो उन स्थितियों पर आधारित होता है जो पहले से ही एक या अधिक खिलाड़ियों द्वारा की गई पसंद के बाद विकसित हुई हैं। स्टैकेलबर्ग संतुलन।- एक ऐसी स्थिति जहां कोई भी खिलाड़ी अपनी जीत को एकतरफा नहीं बढ़ा सकता है, और पहले एक खिलाड़ी द्वारा निर्णय लिए जाते हैं और दूसरे खिलाड़ी को ज्ञात हो जाते हैं। कैदी की दुविधा के खेल में, स्टैकेलबर्ग संतुलन वर्ग (1; 1) में पहुंच जाएगा - दोनों अपराधियों द्वारा "अपराध स्वीकार करें";

5. पारेटो इष्टतमता- सिस्टम की ऐसी स्थिति, जिसमें अन्य खिलाड़ियों की स्थिति को खराब किए बिना सिस्टम की स्थिति का वर्णन करने वाले प्रत्येक विशेष मानदंड के मूल्य में सुधार नहीं किया जा सकता है।

पेरेटो सिद्धांत कहता है: "कोई भी परिवर्तन जो हानि का कारण नहीं बनता है, लेकिन कुछ लोगों को (उनके अपने अनुमान में) लाभ होता है, एक सुधार है।" इस प्रकार, सभी परिवर्तनों का अधिकार जो किसी को अतिरिक्त नुकसान नहीं पहुँचाता है, को मान्यता दी जाती है।

सिस्टम का सेट बताता है कि पेरेटो इष्टतम हैं जिसे "पेरेटो सेट", "पेरेटो के अर्थ में इष्टतम विकल्पों का सेट" या "इष्टतम विकल्पों का सेट" कहा जाता है।

ऐसी स्थिति जहां पारेटो दक्षता हासिल की गई है वह ऐसी स्थिति है जहां विनिमय से सभी लाभ समाप्त हो गए हैं।

पारेतो दक्षता आधुनिक अर्थशास्त्र के लिए केंद्रीय अवधारणाओं में से एक है। इस अवधारणा के आधार पर, पहले और दूसरे मौलिक कल्याणकारी प्रमेयों का निर्माण किया जाता है।

पारेतो इष्टतमता के अनुप्रयोगों में से एक अंतर्राष्ट्रीय आर्थिक एकीकरण में संसाधनों (श्रम और पूंजी) का पारेटो वितरण है, अर्थात दो या दो से अधिक राज्यों का आर्थिक संघ। दिलचस्प बात यह है कि अंतरराष्ट्रीय आर्थिक एकीकरण से पहले और बाद में पारेतो वितरण को गणितीय रूप से पर्याप्त रूप से वर्णित किया गया था (डेलिमोव आरटी, 2008)। विश्लेषण से पता चला है कि क्षेत्रों के अतिरिक्त मूल्य और श्रम संसाधनों की आय अंतरिक्ष में गैस या तरल के समान प्रसिद्ध गर्मी चालन समीकरण के अनुसार विपरीत दिशाओं में चलती है, जो उपयोग की गई विश्लेषण तकनीक को लागू करना संभव बनाती है। भौतिकी में आर्थिक मापदंडों के प्रवासन की आर्थिक समस्याओं के संबंध में।

पारेटो इष्टतमबताता है कि समाज का कल्याण अपनी अधिकतम सीमा तक पहुँच जाता है, और संसाधनों का वितरण इष्टतम हो जाता है यदि इस वितरण में कोई भी परिवर्तन आर्थिक व्यवस्था के कम से कम एक विषय के कल्याण को बिगाड़ देता है।

बाजार की पेरेटो-इष्टतम स्थिति- एक ऐसी स्थिति जहां आर्थिक प्रक्रिया में किसी भी भागीदार की स्थिति में सुधार करना असंभव है, साथ ही कम से कम एक की भलाई को कम किए बिना।

पेरेटो कसौटी (सामाजिक कल्याण के विकास के लिए मानदंड) के अनुसार, संसाधनों के ऐसे वितरण से ही इष्टतम की ओर बढ़ना संभव है जो किसी और को नुकसान पहुंचाए बिना कम से कम एक व्यक्ति के कल्याण को बढ़ाता है।

स्थिति S* को पारेटो प्रभावी स्थिति S कहा जाता है यदि:

किसी भी खिलाड़ी के लिए एस में उसका भुगतान<=S*

· कम से कम एक खिलाड़ी ऐसा है जिसके लिए S*>S स्थिति में उसका भुगतान है

"कैदियों की दुविधा" समस्या में, पारेतो संतुलन, जब दूसरे की स्थिति को खराब किए बिना किसी भी खिलाड़ी की स्थिति में सुधार करना असंभव है, वर्ग (2; 2) की स्थिति से मेल खाती है।

विचार करना उदाहरण 1:

प्रमुख रणनीतियों में संतुलननहीं।

नैश संतुलन. (5.5) और (4.4)। चूँकि किसी भी खिलाड़ी के लिए व्यक्तिगत रूप से चुनी हुई रणनीति से विचलित होना लाभहीन है।

पारेटो इष्टतम. (5.5)। इन रणनीतियों को चुनते समय खिलाड़ियों की अदायगी के बाद से अधिक जीतअन्य रणनीतियों का चयन करते समय।

स्टैकेलबर्ग संतुलन:

प्लेयर ए पहली चाल बनाता है।

अपनी पहली रणनीति चुनता है। बी पहली रणनीति चुनता है। ए को 5 मिलता है।

अपनी दूसरी रणनीति चुनता है। B दूसरा चुनता है। ए को 4 मिलता है।

5 > 4 =>

बी पहली चाल चलता है।

अपनी पहली रणनीति चुनता है। ए पहली रणनीति चुनता है। बी को 5 मिलता है।

अपनी दूसरी रणनीति चुनता है। और वह दूसरा चुनता है। बी को 4 मिलता है।

5 > 4 => स्टैकेलबर्ग संतुलन (5, 5)

उदाहरण 2एकाधिकार मॉडलिंग.

इस मॉडल के सार पर विचार करें:

बता दें कि दो फर्मों वाला एक उद्योग है, जिनमें से एक "लीडर फर्म" है और दूसरी "फॉलोअर फर्म" है। उत्पाद की कीमत होने दें रैखिक प्रकार्यकुल आपूर्ति क्यू:

पी(क्यू) = बीक्यू.

आइए हम यह भी मान लें कि उत्पादन की प्रति इकाई फर्मों की लागत स्थिर और बराबर है साथ 1 और साथ 2 क्रमशः। फिर पहली फर्म का लाभ किसके द्वारा निर्धारित किया जाएगा FORMULA

Π 1 = पी(क्यू 1 + क्यू 2) * क्यू 1 − सी 1 क्यू 1 ,

और क्रमशः दूसरे का लाभ

Π 2 = पी(क्यू 1 + क्यू 2) * क्यू 2 − सी 2 क्यू 2 .

स्टैकेलबर्ग मॉडल के अनुसार, पहली फर्म - अग्रणी फर्म - पहले चरण में अपना आउटपुट प्रदान करती है क्यू 1। उसके बाद, दूसरी फर्म - अनुयायी फर्म - नेता फर्म के कार्यों का विश्लेषण करके इसका उत्पादन निर्धारित करती है क्यू 2. दोनों फर्मों का लक्ष्य अपने भुगतान कार्यों को अधिकतम करना है।

इस खेल में नैश संतुलन बैकवर्ड इंडक्शन द्वारा निर्धारित किया जाता है। खेल के अंतिम चरण पर विचार करें - दूसरी फर्म की चाल। इस स्तर पर, फर्म 2 फर्म 1 के इष्टतम उत्पादन को जानती है क्यू 1 * . फिर इष्टतम आउटपुट निर्धारित करने की समस्या क्यूदूसरी फर्म के अदायगी समारोह के अधिकतम बिंदु को खोजने की समस्या को हल करने के लिए 2 * घटाया गया है। चर के संबंध में फ़ंक्शन Π 2 को अधिकतम करना क्यू 2 गिनती क्यू 1 दिया गया है, हम पाते हैं कि दूसरी फर्म का इष्टतम उत्पादन

रिलीज की लीडर फर्म द्वारा पसंद के लिए अनुयायी फर्म की यह सबसे अच्छी प्रतिक्रिया है क्यू 1 * . अग्रणी फर्म फलन के रूप में दिए गए अपने अदायगी फलन को अधिकतम कर सकती है क्यू 2*. चर में समारोह Π 1 का अधिकतम बिंदु क्यू 1 प्रतिस्थापित करते समय क्यू 2* होगा

के लिए व्यंजक में इसे प्रतिस्थापित करना क्यू 2 * , हम प्राप्त करते हैं

इस प्रकार, संतुलन में, नेता फर्म अनुवर्ती फर्म की तुलना में दोगुना उत्पादन करती है।

आपूर्ति और मांग लाइनों को एक ही चार्ट में मिलाकर, हम प्राप्त करते हैं ग्राफिक छविनिर्देशांक में संतुलन पी क्यू(चित्र 2.6)। रेखाओं के प्रतिच्छेदन बिंदु में निर्देशांक होते हैं (पी क्यू*),कहाँ आर* -सामान्य मूल्य, क्यू*- उत्पादन और खपत का संतुलन मात्रा।

बाजार संतुलन- यह बाजार की एक ऐसी स्थिति है जिसमें किसी दिए गए मूल्य स्तर के लिए मांग की मात्रा आपूर्ति की मात्रा के बराबर होती है।

केवल संतुलन के बिंदु पर बाजार संतुलित है, किसी भी बाजार एजेंट के पास स्थिति को बदलने के लिए प्रोत्साहन नहीं है। इसका मतलब यह है कि बाजार संतुलन की संपत्ति है वहनीयता -एक गैर-संतुलन स्थिति की स्थिति में, बाजार एजेंटों को बाजार को संतुलन में वापस लाने के लिए प्रेरित किया जाता है। स्थिरता को साबित करने के लिए आमतौर पर एल. वाल्रास या ए. मार्शल के तर्क का इस्तेमाल किया जाता है।

एल. वाल्रास के अनुसार, बहुत अधिक कीमतों पर, एक अतिरिक्त आपूर्ति - अतिउत्पादन (सेगमेंट ए-बीअंजीर में। 2.6i), ऐसा बाजार कहलाता है खरीदार का बाजारचूंकि लेन-देन के समापन पर खरीदार के पास मूल्य में कमी की मांग करने का अवसर होता है। ऐसी स्थिति में, सबसे पहले, विक्रेता की दिलचस्पी नहीं होती है, जो कीमतों को कम करने और उत्पादन की मात्रा को कम करने के लिए मजबूर होता है। जैसे ही कीमतें गिरती हैं, मांग की मात्रा बढ़ जाती है ए-बीयह तब तक सिकुड़ता है जब तक यह एक संतुलन बिंदु नहीं बन जाता इ।

पर कम कीमतोंमांग की अधिकता है - एक कमी (खंड CFna चित्र 2.6a), विकसित होती है विक्रेता का बाजार।खरीदार मजबूर है


यदि कोई उपभोक्ता खपत में कटौती करता है और एक दुर्लभ वस्तु के लिए अधिक भुगतान करता है, जैसे ही कीमत बढ़ती है, आपूर्ति की मात्रा बढ़ जाती है, और कमी तब तक कम हो जाती है जब तक कि बाजार में संतुलन न हो जाए।

ए। मार्शल (चित्र। 2.66), उत्पादन की छोटी मात्रा के लिए, मांग मूल्य विक्रेता की कीमत से अधिक है, बड़ी मात्रा के लिए - इसके विपरीत। किसी भी मामले में, असंतुलन की स्थिति कीमत या आपूर्ति की मात्रा में बदलाव और संतुलन की दिशा में मांग को उत्तेजित करती है। संतुलन (ए)वालरस के अनुसार - कीमत आपूर्ति और मांग के असंतुलन को नियंत्रित करती है, (बी)मार्शल के अनुसार - क्रेता और विक्रेता की कीमतें मात्रा में परिवर्तन द्वारा संतुलित होती हैं।

चावल। 2.6। बाजार संतुलन की स्थापना: सी) एल वाल्रास के अनुसार; बी) ए मार्शल के अनुसार

बाजार की मांग या आपूर्ति में बदलाव से संतुलन में बदलाव होता है (चित्र 2.7)। यदि, उदाहरण के लिए, बाजार की मांग बढ़ जाती है, तो मांग रेखा दाईं ओर शिफ्ट हो जाती है, तब संतुलन कीमत और मात्रा में वृद्धि होती है। यदि बाजार आपूर्ति घट जाती है, तो आपूर्ति रेखा बाईं ओर खिसक जाती है, जिसके परिणामस्वरूप कीमत में वृद्धि और मात्रा में कमी होती है।

यह मॉडलबाजार स्थिर है, क्योंकि इसमें समय दिखाई नहीं देता।

"स्पाइडर" मॉडल

बाजार संतुलन के एक गतिशील मॉडल के उदाहरण के रूप में, हम सबसे सरल "कोबवेब" मॉडल प्रस्तुत करते हैं। मान लीजिए कि मांग की गई मात्रा वर्तमान अवधि के मूल्य स्तर पर निर्भर करती है टी,और आपूर्ति की मात्रा - पिछली अवधि टी-1 की कीमतों से:

क्यू डी आई = क्यू डी आई (पी टी), क्यू एस आई = क्यू एस आई (पी टी -1),

जहाँ t = 0.1….T समय अवधि का असतत मान है।




चावल। 2.7। बाजार संतुलन में बदलाव:

क) मांग में वृद्धि के कारण; बी)कमी के कारण

ऑफर

बाजार कीमत पी टीसंतुलन कीमत से मेल नहीं खा सकता है आर*,और तीन संभावित गतिकी हैं पी टी(चित्र 2.8)।

इस मॉडल में विकास प्रक्षेपवक्र का प्रकार आपूर्ति और मांग लाइनों के ढलानों के अनुपात पर निर्भर करता है।

चावल। 2.8। बाजार संतुलन का "स्पाइडर" मॉडल:

क) संतुलन से विचलन कम हो जाता है; 5) विचलन

संतुलन से बढ़ता है ("तबाही" मॉडल); ग) बाजार

संतुलन बिंदु के आसपास चक्रीय रूप से दोलन करता है, लेकिन संतुलन



ऊपर