ความเป็นคู่ในโปรแกรมเชิงเส้น ประเภทของดุลยภาพ: ดุลยภาพ Nash, Stekelberg, ดุลยภาพพาเรโต-เหมาะสมที่สุด, ดุลยภาพของกลยุทธ์เด่น กลไกที่เหมาะสมที่สุดในการหาทางออกสู่ดุลยภาพคืออะไร

คำจำกัดความพื้นฐานของทฤษฎีทวิภาวะ.

ปัญหาโปรแกรมเชิงเส้นแต่ละปัญหาสามารถเชื่อมโยงกับปัญหาโปรแกรมเชิงเส้นอื่นได้ เมื่อหนึ่งในนั้นได้รับการแก้ไข ปัญหาอื่น ๆ จะถูกแก้ไขโดยอัตโนมัติ งานดังกล่าวเรียกว่าคู่ร่วมกัน ให้เราแสดงวิธีการกำหนดปัญหา (เราจะเรียกมันว่าปัญหาเดิม) เราสามารถสร้างคู่ของมัน

พิจารณาปัญหาของผลผลิตที่วางแผนไว้

ฉ=3 เอ็กซ์ 1 + 5เอ็กซ์ 2 + 4เอ็กซ์ 3 + 5เอ็กซ์ 4 → สูงสุด
5x 1 +0.4x 2 +2x 3 +0.5x 4 ≤400
5x2 +x3 +x4 ≤300
x 1 + x 3 + x 4 ≤100
x 1 ≥0, x 2 ≥0, x 3 ≥0, x 4 ≥0

กฎทั่วไปสำหรับการรวบรวมปัญหาคู่:

ตรง คู่
ฟังก์ชันเป้าหมาย (สูงสุด) ทางขวามือของข้อ จำกัด
ทางขวามือของข้อ จำกัด ฟังก์ชันเป้าหมาย (นาที)
A - เมทริกซ์ข้อ จำกัด AT - เมทริกซ์ข้อ จำกัด
ข้อ จำกัด ฉัน -th: ≤ 0, (≥ 0) ตัวแปร y i ≥ 0, (≤ 0)
ข้อ จำกัด ฉัน -th: = 0 ตัวแปร y i ≠ 0
ตัวแปร x j ≥ 0 (≤ 0)
ตัวแปร x j ≠ 0 ข้อ จำกัด j-th: = 0
สูงสุด → นาที
ตรง คู่
ฟังก์ชันเป้าหมาย (นาที) ทางขวามือของข้อ จำกัด
ทางขวามือของข้อ จำกัด ฟังก์ชันเป้าหมาย (สูงสุด)
A - เมทริกซ์ข้อ จำกัด AT - เมทริกซ์ข้อ จำกัด
ข้อจำกัด i-th: ≥ 0, (≤ 0) ตัวแปร y i ≥ 0, (≤ 0)
ข้อ จำกัด ฉัน -th: = 0 ตัวแปร y i ≠ 0
ตัวแปร x j ≥ 0 (≤ 0) ข้อจำกัด j -th: ≤ 0 (≥ 0)
ตัวแปร x j ≠ 0 ข้อ จำกัด j-th: = 0

ให้เราสร้างปัญหาคู่ตามกฎต่อไปนี้

  1. จำนวนตัวแปรในปัญหาคู่เท่ากับจำนวนอสมการในตัวแปรเดิม
  2. เมทริกซ์ของค่าสัมประสิทธิ์ของปัญหาคู่ถูกย้ายไปยังเมทริกซ์ของค่าสัมประสิทธิ์ของค่าเดิม
  3. คอลัมน์ของเงื่อนไขอิสระของปัญหาเดิมคือแถวของค่าสัมประสิทธิ์สำหรับฟังก์ชันวัตถุประสงค์คู่ ฟังก์ชั่นวัตถุประสงค์ถูกขยายให้ใหญ่สุดในปัญหาหนึ่งและย่อให้เล็กสุดในอีกปัญหาหนึ่ง
  4. เงื่อนไขสำหรับการไม่ปฏิเสธของตัวแปรของปัญหาดั้งเดิมสอดคล้องกับความไม่เท่าเทียมกัน - ข้อ จำกัด ของปัญหาคู่ที่ชี้ไปในทิศทางอื่น และในทางกลับกัน อสมการ-ข้อจำกัดในต้นฉบับจะสอดคล้องกับเงื่อนไขของการไม่เป็นลบในทวิภาค

โปรดทราบว่าแถวของเมทริกซ์ของงาน I คือคอลัมน์ของเมทริกซ์ของงาน II ดังนั้น ค่าสัมประสิทธิ์ของตัวแปร y i ในปัญหา II จึงเป็นค่าสัมประสิทธิ์ของอสมการ i ในปัญหา I ตามลำดับ
แบบจำลองผลลัพธ์คือแบบจำลองทางเศรษฐศาสตร์และคณิตศาสตร์ของปัญหาแบบคู่กับปัญหาโดยตรง

ความไม่เท่าเทียมกันที่เชื่อมต่อกันด้วยลูกศรจะเป็น เรียกคอนจูเกต.
การกำหนดปัญหาคู่อย่างมีความหมาย: ค้นหาชุดราคา (ประมาณการ) ของทรัพยากร Y = (y 1 , y 2 ... , y m) ซึ่งต้นทุนรวมของทรัพยากรจะน้อยที่สุดโดยมีเงื่อนไขว่าต้นทุนของทรัพยากรในการผลิตแต่ละประเภท ของสินค้าจะมีมูลค่าไม่ต่ำกว่ากำไร ( เงินที่ได้จากการขายสินค้าเหล่านี้.
ราคาทรัพยากร y 1 , y 2 ... , y m ในเอกสารทางเศรษฐศาสตร์ที่ได้รับ ชื่อเรื่องต่างๆ: บัญชี, ปริยาย, เงา. ความหมายของชื่อเหล่านี้คือราคาที่มีเงื่อนไข "ปลอม" ตรงกันข้ามกับราคา "ภายนอก" จาก 1 จาก 2 ... จาก n สำหรับผลิตภัณฑ์ ตามกฎแล้ว ก่อนเริ่มการผลิต ราคาของทรัพยากร y 1 , y 2 ..., y m เป็นราคาภายใน เนื่องจากไม่ได้ตั้งค่าจากภายนอก แต่ถูกกำหนดโดยตรงจากการแก้ปัญหา ดังนั้นจึงมักเรียกว่าการประมาณการทรัพยากร
การเชื่อมต่อระหว่างปัญหาโดยตรงและปัญหาคู่ประกอบด้วยโดยเฉพาะอย่างยิ่งในข้อเท็จจริงที่ว่าวิธีแก้ปัญหาของหนึ่งในนั้นสามารถหาได้โดยตรงจากวิธีแก้ปัญหาของอีกปัญหาหนึ่ง

ทฤษฎีบทความเป็นคู่

ความเป็นคู่เป็นแนวคิดพื้นฐานในทฤษฎีโปรแกรมเชิงเส้น ผลลัพธ์หลักของทฤษฎีทวิภาวะมีอยู่ในสองทฤษฎีบทที่เรียกว่าทฤษฎีบททวิภาวะ

ทฤษฎีบทคู่แรก.

หากหนึ่งในคู่ของปัญหาคู่ I และ II สามารถแก้ไขได้ แสดงว่าอีกปัญหาหนึ่งสามารถแก้ไขได้ และค่าของฟังก์ชันวัตถุประสงค์ในแผนที่เหมาะสมที่สุดจะเหมือนกัน (x*) = (*) โดยที่ x *, y * - วิธีแก้ปัญหา I และ II ที่เหมาะสมที่สุด

ทฤษฎีบทความเป็นคู่ที่สอง.

แผน x * และ y * เหมาะสมที่สุดในปัญหา I และ II ก็ต่อเมื่อ เมื่อพวกเขาถูกแทนที่เข้าไปในระบบข้อจำกัดของปัญหา I และ II ตามลำดับ อสมการสังยุคอย่างน้อยหนึ่งคู่จะกลายเป็นความเท่าเทียมกัน
นี้ ทฤษฎีบทความเป็นคู่มูลฐาน. กล่าวอีกนัยหนึ่ง ถ้า x * และ y * เป็นวิธีแก้ปัญหาที่เป็นไปได้สำหรับปัญหาแรกและปัญหาคู่ และถ้า c T x*=b T y* ดังนั้น x * และ y * เป็นวิธีแก้ปัญหาคู่ที่เหมาะสมที่สุด

ทฤษฎีบทคู่ที่สาม. ค่าของตัวแปร y i ในวิธีแก้ปัญหาที่ดีที่สุดของปัญหาคู่คือค่าประมาณของอิทธิพลของสมาชิกอิสระ b i ของระบบข้อ จำกัด - ความไม่เท่าเทียมกันของปัญหาโดยตรงต่อค่าของฟังก์ชันวัตถุประสงค์ของปัญหานี้:
Δf(x) = b ฉัน y ฉัน

การแก้ LLP โดยวิธีซิมเพล็กซ์ เราแก้ LLP คู่พร้อมกัน ค่าของตัวแปรของปัญหาคู่ y ผม ในแผนที่เหมาะสมเรียกว่ากำหนดอย่างเป็นกลางหรือค่าประมาณคู่ ในปัญหาที่ใช้ การประมาณค่าแบบคู่ y i มักเรียกว่าค่าซ่อนเร้น ราคาเงา หรือการประมาณการทรัพยากรส่วนเพิ่ม

คุณสมบัติของปัญหาคู่ร่วมกัน

  1. ในปัญหาหนึ่ง ฟังก์ชันเชิงเส้นหาค่าสูงสุด อีกปัญหาหนึ่งหาค่าต่ำสุด
  2. ค่าสัมประสิทธิ์ของตัวแปรในฟังก์ชันเชิงเส้นของปัญหาหนึ่งคือสมาชิกอิสระของระบบข้อจำกัดในอีกปัญหาหนึ่ง
  3. ปัญหาแต่ละข้อจะได้รับในรูปแบบมาตรฐานและในปัญหาการเพิ่มประสิทธิภาพความไม่เท่าเทียมกันทั้งหมดของรูปแบบ ≤ และในปัญหาการย่อขนาดความไม่เท่าเทียมกันทั้งหมดของรูปแบบ ≥ .
  4. เมทริกซ์ค่าสัมประสิทธิ์สำหรับตัวแปรในระบบข้อจำกัดของปัญหาทั้งสองจะถูกถ่ายโอนซึ่งกันและกัน:
  5. จำนวนอสมการในระบบข้อจำกัดของปัญหาหนึ่งเท่ากับจำนวนตัวแปรในอีกปัญหาหนึ่ง
  6. เงื่อนไขสำหรับการไม่ปฏิเสธของตัวแปรมีอยู่ในปัญหาทั้งสอง

ทฤษฎีบทสมดุล

ภารกิจที่ 2
เขียนปัญหาคู่สำหรับปัญหาที่ 1 ค้นหามัน เฉลยโดยทฤษฎีบทสมดุล.
3x1 +x2 ≥12
x1 +2x2 ≥14
4x1 +11x2 ≥68

ทฤษฎีบทสมดุล . ให้ X*=(x 1 *,...,x n *) และ Y*=(y 1 *,...,y n *) เป็นการออกแบบที่ยอมรับได้ของคู่ปัญหาคู่ในรูปแบบสมมาตร แผนเหล่านี้เหมาะสมที่สุดหากตรงตามเงื่อนไขความหย่อนเสริมต่อไปนี้:


ทฤษฎีบท 4 ช่วยให้เราสามารถหาวิธีแก้ปัญหาที่เหมาะสมที่สุดสำหรับปัญหาคู่หนึ่งจากคู่หนึ่งโดยการแก้ปัญหาอื่น ๆ หากข้อจำกัดของปัญหาหนึ่งกลายเป็นอสมการอย่างเข้มงวดเมื่อมีการแทนที่โซลูชันที่เหมาะสมที่สุด ตัวแปรคู่ที่สอดคล้องกันในโซลูชันที่ดีที่สุดของปัญหาคู่จะเท่ากับ 0 หากตัวแปรใดเป็นบวกในแผนที่ดีที่สุดของปัญหาหนึ่ง ดังนั้น ข้อจำกัดที่สอดคล้องกันของปัญหาคู่คือสมการ
ให้เราตีความทางเศรษฐกิจเกี่ยวกับเงื่อนไขของความหย่อนยานเสริม หากในโซลูชันที่เหมาะสมที่สุด วัตถุดิบบางอย่างมีการประมาณการนอกเหนือจาก 0 วัตถุดิบนั้นจะถูกใช้จนหมด (ทรัพยากรหายาก) หากใช้วัตถุดิบไม่หมด (เกิน) การประเมินจะเท่ากับ 0 ดังนั้นเราจึงได้การประเมินแบบคู่เป็นการวัดความขาดแคลนของวัตถุดิบ การประมาณแสดงมูลค่าของฟังก์ชันวัตถุประสงค์จะเพิ่มขึ้นเท่าใดเมื่อสต็อกวัตถุดิบที่เกี่ยวข้องเพิ่มขึ้น 1 หน่วย หากรวมผลิตภัณฑ์บางประเภทไว้ในแผนการผลิต ต้นทุนการผลิตจะสอดคล้องกับต้นทุนของผลิตภัณฑ์ที่ผลิต ถ้าต้นทุนการผลิตสินค้ามากกว่าต้นทุนสินค้า สินค้านั้นจะไม่ผลิต
หากหนึ่งในปัญหาคู่คู่หนึ่งมีตัวแปร 2 ตัว ก็สามารถแก้ไขได้แบบกราฟิก แล้วหาทางออกของปัญหาคู่โดยใช้ทฤษฎีบทที่ 3 และ 4 ในกรณีนี้ อาจเกิด 3 กรณี คือ ปัญหาทั้งสองมีวิธีแก้ปัญหาที่เป็นไปได้เท่านั้น หนึ่งมีวิธีแก้ปัญหาที่เป็นไปได้ ปัญหาทั้งสองไม่มีวิธีแก้ปัญหาที่เป็นไปได้

ตัวอย่างที่ 2
เขียนปัญหาคู่และหาทางออกโดยใช้ทฤษฎีบทสมดุล
x 2 -2x 3 +2x 4 -2x 5 ≤4
-2x 1 -2x 2 +2x 3 +2x 4 +x 5 ≥2
x ฉัน ≥0, ฉัน=1.5
Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → สูงสุด หากทราบวิธีแก้ไขปัญหาดั้งเดิม: Zmax=(3;4;0;0;0)
มาสร้างปัญหาคู่กันเถอะ เราเห็นด้วยกับสัญญาณของความไม่เท่าเทียมกับเป้าหมายของปัญหาเดิม

Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → สูงสุด
งานคู่:

W=4y 1 -2y 2 → นาที
ให้เราหาทางออกที่ดีที่สุดของปัญหาคู่โดยใช้ทฤษฎีบทสมดุล ให้เราเขียนเงื่อนไขของความหย่อนเสริม
y 1 (4-(x 2 -2x 3 +2x 4 -2x 5))=0
y 2 (-2-(2x 1 -2x 2 -2x 3 -2x 4 -x 5))=0
x 1 (-2y 2 -10)=0
x 2 (y 1 -2y 2 +9)=0
x 3 (-2y 1 -2y 2 +19)=0
x 4 (2y 1 -2y 2 +13)=0
x 5 (-2y 1 -y 2 +11)=0
ลองแทนที่วิธีแก้ปัญหาดั้งเดิมที่เหมาะสมที่สุดลงในระบบคอมไพล์: x 1 =3, x 2 =4, x 3 =0, x 4 =0, x 5 =0
y 1 (4-(4-2 0+2 0-2 0))=0
y 2 (-2-(2 3-2 4-2 0-2 0-0))=0 W(y 1 , y 2 , y 3)=12y 1 +31y 2 +18y 3 → สูงสุด โดยทฤษฎีบทที่ 3 Zmax=Wmin=100000.
ในที่สุด Wmin=W(0; 4000/7; 32000/21) = 100,000

ในเกมที่เป็นปรปักษ์กัน เป็นเรื่องปกติที่จะพิจารณาผลลัพธ์ที่ดีที่สุดให้เป็นเกมที่ผู้เล่นคนใดคนหนึ่งเบี่ยงเบนไปจากเกมนั้นไม่เกิดประโยชน์ ผลลัพธ์ดังกล่าว (x*,y*) เรียกว่าสถานการณ์สมดุล และหลักการของความเหมาะสมสูงสุดตามการค้นหาสถานการณ์สมดุลเรียกว่าหลักการสมดุล

คำนิยาม. ในเกมเมทริกซ์ที่มีเมทริกซ์ของมิติ ผลลัพธ์คือ สถานการณ์สมดุลหรือจุดอานถ้า

ที่จุดอาน องค์ประกอบเมทริกซ์เป็นทั้งค่าต่ำสุดในแถวและค่าสูงสุดในคอลัมน์ ในเกมจากตัวอย่าง องค์ประกอบที่ 2 33เป็นจุดอาน กลยุทธ์ที่ดีที่สุดในเกมนี้คือกลยุทธ์ที่สามสำหรับผู้เล่นทั้งสอง หากผู้เล่นคนแรกเบี่ยงเบนไปจากกลยุทธ์ที่สาม เขาจะเริ่มชนะน้อยกว่า 33. หากผู้เล่นคนที่สองเบี่ยงเบนไปจากกลยุทธ์ที่สาม เขาจะเริ่มสูญเสียมากกว่า 33. ดังนั้นสำหรับผู้เล่นทั้งสอง ไม่มีอะไรดีไปกว่าการยึดมั่นในกลยุทธ์ที่สามอย่างสม่ำเสมอ

หลักการของพฤติกรรมที่เหมาะสมที่สุด: หากมีจุดอานม้าในเกมเมทริกซ์ กลยุทธ์ที่เหมาะสมที่สุดคือตัวเลือกที่สอดคล้องกับอานม้า จะเกิดอะไรขึ้นหากมีจุดอานมากกว่าหนึ่งจุดในเกม?

ทฤษฎีบท. อนุญาต จุดอานโดยพลการสองจุดในเกมเมทริกซ์ แล้ว:

การพิสูจน์. จากนิยามของสภาวะสมดุล จะได้ว่า

ให้เราแทนที่ทางด้านซ้ายของความไม่เท่าเทียมกัน (2.8) และทางด้านขวา - ไปทางด้านซ้ายของความไม่เท่าเทียมกัน (2.9) - ทางด้านขวา - . จากนั้นเราจะได้รับ:

ความเท่าเทียมกันมาจากไหน:

จากทฤษฎีบทที่ว่าฟังก์ชัน payoff ใช้ค่าเดียวกันในทุกสถานการณ์สมดุล นั่นคือเหตุผลที่หมายเลขนั้นถูกเรียก ในราคาของเกม. และกลยุทธ์ที่สอดคล้องกับจุดอานใด ๆ เรียกว่า กลยุทธ์ที่ดีที่สุดผู้เล่นที่ 1 และ 2 ตามลำดับ โดยอาศัยอำนาจตาม (2.7) กลยุทธ์ที่ดีที่สุดของผู้เล่นทั้งหมดสามารถใช้แทนกันได้

พฤติกรรมที่ดีที่สุดของผู้เล่นจะไม่เปลี่ยนแปลงหากชุดของกลยุทธ์ในเกมยังคงเหมือนเดิม และฟังก์ชันการจ่ายผลตอบแทนจะคูณด้วยค่าคงที่ที่เป็นบวก (หรือจำนวนคงที่จะถูกเพิ่มเข้าไป)

ทฤษฎีบท. เพื่อให้มีจุดอาน (i*,j*) อยู่ในเกมเมทริกซ์ มีความจำเป็นและเพียงพอที่ค่าสูงสุดจะเท่ากับค่าต่ำสุด:

(2.10)

การพิสูจน์. ความจำเป็น.ถ้า (i*,j*) เป็นจุดอาน ตามข้อ (2.6) :

(2.11)

อย่างไรก็ตาม เรามี:

(2.12)

จาก (2.11) และ (2.12) เราได้รับ:

(2.13)

การโต้เถียงในทำนองเดียวกัน เรามาถึงความเท่าเทียมกัน:

ดังนั้น,

ในทางกลับกัน อสมการกลับด้าน (2.5) มักจะพอใจเสมอ ดังนั้น (2.10) จึงเป็นจริง

ความเพียงพอ. ให้ (2.10) เป็นจริง ให้เราพิสูจน์การมีอยู่ของจุดอานม้า เรามี:

ตามความเท่าเทียมกัน (2.10) ความไม่เท่าเทียมกัน (2.15) และ (2.16) กลายเป็นความเท่าเทียมกัน หลังจากที่เรามี:

ทฤษฎีบทได้รับการพิสูจน์แล้ว ได้รับการพิสูจน์แล้วว่า ความหมายทั่วไป maximin และ minimax เท่ากับราคาของเกม

การขยายตัวของเกมแบบผสม

พิจารณาเกมเมทริกซ์ G หากมีสถานการณ์สมดุลอยู่ในนั้น minimax จะเท่ากับ maximin ยิ่งไปกว่านั้น ผู้เล่นแต่ละคนสามารถบอกข้อมูลผู้เล่นคนอื่นเกี่ยวกับกลยุทธ์ที่ดีที่สุดของเขา คู่ต่อสู้ของเขาจะไม่สามารถได้รับผลประโยชน์เพิ่มเติมจากข้อมูลนี้ ตอนนี้สมมติว่าไม่มีสถานการณ์สมดุลในเกม G แล้ว:

ในกรณีนี้ กลยุทธ์ minimax และ maximin จะไม่เสถียร ผู้เล่นอาจมีแรงจูงใจที่จะเบี่ยงเบนไปจากกลยุทธ์ที่ชาญฉลาดซึ่งเกี่ยวข้องกับความเป็นไปได้ที่จะได้รับผลตอบแทนมากขึ้น แต่ก็มีความเสี่ยงที่จะสูญเสีย เช่น ได้รับผลตอบแทนน้อยกว่าการใช้กลยุทธ์ที่รอบคอบ เมื่อใช้กลยุทธ์ที่มีความเสี่ยง การถ่ายโอนข้อมูลเกี่ยวกับพวกเขาไปยังฝ่ายตรงข้ามมีผลเสีย: ผู้เล่นจะได้รับผลตอบแทนน้อยกว่าโดยอัตโนมัติเมื่อใช้กลยุทธ์ที่ระมัดระวัง

ตัวอย่างที่ 3. ให้เมทริกซ์ของเกมมีลักษณะดังนี้:

สำหรับเมทริกซ์ดังกล่าว เช่น ไม่มีความสมดุล กลยุทธ์ที่ระมัดระวังของผู้เล่นคือ i*=1, j*=2 ให้ผู้เล่น 2 ทำตามกลยุทธ์ j*=2 และผู้เล่น 1 เลือกกลยุทธ์ i=2 จากนั้นหลังจะได้รับผลตอบแทน 3 ซึ่งมากกว่าค่าสูงสุดสองหน่วย อย่างไรก็ตาม หากผู้เล่น 2 คาดเดาเกี่ยวกับแผนการของผู้เล่น 1 เขาจะเปลี่ยนกลยุทธ์เป็น j=1 จากนั้นผู้เล่นคนแรกจะได้รับผลตอบแทนเป็น 0 นั่นคือน้อยกว่าค่าสูงสุดของเขา เหตุผลที่คล้ายกันสามารถดำเนินการกับผู้เล่นคนที่สองได้ โดยทั่วไป เราสามารถสรุปได้ว่าการใช้กลยุทธ์การผจญภัยในเกมที่แยกจากกันสามารถให้ผลลัพธ์ที่มากกว่าการรับประกัน แต่การใช้นั้นเกี่ยวข้องกับความเสี่ยง คำถามเกิดขึ้น เป็นไปได้ไหมที่จะรวมกลยุทธ์ที่ระมัดระวังที่เชื่อถือได้เข้ากับกลยุทธ์ที่ท้าทายเพื่อเพิ่มผลตอบแทนเฉลี่ยของคุณ โดยพื้นฐานแล้ว คำถามคือ จะแบ่งผลตอบแทน (2.17) ระหว่างผู้เล่นอย่างไร?

ปรากฎว่าวิธีแก้ปัญหาที่สมเหตุสมผลคือการใช้กลยุทธ์แบบผสม ซึ่งก็คือการเลือกแบบสุ่มของกลยุทธ์ล้วน ๆ จำได้ว่า กลยุทธ์ของผู้เล่น 1 เรียกว่าผสม, ถ้าเขาเลือกแถวที่ i-th ด้วยความน่าจะเป็น p ผม .กลยุทธ์ดังกล่าวสามารถระบุได้ด้วยการแจกแจงความน่าจะเป็น ในหลายบรรทัด สมมติว่าผู้เล่นคนแรกมีกลยุทธ์ล้วน ๆ และผู้เล่นคนที่สองมีกลยุทธ์ล้วน ๆ จากนั้นกลยุทธ์แบบผสมของพวกเขาคือเวกเตอร์ความน่าจะเป็น:

(2.18)

พิจารณาสองกลยุทธ์แบบผสมที่เป็นไปได้สำหรับผู้เล่นคนแรกในตัวอย่างที่ 3: . กลยุทธ์เหล่านี้แตกต่างกันในการแจกแจงความน่าจะเป็นระหว่างกลยุทธ์บริสุทธิ์ หากในกรณีแรกผู้เล่นเลือกแถวของเมทริกซ์ที่มีความน่าจะเป็นเท่ากันในกรณีที่สอง - ด้วยแถวที่แตกต่างกัน เมื่อเราพูดถึงกลยุทธ์แบบผสม เราหมายถึง สุ่มเลือกไม่ใช่ตัวเลือก "แบบสุ่ม" แต่เป็นทางเลือกตามการทำงานของกลไกสุ่มที่ให้การกระจายความน่าจะเป็นที่เราต้องการ ดังนั้นสำหรับการดำเนินการตามกลยุทธ์แบบผสมแบบแรก การโยนเหรียญจึงเหมาะสมอย่างยิ่ง ผู้เล่นเลือกบรรทัดแรกหรือบรรทัดที่สองขึ้นอยู่กับว่าเหรียญตกลงมาอย่างไร โดยเฉลี่ยแล้ว ผู้เล่นจะเลือกทั้งแถวแรกและแถวที่สองเท่าๆ กัน แต่ตัวเลือกในการวนซ้ำเฉพาะของเกมจะไม่อยู่ภายใต้กฎตายตัวใดๆ และมีระดับความลับสูงสุด: ก่อนดำเนินการตามกลไกสุ่ม ไม่เป็นที่รู้จักแม้แต่กับผู้เล่นคนแรก เพื่อใช้กลยุทธ์ผสมที่สอง กลไกการเสมอกันนั้นเหมาะสมอย่างยิ่ง ผู้เล่นหยิบกระดาษที่เหมือนกันเจ็ดแผ่น ทำเครื่องหมายด้วยไม้กางเขนสามแผ่น แล้วโยนมันเข้าไปในหมวก จากนั้นสุ่มดึงหนึ่งในนั้นออกมา ตามทฤษฎีความน่าจะเป็นแบบดั้งเดิม เขาจะดึงกระดาษที่มีกากบาทที่มีความน่าจะเป็น 3/7 ออกมา และกระดาษสะอาดที่มีความน่าจะเป็น 4/7 กลไกการดึงดังกล่าวสามารถตระหนักถึงความน่าจะเป็นที่มีเหตุผล

ให้ผู้เล่นปฏิบัติตามกลยุทธ์แบบผสม (2.18) จากนั้นผลตอบแทนของผู้เล่นคนแรกในการวนซ้ำของเกมจะเป็นตัวแปรสุ่ม: วี(X,Y). เนื่องจากผู้เล่นเลือกกลยุทธ์โดยอิสระจากกัน ตามทฤษฎีบทการคูณความน่าจะเป็น ความน่าจะเป็นของการเลือกผลลัพธ์ (i, j) ที่ชนะจะเท่ากับผลคูณของความน่าจะเป็น จากนั้นกฎการกระจายของตัวแปรสุ่ม วี(X,Y)กำหนดตามตารางต่อไปนี้

ตอนนี้ปล่อยให้เล่นเกมไปเรื่อย ๆ จากนั้นผลตอบแทนเฉลี่ยในเกมดังกล่าวจะเท่ากับค่าที่คาดหวังทางคณิตศาสตร์ วี(X,Y).

(2.19)

เมื่อสุดท้ายแต่พอ จำนวนมากการเล่นซ้ำของเกม ผลตอบแทนเฉลี่ยจะแตกต่างจากมูลค่าเล็กน้อย (2.19)

ตัวอย่าง 4. คำนวณผลตอบแทนเฉลี่ย (2.19) สำหรับเกมจากตัวอย่างที่ 3 เมื่อผู้เล่นใช้กลยุทธ์ต่อไปนี้: . เมทริกซ์ผลตอบแทนและเมทริกซ์ความน่าจะเป็นมีดังนี้:

มาหาค่าเฉลี่ยกัน:

ดังนั้นผลตอบแทนเฉลี่ย (2.20) จึงอยู่ตรงกลางระหว่างค่าสูงสุดและค่าต่ำสุด

เนื่องจากคู่ของกลยุทธ์ผสม X และ Y เป็นไปได้ที่จะคำนวณค่าเฉลี่ยของเกม ดังนั้นปัญหาในการค้นหากลยุทธ์ที่เหมาะสมจึงเกิดขึ้น เป็นเรื่องปกติที่จะเริ่มต้นด้วยการสำรวจกลยุทธ์ที่ระมัดระวัง กลยุทธ์ที่ระมัดระวังของผู้เล่นคนแรกทำให้เขาได้รับค่าสูงสุด กลยุทธ์ที่ระมัดระวังของผู้เล่นคนที่สองไม่อนุญาตให้คนแรกชนะมากกว่าขั้นต่ำ ผลลัพธ์ที่สำคัญที่สุดในทฤษฎีเกมที่มีความสนใจตรงกันข้ามสามารถพิจารณาได้ดังต่อไปนี้:

ทฤษฎีบท. เกมเมทริกซ์ทุกเกมมีสถานการณ์สมดุลในกลยุทธ์แบบผสม. การพิสูจน์ทฤษฎีบทนี้ไม่ใช่เรื่องง่าย มันถูกละไว้ในหลักสูตรนี้

ผลที่ตามมา: การมีอยู่ของสถานการณ์สมดุลหมายความว่าค่าสูงสุดเท่ากับค่าต่ำสุด ดังนั้นเกมเมทริกซ์ใดๆ จึงมีราคา กลยุทธ์ที่ดีที่สุดสำหรับผู้เล่นคนแรกคือกลยุทธ์สูงสุด กลยุทธ์ที่ดีที่สุดของอันที่สองคือ minimax เนื่องจากปัญหาในการหากลยุทธ์ที่เหมาะสมได้รับการแก้ไขแล้ว เราจึงกล่าวว่าเกมเมทริกซ์ใดๆ แก้ไขได้ในชุดกลยุทธ์แบบผสมผสาน

ทางออกของเกม 2x2

ตัวอย่าง 5. แก้เกม ตรวจสอบได้ไม่ยากว่าไม่มีจุดอานม้า ระบุกลยุทธ์ที่ดีที่สุดของผู้เล่นคนแรก (x, 1-x)เป็นเวกเตอร์คอลัมน์ แต่เพื่อความสะดวก เราเขียนเป็นสตริง ระบุกลยุทธ์ที่ดีที่สุดของผู้เล่นคนที่สอง (ย,1-ป).

ผลตอบแทนของผู้เล่นคนแรกเป็นตัวแปรสุ่มที่มีการแจกแจงต่อไปนี้:

วี(x,y) 2 -1 -4 7
หน้า xy x(1-ย) (1x)ย (1-x)(1-ปี)

เราพบผลตอบแทนเฉลี่ยสำหรับการทำซ้ำของผู้เล่นคนแรก - ความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่ม วี(x,y):

มาแปลงนิพจน์นี้กันเถอะ:

ความคาดหวังทางคณิตศาสตร์นี้ประกอบด้วยค่าคงที่ (5/7) และส่วนที่เป็นตัวแปร: 14(x-11/14)(ย-8/14). ถ้าค่า แตกต่างจาก 8/14 ผู้เล่นคนแรกสามารถเลือกได้เสมอ เอ็กซ์ในลักษณะที่จะทำให้ส่วนของตัวแปรเป็นบวก เพิ่มการชนะของคุณ ถ้าค่า เอ็กซ์แตกต่างจาก 11/14 ผู้เล่นคนที่สองสามารถเลือกได้เสมอ เพื่อให้ตัวแปรติดลบ ลดผลตอบแทนของผู้เล่นคนแรก ดังนั้น จุดอานถูกกำหนดโดยความเท่าเทียมกัน: x*=11/14, y*=8/14

2.5 การแก้เกม

ตัวอย่างจะแสดงวิธีแก้ปัญหาเกมดังกล่าว

ตัวอย่าง 6. แก้เกม . เราตรวจสอบให้แน่ใจว่าไม่มีอานม้า แสดงกลยุทธ์ผสมของผู้เล่นคนแรก X=(x, 1-x)เป็นเวกเตอร์คอลัมน์ แต่เพื่อความสะดวก เราเขียนเป็นสตริง

ให้ผู้เล่นคนแรกใช้กลยุทธ์ X และคนที่สอง - ของเขา j-th สะอาดกลยุทธ์. ให้เราแสดงผลตอบแทนเฉลี่ยของผู้เล่นคนแรกในสถานการณ์นี้เป็น เรามี:

ให้เราวาดกราฟของฟังก์ชัน (2.21) ในส่วน .

ลำดับของจุดที่อยู่บนส่วนใดส่วนหนึ่งของเส้นสอดคล้องกับผลตอบแทนของผู้เล่นคนแรกในสถานการณ์ที่เขาใช้กลยุทธ์แบบผสม (x,(1-x))และผู้เล่นคนที่สองใช้กลยุทธ์บริสุทธิ์ที่สอดคล้องกัน ผลลัพธ์ที่รับประกันของผู้เล่นคนแรกคือซองด้านล่างของตระกูลไลน์ (ABC แตก) จุดสูงสุดเส้นแบ่งนี้ (จุด B) เป็นผลลัพธ์ที่รับประกันสูงสุดของผู้เล่น 1 บทสรุปของจุด B สอดคล้องกับกลยุทธ์ที่ดีที่สุดของผู้เล่นคนแรก

เนื่องจากจุดที่ต้องการ B คือจุดตัดของเส้น ดังนั้น abscissa จึงสามารถหาเป็นคำตอบของสมการได้:

ดังนั้น กลยุทธ์ผสมที่เหมาะสมที่สุดของผู้เล่นคนแรกคือ (5/9, 4/9) พิกัดของจุด B คือราคาของเกม มันเท่ากับ:

(2.22)

โปรดทราบว่าเส้นที่สอดคล้องกับกลยุทธ์ที่สองของผู้เล่นคนที่สองผ่านจุด B ซึ่งหมายความว่าหากผู้เล่นคนแรกใช้กลยุทธ์ที่เหมาะสมที่สุดของเขา และผู้เล่น 2 ใช้กลยุทธ์ที่สอง การสูญเสียของผู้เล่นคนที่สองจะเพิ่มขึ้นเมื่อเทียบกับการใช้กลยุทธ์ 1 หรือ 3 ดังนั้นกลยุทธ์ที่สองจะต้องไม่เข้าร่วมในกลยุทธ์ที่ดีที่สุดของผู้เล่นคนที่สอง กลยุทธ์ที่ดีที่สุดสำหรับผู้เล่น 2 ควรเป็น: . กลยุทธ์บริสุทธิ์ 1 และ 3 ของผู้เล่นคนที่สองที่มีองค์ประกอบที่ไม่ใช่ศูนย์ในกลยุทธ์ที่ดีที่สุดมักจะถูกเรียก สำคัญ. เรียกว่ากลยุทธ์ที่ 2 ไม่มีนัยสำคัญ. จากรูปด้านบนและจากความเสมอภาค (2.22) จะเห็นได้ว่าเมื่อผู้เล่นคนแรกใช้กลยุทธ์ที่ดีที่สุดของเขา ผลตอบแทนของผู้เล่นคนที่สองไม่ได้ขึ้นอยู่กับกลยุทธ์สำคัญที่เขาใช้ นอกจากนี้เขายังสามารถใช้กลยุทธ์แบบผสมใดๆ ที่ประกอบด้วยสิ่งจำเป็น (โดยเฉพาะ เหมาะสมที่สุด) ผลตอบแทนจะไม่เปลี่ยนแปลงในกรณีนี้เช่นกัน คำสั่งที่คล้ายคลึงกันอย่างสมบูรณ์ยังเป็นจริงสำหรับกรณีตรงข้าม หากผู้เล่นคนที่สองใช้กลยุทธ์ที่เหมาะสมที่สุด ผลตอบแทนของผู้เล่นคนแรกจะไม่ขึ้นอยู่กับกลยุทธ์สำคัญที่เขาใช้ และจะเท่ากับต้นทุนของเกม เมื่อใช้ข้อความนี้ เราจะพบกลยุทธ์ที่เหมาะสมที่สุดสำหรับผู้เล่นคนที่สอง

กลยุทธ์ที่เหมาะสมที่สุดในทฤษฎีความขัดแย้งคือกลยุทธ์ที่นำผู้เล่นไปสู่สมดุลที่มั่นคง เช่น บางสถานการณ์ที่สร้างความพึงพอใจให้กับผู้เล่นทุกคน

ความเหมาะสมของการแก้ปัญหาในทฤษฎีเกมขึ้นอยู่กับแนวคิด สถานการณ์สมดุล:

1) มันไม่เกิดประโยชน์สำหรับผู้เล่นคนใดคนหนึ่งที่จะเบี่ยงเบนจากสถานการณ์สมดุลหากคนอื่น ๆ ทั้งหมดยังคงอยู่ในนั้น

2) ความหมายของความสมดุล - ด้วยการเล่นซ้ำ ๆ ของเกม ผู้เล่นจะเข้าถึงสถานการณ์ของความสมดุล เริ่มเกมในสถานการณ์เชิงกลยุทธ์ใด ๆ

ในการโต้ตอบแต่ละครั้ง ดุลยภาพประเภทต่อไปนี้สามารถมีอยู่:

1. สมดุล ในกลยุทธ์ที่ระมัดระวัง . กำหนดโดยกลยุทธ์ที่ให้ผู้เล่น รับประกันผล;

2. สมดุล ในกลยุทธ์ที่โดดเด่น .

กลยุทธ์ที่โดดเด่นเป็นแผนปฏิบัติการที่ให้ผู้เข้าร่วมได้รับประโยชน์สูงสุดโดยไม่คำนึงถึงการกระทำของผู้เข้าร่วมรายอื่น ดังนั้นความสมดุลของกลยุทธ์ที่โดดเด่นจะเป็นจุดตัดของกลยุทธ์ที่โดดเด่นของผู้เข้าร่วมทั้งสองในเกม

หากกลยุทธ์ที่ดีที่สุดของผู้เล่นครอบงำกลยุทธ์อื่น ๆ ทั้งหมด เกมจะมีความสมดุลในกลยุทธ์ที่โดดเด่น ในเกมภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ ชุดกลยุทธ์สมดุลของแนชจะเป็น ("ยอมรับ - ยอมรับ") ยิ่งไปกว่านั้น สิ่งสำคัญคือต้องสังเกตว่าสำหรับทั้งผู้เล่น A และผู้เล่น B "รับรู้" เป็นกลยุทธ์ที่โดดเด่น ในขณะที่ "ไม่จดจำ" นั้นถูกครอบงำ

3. สมดุล แนช . สมดุลของแนชเป็นประเภทของการตัดสินเกมที่มีผู้เล่นตั้งแต่สองคนขึ้นไป ซึ่งไม่มีผู้เข้าร่วมใดสามารถเพิ่มผลตอบแทนได้โดยการเปลี่ยนการตัดสินใจเพียงฝ่ายเดียว เมื่อผู้เข้าร่วมรายอื่นไม่เปลี่ยนการตัดสินใจ

สมมติว่าเกม เผชิญกับรูปแบบปกติซึ่งเป็นชุดของกลยุทธ์ที่บริสุทธิ์และเป็นชุดของผลตอบแทน

เมื่อผู้เล่นแต่ละคนเลือกกลยุทธ์ในโปรไฟล์กลยุทธ์ ผู้เล่นจะได้รับผลตอบแทน ยิ่งไปกว่านั้น ผลตอบแทนจะขึ้นอยู่กับรายละเอียดของกลยุทธ์ทั้งหมด ไม่เพียงแต่กลยุทธ์ที่ผู้เล่นเลือกเอง แต่ยังรวมถึงกลยุทธ์ของผู้อื่นด้วย โปรไฟล์กลยุทธ์คือความสมดุลของแนช หากการเปลี่ยนแปลงในกลยุทธ์นั้นไม่เป็นประโยชน์ต่อผู้เล่นคนใด ซึ่งก็คือ

เกมสามารถมีความสมดุลของแนชได้ทั้งในกลยุทธ์แบบบริสุทธิ์และแบบผสม

แนชพิสูจน์แล้วว่าหากได้รับอนุญาต กลยุทธ์แบบผสมแล้วในแต่ละเกม ผู้เล่นจะมีสมดุลแนชอย่างน้อยหนึ่งจุด

ในสถานการณ์สมดุลของแนช กลยุทธ์ของผู้เล่นแต่ละคนจะช่วยให้เขาตอบสนองได้ดีที่สุดต่อกลยุทธ์ของผู้เล่นคนอื่นๆ

4. ความสมดุล สแต็คเคลเบิร์ก. แบบจำลองสแต็คเคลเบิร์ก– แบบจำลองทฤษฎีเกมของตลาดผู้ขายน้อยรายในความไม่สมดุลของข้อมูล ในโมเดลนี้ พฤติกรรมของบริษัทได้รับการอธิบายโดยเกมไดนามิกพร้อมข้อมูลที่สมบูรณ์แบบ ซึ่งพฤติกรรมของบริษัทถูกจำลองโดยใช้ คงที่เกมกับ ข้อมูลที่สมบูรณ์. คุณสมบัติหลักเกมคือการปรากฏตัวของ บริษัท ชั้นนำซึ่งเป็นคนแรกที่กำหนดปริมาณการส่งออกของสินค้าและ บริษัท ที่เหลือจะได้รับคำแนะนำในการคำนวณ ข้อกำหนดเบื้องต้นของเกม:


อุตสาหกรรมผลิตผลิตภัณฑ์ที่เป็นเนื้อเดียวกัน: ความแตกต่างในผลิตภัณฑ์ของ บริษัท ต่างๆนั้นไม่มีนัยสำคัญ ซึ่งหมายความว่าเมื่อเลือกบริษัทที่จะซื้อจากผู้ซื้อจะมุ่งเน้นไปที่ราคาเท่านั้น

อุตสาหกรรมมีจำนวนบริษัทน้อย

บริษัท กำหนดปริมาณของผลิตภัณฑ์ที่ผลิตและกำหนดราคาตามความต้องการ

มีสิ่งที่เรียกว่าบริษัทผู้นำ ซึ่งบริษัทอื่นได้รับคำแนะนำจากปริมาณการผลิต

ดังนั้น แบบจำลอง Stackelberg จึงถูกนำมาใช้เพื่อหาทางออกที่ดีที่สุดในเกมไดนามิกและสอดคล้องกับผลตอบแทนสูงสุดของผู้เล่น โดยขึ้นอยู่กับเงื่อนไขที่พัฒนาขึ้นหลังจากที่ผู้เล่นหนึ่งคนหรือหลายคนเลือกแล้ว สมดุลของสแตคเคลเบิร์ก- สถานการณ์ที่ไม่มีผู้เล่นคนใดสามารถเพิ่มชัยชนะได้เพียงฝ่ายเดียว และการตัดสินใจจะทำโดยผู้เล่นคนเดียวก่อนและกลายเป็น รู้จักกับคนที่สองผู้เล่น ในเกมภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ ความสมดุลของ Stackelberg จะมาถึงในจัตุรัส (1; 1) - "ยอมรับความผิด" โดยอาชญากรทั้งสอง

5. พาเรโตเหมาะสมที่สุด- สถานะของระบบดังกล่าว ซึ่งค่าของแต่ละเกณฑ์เฉพาะที่อธิบายสถานะของระบบไม่สามารถปรับปรุงได้โดยไม่ทำให้ตำแหน่งของผู้เล่นอื่นแย่ลง

หลักการพาเรโตกล่าวว่า “การเปลี่ยนแปลงใด ๆ ที่ไม่ก่อให้เกิดการสูญเสีย แต่เป็นประโยชน์ต่อบางคน (ในการประเมินของพวกเขาเอง) ถือเป็นการปรับปรุง” ดังนั้น สิทธิในการเปลี่ยนแปลงทั้งหมดที่ไม่ก่อให้เกิดอันตรายเพิ่มเติมแก่ผู้อื่นจึงเป็นที่ยอมรับ

ชุดของสถานะระบบที่เหมาะสมที่สุดของพาเรโตเรียกว่า "ชุดพาเรโต" "ชุดของทางเลือกที่เหมาะสมที่สุดในความหมายของพาเรโต" หรือ "ชุดของทางเลือกที่เหมาะสมที่สุด"

สถานการณ์ที่บรรลุประสิทธิภาพของพาเรโตคือสถานการณ์ที่ผลประโยชน์ทั้งหมดจากการแลกเปลี่ยนหมดลง

ประสิทธิภาพของพาเรโตเป็นหนึ่งในแนวคิดหลักสำหรับเศรษฐศาสตร์สมัยใหม่ ตามแนวคิดนี้ ทฤษฎีบทสวัสดิการพื้นฐานข้อที่หนึ่งและข้อที่สองถูกสร้างขึ้น

หนึ่งในการประยุกต์ใช้ Pareto optimity คือการกระจายทรัพยากรของ Pareto (แรงงานและทุน) ในการรวมกลุ่มทางเศรษฐกิจระหว่างประเทศ เช่น สหภาพเศรษฐกิจของสองรัฐขึ้นไป ที่น่าสนใจ การกระจายพาเรโตก่อนและหลังการรวมกลุ่มทางเศรษฐกิจระหว่างประเทศได้รับการอธิบายทางคณิตศาสตร์อย่างเพียงพอ (Dalimov R.T., 2008) การวิเคราะห์แสดงให้เห็นว่ามูลค่าเพิ่มของภาคส่วนและรายได้ของทรัพยากรแรงงานเคลื่อนที่ไปในทิศทางตรงกันข้ามตามสมการการนำความร้อนที่รู้จักกันดี ซึ่งคล้ายกับก๊าซหรือของเหลวในอวกาศ ซึ่งทำให้สามารถนำเทคนิคการวิเคราะห์ไปใช้ได้ ในวิชาฟิสิกส์ที่เกี่ยวข้องกับปัญหาทางเศรษฐกิจของการโยกย้ายพารามิเตอร์ทางเศรษฐกิจ

Pareto ที่เหมาะสมที่สุดระบุว่าสวัสดิการของสังคมถึงขีดสุด และการกระจายทรัพยากรจะเหมาะสมที่สุด หากการเปลี่ยนแปลงใด ๆ ในการกระจายนี้ทำให้สวัสดิการของระบบเศรษฐกิจแย่ลงอย่างน้อยหนึ่งเรื่อง

สถานะที่ดีที่สุดของตลาด Pareto- สถานการณ์ที่เป็นไปไม่ได้ที่จะปรับปรุงตำแหน่งของผู้เข้าร่วมในกระบวนการทางเศรษฐกิจโดยไม่ลดความเป็นอยู่ที่ดีของผู้อื่นอย่างน้อยหนึ่งคนพร้อมกัน

ตามเกณฑ์ Pareto (เกณฑ์สำหรับการเติบโตของสวัสดิการสังคม) การเคลื่อนไหวไปสู่จุดสูงสุดเป็นไปได้เฉพาะกับการกระจายทรัพยากรที่เพิ่มสวัสดิการของคนอย่างน้อยหนึ่งคนโดยไม่ทำร้ายใคร

สถานการณ์ S* ถูกกล่าวว่าเป็นสถานการณ์เด่นของ Pareto S ถ้า:

สำหรับผู้เล่นใด ๆ ผลตอบแทนของเขาใน S<=S*

· มีผู้เล่นอย่างน้อยหนึ่งคนที่ได้ผลตอบแทนในสถานการณ์ S*>S

ในปัญหา "ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ" ความสมดุลของ Pareto เมื่อเป็นไปไม่ได้ที่จะปรับปรุงตำแหน่งของผู้เล่นคนใดคนหนึ่งโดยไม่ทำให้ตำแหน่งของอีกฝ่ายแย่ลงสอดคล้องกับสถานการณ์ของตาราง (2; 2)

พิจารณา ตัวอย่างที่ 1.

กลยุทธ์ที่เหมาะสมที่สุดในทฤษฎีความขัดแย้งคือกลยุทธ์ที่นำผู้เล่นไปสู่สมดุลที่มั่นคง เช่น บางสถานการณ์ที่สร้างความพึงพอใจให้กับผู้เล่นทุกคน

ความเหมาะสมของการแก้ปัญหาในทฤษฎีเกมขึ้นอยู่กับแนวคิด สถานการณ์สมดุล:

1) มันไม่เกิดประโยชน์สำหรับผู้เล่นคนใดคนหนึ่งที่จะเบี่ยงเบนจากสถานการณ์สมดุลหากคนอื่น ๆ ทั้งหมดยังคงอยู่ในนั้น

2) ความหมายของความสมดุล - ด้วยการเล่นซ้ำ ๆ ของเกม ผู้เล่นจะเข้าถึงสถานการณ์ของความสมดุล เริ่มเกมในสถานการณ์เชิงกลยุทธ์ใด ๆ

ในการโต้ตอบแต่ละครั้ง ดุลยภาพประเภทต่อไปนี้สามารถมีอยู่:

1. สมดุล ในกลยุทธ์ที่ระมัดระวัง . กำหนดโดยกลยุทธ์ที่ให้ผลลัพธ์ที่รับประกันแก่ผู้เล่น

2. สมดุล ในกลยุทธ์ที่โดดเด่น .

กลยุทธ์ที่โดดเด่นเป็นแผนปฏิบัติการที่ให้ผู้เข้าร่วมได้รับประโยชน์สูงสุดโดยไม่คำนึงถึงการกระทำของผู้เข้าร่วมรายอื่น ดังนั้นความสมดุลของกลยุทธ์ที่โดดเด่นจะเป็นจุดตัดของกลยุทธ์ที่โดดเด่นของผู้เข้าร่วมทั้งสองในเกม

หากกลยุทธ์ที่ดีที่สุดของผู้เล่นครอบงำกลยุทธ์อื่น ๆ ทั้งหมด เกมจะมีความสมดุลในกลยุทธ์ที่โดดเด่น ในเกมภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ ชุดกลยุทธ์สมดุลของแนชจะเป็น ("ยอมรับ - ยอมรับ") ยิ่งไปกว่านั้น สิ่งสำคัญคือต้องสังเกตว่าสำหรับทั้งผู้เล่น A และผู้เล่น B "รับรู้" เป็นกลยุทธ์ที่โดดเด่น ในขณะที่ "ไม่จดจำ" นั้นถูกครอบงำ

3. สมดุล แนช . สมดุลของแนชเป็นประเภทของการตัดสินเกมที่มีผู้เล่นตั้งแต่สองคนขึ้นไป ซึ่งไม่มีผู้เข้าร่วมใดสามารถเพิ่มผลตอบแทนได้โดยการเปลี่ยนการตัดสินใจเพียงฝ่ายเดียว เมื่อผู้เข้าร่วมรายอื่นไม่เปลี่ยนการตัดสินใจ

สมมติว่าเกม เผชิญกับรูปแบบปกติซึ่งเป็นชุดของกลยุทธ์ที่บริสุทธิ์และเป็นชุดของผลตอบแทน

เมื่อผู้เล่นแต่ละคนเลือกกลยุทธ์ในโปรไฟล์กลยุทธ์ ผู้เล่นจะได้รับผลตอบแทน ยิ่งไปกว่านั้น ผลตอบแทนจะขึ้นอยู่กับรายละเอียดของกลยุทธ์ทั้งหมด ไม่เพียงแต่กลยุทธ์ที่ผู้เล่นเลือกเอง แต่ยังรวมถึงกลยุทธ์ของผู้อื่นด้วย โปรไฟล์กลยุทธ์คือความสมดุลของแนช หากการเปลี่ยนแปลงในกลยุทธ์นั้นไม่เป็นประโยชน์ต่อผู้เล่นคนใด ซึ่งก็คือ



เกมสามารถมีความสมดุลของแนชได้ทั้งในกลยุทธ์แบบบริสุทธิ์และแบบผสม

แนชพิสูจน์แล้วว่าหากได้รับอนุญาต กลยุทธ์แบบผสมแล้วในแต่ละเกม ผู้เล่นจะมีสมดุลแนชอย่างน้อยหนึ่งจุด

ในสถานการณ์สมดุลของแนช กลยุทธ์ของผู้เล่นแต่ละคนจะช่วยให้เขาตอบสนองได้ดีที่สุดต่อกลยุทธ์ของผู้เล่นคนอื่นๆ

4. ความสมดุล สแต็คเคลเบิร์ก. แบบจำลองสแต็คเคลเบิร์ก– แบบจำลองทฤษฎีเกมของตลาดผู้ขายน้อยรายในความไม่สมดุลของข้อมูล ในโมเดลนี้ พฤติกรรมของบริษัทได้รับการอธิบายโดยเกมไดนามิกพร้อมข้อมูลที่สมบูรณ์แบบ ซึ่งพฤติกรรมของบริษัทถูกจำลองโดยใช้ คงที่เกมที่มีข้อมูลครบถ้วน คุณสมบัติหลักของเกมคือการปรากฏตัวของ บริษัท ชั้นนำซึ่งกำหนดปริมาณการส่งออกของสินค้าเป็นอันดับแรกและ บริษัท อื่น ๆ จะได้รับคำแนะนำในการคำนวณ ข้อกำหนดเบื้องต้นของเกม:

อุตสาหกรรมผลิตผลิตภัณฑ์ที่เป็นเนื้อเดียวกัน: ความแตกต่างในผลิตภัณฑ์ของ บริษัท ต่างๆนั้นไม่มีนัยสำคัญ ซึ่งหมายความว่าเมื่อเลือกบริษัทที่จะซื้อจากผู้ซื้อจะมุ่งเน้นไปที่ราคาเท่านั้น

อุตสาหกรรมมีจำนวนบริษัทน้อย

บริษัท กำหนดปริมาณของผลิตภัณฑ์ที่ผลิตและกำหนดราคาตามความต้องการ

มีสิ่งที่เรียกว่าบริษัทผู้นำ ซึ่งบริษัทอื่นได้รับคำแนะนำจากปริมาณการผลิต

ดังนั้น แบบจำลอง Stackelberg จึงถูกนำมาใช้เพื่อหาทางออกที่ดีที่สุดในเกมไดนามิกและสอดคล้องกับผลตอบแทนสูงสุดของผู้เล่น โดยขึ้นอยู่กับเงื่อนไขที่พัฒนาขึ้นหลังจากที่ผู้เล่นหนึ่งคนหรือหลายคนเลือกแล้ว สมดุลของสแตคเคลเบิร์ก- สถานการณ์ที่ไม่มีผู้เล่นคนใดสามารถเพิ่มชัยชนะได้เพียงฝ่ายเดียว และการตัดสินใจจะทำโดยผู้เล่นคนหนึ่งก่อน และกลายเป็นที่รู้กันของผู้เล่นคนที่สอง ในเกมภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ ความสมดุลของ Stackelberg จะมาถึงในจัตุรัส (1; 1) - "ยอมรับความผิด" โดยอาชญากรทั้งสอง

5. พาเรโตเหมาะสมที่สุด- สถานะของระบบดังกล่าว ซึ่งค่าของแต่ละเกณฑ์เฉพาะที่อธิบายสถานะของระบบไม่สามารถปรับปรุงได้โดยไม่ทำให้ตำแหน่งของผู้เล่นอื่นแย่ลง

หลักการพาเรโตกล่าวว่า “การเปลี่ยนแปลงใด ๆ ที่ไม่ก่อให้เกิดการสูญเสีย แต่เป็นประโยชน์ต่อบางคน (ในการประเมินของพวกเขาเอง) ถือเป็นการปรับปรุง” ดังนั้น สิทธิในการเปลี่ยนแปลงทั้งหมดที่ไม่ก่อให้เกิดอันตรายเพิ่มเติมแก่ผู้อื่นจึงเป็นที่ยอมรับ

ชุดของสถานะระบบที่เหมาะสมที่สุดของพาเรโตเรียกว่า "ชุดพาเรโต" "ชุดของทางเลือกที่เหมาะสมที่สุดในความหมายของพาเรโต" หรือ "ชุดของทางเลือกที่เหมาะสมที่สุด"

สถานการณ์ที่บรรลุประสิทธิภาพของพาเรโตคือสถานการณ์ที่ผลประโยชน์ทั้งหมดจากการแลกเปลี่ยนหมดลง

ประสิทธิภาพของพาเรโตเป็นหนึ่งในแนวคิดหลักสำหรับเศรษฐศาสตร์สมัยใหม่ ตามแนวคิดนี้ ทฤษฎีบทสวัสดิการพื้นฐานข้อที่หนึ่งและข้อที่สองถูกสร้างขึ้น

หนึ่งในการประยุกต์ใช้ Pareto optimity คือการกระจายทรัพยากรของ Pareto (แรงงานและทุน) ในการรวมกลุ่มทางเศรษฐกิจระหว่างประเทศ เช่น สหภาพเศรษฐกิจของสองรัฐขึ้นไป ที่น่าสนใจ การกระจายพาเรโตก่อนและหลังการรวมกลุ่มทางเศรษฐกิจระหว่างประเทศได้รับการอธิบายทางคณิตศาสตร์อย่างเพียงพอ (Dalimov R.T., 2008) การวิเคราะห์แสดงให้เห็นว่ามูลค่าเพิ่มของภาคส่วนและรายได้ของทรัพยากรแรงงานเคลื่อนที่ไปในทิศทางตรงกันข้ามตามสมการการนำความร้อนที่รู้จักกันดี ซึ่งคล้ายกับก๊าซหรือของเหลวในอวกาศ ซึ่งทำให้สามารถนำเทคนิคการวิเคราะห์ไปใช้ได้ ในวิชาฟิสิกส์ที่เกี่ยวข้องกับปัญหาทางเศรษฐกิจของการโยกย้ายพารามิเตอร์ทางเศรษฐกิจ

Pareto ที่เหมาะสมที่สุดระบุว่าสวัสดิการของสังคมถึงขีดสุด และการกระจายทรัพยากรจะเหมาะสมที่สุด หากการเปลี่ยนแปลงใด ๆ ในการกระจายนี้ทำให้สวัสดิการของระบบเศรษฐกิจแย่ลงอย่างน้อยหนึ่งเรื่อง

สถานะที่ดีที่สุดของตลาด Pareto- สถานการณ์ที่เป็นไปไม่ได้ที่จะปรับปรุงตำแหน่งของผู้เข้าร่วมในกระบวนการทางเศรษฐกิจโดยไม่ลดความเป็นอยู่ที่ดีของผู้อื่นอย่างน้อยหนึ่งคนพร้อมกัน

ตามเกณฑ์ Pareto (เกณฑ์สำหรับการเติบโตของสวัสดิการสังคม) การเคลื่อนไหวไปสู่จุดสูงสุดเป็นไปได้เฉพาะกับการกระจายทรัพยากรที่เพิ่มสวัสดิการของคนอย่างน้อยหนึ่งคนโดยไม่ทำร้ายใคร

สถานการณ์ S* ถูกกล่าวว่าเป็นสถานการณ์เด่นของ Pareto S ถ้า:

สำหรับผู้เล่นใด ๆ ผลตอบแทนของเขาใน S<=S*

· มีผู้เล่นอย่างน้อยหนึ่งคนที่ได้ผลตอบแทนในสถานการณ์ S*>S

ในปัญหา "ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ" ความสมดุลของ Pareto เมื่อเป็นไปไม่ได้ที่จะปรับปรุงตำแหน่งของผู้เล่นคนใดคนหนึ่งโดยไม่ทำให้ตำแหน่งของอีกฝ่ายแย่ลงสอดคล้องกับสถานการณ์ของตาราง (2; 2)

พิจารณา ตัวอย่างที่ 1:

ความสมดุลในกลยุทธ์ที่โดดเด่นเลขที่

สมดุลของแนช. (5.5) และ (4.4) เนื่องจากไม่เกิดประโยชน์สำหรับผู้เล่นรายใดที่จะเบี่ยงเบนจากกลยุทธ์ที่เลือกเป็นรายบุคคล

Pareto ที่เหมาะสมที่สุด. (5.5). เนื่องจากผลตอบแทนของผู้เล่นเมื่อเลือกกลยุทธ์เหล่านี้ ชนะมากขึ้นเมื่อเลือกกลยุทธ์อื่นๆ

สมดุลของสแตคเคลเบิร์ก:

ผู้เล่น A ทำการเคลื่อนไหวครั้งแรก

เลือกกลยุทธ์แรกของเขา B เลือกกลยุทธ์แรก A ได้ 5

เลือกกลยุทธ์ที่สองของเขา B เลือกอันที่สอง A ได้ 4

5 > 4 =>

B ทำการเคลื่อนไหวครั้งแรก

เลือกกลยุทธ์แรกของเขา A เลือกกลยุทธ์แรก บี ได้ 5

เลือกกลยุทธ์ที่สองของเขา และเขาเลือกอันที่สอง บี ได้ 4

5 > 4 => สมดุลสแตคเคลเบิร์ก (5, 5)

ตัวอย่างที่ 2การสร้างแบบจำลองดูโอโพลี.

พิจารณาสาระสำคัญของแบบจำลองนี้:

ให้มีอุตสาหกรรมที่มีสองบริษัท แห่งหนึ่งเป็น "บริษัทผู้นำ" และอีกแห่งเป็น "บริษัทผู้ตาม" ให้ราคาสินค้าเป็น ฟังก์ชันเชิงเส้นอุปทานทั้งหมด ถาม:

พี(ถาม) = บีคิว.

ให้เราสมมติว่าต้นทุนของบริษัทต่อหน่วยของผลผลิตมีค่าคงที่และเท่ากับ กับ 1 และ กับ 2 ตามลำดับ จากนั้นกำไรของบริษัทแรกจะถูกกำหนดโดย สูตร

Π 1 = พี(ถาม 1 + ถาม 2) * ถาม 1 − 1 ถาม 1 ,

และกำไรของส่วนที่สองตามลำดับ

Π 2 = พี(ถาม 1 + ถาม 2) * ถาม 2 − 2 ถาม 2 .

ตามแบบจำลอง Stackelberg บริษัทแรก - บริษัทชั้นนำ - ในขั้นตอนแรกกำหนดผลลัพธ์ ถาม 1 . หลังจากนั้น บริษัทที่สอง - บริษัทผู้ตาม - โดยการวิเคราะห์การกระทำของ บริษัท ผู้นำจะเป็นตัวกำหนดผลลัพธ์ ถาม 2. เป้าหมายของทั้งสองบริษัทคือเพิ่มฟังก์ชันการชำระเงินให้ได้สูงสุด

สมดุลแนชในเกมนี้ถูกกำหนดโดยการเหนี่ยวนำย้อนกลับ พิจารณาขั้นตอนสุดท้ายของเกม - การย้ายของ บริษัท ที่สอง ในขั้นตอนนี้ บริษัท 2 รู้ผลลัพธ์ที่ดีที่สุดของ บริษัท 1 ถาม 1 * . จากนั้นปัญหาในการพิจารณาผลลัพธ์ที่ดีที่สุด ถาม 2 * ลดลงเพื่อแก้ปัญหาในการหาจุดสูงสุดของฟังก์ชันการจ่ายเงินของบริษัทที่สอง การทำให้ฟังก์ชัน Π 2 มีค่าสูงสุดตามตัวแปร ถาม 2 นับ ถามจาก 1 เราพบว่าผลลัพธ์ที่ดีที่สุดของบริษัทที่สอง

นี่คือการตอบสนองที่ดีที่สุดของบริษัทผู้ติดตามต่อการเลือกโดยบริษัทผู้นำของการเปิดตัว ถาม 1 * . บริษัทชั้นนำสามารถเพิ่มฟังก์ชันการจ่ายเงินให้ได้สูงสุดตามรูปแบบของฟังก์ชัน ถาม 2*. จุดสูงสุดของฟังก์ชัน Π 1 ในตัวแปร ถาม 1 เมื่อเปลี่ยน ถาม 2 * จะ

แทนที่สิ่งนี้ลงในนิพจน์สำหรับ ถาม 2 * , เราได้รับ

ดังนั้น ในภาวะสมดุล บริษัทผู้นำจะสร้างผลผลิตมากเป็นสองเท่าของบริษัทผู้ตาม

เราได้รวมเส้นอุปสงค์และอุปทานไว้ในแผนภูมิเดียว ภาพกราฟิกสมดุลในพิกัด พี, คิว(รูปที่ 2.6) จุดตัดของเส้นมีพิกัด (พ * , คิว*),ที่ไหน ร* -ราคาดุลยภาพ, ถาม *- ปริมาณการผลิตและการบริโภคที่สมดุล

ดุลยภาพของตลาด- นี่คือสถานะของตลาดซึ่งสำหรับระดับราคาที่กำหนด ปริมาณที่ต้องการจะเท่ากับปริมาณที่จัดหา

อยู่ที่จุดสมดุลเท่านั้น อีตลาดมีความสมดุล ไม่มีตัวแทนในตลาดรายใดที่มีแรงจูงใจในการเปลี่ยนแปลงสถานการณ์ ซึ่งหมายความว่าดุลยภาพของตลาดมีคุณสมบัติ ความยั่งยืน -ในกรณีที่สภาวะไม่สมดุล ตัวแทนในตลาดจะได้รับแรงจูงใจให้ตลาดกลับคืนสู่สภาวะสมดุล เพื่อพิสูจน์ความเสถียร มักใช้ตรรกะของ L. Walras หรือ A. Marshall

จากข้อมูลของ L. Walras ในราคาที่สูงเกินไป มีอุปทานส่วนเกิน - การผลิตมากเกินไป (ส่วน เอ-บีในรูป 2.6i) ตลาดดังกล่าวเรียกว่า ตลาดของผู้ซื้อเนื่องจากผู้ซื้อมีโอกาสที่จะขอลดราคาเมื่อทำธุรกรรม ในสถานการณ์เช่นนี้ ประการแรก ผู้ขายไม่สนใจซึ่งถูกบังคับให้ลดราคาและลดปริมาณการผลิต เมื่อราคาลดลง ปริมาณความต้องการก็เพิ่มขึ้น เอ-บีหดตัวจนกลายเป็นจุดสมดุล อี

ที่ ราคาต่ำมีความต้องการมากเกินไป - การขาดแคลน (ส่วน CFna รูปที่ 2.6a) พัฒนาขึ้น ตลาดของผู้ขายผู้ซื้อถูกบังคับ


หากผู้บริโภคลดการบริโภคและจ่ายเงินมากเกินไปสำหรับสินค้าที่หายาก เมื่อราคาสูงขึ้น ปริมาณที่จัดหาเพิ่มขึ้น และความขาดแคลนจะลดลงจนกว่าตลาดจะสมดุล

ตามที่ A. Marshall กล่าว (ภาพที่ 2.66), สำหรับการผลิตในปริมาณน้อย ราคาอุปสงค์จะสูงกว่าราคาของผู้ขาย สำหรับปริมาณมาก - ในทางกลับกัน ไม่ว่าในกรณีใด สถานการณ์ความไม่สมดุลจะกระตุ้นการเปลี่ยนแปลงของราคาหรือปริมาณของอุปสงค์และอุปทานไปสู่สมดุล สมดุล (เอ)ตาม Walras - ราคาควบคุมความไม่สมดุลของอุปสงค์และอุปทาน (ข)ตามมาร์แชล - ราคาของผู้ซื้อและผู้ขายมีความสมดุลโดยการเปลี่ยนแปลงของปริมาณ

ข้าว. 2.6. การสร้างดุลยภาพของตลาด: c) ตาม L. Walras; b) ตาม A. Marshall

การเปลี่ยนแปลงของอุปสงค์หรืออุปทานของตลาดนำไปสู่การเปลี่ยนแปลงของดุลยภาพ (รูปที่ 2.7) ตัวอย่างเช่น หากความต้องการของตลาดเพิ่มขึ้น เส้นอุปสงค์จะเลื่อนไปทางขวา จากนั้นราคาดุลยภาพและปริมาณจะเพิ่มขึ้น หากอุปทานในตลาดลดลง เส้นอุปทานจะเลื่อนไปทางซ้าย ส่งผลให้ราคาเพิ่มขึ้นและปริมาณลดลง

รุ่นนี้ตลาดคงที่เนื่องจากเวลาไม่ปรากฏในนั้น

โมเดล "สไปเดอร์"

ตัวอย่างของแบบจำลองไดนามิกของดุลยภาพตลาด เรานำเสนอแบบจำลอง "ใยแมงมุม" ที่ง่ายที่สุด สมมติว่าปริมาณที่ต้องการขึ้นอยู่กับระดับราคาของงวดปัจจุบัน เสื้อและปริมาณอุปทาน - จากราคาของงวดก่อนหน้า t-1:

Q d i = Q d i (P t) , Q s i = Q s i (P t -1) ,

โดยที่ t = 0.1….T คือค่าที่ไม่ต่อเนื่องของช่วงเวลา




ข้าว. 2.7. การเปลี่ยนแปลงดุลยภาพของตลาด:

ก) เนื่องจากความต้องการที่เพิ่มขึ้น ข)เนื่องจากการลดลง

ข้อเสนอ

ราคาตลาด พี ทีอาจไม่ตรงกับราคาดุลยภาพ ร*,และมีสามไดนามิกที่เป็นไปได้ พี ที(รูปที่ 2.8)

ตัวแปรของวิถีการพัฒนาในแบบจำลองนี้ขึ้นอยู่กับอัตราส่วนของความลาดเอียงของเส้นอุปสงค์และอุปทาน

ข้าว. 2.8. แบบจำลองดุลยภาพของตลาด "แมงมุม":

ก) การเบี่ยงเบนจากสมดุลลดลง 5) การเบี่ยงเบน

เพิ่มขึ้นจากสภาวะสมดุล (แบบจำลอง "หายนะ"); ค) ตลาด

แกว่งเป็นวงกลมรอบจุดสมดุล แต่สมดุล



สูงสุด