Η δυαδικότητα στον γραμμικό προγραμματισμό. Τύποι ισορροπίας: Ισορροπία Nash, Stekelberg, Pareto-βέλτιστη ισορροπία, ισορροπία κυρίαρχων στρατηγικών Ποιος είναι ο βέλτιστος μηχανισμός για την εύρεση λύσης στην ισορροπία

Βασικοί ορισμοί της θεωρίας της δυαδικότητας.

Κάθε πρόβλημα γραμμικού προγραμματισμού μπορεί να συσχετιστεί με άλλο πρόβλημα γραμμικού προγραμματισμού. Όταν ένα από αυτά λυθεί, το άλλο πρόβλημα λύνεται αυτόματα. Τέτοιες εργασίες ονομάζονται αμοιβαία διπλές. Ας δείξουμε πώς, δεδομένου ενός δεδομένου προβλήματος (θα το ονομάσουμε το αρχικό), μπορούμε να κατασκευάσουμε το διπλό του.

Εξετάστε το πρόβλημα της προγραμματισμένης παραγωγής.

F=3 Χ 1 + 5Χ 2 + 4Χ 3 + 5Χ 4 → μέγ.
5x 1 +0,4x 2 +2x 3 +0,5x 4 ≤400
5x2 +x3 +x4 ≤300
x 1 + x 3 + x 4 ≤100
x 1 ≥0, x 2 ≥0, x 3 ≥0, x 4 ≥0

Γενικοί κανόνες για τη σύνταξη ενός διπλού προβλήματος:

Ευθεία διπλός
Συνάρτηση στόχου (μέγ.) Η δεξιά πλευρά των περιορισμών
Η δεξιά πλευρά των περιορισμών Συνάρτηση στόχου (λεπτά)
A - πίνακας περιορισμών Ένας πίνακας περιορισμών T
i -ος περιορισμός: ≤ 0, (≥ 0) Μεταβλητή y i ≥ 0, (≤ 0)
i -ος περιορισμός: = 0 Μεταβλητή y i ≠ 0
Μεταβλητή x j ≥ 0 (≤ 0)
Μεταβλητή x j ≠ 0 j-ος περιορισμός: = 0
μέγ. → ελάχ
Ευθεία διπλός
Συνάρτηση στόχου (λεπτά) Η δεξιά πλευρά των περιορισμών
Η δεξιά πλευρά των περιορισμών Συνάρτηση στόχου (μέγ.)
A - πίνακας περιορισμών Ένας πίνακας περιορισμών T
i -ος περιορισμός: ≥ 0, (≤ 0) Μεταβλητή y i ≥ 0, (≤ 0)
i -ος περιορισμός: = 0 Μεταβλητή y i ≠ 0
Μεταβλητή x j ≥ 0 (≤ 0) j -ος περιορισμός: ≤ 0 (≥ 0)
Μεταβλητή x j ≠ 0 j-ος περιορισμός: = 0

Ας κατασκευάσουμε το διπλό του πρόβλημα σύμφωνα με τους παρακάτω κανόνες.

  1. Ο αριθμός των μεταβλητών στο διπλό πρόβλημα είναι ίσος με τον αριθμό των ανισοτήτων στο αρχικό.
  2. Ο πίνακας συντελεστών του διπλού προβλήματος μεταφέρεται στον πίνακα συντελεστών του αρχικού.
  3. Η στήλη των ελεύθερων όρων του αρχικού προβλήματος είναι μια σειρά συντελεστών για τη συνάρτηση διπλού στόχου. Η αντικειμενική συνάρτηση μεγιστοποιείται σε ένα πρόβλημα και ελαχιστοποιείται σε ένα άλλο.
  4. Οι προϋποθέσεις για τη μη αρνητικότητα των μεταβλητών του αρχικού προβλήματος αντιστοιχούν στις ανισότητες-περιορισμούς του διπλού προβλήματος που κατευθύνονται προς την αντίθετη κατεύθυνση. Και αντίστροφα, οι ανισότητες-περιορισμοί στο πρωτότυπο αντιστοιχούν στις συνθήκες της μη αρνητικότητας στο δυαδικό.

Σημειώστε ότι οι σειρές του πίνακα της εργασίας I είναι οι στήλες του πίνακα της εργασίας II. Επομένως, οι συντελεστές για τις μεταβλητές y i στο πρόβλημα II είναι, αντίστοιχα, οι συντελεστές της i -ης ανισότητας στο πρόβλημα I.
Το μοντέλο που προκύπτει είναι το οικονομικό και μαθηματικό μοντέλο του προβλήματος διπλό προς το άμεσο πρόβλημα.

Οι ανισότητες που συνδέονται με βέλη θα είναι κλήση συζευγμένος.
Ουσιαστική διατύπωση του διπλού προβλήματος: βρείτε ένα τέτοιο σύνολο τιμών (εκτιμήσεις) πόρων Y = (y 1 , y 2 ..., y m), στο οποίο το συνολικό κόστος των πόρων θα είναι ελάχιστο, με την προϋπόθεση ότι το κόστος των πόρων στην παραγωγή κάθε τύπου του προϊόντος δεν θα είναι μικρότερο από το κέρδος ( έσοδα από την πώληση αυτών των προϊόντων.
Τιμές πόρων y 1 , y 2 ..., y m στην οικονομική βιβλιογραφία που ελήφθη διάφορους τίτλους: λογιστικό, άρρητο, σκιά. Το νόημα αυτών των ονομάτων είναι ότι πρόκειται για τιμές υπό όρους, «ψεύτικα». Σε αντίθεση με τις "εξωτερικές" τιμές από 1 , από 2 ..., από n για προϊόντα, γνωστές, κατά κανόνα, πριν από την έναρξη της παραγωγής, οι τιμές των πόρων y 1 , y 2 ..., y m είναι εσωτερικές , επειδή δεν ορίζονται από έξω, αλλά καθορίζονται άμεσα ως αποτέλεσμα της επίλυσης του προβλήματος, γι' αυτό ονομάζονται συχνά εκτιμήσεις πόρων.
Η σύνδεση μεταξύ του άμεσου και του διπλού προβλημάτων συνίσταται, ειδικότερα, στο γεγονός ότι η λύση του ενός από αυτά μπορεί να επιτευχθεί απευθείας από τη λύση του άλλου.

Θεωρήματα δυαδικότητας

Η δυαδικότητα είναι μια θεμελιώδης έννοια στη θεωρία του γραμμικού προγραμματισμού. Τα κύρια αποτελέσματα της θεωρίας της δυαδικότητας περιέχονται σε δύο θεωρήματα που ονομάζονται θεωρήματα δυαδικότητας.

Πρώτο θεώρημα δυαδικότητας.

Εάν ένα από το ζεύγος των διπλών προβλημάτων I και II είναι επιλύσιμο, τότε το άλλο είναι επιλύσιμο και οι τιμές των αντικειμενικών συναρτήσεων στα βέλτιστα σχέδια είναι οι ίδιες, φά(Χ*) = σολ(y*), όπου x *, y * - βέλτιστες λύσεις προβλημάτων I και II

Δεύτερο θεώρημα δυαδικότητας.

Τα σχέδια x * και y * είναι βέλτιστα στα προβλήματα I και II εάν και μόνο εάν, όταν αντικατασταθούν στο σύστημα περιορισμών των προβλημάτων I και II, αντίστοιχα, τουλάχιστον ένα από οποιοδήποτε ζεύγος συζυγών ανισοτήτων γίνεται ισότητα.
Αυτό θεμελιώδες θεώρημα δυαδικότητας. Με άλλα λόγια, εάν τα x * και y * είναι εφικτές λύσεις στα πρωτεύοντα και διπλά προβλήματα, και αν c T x*=b T y*, τότε τα x * και y * είναι βέλτιστες λύσεις σε ένα ζεύγος διπλών προβλημάτων.

Τρίτο θεώρημα δυαδικότητας. Οι τιμές των μεταβλητών y i στη βέλτιστη λύση του διπλού προβλήματος είναι εκτιμήσεις της επίδρασης των ελεύθερων μελών b i του συστήματος περιορισμών - ανισοτήτων του άμεσου προβλήματος στην τιμή της αντικειμενικής συνάρτησης αυτού του προβλήματος:
Δf(x) = b i y i

Επιλύοντας το LLP με τη μέθοδο simplex, λύνουμε ταυτόχρονα το διπλό LLP. Οι τιμές των μεταβλητών του διπλού προβλήματος y i, στο βέλτιστο σχέδιο ονομάζονται αντικειμενικά προσδιορισμένες ή διπλές εκτιμήσεις. Σε εφαρμοσμένα προβλήματα, οι διπλές εκτιμήσεις y i ονομάζονται συχνά κρυφές, σκιώδεις τιμές ή οριακές εκτιμήσεις πόρων.

Ιδιότητα αμοιβαία διττών προβλημάτων

  1. Σε ένα πρόβλημα, αναζητείται το μέγιστο μιας γραμμικής συνάρτησης, στο άλλο, το ελάχιστο.
  2. Οι συντελεστές για τις μεταβλητές σε μια γραμμική συνάρτηση ενός προβλήματος είναι ελεύθερα μέλη του συστήματος των περιορισμών σε ένα άλλο.
  3. Κάθε ένα από τα προβλήματα δίνεται στην τυπική μορφή, και στο πρόβλημα μεγιστοποίησης όλες οι ανισότητες της μορφής ≤ , και στο πρόβλημα ελαχιστοποίησης όλες οι ανισότητες της μορφής ≥ .
  4. Οι πίνακες συντελεστών για τις μεταβλητές στα συστήματα περιορισμών και των δύο προβλημάτων μεταφέρονται μεταξύ τους:
  5. Ο αριθμός των ανισοτήτων στο σύστημα περιορισμών ενός προβλήματος είναι ίδιος με τον αριθμό των μεταβλητών στο άλλο πρόβλημα.
  6. Προϋποθέσεις για τη μη αρνητικότητα των μεταβλητών υπάρχουν και στα δύο προβλήματα.

Θεώρημα ισορροπίας

Εργασία 2
Να συνθέσετε ένα διπλό πρόβλημα για το πρόβλημα 1. Βρείτε το λύση με το θεώρημα της ισορροπίας.
3x1 +x2 ≥12
x1 +2x2 ≥14
4x1 +11x2 ≥68

Θεώρημα ισορροπίας . Έστω X*=(x 1 *,...,x n *) και Y*=(y 1 *,...,y n *) αποδεκτά σχέδια ενός ζεύγους διπλών προβλημάτων σε συμμετρική μορφή. Αυτά τα σχέδια είναι βέλτιστα εάν και μόνο εάν πληρούνται οι ακόλουθες συμπληρωματικές συνθήκες χαλαρότητας:


Το θεώρημα 4 μας επιτρέπει να προσδιορίσουμε τη βέλτιστη λύση σε ένα από ένα ζεύγος διπλών προβλημάτων λύνοντας το άλλο. Εάν ο περιορισμός ενός προβλήματος μετατραπεί σε αυστηρή ανισότητα όταν αντικατασταθεί η βέλτιστη λύση, τότε η αντίστοιχη διπλή μεταβλητή στη βέλτιστη λύση του διπλού προβλήματος είναι ίση με 0. Εάν κάποια μεταβλητή είναι θετική στο βέλτιστο σχέδιο ενός προβλήματος, τότε ο αντίστοιχος περιορισμός του διπλού προβλήματος είναι μια εξίσωση.
Ας δώσουμε μια οικονομική ερμηνεία των συνθηκών της συμπληρωματικής χαλαρότητας. Εάν στη βέλτιστη λύση κάποια πρώτη ύλη έχει εκτίμηση διαφορετική από 0, τότε θα εξαντληθεί πλήρως (ο πόρος είναι σπάνιος). Εάν η πρώτη ύλη δεν καταναλωθεί πλήρως (υπάρχει περίσσεια), τότε η εκτίμησή της είναι ίση με 0. Έτσι, παίρνουμε ότι οι διπλές αξιολογήσεις είναι ένα μέτρο της σπανιότητας των πρώτων υλών. Η εκτίμηση δείχνει πόσο θα αυξηθεί η αξία της αντικειμενικής συνάρτησης με αύξηση του αποθέματος της αντίστοιχης πρώτης ύλης κατά 1 μονάδα. Εάν ένα συγκεκριμένο είδος προϊόντος περιλαμβάνεται στο σχέδιο παραγωγής, τότε το κόστος παραγωγής του συμπίπτει με το κόστος του παραγόμενου προϊόντος. Εάν το κόστος παραγωγής ενός προϊόντος είναι μεγαλύτερο από το κόστος του προϊόντος, τότε το προϊόν δεν παράγεται.
Εάν ένα από το ζεύγος των διπλών προβλημάτων περιέχει δύο μεταβλητές, μπορεί να λυθεί γραφικά και, στη συνέχεια, να βρεθεί μια λύση στο διπλό πρόβλημα χρησιμοποιώντας τα θεωρήματα 3 και 4. Σε αυτήν την περίπτωση, μπορεί να προκύψουν 3 περιπτώσεις: και τα δύο προβλήματα έχουν εφικτές λύσεις, μόνο Το ένα έχει πρόβλημα με εφικτές λύσεις, και τα δύο προβλήματα δεν έχουν εφικτές λύσεις.

Παράδειγμα 2
Να συνθέσετε ένα διπλό πρόβλημα και να βρείτε τη λύση του χρησιμοποιώντας το θεώρημα της ισορροπίας
x 2 -2x 3 +2x 4 -2x 5 ≤4
-2x 1 -2x 2 +2x 3 +2x 4 +x 5 ≥2
x i ≥0, i=1,5
Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → max, αν η λύση του αρχικού προβλήματος είναι γνωστή: Zmax=(3;4;0;0;0).
Ας κατασκευάσουμε ένα διπλό πρόβλημα. Συμφωνούμε τα σημάδια των ανισοτήτων με τον στόχο του αρχικού προβλήματος.

Z=10x 1 -9x 2 -19x 3 -13x 4 -11x 5 → μέγ.
Διπλή εργασία:

W=4y 1 -2y 2 → min
Ας βρούμε τη βέλτιστη λύση του διπλού προβλήματος χρησιμοποιώντας το θεώρημα της ισορροπίας. Ας γράψουμε τις συνθήκες της συμπληρωματικής νωθρότητας.
y 1 (4-(x 2 -2x 3 +2x 4 -2x 5))=0
y 2 (-2-(2x 1 -2x 2 -2x 3 -2x 4 -x 5))=0
x 1 (-2y 2 -10)=0
x 2 (y 1 -2y 2 +9)=0
x 3 (-2y 1 -2y 2 +19)=0
x 4 (2y 1 -2y 2 +13)=0
x 5 (-2y 1 -y 2 +11)=0
Ας αντικαταστήσουμε τη βέλτιστη λύση του αρχικού προβλήματος στο μεταγλωττισμένο σύστημα: x 1 =3, x 2 =4, x 3 =0, x 4 =0, x 5 =0.
y 1 (4-(4-2 0+2 0-2 0))=0
y 2 (-2-(2 3-2 4-2 0-2 0-0))=0 W(y 1 , y 2 , y 3)=12y 1 +31y 2 +18y 3 → μέγ. Από το Θεώρημα 3 Zmax=Wmin=100000.
Τέλος, Wmin=W(0; 4000/7; 32000/21) = 100000

Σε ένα ανταγωνιστικό παιχνίδι, είναι φυσικό να θεωρούμε ότι το βέλτιστο αποτέλεσμα είναι αυτό στο οποίο είναι ασύμφορο για οποιονδήποτε από τους παίκτες να παρεκκλίνει από αυτό. Ένα τέτοιο αποτέλεσμα (x*,y*) ονομάζεται κατάσταση ισορροπίας και η αρχή της βελτιστοποίησης που βασίζεται στην εύρεση μιας κατάστασης ισορροπίας ονομάζεται αρχή ισορροπίας.

Ορισμός. Σε ένα παιχνίδι μήτρας με μήτρα διαστάσεων, το αποτέλεσμα είναι κατάσταση ισορροπίαςή ένα σημείο σέλας αν

Σε ένα σημείο σέλας, ένα στοιχείο μήτρας είναι τόσο το ελάχιστο στη σειρά του όσο και το μέγιστο στη στήλη του. Στο παιχνίδι από το παράδειγμα, στοιχείο 2 ένα 33είναι ένα σημείο σέλας. Βέλτιστες σε αυτό το παιχνίδι είναι οι τρίτες στρατηγικές και για τους δύο παίκτες. Εάν ο πρώτος παίκτης παρεκκλίνει από την τρίτη στρατηγική, τότε αρχίζει να κερδίζει λιγότερο από ένα 33. Εάν ο δεύτερος παίκτης παρεκκλίνει από την τρίτη στρατηγική, τότε αρχίζει να χάνει περισσότερα από ένα 33. Έτσι, και για τους δύο παίκτες, δεν υπάρχει τίποτα καλύτερο από το να τηρούν με συνέπεια την τρίτη στρατηγική.

Η αρχή της βέλτιστης συμπεριφοράς: εάν υπάρχει ένα σημείο σέλας σε ένα παιχνίδι matrix, τότε η βέλτιστη στρατηγική είναι η επιλογή που αντιστοιχεί στο σημείο σέλας. Τι συμβαίνει εάν υπάρχουν περισσότερα από ένα σημεία σέλας στο παιχνίδι;

Θεώρημα. Αφήνω δύο αυθαίρετα σημεία σέλας σε ένα παιχνίδι matrix. Επειτα:

Απόδειξη. Από τον ορισμό της κατάστασης ισορροπίας έχουμε:

Ας αντικαταστήσουμε στην αριστερή πλευρά της ανισότητας (2.8) και στη δεξιά - , στην αριστερή πλευρά της ανισότητας (2.9) - , στη δεξιά - . Τότε παίρνουμε:

Από πού προέρχεται η ισότητα:

Από το θεώρημα προκύπτει ότι η συνάρτηση αποπληρωμής έχει την ίδια τιμή σε όλες τις καταστάσεις ισορροπίας. Γι' αυτό λέγεται ο αριθμός με το κόστος του παιχνιδιού. Και οι στρατηγικές που αντιστοιχούν σε οποιοδήποτε από τα σημεία σέλας καλούνται βέλτιστες στρατηγικέςπαίκτες 1 και 2, αντίστοιχα. Δυνάμει του (2.7), όλες οι βέλτιστες στρατηγικές του παίκτη είναι εναλλάξιμες.

Η βέλτιστη συμπεριφορά των παικτών δεν θα αλλάξει εάν το σύνολο των στρατηγικών στο παιχνίδι παραμείνει το ίδιο και η συνάρτηση πληρωμής πολλαπλασιαστεί με μια θετική σταθερά (ή προστεθεί ένας σταθερός αριθμός σε αυτό).

Θεώρημα. Για να υπάρχει ένα σημείο σέλας (i*,j*) στο παιχνίδι μήτρας, είναι απαραίτητο και αρκετό το μέγιστο να είναι ίσο με το minimax:

(2.10)

Απόδειξη. Ανάγκη.Αν το (i*,j*) είναι σημείο σέλας, τότε σύμφωνα με το (2.6):

(2.11)

Ωστόσο, έχουμε:

(2.12)

Από (2.11) και (2.12) παίρνουμε:

(2.13)

Με το ίδιο επιχείρημα, καταλήγουμε στις ισότητες:

Ετσι,

Από την άλλη πλευρά, η αντίστροφη ανισότητα (2,5) ικανοποιείται πάντα, άρα ισχύει η (2,10).

Επάρκεια. Ας είναι αλήθεια (2.10). Ας αποδείξουμε την ύπαρξη ενός σημείου σέλας. Εχουμε:

Σύμφωνα με την ισότητα (2.10), οι ανισότητες (2.15) και (2.16) μετατρέπονται σε ισότητες. Μετά από αυτό έχουμε:

Το θεώρημα έχει αποδειχθεί. Έχει επίσης αποδειχθεί ότι γενική σημασία maximin και minimax είναι ίσο με την τιμή του παιχνιδιού.

Μικτή επέκταση παιχνιδιών

Θεωρήστε ένα παιχνίδι μήτρας G. Αν υπάρχει μια κατάσταση ισορροπίας σε αυτό, τότε το ελάχιστο είναι ίσο με το μέγιστο. Επιπλέον, καθένας από τους παίκτες μπορεί να πει στον άλλο παίκτη πληροφορίες για τη βέλτιστη στρατηγική του. Ο αντίπαλός του δεν θα μπορέσει να αποκομίσει κανένα πρόσθετο όφελος από αυτές τις πληροφορίες. Τώρα ας υποθέσουμε ότι δεν υπάρχει κατάσταση ισορροπίας στο παιχνίδι G. Επειτα:

Σε αυτήν την περίπτωση, οι στρατηγικές minimax και maximin δεν είναι σταθερές. Οι παίκτες μπορεί να έχουν κίνητρα να αποκλίνουν από τις συνετές στρατηγικές τους που σχετίζονται με την πιθανότητα να λάβουν περισσότερα κέρδη, αλλά και τον κίνδυνο να χάσουν, δηλαδή να λάβουν λιγότερη απόδοση από τη χρήση μιας συνετής στρατηγικής. Όταν χρησιμοποιείτε ριψοκίνδυνες στρατηγικές, η μεταφορά πληροφοριών σχετικά με αυτές στον αντίπαλο έχει επιζήμιες συνέπειες: ο παίκτης λαμβάνει αυτόματα μικρότερη απόδοση από ό,τι όταν χρησιμοποιεί μια προσεκτική στρατηγική.

Παράδειγμα 3. Αφήστε τη μήτρα του παιχνιδιού να μοιάζει με:

Για έναν τέτοιο πίνακα , δηλ. ισορροπία δεν υπάρχει. Οι προσεκτικές στρατηγικές των παικτών είναι i*=1, j*=2. Αφήστε τον παίκτη 2 να ακολουθήσει τη στρατηγική j*=2 και ο παίκτης 1 να επιλέξει τη στρατηγική i=2. τότε ο τελευταίος θα λάβει μια πληρωμή 3, που είναι δύο μονάδες περισσότερο από το μέγιστο. Εάν, ωστόσο, ο παίκτης 2 μαντέψει για τα σχέδια του παίκτη 1, θα αλλάξει τη στρατηγική του σε j=1 και, στη συνέχεια, ο πρώτος θα λάβει πληρωμή 0, δηλαδή λιγότερο από το μέγιστο. Παρόμοιος συλλογισμός μπορεί να γίνει και για τον δεύτερο παίκτη. Σε γενικές γραμμές, μπορούμε να συμπεράνουμε ότι η χρήση μιας περιπετειώδους στρατηγικής σε ένα ξεχωριστό παιχνίδι του παιχνιδιού μπορεί να φέρει αποτέλεσμα μεγαλύτερο από το εγγυημένο, αλλά η χρήση της συνδέεται με ρίσκο. Τίθεται το ερώτημα, είναι δυνατόν να συνδυάσετε μια αξιόπιστη προσεκτική στρατηγική με μια περιπετειώδη με τέτοιο τρόπο ώστε να αυξήσετε τη μέση απόδοση σας; Ουσιαστικά, το ερώτημα είναι πώς θα μοιράσει την πληρωμή (2,17) στους παίκτες;

Αποδεικνύεται ότι μια λογική λύση είναι να χρησιμοποιήσετε μια μικτή στρατηγική, δηλαδή μια τυχαία επιλογή καθαρών στρατηγικών. Θυμηθείτε ότι Η στρατηγική του παίκτη 1 ονομάζεται μικτή, αν η επιλογή της i-ης σειράς γίνει από αυτόν με κάποια πιθανότητα p i .Μια τέτοια στρατηγική μπορεί να ταυτιστεί με την κατανομή πιθανοτήτων σε πολλές γραμμές. Ας υποθέσουμε ότι ο πρώτος παίκτης έχει m καθαρές στρατηγικές και ο δεύτερος παίκτης έχει n καθαρές στρατηγικές. Τότε οι μικτές στρατηγικές τους είναι διανύσματα πιθανοτήτων:

(2.18)

Εξετάστε δύο πιθανές μικτές στρατηγικές για τον πρώτο παίκτη στο Παράδειγμα 3: . Αυτές οι στρατηγικές διαφέρουν στις κατανομές πιθανοτήτων μεταξύ καθαρών στρατηγικών. Εάν στην πρώτη περίπτωση οι σειρές του πίνακα επιλέγονται από τον παίκτη με ίσες πιθανότητες, τότε στη δεύτερη περίπτωση - με διαφορετικές. Όταν μιλάμε για μικτή στρατηγική, εννοούμε τυχαία επιλογήόχι μια επιλογή «τυχαία», αλλά μια επιλογή που βασίζεται στη δουλειά ενός τυχαίου μηχανισμού που παρέχει την κατανομή πιθανοτήτων που χρειαζόμαστε. Έτσι, για την εφαρμογή της πρώτης από τις μικτές στρατηγικές, η ρίψη νομίσματος είναι κατάλληλη. Ο παίκτης επιλέγει την πρώτη γραμμή ή τη δεύτερη, ανάλογα με το πώς πέφτει το κέρμα. Κατά μέσο όρο, ο παίκτης θα επιλέγει και την πρώτη και τη δεύτερη σειρά εξίσου συχνά, αλλά η επιλογή σε μια συγκεκριμένη επανάληψη του παιχνιδιού δεν υπόκειται σε κανένα σταθερό κανόνα και έχει τον μέγιστο βαθμό μυστικότητας: πριν από την εφαρμογή του τυχαίου μηχανισμού , είναι άγνωστο ακόμη και στον πρώτο παίκτη. Για την εφαρμογή της δεύτερης μικτής στρατηγικής, ο μηχανισμός έλξης είναι κατάλληλος. Ο παίκτης παίρνει επτά πανομοιότυπα κομμάτια χαρτιού, σημειώνοντας τρία από αυτά με σταυρό και τα πετάει στο καπέλο. Στη συνέχεια, τυχαία, εξάγει ένα από αυτά. Σύμφωνα με την κλασική θεωρία πιθανοτήτων, θα βγάλει ένα κομμάτι χαρτί με σταυρό με πιθανότητα 3/7 και ένα καθαρό χαρτί με πιθανότητα 4/7. Ένας τέτοιος μηχανισμός έλξης είναι ικανός να πραγματοποιήσει οποιεσδήποτε λογικές πιθανότητες.

Αφήστε τους παίκτες να ακολουθήσουν μικτές στρατηγικές (2.18). Τότε η πληρωμή του πρώτου παίκτη σε μία επανάληψη του παιχνιδιού είναι μια τυχαία μεταβλητή: v(X,Y). Εφόσον οι παίκτες επιλέγουν στρατηγικές ανεξάρτητα ο ένας από τον άλλο, τότε, σύμφωνα με το θεώρημα του πολλαπλασιασμού πιθανοτήτων, η πιθανότητα επιλογής ενός αποτελέσματος (i, j) με νίκη είναι ίση με το γινόμενο των πιθανοτήτων. Στη συνέχεια ο νόμος κατανομής της τυχαίας μεταβλητής v(X,Y)δίνεται από τον παρακάτω πίνακα

Τώρα αφήστε το παιχνίδι να παίζεται επ' αόριστον. Τότε η μέση απόδοση σε ένα τέτοιο παιχνίδι είναι ίση με τη μαθηματική προσδοκία της αξίας v(X,Y).

(2.19)

Πότε οριστικό αλλά αρκετό μεγάλοι αριθμοίεπαναλήψεις του παιχνιδιού, η μέση απόδοση θα διαφέρει ελαφρώς από την τιμή (2,19).

Παράδειγμα 4. Υπολογίστε τη μέση απόδοση (2,19) για το παιχνίδι από το παράδειγμα 3, όταν οι παίκτες χρησιμοποιούν τις ακόλουθες στρατηγικές: . Ο πίνακας αποπληρωμής και ο πίνακας πιθανοτήτων είναι οι εξής:

Ας βρούμε τον μέσο όρο:

Έτσι, η μέση απόδοση (2,20) είναι ενδιάμεση μεταξύ της μέγιστης και της ελάχιστης τιμής.

Εφόσον για οποιοδήποτε ζεύγος μικτών στρατηγικών Χ και Υ είναι δυνατός ο υπολογισμός της μέσης τιμής του παιχνιδιού, τότε προκύπτει το πρόβλημα της εύρεσης της βέλτιστης στρατηγικής. Είναι φυσικό να ξεκινήσετε εξερευνώντας προσεκτικές στρατηγικές. Η προσεκτική στρατηγική του πρώτου παίκτη του παρέχει ένα μέγιστο. Η προσεκτική στρατηγική του δεύτερου παίκτη δεν επιτρέπει στον πρώτο να κερδίσει περισσότερα από τα minimax. Το πιο σημαντικό αποτέλεσμα στη θεωρία των παιχνιδιών με αντίθετα ενδιαφέροντα μπορεί να θεωρηθεί το εξής:

Θεώρημα. Κάθε παιχνίδι μήτρας έχει μια κατάσταση ισορροπίας σε μικτές στρατηγικές. Η απόδειξη αυτού του θεωρήματος δεν είναι εύκολη. Παραλείπεται σε αυτό το μάθημα.

Συνέπειες: Η ύπαρξη μιας κατάστασης ισορροπίας σημαίνει ότι η μεγίστη είναι ίση με την ελάχιστη, και επομένως κάθε παιχνίδι μήτρας έχει μια τιμή. Η βέλτιστη στρατηγική για τον πρώτο παίκτη είναι η στρατηγική μεγιστοποίησης. Η βέλτιστη στρατηγική του δεύτερου είναι το minimax. Εφόσον το πρόβλημα της εύρεσης βέλτιστων στρατηγικών έχει λυθεί, λέμε ότι οποιοδήποτε παιχνίδι μήτρας διαλυτόςσε ένα σύνολο μικτών στρατηγικών.

Λύση του παιχνιδιού 2x2

Παράδειγμα 5. Λύστε το παιχνίδι. Δεν είναι δύσκολο να επαληθεύσετε ότι δεν υπάρχει σημείο σέλας. Δηλώστε τη βέλτιστη στρατηγική του πρώτου παίκτη (x, 1-x)είναι διάνυσμα στήλης, αλλά για ευκολία το γράφουμε ως συμβολοσειρά. Δηλώστε τη βέλτιστη στρατηγική του δεύτερου παίκτη (ε, 1-ε).

Η πληρωμή του πρώτου παίκτη είναι μια τυχαία μεταβλητή με την ακόλουθη κατανομή:

v(x,y) 2 -1 -4 7
Π xy x(1-y) (1x)y (1-x)(1-ε)

Βρίσκουμε τη μέση απόδοση για την επανάληψη του πρώτου παίκτη - τη μαθηματική προσδοκία μιας τυχαίας μεταβλητής v(x,y):

Ας μετατρέψουμε αυτήν την έκφραση:

Αυτή η μαθηματική προσδοκία αποτελείται από ένα σταθερό (5/7) και ένα μεταβλητό μέρος: 14(x-11/14)(y-8/14). Εάν η τιμή yδιαφορετικό από το 8/14, τότε ο πρώτος παίκτης μπορεί πάντα να επιλέξει Χμε τέτοιο τρόπο ώστε να κάνετε το μεταβλητό μέρος θετικό, αυξάνοντας τα κέρδη σας. Εάν η τιμή Χδιαφορετικό από 14/11, τότε ο δεύτερος παίκτης μπορεί πάντα να επιλέξει yώστε να γίνει αρνητικό το μεταβλητό μέρος, μειώνοντας την απόδοση του πρώτου παίκτη. Έτσι, το σημείο σέλας ορίζεται από τις ισότητες: x*=11/14, y*=8/14.

2.5 Επίλυση παιχνιδιών

Ένα παράδειγμα θα δείξει πώς να λύσετε τέτοια παιχνίδια.

Παράδειγμα 6. Λύστε το παιχνίδι . Φροντίζουμε να μην υπάρχει σημείο σέλας. Δηλώστε τη μικτή στρατηγική του πρώτου παίκτη X=(x, 1-x)είναι διάνυσμα στήλης, αλλά για ευκολία το γράφουμε ως συμβολοσειρά.

Αφήστε τον πρώτο παίκτη να εφαρμόσει τη στρατηγική Χ και ο δεύτερος - τη δική του j-ο καθαρόςστρατηγική. Ας υποδηλώσουμε τη μέση απόδοση του πρώτου παίκτη σε αυτήν την κατάσταση ως . Εχουμε:

Ας σχεδιάσουμε τις γραφικές παραστάσεις των συναρτήσεων (2.21) στο τμήμα .

Η τεταγμένη ενός σημείου που βρίσκεται σε οποιοδήποτε από τα τμήματα γραμμής αντιστοιχεί στην απόδοση του πρώτου παίκτη σε μια κατάσταση όπου χρησιμοποιεί μια μικτή στρατηγική (x,(1-x)), και ο δεύτερος παίκτης την αντίστοιχη καθαρή στρατηγική. Το εγγυημένο αποτέλεσμα του πρώτου παίκτη είναι ο κάτω φάκελος της οικογένειας των γραμμών (σπασμένα ABC). το ΨΗΛΟΤΕΡΟ ΣΗΜΕΙΟαυτή η διακεκομμένη γραμμή (σημείο Β) είναι το μέγιστο εγγυημένο αποτέλεσμα του παίκτη 1. Η τετμημένη του σημείου Β αντιστοιχεί στη βέλτιστη στρατηγική του πρώτου παίκτη.

Δεδομένου ότι το επιθυμητό σημείο Β είναι η τομή των ευθειών και, τότε η τετμημένη του μπορεί να βρεθεί ως λύση στην εξίσωση:

Έτσι, η βέλτιστη μικτή στρατηγική του πρώτου παίκτη είναι (5/9, 4/9). Η τεταγμένη του σημείου Β είναι η τιμή του παιχνιδιού. Είναι ίσο με:

(2.22)

Σημειώστε ότι η γραμμή που αντιστοιχεί στη δεύτερη στρατηγική του δεύτερου παίκτη περνά πάνω από το σημείο Β. Αυτό σημαίνει ότι εάν ο πρώτος παίκτης εφαρμόσει τη βέλτιστη στρατηγική του και ο παίκτης 2 χρησιμοποιήσει τη δεύτερη, τότε η απώλεια του δεύτερου παίκτη αυξάνεται σε σύγκριση με την εφαρμογή στρατηγικών 1 ή 3. Έτσι, το δεύτερο η στρατηγική δεν πρέπει να συμμετέχει στη βέλτιστη στρατηγική του δεύτερου παίκτη. Η βέλτιστη στρατηγική για τον παίκτη 2 θα πρέπει να είναι: . Οι καθαρές στρατηγικές 1 και 3 του δεύτερου παίκτη που έχουν μη μηδενικά στοιχεία στη βέλτιστη στρατηγική συνήθως ονομάζονται σημαντικός. Η στρατηγική 2 ονομάζεται ασήμαντος. Από το παραπάνω σχήμα, καθώς και από την ισότητα (2.22), μπορεί να φανεί ότι όταν ο πρώτος παίκτης εφαρμόζει τη βέλτιστη στρατηγική του, η απόδοση του δεύτερου παίκτη δεν εξαρτάται από τις βασικές στρατηγικές του που χρησιμοποιεί. Μπορεί επίσης να εφαρμόσει οποιαδήποτε μικτή στρατηγική που αποτελείται από ουσιώδη (ιδίως τη βέλτιστη), η ανταμοιβή δεν θα αλλάξει ούτε σε αυτήν την περίπτωση. Μια εντελώς ανάλογη δήλωση ισχύει και για την αντίθετη περίπτωση. Εάν ο δεύτερος παίκτης χρησιμοποιεί τη βέλτιστη στρατηγική του, τότε η ανταμοιβή του πρώτου παίκτη δεν εξαρτάται από τις βασικές του στρατηγικές που χρησιμοποιεί και είναι ίση με το κόστος του παιχνιδιού. Χρησιμοποιώντας αυτή τη δήλωση, βρίσκουμε τη βέλτιστη στρατηγική για τον δεύτερο παίκτη.

Οι βέλτιστες στρατηγικές στη θεωρία των συγκρούσεων είναι εκείνες οι στρατηγικές που οδηγούν τους παίκτες σε σταθερές ισορροπίες, δηλ. κάποιες καταστάσεις που ικανοποιούν όλους τους παίκτες.

Η βέλτιστη λύση στη θεωρία παιγνίων βασίζεται στην έννοια κατάσταση ισορροπίας:

1) δεν είναι κερδοφόρο για κανέναν από τους παίκτες να παρεκκλίνει από την κατάσταση ισορροπίας εάν όλοι οι άλλοι παραμένουν σε αυτήν,

2) η έννοια της ισορροπίας - με επαναλαμβανόμενη επανάληψη του παιχνιδιού, οι παίκτες θα φτάσουν σε μια κατάσταση ισορροπίας, ξεκινώντας το παιχνίδι σε οποιαδήποτε στρατηγική κατάσταση.

Σε κάθε αλληλεπίδραση, μπορούν να υπάρχουν οι ακόλουθοι τύποι ισορροπιών:

1. ισορροπία σε προσεκτικές στρατηγικές . Καθορίζεται από στρατηγικές που παρέχουν στους παίκτες εγγυημένο αποτέλεσμα;

2. ισορροπία σε κυρίαρχες στρατηγικές .

Κυρίαρχη στρατηγικήείναι ένα τέτοιο σχέδιο δράσης που παρέχει στον συμμετέχοντα το μέγιστο κέρδος, ανεξάρτητα από τις ενέργειες του άλλου συμμετέχοντα. Επομένως, η ισορροπία των κυρίαρχων στρατηγικών θα είναι η τομή των κυρίαρχων στρατηγικών και των δύο συμμετεχόντων στο παιχνίδι.

Εάν οι βέλτιστες στρατηγικές των παικτών κυριαρχούν σε όλες τις άλλες στρατηγικές τους, τότε το παιχνίδι έχει μια ισορροπία στις κυρίαρχες στρατηγικές. Στο παιχνίδι διλήμματος του κρατουμένου, το σύνολο στρατηγικών ισορροπίας Nash θα είναι ("παραδέχομαι - παραδέχομαι"). Επιπλέον, είναι σημαντικό να σημειωθεί ότι τόσο για τον παίκτη Α όσο και για τον παίκτη Β η «αναγνώριση» είναι η κυρίαρχη στρατηγική, ενώ κυριαρχεί το «δεν αναγνωρίζω».

3. ισορροπία Nash . Ισορροπία Nashείναι ένας τύπος απόφασης ενός παιχνιδιού δύο ή περισσότερων παικτών, στο οποίο κανένας συμμετέχων δεν μπορεί να αυξήσει την ανταμοιβή αλλάζοντας την απόφασή του μονομερώς, όταν οι άλλοι συμμετέχοντες δεν αλλάξουν την απόφασή τους.

Ας πούμε το παιχνίδι nπρόσωπα σε κανονική μορφή, όπου είναι το σύνολο των καθαρών στρατηγικών και είναι το σύνολο των κερδών.

Όταν κάθε παίκτης επιλέγει μια στρατηγική στο προφίλ στρατηγικών, ο παίκτης λαμβάνει μια πληρωμή. Επιπλέον, η ανταμοιβή εξαρτάται από ολόκληρο το προφίλ των στρατηγικών: όχι μόνο από τη στρατηγική που έχει επιλέξει ο ίδιος ο παίκτης, αλλά και από τις στρατηγικές άλλων ανθρώπων. Το προφίλ στρατηγικής είναι μια ισορροπία Nash εάν μια αλλαγή στη στρατηγική του δεν είναι επωφελής για κανέναν παίκτη, δηλαδή για οποιονδήποτε

Ένα παιχνίδι μπορεί να έχει μια ισορροπία Nash τόσο σε καθαρές όσο και σε μικτές στρατηγικές.

Ο Νας το απέδειξε αυτό αν του επιτρεπόταν μικτές στρατηγικές, στη συνέχεια σε κάθε παιχνίδι nΟι παίκτες θα έχουν τουλάχιστον μία ισορροπία Nash.

Σε μια κατάσταση ισορροπίας Nash, η στρατηγική κάθε παίκτη του παρέχει την καλύτερη ανταπόκριση στις στρατηγικές των άλλων παικτών.

4. Ισορροπία Stackelberg. Μοντέλο Stackelberg– μοντέλο θεωρίας παιγνίων μιας ολιγοπωλιακής αγοράς παρουσία ασυμμετρίας πληροφοριών. Σε αυτό το μοντέλο, η συμπεριφορά των επιχειρήσεων περιγράφεται από ένα δυναμικό παιχνίδι με πλήρεις τέλειες πληροφορίες, στο οποίο η συμπεριφορά των επιχειρήσεων μοντελοποιείται χρησιμοποιώντας στατικόςπαιχνίδια με πλήρεις πληροφορίες. Κύριο χαρακτηριστικόΤο παιχνίδι είναι η παρουσία μιας κορυφαίας εταιρείας, η οποία είναι η πρώτη που καθορίζει τον όγκο της παραγωγής αγαθών και οι υπόλοιπες επιχειρήσεις καθοδηγούνται στους υπολογισμούς τους από αυτό. Βασικές προϋποθέσεις του παιχνιδιού:


Ο κλάδος παράγει ένα ομοιογενές προϊόν: οι διαφορές στα προϊόντα διαφορετικών εταιρειών είναι αμελητέες, πράγμα που σημαίνει ότι ο αγοραστής, όταν επιλέγει από ποια εταιρεία θα αγοράσει, εστιάζει μόνο στην τιμή.

Ο κλάδος έχει μικρό αριθμό επιχειρήσεων.

οι επιχειρήσεις καθορίζουν την ποσότητα των παραγόμενων προϊόντων και η τιμή για αυτήν καθορίζεται με βάση τη ζήτηση.

Υπάρχει μια λεγόμενη εταιρεία ηγέτης, στον όγκο της παραγωγής της οποίας καθοδηγούνται άλλες επιχειρήσεις.

Έτσι, το μοντέλο Stackelberg χρησιμοποιείται για την εύρεση της βέλτιστης λύσης σε δυναμικά παιχνίδια και αντιστοιχεί στη μέγιστη απόδοση των παικτών, με βάση τις συνθήκες που έχουν αναπτυχθεί μετά την επιλογή που έχει ήδη γίνει από έναν ή περισσότερους παίκτες. Ισορροπία Stackelberg.- μια κατάσταση όπου κανένας από τους παίκτες δεν μπορεί να αυξήσει τα κέρδη του μονομερώς και οι αποφάσεις λαμβάνονται πρώτα από έναν παίκτη και γίνονται γνωστό στον δεύτεροπαίχτης. Στο παιχνίδι διλήμματος του κρατούμενου, η ισορροπία Stackelberg θα επιτευχθεί στο τετράγωνο (1; 1) - "παραδέξου την ενοχή" και από τους δύο εγκληματίες.

5. Βελτιστότητα Pareto- μια τέτοια κατάσταση του συστήματος, στην οποία η αξία κάθε συγκεκριμένου κριτηρίου που περιγράφει την κατάσταση του συστήματος δεν μπορεί να βελτιωθεί χωρίς να επιδεινωθεί η θέση των άλλων παικτών.

Η Αρχή Pareto δηλώνει: «Οποιαδήποτε αλλαγή που δεν προκαλεί απώλεια, αλλά ωφελεί ορισμένους ανθρώπους (κατά τη δική τους εκτίμηση), είναι μια βελτίωση». Έτσι, αναγνωρίζεται το δικαίωμα σε όλες τις αλλαγές που δεν επιφέρουν πρόσθετη βλάβη σε κανέναν.

Το σύνολο των καταστάσεων συστήματος που είναι βέλτιστες Pareto ονομάζεται "σύνολο Pareto", "το σύνολο των εναλλακτικών βέλτιστων με την έννοια του Pareto" ή το "σύνολο βέλτιστων εναλλακτικών".

Μια κατάσταση όπου έχει επιτευχθεί αποτελεσματικότητα Pareto είναι μια κατάσταση όπου όλα τα οφέλη από την ανταλλαγή έχουν εξαντληθεί.

Η αποτελεσματικότητα Pareto είναι μια από τις κεντρικές έννοιες για τη σύγχρονη οικονομία. Με βάση αυτή την έννοια, κατασκευάζονται το πρώτο και το δεύτερο θεμελιώδες θεώρημα ευημερίας.

Μία από τις εφαρμογές της βελτιστοποίησης Pareto είναι η Pareto κατανομή πόρων (εργασίας και κεφαλαίου) στη διεθνή οικονομική ολοκλήρωση, δηλ. οικονομική ένωση δύο ή περισσότερων κρατών. Είναι ενδιαφέρον ότι η κατανομή Pareto πριν και μετά τη διεθνή οικονομική ολοκλήρωση περιγράφηκε επαρκώς μαθηματικά (Dalimov R.T., 2008). Η ανάλυση έδειξε ότι η προστιθέμενη αξία των τομέων και το εισόδημα των εργατικών πόρων κινούνται σε αντίθετες κατευθύνσεις σύμφωνα με τη γνωστή εξίσωση αγωγιμότητας θερμότητας, παρόμοια με ένα αέριο ή υγρό στο διάστημα, που καθιστά δυνατή την εφαρμογή της τεχνικής ανάλυσης που χρησιμοποιείται στη φυσική σε σχέση με οικονομικά προβλήματα μετανάστευσης οικονομικών παραμέτρων.

Pareto βέλτιστοδηλώνει ότι η ευημερία της κοινωνίας φτάνει στο μέγιστο και η κατανομή των πόρων γίνεται βέλτιστη εάν οποιαδήποτε αλλαγή σε αυτήν την κατανομή επιδεινώσει την ευημερία τουλάχιστον ενός υποκειμένου του οικονομικού συστήματος.

Pareto-βέλτιστη κατάσταση της αγοράς- μια κατάσταση όπου είναι αδύνατο να βελτιωθεί η θέση οποιουδήποτε συμμετέχοντος στην οικονομική διαδικασία χωρίς ταυτόχρονα να μειωθεί η ευημερία τουλάχιστον ενός από τους άλλους.

Σύμφωνα με το κριτήριο Pareto (κριτήριο για την ανάπτυξη της κοινωνικής ευημερίας), η κίνηση προς το βέλτιστο είναι δυνατή μόνο με μια τέτοια κατανομή πόρων που αυξάνει την ευημερία τουλάχιστον ενός ατόμου χωρίς να βλάπτει κανέναν άλλο.

Η κατάσταση S* λέγεται ότι είναι η κυρίαρχη κατάσταση S Pareto εάν:

για οποιονδήποτε παίκτη η ανταμοιβή του στο S<=S*

· υπάρχει τουλάχιστον ένας παίκτης για τον οποίο η ανταμοιβή του στην κατάσταση S*>S

Στο πρόβλημα του «διλήμματος των φυλακισμένων», η ισορροπία Pareto, όταν είναι αδύνατο να βελτιωθεί η θέση κάποιου από τους παίκτες χωρίς να επιδεινωθεί η θέση του άλλου, αντιστοιχεί στην κατάσταση του τετραγώνου (2; 2).

Σκεφτείτε παράδειγμα 1.

Οι βέλτιστες στρατηγικές στη θεωρία των συγκρούσεων είναι εκείνες οι στρατηγικές που οδηγούν τους παίκτες σε σταθερές ισορροπίες, δηλ. κάποιες καταστάσεις που ικανοποιούν όλους τους παίκτες.

Η βέλτιστη λύση στη θεωρία παιγνίων βασίζεται στην έννοια κατάσταση ισορροπίας:

1) δεν είναι κερδοφόρο για κανέναν από τους παίκτες να παρεκκλίνει από την κατάσταση ισορροπίας εάν όλοι οι άλλοι παραμένουν σε αυτήν,

2) η έννοια της ισορροπίας - με επαναλαμβανόμενη επανάληψη του παιχνιδιού, οι παίκτες θα φτάσουν σε μια κατάσταση ισορροπίας, ξεκινώντας το παιχνίδι σε οποιαδήποτε στρατηγική κατάσταση.

Σε κάθε αλληλεπίδραση, μπορούν να υπάρχουν οι ακόλουθοι τύποι ισορροπιών:

1. ισορροπία σε προσεκτικές στρατηγικές . Καθορίζεται από στρατηγικές που παρέχουν στους παίκτες ένα εγγυημένο αποτέλεσμα.

2. ισορροπία σε κυρίαρχες στρατηγικές .

Κυρίαρχη στρατηγικήείναι ένα τέτοιο σχέδιο δράσης που παρέχει στον συμμετέχοντα το μέγιστο κέρδος, ανεξάρτητα από τις ενέργειες του άλλου συμμετέχοντα. Επομένως, η ισορροπία των κυρίαρχων στρατηγικών θα είναι η τομή των κυρίαρχων στρατηγικών και των δύο συμμετεχόντων στο παιχνίδι.

Εάν οι βέλτιστες στρατηγικές των παικτών κυριαρχούν σε όλες τις άλλες στρατηγικές τους, τότε το παιχνίδι έχει μια ισορροπία στις κυρίαρχες στρατηγικές. Στο παιχνίδι διλήμματος του κρατουμένου, το σύνολο στρατηγικών ισορροπίας Nash θα είναι ("παραδέχομαι - παραδέχομαι"). Επιπλέον, είναι σημαντικό να σημειωθεί ότι τόσο για τον παίκτη Α όσο και για τον παίκτη Β η «αναγνώριση» είναι η κυρίαρχη στρατηγική, ενώ κυριαρχεί το «δεν αναγνωρίζω».

3. ισορροπία Nash . Ισορροπία Nashείναι ένας τύπος απόφασης ενός παιχνιδιού δύο ή περισσότερων παικτών, στο οποίο κανένας συμμετέχων δεν μπορεί να αυξήσει την ανταμοιβή αλλάζοντας την απόφασή του μονομερώς, όταν οι άλλοι συμμετέχοντες δεν αλλάξουν την απόφασή τους.

Ας πούμε το παιχνίδι nπρόσωπα σε κανονική μορφή, όπου είναι το σύνολο των καθαρών στρατηγικών και είναι το σύνολο των κερδών.

Όταν κάθε παίκτης επιλέγει μια στρατηγική στο προφίλ στρατηγικών, ο παίκτης λαμβάνει μια πληρωμή. Επιπλέον, η ανταμοιβή εξαρτάται από ολόκληρο το προφίλ των στρατηγικών: όχι μόνο από τη στρατηγική που έχει επιλέξει ο ίδιος ο παίκτης, αλλά και από τις στρατηγικές άλλων ανθρώπων. Το προφίλ στρατηγικής είναι μια ισορροπία Nash εάν μια αλλαγή στη στρατηγική του δεν είναι επωφελής για κανέναν παίκτη, δηλαδή για οποιονδήποτε



Ένα παιχνίδι μπορεί να έχει μια ισορροπία Nash τόσο σε καθαρές όσο και σε μικτές στρατηγικές.

Ο Νας το απέδειξε αυτό αν του επιτρεπόταν μικτές στρατηγικές, στη συνέχεια σε κάθε παιχνίδι nΟι παίκτες θα έχουν τουλάχιστον μία ισορροπία Nash.

Σε μια κατάσταση ισορροπίας Nash, η στρατηγική κάθε παίκτη του παρέχει την καλύτερη ανταπόκριση στις στρατηγικές των άλλων παικτών.

4. Ισορροπία Stackelberg. Μοντέλο Stackelberg– μοντέλο θεωρίας παιγνίων μιας ολιγοπωλιακής αγοράς παρουσία ασυμμετρίας πληροφοριών. Σε αυτό το μοντέλο, η συμπεριφορά των επιχειρήσεων περιγράφεται από ένα δυναμικό παιχνίδι με πλήρεις τέλειες πληροφορίες, στο οποίο η συμπεριφορά των επιχειρήσεων μοντελοποιείται χρησιμοποιώντας στατικόςπαιχνίδια με πλήρεις πληροφορίες. Το κύριο χαρακτηριστικό του παιχνιδιού είναι η παρουσία μιας κορυφαίας εταιρείας, η οποία καθορίζει πρώτα τον όγκο της παραγωγής των αγαθών και οι υπόλοιπες επιχειρήσεις καθοδηγούνται στους υπολογισμούς τους από αυτήν. Βασικές προϋποθέσεις του παιχνιδιού:

Ο κλάδος παράγει ένα ομοιογενές προϊόν: οι διαφορές στα προϊόντα διαφορετικών εταιρειών είναι αμελητέες, πράγμα που σημαίνει ότι ο αγοραστής, όταν επιλέγει από ποια εταιρεία θα αγοράσει, εστιάζει μόνο στην τιμή.

Ο κλάδος έχει μικρό αριθμό επιχειρήσεων.

οι επιχειρήσεις καθορίζουν την ποσότητα των παραγόμενων προϊόντων και η τιμή για αυτήν καθορίζεται με βάση τη ζήτηση.

Υπάρχει μια λεγόμενη εταιρεία ηγέτης, στον όγκο της παραγωγής της οποίας καθοδηγούνται άλλες επιχειρήσεις.

Έτσι, το μοντέλο Stackelberg χρησιμοποιείται για την εύρεση της βέλτιστης λύσης σε δυναμικά παιχνίδια και αντιστοιχεί στη μέγιστη απόδοση των παικτών, με βάση τις συνθήκες που έχουν αναπτυχθεί μετά την επιλογή που έχει ήδη γίνει από έναν ή περισσότερους παίκτες. Ισορροπία Stackelberg.- μια κατάσταση όπου κανένας από τους παίκτες δεν μπορεί να αυξήσει τα κέρδη του μονομερώς και οι αποφάσεις λαμβάνονται πρώτα από έναν παίκτη και γίνονται γνωστές στον δεύτερο παίκτη. Στο παιχνίδι διλήμματος του κρατούμενου, η ισορροπία Stackelberg θα επιτευχθεί στο τετράγωνο (1; 1) - "παραδέξου την ενοχή" και από τους δύο εγκληματίες.

5. Βελτιστότητα Pareto- μια τέτοια κατάσταση του συστήματος, στην οποία η αξία κάθε συγκεκριμένου κριτηρίου που περιγράφει την κατάσταση του συστήματος δεν μπορεί να βελτιωθεί χωρίς να επιδεινωθεί η θέση των άλλων παικτών.

Η Αρχή Pareto δηλώνει: «Οποιαδήποτε αλλαγή που δεν προκαλεί απώλεια, αλλά ωφελεί ορισμένους ανθρώπους (κατά τη δική τους εκτίμηση), είναι μια βελτίωση». Έτσι, αναγνωρίζεται το δικαίωμα σε όλες τις αλλαγές που δεν επιφέρουν πρόσθετη βλάβη σε κανέναν.

Το σύνολο των καταστάσεων συστήματος που είναι βέλτιστες Pareto ονομάζεται "σύνολο Pareto", "το σύνολο των εναλλακτικών βέλτιστων με την έννοια του Pareto" ή το "σύνολο βέλτιστων εναλλακτικών".

Μια κατάσταση όπου έχει επιτευχθεί αποτελεσματικότητα Pareto είναι μια κατάσταση όπου όλα τα οφέλη από την ανταλλαγή έχουν εξαντληθεί.

Η αποτελεσματικότητα Pareto είναι μια από τις κεντρικές έννοιες για τη σύγχρονη οικονομία. Με βάση αυτή την έννοια, κατασκευάζονται το πρώτο και το δεύτερο θεμελιώδες θεώρημα ευημερίας.

Μία από τις εφαρμογές της βελτιστοποίησης Pareto είναι η Pareto κατανομή πόρων (εργασίας και κεφαλαίου) στη διεθνή οικονομική ολοκλήρωση, δηλ. οικονομική ένωση δύο ή περισσότερων κρατών. Είναι ενδιαφέρον ότι η κατανομή Pareto πριν και μετά τη διεθνή οικονομική ολοκλήρωση περιγράφηκε επαρκώς μαθηματικά (Dalimov R.T., 2008). Η ανάλυση έδειξε ότι η προστιθέμενη αξία των τομέων και το εισόδημα των εργατικών πόρων κινούνται σε αντίθετες κατευθύνσεις σύμφωνα με τη γνωστή εξίσωση αγωγιμότητας θερμότητας, παρόμοια με ένα αέριο ή υγρό στο διάστημα, που καθιστά δυνατή την εφαρμογή της τεχνικής ανάλυσης που χρησιμοποιείται στη φυσική σε σχέση με οικονομικά προβλήματα μετανάστευσης οικονομικών παραμέτρων.

Pareto βέλτιστοδηλώνει ότι η ευημερία της κοινωνίας φτάνει στο μέγιστο και η κατανομή των πόρων γίνεται βέλτιστη εάν οποιαδήποτε αλλαγή σε αυτήν την κατανομή επιδεινώσει την ευημερία τουλάχιστον ενός υποκειμένου του οικονομικού συστήματος.

Pareto-βέλτιστη κατάσταση της αγοράς- μια κατάσταση όπου είναι αδύνατο να βελτιωθεί η θέση οποιουδήποτε συμμετέχοντος στην οικονομική διαδικασία χωρίς ταυτόχρονα να μειωθεί η ευημερία τουλάχιστον ενός από τους άλλους.

Σύμφωνα με το κριτήριο Pareto (κριτήριο για την ανάπτυξη της κοινωνικής ευημερίας), η κίνηση προς το βέλτιστο είναι δυνατή μόνο με μια τέτοια κατανομή πόρων που αυξάνει την ευημερία τουλάχιστον ενός ατόμου χωρίς να βλάπτει κανέναν άλλο.

Η κατάσταση S* λέγεται ότι είναι η κυρίαρχη κατάσταση S Pareto εάν:

για οποιονδήποτε παίκτη η ανταμοιβή του στο S<=S*

· υπάρχει τουλάχιστον ένας παίκτης για τον οποίο η ανταμοιβή του στην κατάσταση S*>S

Στο πρόβλημα του «διλήμματος των φυλακισμένων», η ισορροπία Pareto, όταν είναι αδύνατο να βελτιωθεί η θέση κάποιου από τους παίκτες χωρίς να επιδεινωθεί η θέση του άλλου, αντιστοιχεί στην κατάσταση του τετραγώνου (2; 2).

Σκεφτείτε παράδειγμα 1:

Ισορροπίες σε κυρίαρχες στρατηγικέςΟχι.

Ισορροπία Nash. (5.5) και (4.4). Δεδομένου ότι είναι ασύμφορο για οποιονδήποτε από τους παίκτες να παρεκκλίνει από την επιλεγμένη στρατηγική μεμονωμένα.

Pareto βέλτιστο. (5.5). Από την πληρωμή των παικτών όταν επιλέγουν αυτές τις στρατηγικές περισσότερες νίκεςόταν επιλέγετε άλλες στρατηγικές.

Ισορροπία Stackelberg:

Ο παίκτης Α κάνει την πρώτη κίνηση.

Επιλέγει την πρώτη του στρατηγική. Ο Β επιλέγει την πρώτη στρατηγική. Ο Α παίρνει 5.

Επιλέγει τη δεύτερη στρατηγική του. Ο Β επιλέγει το δεύτερο. Ο Α παίρνει 4.

5 > 4 =>

Ο Β κάνει την πρώτη κίνηση.

Επιλέγει την πρώτη του στρατηγική. Ο Α επιλέγει την πρώτη στρατηγική. Ο Β παίρνει 5.

Επιλέγει τη δεύτερη στρατηγική του. Και διαλέγει το δεύτερο. Ο Β παίρνει 4.

5 > 4 => Ισορροπία Stackelberg (5, 5)

Παράδειγμα 2μοντελοποίηση διπωλίου.

Εξετάστε την ουσία αυτού του μοντέλου:

Ας υπάρχει ένας κλάδος με δύο εταιρείες, εκ των οποίων η μία είναι η «επιχείρηση ηγετική» και η άλλη η «ακόλουθη εταιρεία». Ας είναι η τιμή του προϊόντος γραμμική συνάρτησησυνολική προσφορά Q:

Π(Q) = έναbQ.

Ας υποθέσουμε επίσης ότι το κόστος των επιχειρήσεων ανά μονάδα παραγωγής είναι σταθερό και ίσο με Με 1 και Με 2 αντίστοιχα. Τότε το κέρδος της πρώτης επιχείρησης θα καθοριστεί από τύπος

Π 1 = Π(Q 1 + Q 2) * Q 1 − ντο 1 Q 1 ,

και το κέρδος του δεύτερου αντίστοιχα

Π 2 = Π(Q 1 + Q 2) * Q 2 − ντο 2 Q 2 .

Σύμφωνα με το μοντέλο Stackelberg, η πρώτη εταιρεία - η κορυφαία εταιρεία - στο πρώτο βήμα εκχωρεί την παραγωγή της Q 1 . Μετά από αυτό, η δεύτερη εταιρεία - η εταιρεία που ακολουθεί - αναλύοντας τις ενέργειες της ηγετικής εταιρείας καθορίζει την παραγωγή της Q 2. Στόχος και των δύο εταιρειών είναι να μεγιστοποιήσουν τις λειτουργίες πληρωμών τους.

Η ισορροπία Nash σε αυτό το παιχνίδι καθορίζεται από την αντίστροφη επαγωγή. Σκεφτείτε το προτελευταίο στάδιο του παιχνιδιού - την κίνηση της δεύτερης εταιρείας. Σε αυτό το στάδιο, η εταιρεία 2 γνωρίζει τη βέλτιστη απόδοση της επιχείρησης 1 Q 1 * . Στη συνέχεια, το πρόβλημα του προσδιορισμού της βέλτιστης παραγωγής Q 2 * περιορίζεται στην επίλυση του προβλήματος της εύρεσης του μέγιστου σημείου της συνάρτησης αποπληρωμής της δεύτερης εταιρείας. Μεγιστοποίηση της συνάρτησης Π 2 ως προς τη μεταβλητή Q 2 μετρώντας Q 1 δεδομένου, βρίσκουμε ότι η βέλτιστη παραγωγή της δεύτερης επιχείρησης

Αυτή είναι η καλύτερη απάντηση της εταιρείας που ακολουθεί στην επιλογή της ηγετικής εταιρείας της κυκλοφορίας Q 1 * . Η κορυφαία εταιρεία μπορεί να μεγιστοποιήσει τη συνάρτηση αποπληρωμής δεδομένης της μορφής της συνάρτησης Q 2*. Το μέγιστο σημείο της συνάρτησης Π 1 στη μεταβλητή Q 1 κατά την αντικατάσταση Q 2 * θα

Αντικαθιστώντας αυτό στην έκφραση για Q 2 * , παίρνουμε

Έτσι, σε κατάσταση ισορροπίας, η ηγέτιδα εταιρεία παράγει διπλάσια παραγωγή από την εταιρεία που ακολουθεί.

Συνδυάζοντας τις γραμμές προσφοράς και ζήτησης σε ένα ενιαίο γράφημα, παίρνουμε γραφική εικόναισορροπία στις συντεταγμένες P, Q(Εικ. 2.6). Το σημείο τομής των ευθειών έχει συντεταγμένες (P * , Q*),Οπου R* -τιμή ισορροπίας, Ε*- όγκος ισορροπίας παραγωγής και κατανάλωσης.

Ισορροπία της αγοράς- αυτή είναι μια κατάσταση της αγοράς στην οποία, για ένα δεδομένο επίπεδο τιμών, η ζητούμενη ποσότητα είναι ίση με την ποσότητα που παρέχεται.

Μόνο στο σημείο ισορροπίας μιη αγορά είναι ισορροπημένη, κανένας από τους παράγοντες της αγοράς δεν έχει κίνητρα να αλλάξει την κατάσταση. Αυτό σημαίνει ότι η ισορροπία της αγοράς έχει την ιδιότητα βιωσιμότητα -Σε περίπτωση κατάστασης μη ισορροπίας, οι παράγοντες της αγοράς παρακινούνται να επαναφέρουν την αγορά σε κατάσταση ισορροπίας. Για την απόδειξη της σταθερότητας συνήθως χρησιμοποιείται η λογική του L. Walras ή του A. Marshall.

Σύμφωνα με τον L. Walras, σε πολύ υψηλές τιμές, υπάρχει πλεονάζουσα προσφορά - υπερπαραγωγή (τμήμα Α-Βστο σχ. 2.6i), μια τέτοια αγορά ονομάζεται αγορά του αγοραστήαφού ο αγοραστής έχει τη δυνατότητα να απαιτήσει μείωση τιμής κατά την ολοκλήρωση των συναλλαγών. Σε μια τέτοια κατάσταση, πρώτα απ 'όλα, δεν ενδιαφέρεται ο πωλητής, ο οποίος αναγκάζεται να μειώσει τις τιμές και να μειώσει τους όγκους παραγωγής. Καθώς οι τιμές πέφτουν, η ζητούμενη ποσότητα αυξάνεται Α-Βσυρρικνώνεται μέχρι να γίνει σημείο ισορροπίας ΜΙ.

Στο ΧΑΜΗΛΕΣ ΤΙΜΕΣυπάρχει υπερβολική ζήτηση - έλλειψη (τμήμα CFna Εικ. 2.6α), αναπτύσσεται αγορά πωλητή.Ο αγοραστής αναγκάζεται


Εάν ένας καταναλωτής μειώσει την κατανάλωση και πληρώσει υπερβολικά για ένα σπάνιο αγαθό, καθώς αυξάνεται η τιμή, αυξάνεται η προσφερόμενη ποσότητα και η σπανιότητα συρρικνώνεται μέχρι να ισορροπήσει η αγορά.

Σύμφωνα με τον A. Marshall (Εικ. 2.66), για μικρούς όγκους παραγωγής, η τιμή ζήτησης υπερβαίνει την τιμή του πωλητή, για μεγάλους όγκους - το αντίστροφο. Σε κάθε περίπτωση, η κατάσταση ανισορροπίας διεγείρει μια μετατόπιση της τιμής ή του όγκου της προσφοράς και της ζήτησης προς την ισορροπία. Ισορροπία (ΕΝΑ)σύμφωνα με τον Walras - η τιμή ρυθμίζει την ανισορροπία προσφοράς και ζήτησης, (σι)σύμφωνα με τον Marshall - οι τιμές του αγοραστή και του πωλητή εξισορροπούνται από μια αλλαγή στους όγκους.

Ρύζι. 2.6. Εδραίωση της ισορροπίας της αγοράς: γ) σύμφωνα με τον L. Walras; β) κατά τον A. Marshall

Μια αλλαγή στη ζήτηση ή την προσφορά της αγοράς οδηγεί σε αλλαγή της ισορροπίας (Εικ. 2.7). Εάν, για παράδειγμα, η ζήτηση της αγοράς αυξηθεί, τότε η γραμμή ζήτησης μετατοπίζεται προς τα δεξιά, τότε η τιμή ισορροπίας και ο όγκος αυξάνονται. Εάν η προσφορά της αγοράς μειωθεί, η γραμμή προσφοράς μετατοπίζεται προς τα αριστερά, με αποτέλεσμα την αύξηση της τιμής και τη μείωση του όγκου.

Αυτό το μοντέλοΗ αγορά είναι στατική, αφού ο χρόνος δεν φαίνεται σε αυτήν.

Μοντέλο "Spider".

Ως παράδειγμα ενός δυναμικού μοντέλου ισορροπίας της αγοράς, παρουσιάζουμε το απλούστερο μοντέλο «ιστού αράχνης». Ας υποθέσουμε ότι η ζητούμενη ποσότητα εξαρτάται από το επίπεδο τιμών της τρέχουσας περιόδου t,και ο όγκος προσφοράς - από τις τιμές της προηγούμενης περιόδου t-1:

Q d i = Q d i (P t) , Q s i = Q s i (P t -1) ,

όπου t = 0,1….T είναι η διακριτή τιμή της χρονικής περιόδου.




Ρύζι. 2.7. Αλλαγή στην ισορροπία της αγοράς:

α) λόγω αύξησης της ζήτησης· σι)λόγω μείωσης

προσφορές

Τιμή αγοράς P tμπορεί να μην ταιριάζει με την τιμή ισορροπίας R*,και υπάρχουν τρεις πιθανές δυναμικές P t(Εικ. 2.8).

Η παραλλαγή της τροχιάς ανάπτυξης σε αυτό το μοντέλο εξαρτάται από την αναλογία των κλίσεων των γραμμών προσφοράς και ζήτησης.

Ρύζι. 2.8. Μοντέλο "Spider" ισορροπίας αγοράς:

α) η απόκλιση από την ισορροπία μειώνεται. 5) απόκλιση

αυξάνεται από την ισορροπία (το μοντέλο της «καταστροφής»). γ) την αγορά

ταλαντώνεται κυκλικά γύρω από το σημείο ισορροπίας, αλλά την ισορροπία



Μπλουζα