Θεωρία Παιγνίων: Κλασικά Παραδείγματα σε Εικόνες και Συγκεκριμένες Ενότητες Παιχνιδιού. Θεωρία Παιγνίων: Ιστορία και Εφαρμογές

Χρειάζεται όχι μόνο για να κερδίσουμε τους πάντες στην προτίμηση ή στο κρυφτό.

Η θεωρία παιγνίων είναι μια επιστήμη που μελετά τις αρχές της λήψης αποφάσεων σε καταστάσεις στις οποίες πολλοί πράκτορες αλληλεπιδρούν μεταξύ τους. Οι αποφάσεις που λαμβάνονται από ένα άτομο επηρεάζουν τις αποφάσεις των άλλων και το αποτέλεσμα της αλληλεπίδρασης συνολικά. Οι αλληλεπιδράσεις αυτού του τύπου ονομάζονται στρατηγικές.

Η λέξη «παιχνίδι» δεν πρέπει να είναι παραπλανητική. Αυτή η έννοια στη θεωρία παιγνίων αντιμετωπίζεται ευρύτερα από ό,τι στο Καθημερινή ζωή. Η κατάσταση της στρατηγικής αλληλεπίδρασης μπορεί να περιγραφεί ως ένα μοντέλο, το οποίο ονομάζεται παιχνίδι. Έτσι, στη θεωρία των παιγνίων, όχι μόνο το να παίζεις σκάκι, αλλά και η ψηφοφορία στο Συμβούλιο Ασφαλείας του ΟΗΕ, και το παζάρι μεταξύ του πωλητή και του αγοραστή στην αγορά θα θεωρείται παιχνίδι.

Οι στρατηγικές αλληλεπιδράσεις βρίσκονται σχεδόν σε κάθε τομέα της ζωής μας. Ένα παράδειγμα από την οικονομία: αρκετές εταιρείες που ανταγωνίζονται στην αγορά πρέπει να εξετάζουν τις ενέργειες των ανταγωνιστών όταν λαμβάνουν αποφάσεις. Αν μιλάμε για πολιτική, τότε οι υποψήφιοι που διαγωνίζονται στις εκλογές, όταν δηλώνουν την προεκλογική τους πλατφόρμα, λαμβάνουν φυσικά υπόψη τις θέσεις άλλων υποψηφίων σε σχέση με αυτό το θέμα. Και αν μελετήσουμε την αλληλεπίδραση των ανθρώπων στην κοινωνία, τότε με τη βοήθεια της θεωρίας παιγνίων μπορούμε να μάθουμε πολλά ενδιαφέροντα πράγματα για την τάση των ανθρώπων να συνεργάζονται.

Οι εκπρόσωποι των κοινωνικών επιστημών χρησιμοποιούν συχνά τη θεωρία παιγνίων ως εργαλείο που τους επιτρέπει να λύνουν προβλήματα που τους ενδιαφέρουν. Απλοποιώντας, η μοντελοποίηση της θεωρίας παιγνίων μπορεί να χωριστεί σε δύο στάδια.

Πρώτα στο πραγματικό κατάσταση ζωήςπρέπει να δημιουργήσετε ένα επίσημο μοντέλο. Κατά κανόνα, τρία βασικά χαρακτηριστικά μιας κατάστασης ζωής πρέπει να αντικατοπτρίζονται στο μοντέλο: ποιος αλληλεπιδρά μεταξύ τους (τέτοιοι παράγοντες στη θεωρία παιγνίων ονομάζονται παίκτες), ποιες αποφάσεις μπορούν να πάρουν οι παίκτες και ποιες πληρωμές λαμβάνουν ως αποτέλεσμα αυτή την αλληλεπίδραση. Το επίσημο μοντέλο ονομάζεται παιχνίδι.

Μόλις φτιάξουμε ένα παιχνίδι, πρέπει να λυθεί με κάποιο τρόπο. Σε αυτό το στάδιο, αφαιρούμε εντελώς από την πραγματικότητα και μελετάμε μόνο το επίσημο μοντέλο. Πώς κανονίζεται η λύση του μοντέλου; Πρέπει να διορθώσουμε την έννοια της συμπεριφοράς των παικτών στο παιχνίδι, δηλαδή τις αρχές των αποφάσεων που παίρνουν. Μόλις διορθώσουμε αυτήν την ιδέα, μπορούμε να προσπαθήσουμε να τη χρησιμοποιήσουμε για να λύσουμε το παιχνίδι, δηλαδή να παρουσιάσουμε το αποτέλεσμα που θα τελειώσει το παιχνίδι.

Με τη βοήθεια διαφορετικών θεωρητικών εννοιών παιχνιδιών, είναι δυνατή η επίλυση διαφορετικών κατηγοριών παιχνιδιών. Ένα από τα πιο όμορφα θεωρητικά αποτελέσματα της θεωρίας παιγνίων αποδεικνύει ότι είναι εγγυημένο ότι μπορεί να βρεθεί λύση σε κάποια πολύ μεγάλη κατηγορία μοντέλων. Αναφέρομαι στο αποτέλεσμα του John Nash το 1950: σε κάθε πεπερασμένο παιχνίδι σε κανονική μορφή μπορεί κανείς πάντα να βρει τουλάχιστον μία ισορροπία σε μικτές στρατηγικές. Χρονολογικά, αυτή ήταν η πρώτη καθολική έννοια της θεωρίας παιγνίων που επιτρέπει σε κάποιον να βρει μια λύση σε μια πολύ μεγάλη κατηγορία μοντέλων.

Σε αντίθεση με τους εκπροσώπους των κοινωνικών επιστημών, οι μαθηματικοί παιχνιδιών ενδιαφέρονται περισσότερο για τις εσωτερικές ιδιότητες των παιχνιδιών και τις έννοιες της λύσης τους. Χάρη σε τέτοια θεωρητικά αποτελέσματα μπορούμε να είμαστε σίγουροι ότι, κατασκευάζοντας και λύνοντας ένα ή άλλο μοντέλο θεωρίας παιγνίων, θα λάβουμε τελικά μια λύση με τις απαραίτητες ιδιότητες.

Φυσικά, Τζον Ναςδεν είναι ο μόνος συγγραφέας της θεωρίας παιγνίων. Η θεωρία παιγνίων ως ανεξάρτητη επιστήμη άρχισε να αναπτύσσεται λίγο νωρίτερα, στις αρχές του 20ου αιώνα. Οι πρώτες προσπάθειες να καθοριστούν επίσημα παιχνίδια, στρατηγικές παικτών και έννοιες επίλυσης παιχνιδιών ανάγονται στα ονόματα των Emil Borel και John von Neumann. Ωστόσο, ήταν ο Nash που παρουσίασε την έννοια της ισορροπίας, η οποία καθιστά δυνατή την εύρεση μιας εγγυημένης λύσης σε πεπερασμένα παιχνίδια. Προς τιμήν του συγγραφέα του θεωρήματος για την ύπαρξη μιας ισορροπίας σε μικτές στρατηγικές σε πεπερασμένα παιχνίδια, αυτή η ισορροπία άρχισε να ονομάζεται ισορροπία Nash.

Το πρώτο βραβείο Νόμπελ που απονεμήθηκε το 1994 για αποτελέσματα στον τομέα της θεωρίας παιγνίων (στον John Nash, Reinhard Zelten και John Harsanyi) επιβεβαίωσε στην πραγματικότητα το καθεστώς της θεωρίας παιγνίων ως ανεξάρτητης επιστημονικής κατεύθυνσης με τα δικά της προβλήματα και μεθόδους επίλυσής τους. Ακολούθησαν αρκετές ακόμη βραβεία Νόμπελβραβεύτηκαν τόσο για θεμελιώδη αποτελέσματα θεωρητικών παιγνίων όσο και για εφαρμογές της θεωρίας παιγνίων σε μια ή την άλλη πτυχή της ζωής μας. Στα κορυφαία πανεπιστήμια του κόσμου σε προγράμματα τόσο στα οικονομικά όσο και πολιτικές επιστήμεςΗ θεωρία παιγνίων περιλαμβάνεται στο τυπικό σύνολο μαθημάτων. Συχνά μελετάται τόσο από ψυχολόγους όσο και από μαθηματικούς.

Σήμερα, αν κοιτάξετε ενότητες μεγάλων συνεδρίων και άρθρα σε κορυφαία επιστημονικά περιοδικά σχετικά με τη θεωρία παιγνίων, ο αριθμός των εργασιών που χρησιμοποιούν τη συσκευή της θεωρίας παιγνίων για την επίλυση εφαρμοσμένων προβλημάτων είναι πολύ μεγαλύτερος από τον αριθμό των θεμελιωδών αποτελεσμάτων θεωρητικών παιγνίων. Η τρέχουσα κατάσταση του κλάδου μπορεί να περιγραφεί ως εξής: ένας αρκετά ισχυρός πυρήνας έχει διαμορφωθεί στη θεωρία παιγνίων, ένα επίπεδο γνώσης που επιτρέπει σε ερευνητές από συναφείς τομείς να αποκτήσουν καλά και ενδιαφέροντα αποτελέσματα.

Ωστόσο, νέες ενδιαφέρουσες κατευθύνσεις έρευνας ανοίγονται πάντα στην ίδια τη θεωρία παιγνίων. Έτσι, χάρη στην ανάπτυξη των υπολογιστικών τεχνολογιών, έχουν εμφανιστεί νέες έννοιες θεωρίας παιγνίων που λαμβάνουν υπόψη τις δυνατότητες και τους περιορισμούς των υπολογιστών. Χάρη σε αυτούς, κατέστη δυνατή η επίλυση νέων προβλημάτων. Το αποτέλεσμα των Bowling, Birch, Johanson και Tammelin το 2015 σχετικά με την ισορροπία σε μια εκδοχή του πόκερ είναι ένα εξαιρετικό παράδειγμα χρήσης σύγχρονων θεωριών και τεχνικών.

Ως αποτέλεσμα της μελέτης αυτού του κεφαλαίου, ο μαθητής θα πρέπει:

ξέρω

Έννοιες παιχνιδιών που βασίζονται στην αρχή της κυριαρχίας, την ισορροπία Nash, τι είναι η οπισθοδρομική επαγωγή κ.λπ. εννοιολογικές προσεγγίσεις για την επίλυση του παιχνιδιού, την έννοια της έννοιας του ορθολογισμού και της ισορροπίας στο πλαίσιο της στρατηγικής αλληλεπίδρασης.

έχω την δυνατότητα να

Διακρίνετε τα παιχνίδια σε στρατηγικές και διευρυμένες μορφές, δημιουργήστε ένα "δέντρο παιχνιδιού". διαμορφώνουν μοντέλα παιχνιδιών ανταγωνισμού για διάφορους τύπους αγορών·

το δικό

Μέθοδοι για τον προσδιορισμό του αποτελέσματος του παιχνιδιού.

Παιχνίδια: βασικές έννοιες και αρχές

Η πρώτη προσπάθεια δημιουργίας μιας μαθηματικής θεωρίας παιχνιδιών έγινε το 1921 από τον E. Borel. Ως ανεξάρτητο πεδίο της επιστήμης, η θεωρία παιγνίων παρουσιάστηκε για πρώτη φορά συστηματικά στη μονογραφία των J. von Neumann και O. Morgenstern «Theory of Games and οικονομική συμπεριφορά«το 1944. Έκτοτε πολλά τμήματα οικονομική θεωρία(για παράδειγμα, η θεωρία ατελής ανταγωνισμός, η θεωρία των οικονομικών κινήτρων κ.λπ.) που αναπτύχθηκε σε στενή επαφή με τη θεωρία παιγνίων. Η θεωρία παιγνίων έχει εφαρμοστεί με επιτυχία κοινωνικές επιστήμες(για παράδειγμα, η ανάλυση των διαδικασιών ψηφοφορίας, η αναζήτηση εννοιών ισορροπίας που καθορίζουν τη συνεργατική και μη συνεργατική συμπεριφορά των ατόμων). Κατά κανόνα, οι ψηφοφόροι απορρίπτουν υποψηφίους που εκπροσωπούν ακραίες απόψεις, αλλά όταν επιλέγουν έναν από τους δύο υποψηφίους που προσφέρουν διαφορετικές συμβιβαστικές λύσεις, δημιουργείται αγώνας. Ακόμη και η ιδέα του Rousseau για την εξέλιξη από τη «φυσική ελευθερία» στην «πολιτική ελευθερία» αντιστοιχεί τυπικά στην άποψη της συνεργασίας από τη σκοπιά της θεωρίας παιγνίων.

Το παιχνίδι- αυτό είναι ένα εξιδανικευμένο μαθηματικό μοντέλο της συλλογικής συμπεριφοράς πολλών προσώπων (παικτών), των οποίων τα ενδιαφέροντα είναι διαφορετικά, γεγονός που προκαλεί σύγκρουση. Η σύγκρουση δεν συνεπάγεται απαραίτητα την παρουσία ανταγωνιστικών αντιθέσεων των μερών, αλλά συνδέεται πάντα με ένα συγκεκριμένο είδος διαφωνίας. Μια κατάσταση σύγκρουσης θα είναι ανταγωνιστική εάν μια αύξηση της αποπληρωμής ενός από τα μέρη κατά ένα ορισμένο ποσό οδηγεί σε μείωση της πληρωμής της άλλης πλευράς κατά το ίδιο ποσό και αντίστροφα. Ο ανταγωνισμός συμφερόντων δημιουργεί μια σύγκρουση και η σύμπτωση συμφερόντων ανάγει το παιχνίδι σε συντονισμό ενεργειών (συνεργασία).

Παραδείγματα κατάσταση σύγκρουσηςείναι καταστάσεις που αναπτύσσονται στη σχέση μεταξύ αγοραστή και πωλητή· σε συνθήκες ανταγωνισμού διαφόρων εταιρειών· κατά τη διάρκεια των εχθροπραξιών κ.λπ. Τα συνηθισμένα παιχνίδια είναι επίσης παραδείγματα παιχνιδιών: σκάκι, πούλι, παιχνίδια με χαρτιά, παιχνίδια σαλονιού κ.λπ. (εξ ου και η ονομασία «θεωρία παιγνίων» και η ορολογία της).

Στα περισσότερα παιχνίδια που προκύπτουν από την ανάλυση οικονομικών, οικονομικών και διαχειριστικών καταστάσεων, τα συμφέροντα των παικτών (κομμάτων) δεν είναι ούτε αυστηρά ανταγωνιστικά ούτε απολύτως συμπίπτοντα. Ο αγοραστής και ο πωλητής συμφωνούν ότι είναι προς το κοινό τους συμφέρον να συμφωνήσουν σε μια πώληση, αλλά διαπραγματεύονται σθεναρά για να επιλέξουν μια συγκεκριμένη τιμή εντός των ορίων του αμοιβαίου πλεονεκτήματος.

Θεωρία παιγνίωνείναι μια μαθηματική θεωρία καταστάσεων σύγκρουσης.

Το παιχνίδι διαφέρει από μια πραγματική σύγκρουση στο ότι παίζεται σύμφωνα με ορισμένους κανόνες. Αυτοί οι κανόνες καθορίζουν τη σειρά των κινήσεων, την ποσότητα πληροφοριών που έχει κάθε πλευρά για τη συμπεριφορά της άλλης και το αποτέλεσμα του παιχνιδιού ανάλογα με την κατάσταση. Οι κανόνες καθορίζουν επίσης το τέλος του παιχνιδιού, όταν έχει ήδη γίνει μια συγκεκριμένη σειρά κινήσεων και δεν επιτρέπονται άλλες κινήσεις.

Η θεωρία παιγνίων, όπως κάθε μαθηματικό μοντέλο, έχει τους περιορισμούς της. Ένα από αυτά είναι η υπόθεση της πλήρους (ιδανικής) λογικής των αντιπάλων. Σε μια πραγματική σύγκρουση, συχνά η καλύτερη στρατηγική είναι να μαντέψετε τι είναι ανόητος ο εχθρός και να χρησιμοποιήσετε αυτή τη βλακεία προς όφελός σας.

Ένα άλλο μειονέκτημα της θεωρίας παιγνίων είναι ότι ο καθένας από τους παίκτες πρέπει να γνωρίζει όλες τις πιθανές ενέργειες (στρατηγικές) του αντιπάλου, είναι γνωστό μόνο ποιες από αυτές θα χρησιμοποιήσει σε ένα δεδομένο παιχνίδι. Σε μια πραγματική σύγκρουση, αυτό συνήθως δεν συμβαίνει: η λίστα με όλες τις πιθανές στρατηγικές του εχθρού είναι ακριβώς άγνωστη, και καλύτερη λύσηΣε μια κατάσταση σύγκρουσης, συχνά θα είναι ακριβώς η υπέρβαση των στρατηγικών που γνωρίζει ο εχθρός, «μπουκώνοντάς» τον με κάτι εντελώς νέο, απρόβλεπτο.

Η θεωρία παιγνίων δεν περιλαμβάνει τα στοιχεία κινδύνου που αναπόφευκτα συνοδεύουν λογικές αποφάσεις σε πραγματικές συγκρούσεις. Καθορίζει την πιο προσεκτική, αντασφαλιστική συμπεριφορά των συμμετεχόντων στη σύγκρουση.

Επιπλέον, στη θεωρία παιγνίων, οι βέλτιστες στρατηγικές βρίσκονται σε σχέση με έναν δείκτη (κριτήριο). Σε πρακτικές καταστάσεις, είναι συχνά απαραίτητο να ληφθούν υπόψη όχι ένα, αλλά πολλά αριθμητικά κριτήρια. Μια στρατηγική που είναι βέλτιστη σε ένα μέτρο μπορεί να μην είναι βέλτιστη σε ένα άλλο.

Έχοντας επίγνωση αυτών των περιορισμών και επομένως μη τυφλή τήρηση των συστάσεων που δίνουν οι θεωρίες παιγνίων, είναι ακόμα δυνατό να αναπτυχθεί μια απολύτως αποδεκτή στρατηγική για πολλές πραγματικές καταστάσεις σύγκρουσης.

Επί του παρόντος σε εξέλιξη Επιστημονική έρευναμε στόχο τη διεύρυνση του πεδίου εφαρμογής της θεωρίας παιγνίων.

Οι ακόλουθοι ορισμοί των στοιχείων που απαρτίζουν το παιχνίδι βρίσκονται στη βιβλιογραφία.

Παίκτες- αυτά είναι τα θέματα που εμπλέκονται στην αλληλεπίδραση, που αναπαριστώνται με τη μορφή παιχνιδιού. Στην περίπτωσή μας, πρόκειται για νοικοκυριά, επιχειρήσεις, κυβέρνηση. Ωστόσο, σε περίπτωση αβεβαιότητας εξωτερικών συνθηκών, είναι αρκετά βολικό να αναπαραστήσουμε τα τυχαία στοιχεία του παιχνιδιού, τα οποία δεν εξαρτώνται από τη συμπεριφορά των παικτών, ως ενέργειες της «φύσης».

Οι κανόνες του παιχνιδιού.Οι κανόνες του παιχνιδιού είναι τα σύνολα ενεργειών ή κινήσεων που είναι διαθέσιμα στους παίκτες. Σε αυτήν την περίπτωση, οι ενέργειες μπορεί να είναι πολύ διαφορετικές: αποφάσεις των αγοραστών σχετικά με τον όγκο των αγορασθέντων αγαθών ή υπηρεσιών. επιχειρήσεις - στον όγκο της παραγωγής. το επίπεδο των φόρων που επιβάλλει η κυβέρνηση.

Καθορισμός του αποτελέσματος (αποτελέσματος) του παιχνιδιού.Για κάθε συνδυασμό ενεργειών των παικτών, το αποτέλεσμα του παιχνιδιού ρυθμίζεται σχεδόν μηχανικά. Το αποτέλεσμα μπορεί να είναι: σύνθεση καταναλωτικό καλάθι, ένα διάνυσμα σταθερών εκροών ή ένα σύνολο άλλων ποσοτήτων.

Κέρδη.Το νόημα που αποδίδεται στην έννοια του κέρδους μπορεί να διαφέρει για ΔΙΑΦΟΡΕΤΙΚΟΙ ΤΥΠΟΙΠαιχνίδια. Ταυτόχρονα, είναι απαραίτητο να γίνει σαφής διάκριση μεταξύ των κερδών που μετρώνται σε μια τακτική κλίμακα (για παράδειγμα, το επίπεδο χρησιμότητας) και των τιμών για τις οποίες έχει νόημα η σύγκριση διαστημάτων (για παράδειγμα, κέρδος, επίπεδο ευημερίας).

Πληροφορίες και προσδοκίες.Η αβεβαιότητα και οι συνεχώς μεταβαλλόμενες πληροφορίες μπορεί να έχουν εξαιρετικά σοβαρό αντίκτυπο στα πιθανά αποτελέσματα μιας αλληλεπίδρασης. Γι' αυτό είναι απαραίτητο να ληφθεί υπόψη ο ρόλος των πληροφοριών στην ανάπτυξη του παιχνιδιού. Από αυτή την άποψη, η έννοια σύνολο πληροφοριώνπαίκτης, δηλ. το σύνολο όλων των πληροφοριών σχετικά με την κατάσταση του παιχνιδιού που κατέχει βασικά σημείαχρόνος.

Όταν εξετάζετε την πρόσβαση των παικτών σε πληροφορίες, η διαισθητική ιδέα της κοινής γνώσης ή δημοσιότητα,που σημαίνει το εξής: ένα γεγονός είναι γνωστό εάν όλοι οι παίκτες το γνωρίζουν και όλοι οι παίκτες γνωρίζουν ότι και άλλοι παίκτες το γνωρίζουν.

Για περιπτώσεις που δεν αρκεί η εφαρμογή της έννοιας της κοινής γνώσης, η έννοια του ατόμου προσδοκίεςσυμμετέχοντες - ιδέες για το πώς είναι η κατάσταση του παιχνιδιού σε αυτό το στάδιο.

Στη θεωρία παιγνίων, θεωρείται ότι το παιχνίδι αποτελείται από κινήσεις,εκτελούνται από παίκτες ταυτόχρονα ή διαδοχικά.

Οι κινήσεις είναι προσωπικές και τυχαίες. Η κίνηση ονομάζεται προσωπικός,εάν ο παίκτης το επιλέξει συνειδητά από ένα σύνολο πιθανών επιλογών δράσης και το εφαρμόσει (για παράδειγμα, οποιαδήποτε κίνηση σε παιχνίδι σκακιού). Η κίνηση ονομάζεται τυχαίος,εάν η επιλογή του δεν γίνεται από τον παίκτη, αλλά από κάποιον μηχανισμό τυχαίας επιλογής (για παράδειγμα, με βάση τα αποτελέσματα της ρίψης ενός νομίσματος).

Το σύνολο των κινήσεων που κάνουν οι παίκτες από την αρχή μέχρι το τέλος του παιχνιδιού ονομάζεται κόμμα.

Μία από τις βασικές έννοιες της θεωρίας παιγνίων είναι η έννοια της στρατηγικής. στρατηγικήπαίκτης ονομάζεται ένα σύνολο κανόνων που καθορίζουν την επιλογή μιας παραλλαγής δράσης για κάθε προσωπική κίνηση, ανάλογα με την κατάσταση που έχει δημιουργηθεί κατά τη διάρκεια του παιχνιδιού. Στα απλά (μία κίνηση) παιχνίδια, όταν ένας παίκτης μπορεί να κάνει μόνο μία κίνηση σε κάθε παιχνίδι, η έννοια της στρατηγικής και πιθανή επιλογήοι ενέργειες ταιριάζουν. Σε αυτή την περίπτωση, το σύνολο των στρατηγικών του παίκτη καλύπτει όλες τις πιθανές ενέργειές του και οποιεσδήποτε πιθανές για τον παίκτη Εγώη δράση είναι η στρατηγική του. Σε πολύπλοκα (πολλαπλής κίνησης) παιχνίδια, οι έννοιες της «παραλλαγής πιθανών ενεργειών» και της «στρατηγικής» μπορεί να διαφέρουν μεταξύ τους.

Η στρατηγική του παίκτη ονομάζεται άριστος,εάν παρέχει σε έναν συγκεκριμένο παίκτη το μέγιστο δυνατό μέσο κέρδος ή την ελάχιστη δυνατή μέση απώλεια, ανεξάρτητα από τις στρατηγικές που χρησιμοποιεί ο αντίπαλος, όταν το παιχνίδι επαναλαμβάνεται πολλές φορές. Μπορούν επίσης να χρησιμοποιηθούν και άλλα κριτήρια βελτιστοποίησης.

Είναι πιθανό η στρατηγική που παρέχει τη μέγιστη απόδοση να μην έχει άλλη σημαντική αναπαράσταση της βέλτιστης, όπως η σταθερότητα (ισορροπία) της λύσης. Η λύση του παιχνιδιού είναι βιώσιμος(ισορροπία) εάν οι στρατηγικές που αντιστοιχούν σε αυτήν την απόφαση σχηματίζουν μια κατάσταση που κανένας από τους παίκτες δεν ενδιαφέρεται να αλλάξει.

Επαναλαμβάνουμε ότι το καθήκον της θεωρίας παιγνίων είναι να βρει τις βέλτιστες στρατηγικές.

Η ταξινόμηση των παιχνιδιών φαίνεται στο σχ. 8.1.

  • 1. Ανάλογα με τα είδη των κινήσεων, τα παιχνίδια χωρίζονται σε στρατηγικά και τυχερά παιχνίδια. ΤΥΧΕΡΑ ΠΑΙΧΝΙΔΙΑΤα παιχνίδια αποτελούνται μόνο από τυχαίες κινήσεις, με τις οποίες δεν ασχολείται η θεωρία παιγνίων. Εάν, μαζί με τυχαίες κινήσεις, υπάρχουν προσωπικές κινήσεις ή όλες οι κινήσεις είναι προσωπικές, τότε τέτοια παιχνίδια ονομάζονται στρατηγικό.
  • 2. Ανάλογα με τον αριθμό των παικτών, τα παιχνίδια χωρίζονται σε διπλά και πολλαπλά. ΣΤΟ παιχνίδι διπλώνο αριθμός των συμμετεχόντων είναι δύο πολλαπλούς- περισσότερα από δύο.
  • 3. Οι συμμετέχοντες στο πολλαπλό παιχνίδι μπορούν να σχηματίσουν συνασπισμούς, είτε μόνιμους είτε προσωρινούς. Ανάλογα με τη φύση της σχέσης μεταξύ των παικτών, τα παιχνίδια χωρίζονται σε μη συνεργάσιμο, συνασπισμό και συνεταιρισμό.

Μη συνασπισμόςονομάζονται παιχνίδια στα οποία οι παίκτες δεν έχουν το δικαίωμα να συνάψουν συμφωνίες, να σχηματίσουν συνασπισμούς και ο στόχος κάθε παίκτη είναι να αποκτήσει το μεγαλύτερο δυνατό ατομικό κέρδος.

Παιχνίδια στα οποία οι ενέργειες των παικτών στοχεύουν στη μεγιστοποίηση των κερδών των συλλογικοτήτων (συνασπισμών) χωρίς τον επακόλουθο διαχωρισμό τους μεταξύ των παικτών ονομάζονται συνασπισμός.

Ρύζι. 8.1.

Εξοδος πλήθους συνεργατικήΤο παιχνίδι είναι η κατανομή της ανταμοιβής του συνασπισμού, η οποία προκύπτει όχι ως αποτέλεσμα ορισμένων ενεργειών των παικτών, αλλά ως αποτέλεσμα των προκαθορισμένων συμφωνιών τους.

Σύμφωνα με αυτό, στα συνεργατικά παιχνίδια δεν συγκρίνονται καταστάσεις από άποψη προτίμησης, όπως συμβαίνει στα μη συνεργατικά παιχνίδια, αλλά διαιρέσεις. και η σύγκριση δεν περιορίζεται στην εξέταση μεμονωμένων κερδών, αλλά είναι πιο περίπλοκη.

  • 4. Ανάλογα με τον αριθμό των στρατηγικών για κάθε παίκτη, τα παιχνίδια χωρίζονται σε τελικός(ο αριθμός των στρατηγικών για κάθε παίκτη είναι πεπερασμένος) και ατελείωτες(το σύνολο των στρατηγικών για κάθε παίκτη είναι άπειρο).
  • 5. Ανάλογα με τον όγκο των πληροφοριών που διαθέτουν οι παίκτες σχετικά με προηγούμενες κινήσεις, τα παιχνίδια χωρίζονται σε παιχνίδια με πλήρεις πληροφορίες (όλες οι πληροφορίες για προηγούμενες κινήσεις είναι διαθέσιμες) και ελλιπείς πληροφορίες.Παραδείγματα παιχνιδιών με πλήρεις πληροφορίες είναι το σκάκι, το πούλι και τα παρόμοια.
  • 6. Ανάλογα με το είδος της περιγραφής, τα παιχνίδια χωρίζονται σε παιχνίδια θέσης (ή παιχνίδια σε διευρυμένη μορφή) και παιχνίδια σε κανονική μορφή. Παιχνίδια θέσεωνδίνονται με τη μορφή δέντρου παιχνιδιού. Αλλά οποιοδήποτε παιχνίδι θέσης μπορεί να μειωθεί σε κανονική μορφή,στην οποία κάθε παίκτης κάνει μόνο μία ανεξάρτητη κίνηση. Στα παιχνίδια θέσης, οι κινήσεις γίνονται σε διακριτούς χρόνους. Υπάρχει διαφορικά παιχνίδια,στο οποίο γίνονται συνεχώς κινήσεις. Αυτά τα παιχνίδια μελετούν τα προβλήματα της καταδίωξης ενός ελεγχόμενου αντικειμένου από ένα άλλο ελεγχόμενο αντικείμενο, λαμβάνοντας υπόψη τη δυναμική της συμπεριφοράς τους, η οποία περιγράφεται με διαφορικές εξισώσεις.

Υπάρχουν επίσης αναστοχαστικά παιχνίδια,που εξετάζουν καταστάσεις ως προς τη νοητική αναπαραγωγή της πιθανής πορείας δράσης και συμπεριφοράς του εχθρού.

7. Εάν οποιοδήποτε πιθανό παιχνίδι κάποιου παιχνιδιού έχει μηδενικό άθροισμα κερδών όλων Νπαίκτες(), μετά μιλήστε για παιχνίδι μηδενικού αθροίσματος.Διαφορετικά, τα παιχνίδια ονομάζονται παιχνίδια με μη μηδενικό άθροισμα.

Σαφώς, το παιχνίδι ζεύγους μηδενικού αθροίσματος είναι ανταγωνιστικόςαφού το κέρδος ενός παίκτη ισούται με την απώλεια του δεύτερου και, κατά συνέπεια, οι στόχοι αυτών των παικτών είναι ακριβώς αντίθετοι.

Καλείται ένα πεπερασμένο κατά ζεύγη παιχνίδι μηδενικού αθροίσματος παιχνίδι matrix.Ένα τέτοιο παιχνίδι περιγράφεται από έναν πίνακα πληρωμών στον οποίο δίνονται οι αποδόσεις του πρώτου παίκτη. Ο αριθμός σειράς της μήτρας αντιστοιχεί στον αριθμό της εφαρμοσμένης στρατηγικής του πρώτου παίκτη, η στήλη αντιστοιχεί στον αριθμό της εφαρμοσμένης στρατηγικής του δεύτερου παίκτη. στη διασταύρωση της γραμμής και της στήλης είναι το αντίστοιχο κέρδος του πρώτου παίκτη (απώλεια του δεύτερου παίκτη).

Ένα παιχνίδι πεπερασμένων ζευγών με μη μηδενικό άθροισμα ονομάζεται παιχνίδι bimatrix.Ένα τέτοιο παιχνίδι περιγράφεται από δύο πίνακες πληρωμών, ο καθένας για τον αντίστοιχο παίκτη.

Ας φέρουμε επόμενο παράδειγμα. Παιχνίδι "Record".Αφήστε τον παίκτη 1 να είναι ένας μαθητής που προετοιμάζεται για το τεστ και ο παίκτης 2 να είναι ο δάσκαλος που δίνει το τεστ. Ας υποθέσουμε ότι ένας μαθητής έχει δύο στρατηγικές: A1 - προετοιμαστείτε καλά για το τεστ. ΕΝΑ 2 - μην προετοιμαστείτε. Ο δάσκαλος έχει επίσης δύο στρατηγικές: Β1 - βάλε ένα τεστ. σι 2 - μην ξεκινήσετε. Η εκτίμηση των τιμών ανταμοιβής των παικτών μπορεί να βασίζεται, για παράδειγμα, στις ακόλουθες εκτιμήσεις που αντικατοπτρίζονται στους πίνακες πληρωμών:

Αυτό το παιχνίδι, σύμφωνα με την παραπάνω ταξινόμηση, είναι στρατηγικό, ζευγαρωμένο, μη συνεργάσιμο, πεπερασμένο, περιγράφεται σε κανονική μορφή, με μη μηδενικό άθροισμα. Συνοπτικά, αυτό το παιχνίδι μπορεί να ονομαστεί bimatrix.

Το καθήκον είναι να καθοριστούν οι βέλτιστες στρατηγικές για τον μαθητή και για τον δάσκαλο.

Ένα άλλο παράδειγμα του γνωστού παιχνιδιού bimatrix Prisoner's Dilemma.

Καθένας από τους δύο παίκτες έχει δύο στρατηγικές: ΕΝΑ 2 και Β 2 - στρατηγικές επιθετική συμπεριφορά, ένα ΕΝΑεγώ και σι i - ειρηνική συμπεριφορά. Ας υποθέσουμε ότι η "ειρήνη" (και οι δύο παίκτες είναι ειρηνικοί) είναι καλύτερη και για τους δύο παίκτες από τον "πόλεμο". Η περίπτωση που ο ένας παίκτης είναι επιθετικός και ο άλλος ειρηνικός είναι πιο επικερδής για τον επιθετικό. Αφήστε τους πίνακες πληρωμών των παικτών 1 και 2 σε αυτό το παιχνίδι bimatrix να έχουν τη μορφή

Και για τους δύο παίκτες, οι επιθετικές στρατηγικές A2 και B2 κυριαρχούν στις ειρηνικές στρατηγικές Ax και σι v Έτσι, η μόνη ισορροπία στις στρατηγικές κυριαρχίας έχει τη μορφή (A2, σι 2), δηλ.Υποτίθεται ότι το αποτέλεσμα της μη συνεργατικής συμπεριφοράς είναι ο πόλεμος. Ταυτόχρονα, το αποτέλεσμα (Α1, Β1) (κόσμος) δίνει μεγαλύτερη ανταμοιβή και για τους δύο παίκτες. Έτσι, η μη συνεργατική εγωιστική συμπεριφορά έρχεται σε σύγκρουση με τα συλλογικά συμφέροντα. Τα συλλογικά συμφέροντα υπαγορεύουν την επιλογή ειρηνικών στρατηγικών. Ταυτόχρονα, εάν οι παίκτες δεν ανταλλάξουν πληροφορίες, ο πόλεμος είναι το πιο πιθανό αποτέλεσμα.

Σε αυτή την περίπτωση, η κατάσταση (A1, B1) είναι η βέλτιστη Pareto. Ωστόσο, αυτή η κατάσταση είναι ασταθής, γεγονός που οδηγεί στην πιθανότητα παραβίασης της καθορισμένης συμφωνίας από τους παίκτες. Πράγματι, εάν ο πρώτος παίκτης παραβιάσει τη συμφωνία και ο δεύτερος όχι, τότε η πληρωμή του πρώτου παίκτη θα αυξηθεί σε τρεις και ο δεύτερος θα πέσει στο μηδέν και το αντίστροφο. Επιπλέον, κάθε παίκτης που δεν παραβιάζει τη συμφωνία χάνει περισσότερα εάν ο δεύτερος παίκτης παραβιάσει τη συμφωνία παρά εάν παραβιάσουν και οι δύο τη συμφωνία.

Υπάρχουν δύο βασικές μορφές παιχνιδιού. παιχνίδι μέσα εκτεταμένη μορφήαναπαρίσταται ως διάγραμμα «δέντρου» λήψης αποφάσεων, με τη «ρίζα» να αντιστοιχεί στο σημείο εκκίνησης του παιχνιδιού και την αρχή κάθε νέου «κλαδιού», που ονομάζεται κόμπος,- η κατάσταση που έχει φτάσει σε αυτό το στάδιο με δεδομένες ενέργειες που έχουν ήδη γίνει από τους παίκτες. Σε κάθε τερματικό κόμβο - σε κάθε τελικό σημείο του παιχνιδιού - εκχωρείται ένα διάνυσμα ανταμοιβής, ένα στοιχείο για κάθε παίκτη.

στρατηγικό,ονομάζεται αλλιώς κανονική, μορφήΗ αναπαράσταση του παιχνιδιού αντιστοιχεί σε έναν πολυδιάστατο πίνακα, με κάθε διάσταση (γραμμές και στήλες στη δισδιάστατη περίπτωση) να περιλαμβάνει ένα σύνολο πιθανών ενεργειών για έναν πράκτορα.

Ένα ξεχωριστό κελί του πίνακα περιέχει ένα διάνυσμα κερδών που αντιστοιχεί σε έναν δεδομένο συνδυασμό στρατηγικών παικτών.

Στο σχ. Το 8.2 παρουσιάζει μια εκτενή μορφή του παιχνιδιού και στον πίνακα. 8.1 - στρατηγική μορφή.

Ρύζι. 8.2.

Πίνακας 8.1.Παιχνίδι με ταυτόχρονη λήψη αποφάσεων σε στρατηγική μορφή

Υπάρχει μια αρκετά λεπτομερής ταξινόμηση συστατικά μέρηθεωρία παιγνίων. Ένα από τα πιο γενικά κριτήρια για μια τέτοια ταξινόμηση είναι η διαίρεση της θεωρίας παιγνίων στη θεωρία των μη συνεργατικών παιχνιδιών, στην οποία τα θέματα λήψης αποφάσεων είναι τα ίδια τα άτομα, και τη θεωρία των συνεργατικών παιχνιδιών, στην οποία τα υποκείμενα η λήψη αποφάσεων είναι ομάδες ή συνασπισμοί ατόμων.

Τα μη συνεργατικά παιχνίδια παρουσιάζονται συνήθως σε κανονικές (στρατηγικές) και διευρυμένες (εκτεταμένες) μορφές.

  • Vorobyov N. Ν.Θεωρία παιγνίων για οικολόγους-κυβερνιστές. Μόσχα: Nauka, 1985.
  • Wentzel E. S.Επιχειρησιακή έρευνα. Μόσχα: Nauka, 1980.

Ένα αστείο παράδειγμα εφαρμογής της θεωρίας παιγνίων βρίσκεται στο βιβλίο φαντασίας του Anthony Pierce The Brave Golem.

Πολύ κείμενο

«Το θέμα αυτού που πρόκειται να σας δείξω σε όλους», άρχισε ο Grundy, «είναι να συγκεντρώσω τον απαιτούμενο αριθμό πόντων. Οι πόντοι μπορεί να είναι πολύ διαφορετικοί - όλα εξαρτώνται από τον συνδυασμό των αποφάσεων που λαμβάνονται από τους συμμετέχοντες στο παιχνίδι. Για παράδειγμα, ας υποθέσουμε ότι κάθε συμμετέχων καταθέτει εναντίον του συμπαίκτη του. Σε αυτή την περίπτωση, σε κάθε συμμετέχοντα μπορεί να απονεμηθεί ένας βαθμός!
- Ένα σημείο! είπε η μάγισσα της θάλασσας, δείχνοντας απρόσμενο ενδιαφέρον για το παιχνίδι. Προφανώς, η μάγισσα ήθελε να βεβαιωθεί ότι το golem δεν είχε καμία ευκαιρία για τον δαίμονα Xanth να είναι ευχαριστημένος μαζί του.
«Τώρα ας υποθέσουμε ότι καθένας από τους συμμετέχοντες στο παιχνίδι δεν καταθέτει εναντίον του συντρόφου του! συνέχισε ο Γκράντι. - Σε αυτή την περίπτωση, ο καθένας μπορεί να λάβει τρεις βαθμούς. Θέλω να σημειώσω ιδιαίτερα ότι εφόσον όλοι οι συμμετέχοντες ενεργούν με τον ίδιο τρόπο, λαμβάνουν τον ίδιο αριθμό πόντων. Κανείς δεν έχει κανένα πλεονέκτημα έναντι του άλλου.
- Τρεις βαθμοί! είπε η δεύτερη μάγισσα.
- Αλλά τώρα έχουμε το δικαίωμα να προτείνουμε ότι ένας από τους παίκτες άρχισε να καταθέτει εναντίον του δεύτερου, και ο δεύτερος εξακολουθεί να σιωπά! είπε ο Γκράντι. - Σε αυτήν την περίπτωση, αυτός που δίνει αυτά τα στοιχεία παίρνει πέντε βαθμούς ταυτόχρονα και αυτός που σιωπά δεν παίρνει ούτε έναν βαθμό!
– Αχα! αναφώνησαν και οι δύο μάγισσες με μια φωνή, γλείφοντας τα χείλη τους αρπακτικά. Ήταν ξεκάθαρο ότι και οι δύο θα έπαιρναν ξεκάθαρα από πέντε πόντους.
«Έχανα πόντους όλη την ώρα!» αναφώνησε ο δαίμονας. – Αλλά έχετε περιγράψει μόνο την κατάσταση μέχρι τώρα, αλλά δεν έχετε παρουσιάσει ακόμη τρόπο επίλυσης της! Ποια είναι λοιπόν η στρατηγική σας; Δεν χρειάζεται να χάνουμε χρόνο!
«Περίμενε, θα τα εξηγήσω όλα τώρα!» αναφώνησε ο Γκράντι. «Καθένας από τους τέσσερις από εμάς –είμαστε δύο γκόλεμ και δύο μάγισσες– θα πολεμήσουμε εναντίον των αντιπάλων μας. Φυσικά, οι μάγισσες θα προσπαθήσουν να μην υποχωρήσουν σε κανέναν σε τίποτα ...
- Φυσικά! αναφώνησαν και οι δύο μάγισσες πάλι με μια φωνή. Κατάλαβαν τέλεια το golem από μισή λέξη!
«Και το δεύτερο golem θα ακολουθήσει την τακτική μου», συνέχισε ανενόχλητος ο Grundy. Κοίταξε το doppelgänger του. «Φυσικά ξέρεις;
- Α, καλά! Είμαι το αντίγραφό σου! Καταλαβαίνω απόλυτα τι σκέφτεσαι!
- Αυτό είναι υπέροχο! Σε αυτή την περίπτωση, ας κάνουμε την πρώτη κίνηση για να δει μόνος του ο δαίμονας. Θα υπάρχουν αρκετοί γύροι σε κάθε αγώνα, ώστε η όλη στρατηγική να εκδηλωθεί μέχρι το τέλος και να δώσει την εντύπωση ενός συνεκτικού συστήματος. Ίσως θα έπρεπε να ξεκινήσω.

«Τώρα ο καθένας μας πρέπει να βάλει σημάδια στα χαρτάκια του!» το γκόλεμ γύρισε στη μάγισσα. - Πρώτα πρέπει να σχεδιάσετε ένα χαμογελαστό πρόσωπο. Αυτό θα σημαίνει ότι δεν θα καταθέσουμε εναντίον ενός συγκρατούμενου μας. Μπορείτε επίσης να σχεδιάσετε ένα συνοφρυωμένο πρόσωπο, που σημαίνει ότι σκεφτόμαστε μόνο τον εαυτό μας και δίνουμε την απαραίτητη μαρτυρία στον σύντροφό μας. Και οι δύο αντιλαμβανόμαστε ότι θα ήταν καλύτερα να μην αποδειχτεί κανείς ότι είναι τόσο σκυθρωπό πρόσωπο, αλλά, από την άλλη πλευρά, ένα σκυθρωπό πρόσωπο έχει ορισμένα πλεονεκτήματα σε σχέση με ένα χαμογελαστό πρόσωπο! Η ουσία όμως είναι ότι ο καθένας μας δεν ξέρει τι θα επιλέξει ο άλλος! Δεν θα μάθουμε έως ότου ο συνεργάτης του παιχνιδιού αποκαλύψει τη ζωγραφιά του!
- Ξεκίνα, κάθαρμα! μάλωσε η μάγισσα. Εκείνη, όπως πάντα, δεν μπορούσε χωρίς υβριστικά επίθετα!
- Ετοιμος! αναφώνησε ο Γκράντι, σχεδιάζοντας ένα μεγάλο χαμογελαστό πρόσωπο στο χαρτί του με τέτοιο τρόπο που η μάγισσα δεν μπορούσε να δει τι είχε ζωγραφίσει εκεί. Η μάγισσα έκανε την κίνηση της, κάνοντας κι αυτή γκριμάτσα. Πρέπει να σκεφτεί κανείς ότι σίγουρα απεικόνιζε μια αγενή φυσιογνωμία!
«Λοιπόν, τώρα πρέπει απλώς να δείξουμε ο ένας στον άλλο τα σχέδιά μας», ανακοίνωσε ο Grundy. Γυρίζοντας πίσω, άνοιξε το σχέδιο στο κοινό και το έδειξε προς όλες τις κατευθύνσεις για να δουν όλοι το σχέδιο. Γκρινιάζοντας κάτι δυσαρεστημένο, το Sea Witch έκανε το ίδιο.
Όπως ήλπιζε ο Γκράντι, ένα θυμωμένο, δυσαρεστημένο πρόσωπο φαινόταν έξω από το σχέδιο της μάγισσας.
«Τώρα εσείς, σεβαστοί θεατές», είπε ο Γκρούντι επίσημα, «δείτε ότι η μάγισσα προτίμησε να καταθέσει εναντίον μου. Δεν πρόκειται να το κάνω αυτό. Έτσι, η μάγισσα της θάλασσας κερδίζει πέντε πόντους. Και, κατά συνέπεια, δεν λαμβάνω ούτε έναν βαθμό. Και εδώ…
Ένας ελαφρύς θόρυβος σάρωσε ξανά τις σειρές των θεατών. Όλοι συμπαθούσαν ξεκάθαρα το golem και λαχταρούσαν να χάσει η μάγισσα της θάλασσας.
Το παιχνίδι όμως μόλις ξεκίνησε! Αν ήταν σωστή η στρατηγική του...
«Τώρα μπορούμε να περάσουμε στον δεύτερο γύρο!» ανακοίνωσε πανηγυρικά ο Γκράντι. Πρέπει να επαναλάβουμε τις κινήσεις ξανά. Όλοι ζωγραφίζουν ένα πρόσωπο που είναι πιο κοντά του!
Έτσι έκαναν. Ο Γκράντι είχε τώρα ένα ζοφερό, δυσαρεστημένο πρόσωπο.
Μόλις οι παίκτες έδειξαν τις ζωγραφιές τους, το κοινό είδε ότι τώρα και οι δύο είχαν ζωγραφίσει θυμωμένα πρόσωπα.
- Δύο πόντους έκαστος! είπε ο Γκράντι.
«Επτά δύο υπέρ μου!» φώναξε χαρούμενη η μάγισσα. «Δεν θα φύγεις από εδώ, ρε κάθαρμα!
- Ας ξεκινήσουμε πάλι! αναφώνησε ο Γκράντι. Έκαναν άλλη μια ζωγραφιά και την έδειξαν στο κοινό. Και πάλι τα ίδια κακά πρόσωπα.
- Καθένας από εμάς επανέλαβε την προηγούμενη κίνηση, συμπεριφέρθηκε εγωιστικά, και ως εκ τούτου, μου φαίνεται, είναι καλύτερο να μην απονέμουμε βαθμούς σε κανέναν! είπε το golem.
Αλλά εξακολουθώ να οδηγώ το παιχνίδι! - είπε η μάγισσα τρίβοντας χαρούμενα τα χέρια της.
- Εντάξει, μην κάνεις θόρυβο! είπε ο Γκράντι. - Το παιχνίδι δεν έχει τελειώσει. Για να δούμε τι θα γίνει! Λοιπόν, αγαπητό κοινό, ξεκινάμε τον τέταρτο κύκλο!
Οι παίκτες έκαναν ξανά σχέδια, δείχνοντας στο κοινό τι είχαν ζωγραφίσει στα σεντόνια τους. Και τα δύο φύλλα έδειξαν ξανά τα ίδια θυμωμένα πρόσωπα στο κοινό.
- Οκτώ - τρία! ούρλιαξε η μάγισσα ξεσπώντας σε πονηρά γέλια. «Έσκαψες τον τάφο σου με την ηλίθια στρατηγική σου, Γκόλεμ!»
– Πέμπτος γύρος! φώναξε η Γκράντυ. Συνέβη το ίδιο όπως και στους προηγούμενους γύρους - πάλι θυμωμένα πρόσωπα, μόνο το σκορ άλλαξε - έγινε εννιά - τέσσερα υπέρ της μάγισσας.
- Τώρα ο τελευταίος, έκτος γύρος! είπε ο Γκούντι. Οι προκαταρκτικοί υπολογισμοί του έδειξαν ότι αυτός ο γύρος θα έπρεπε να γίνει κρίσιμος. Τώρα η θεωρία έπρεπε να επιβεβαιωθεί ή να διαψευσθεί από την πράξη.
Μερικές γρήγορες και νευρικές κινήσεις ενός μολυβιού σε χαρτί - και τα δύο σχέδια εμφανίστηκαν μπροστά στα μάτια του κοινού. Δύο πρόσωπα ξανά, τώρα και με γυμνά δόντια!
- Δέκα - πέντε υπέρ μου! Το παιχνίδι μου! Νίκησα! η θαλάσσια μάγισσα χακάρισε.

«Πραγματικά κέρδισες», συμφώνησε σκυθρωπός ο Γκράντι. Το κοινό ήταν δυσοίωνο σιωπηλό.
Ο δαίμονας κούνησε τα χείλη του για να πει κάτι.

Αλλά ο διαγωνισμός μας δεν έχει τελειώσει ακόμα! φώναξε δυνατά η Γκράντυ. «Ήταν μόνο το πρώτο μέρος του παιχνιδιού.
- Να σου δώσω μια αιωνιότητα! γκρίνιαξε δυσαρεστημένος ο δαίμονας Ξανθ.
- Είναι σωστό! είπε ήρεμα ο Γκράντι. - Αλλά ένας γύρος δεν λύνει τίποτα, μόνο η μεθοδικότητα δείχνει το καλύτερο αποτέλεσμα.
Τώρα το γκόλεμ πλησίασε την άλλη μάγισσα.
– Θα ήθελα να παίξω αυτόν τον γύρο με άλλον αντίπαλο! ανακοίνωσε. - Ο καθένας μας θα απεικονίσει πρόσωπα, όπως ήταν την προηγούμενη φορά, μετά θα επιδείξει αυτό που έχει τραβήξει στο κοινό!
Και έτσι έκαναν. Το αποτέλεσμα ήταν το ίδιο με την προηγούμενη φορά - ο Grundy ζωγράφισε ένα χαμογελαστό πρόσωπο και η μάγισσα ένα κρανίο. Κέρδισε αμέσως ένα πλεονέκτημα έως και πέντε πόντων, αφήνοντας πίσω τον Grundy.
Οι υπόλοιποι πέντε γύροι ολοκληρώθηκαν με τα αναμενόμενα αποτελέσματα. Και πάλι το σκορ ήταν δέκα-πέντε υπέρ της μάγισσας της θάλασσας.
«Γκόλεμ, μου αρέσει πολύ η στρατηγική σου!» η μάγισσα γέλασε.
- Λοιπόν, παρακολουθήσατε δύο γύρους του παιχνιδιού, αγαπητοί θεατές! αναφώνησε ο Γκράντι. - Σκόραρα έτσι δέκα πόντους, και οι αντίπαλοί μου - είκοσι!
Το κοινό, που επίσης μετρούσε τους πόντους, κούνησε πένθιμα το κεφάλι. Η καταμέτρησή τους ταίριαζε με αυτή του golem. Μόνο το σύννεφο με το όνομα Frakto φαινόταν πολύ ευχαριστημένο, αν και φυσικά δεν άρεσε ούτε στη μάγισσα.
Αλλά η Ραπουντζέλια χαμογέλασε επιδοκιμαστικά στο γκόλεμ - συνέχισε να πιστεύει σε αυτόν. Μπορεί να ήταν η μόνη που τον πίστεψε τώρα. Ο Γκράντι ήλπιζε ότι θα δικαιολογούσε αυτή την απεριόριστη εμπιστοσύνη.
Τώρα ο Grundy έχει πλησιάσει τον τρίτο του αντίπαλο - τον doppelgänger του. Έμελλε να είναι ο τελευταίος του αντίπαλος. Γράφοντας γρήγορα μολύβια στο χαρτί, τα golem έδειχναν τα χαρτιά στο κοινό. Όλοι είδαν δύο γελαστά πρόσωπα.
- Προσέξτε, αγαπητοί θεατές, ο καθένας μας προτιμούσε να είναι καλός συγκάτοικος! αναφώνησε ο Γκράντι. - Και επομένως, κανένας από εμάς δεν πήρε το απαραίτητο πλεονέκτημα έναντι του αντιπάλου σε αυτό το παιχνίδι. Έτσι, παίρνουμε και οι δύο τρεις βαθμούς και προχωράμε στον επόμενο γύρο!
Ο δεύτερος γύρος ξεκίνησε. Το αποτέλεσμα ήταν το ίδιο με την προηγούμενη φορά. Στη συνέχεια οι υπόλοιποι γύροι. Και σε κάθε γύρο, και οι δύο αντίπαλοι σημείωσαν ξανά τρεις βαθμούς! Ήταν απλά απίστευτο, αλλά το κοινό ήταν έτοιμο να επιβεβαιώσει όλα όσα συνέβαιναν.

Τελικά, αυτή η περιοδεία έφτασε στο τέλος της και ο Grundy, μετακινώντας γρήγορα το μολύβι του πάνω από το χαρτί, άρχισε να υπολογίζει το αποτέλεσμα. Τέλος, ανακοίνωσε πανηγυρικά:
- Δεκαοχτώ επί δεκαοκτώ! Συνολικά, εγώ πέτυχα είκοσι οκτώ πόντους και οι αντίπαλοί μου τριάντα οκτώ!
«Λοιπόν έχασες», ανακοίνωσε χαρούμενα η μάγισσα της θάλασσας. - Ένας από εμάς θα είναι ο νικητής!
- Μπορεί! απάντησε ήρεμα ο Γκράντι. Τώρα έρχεται άλλος σημαντικό σημείο. Αν όλα πάνε όπως τα σχεδίασε...
- Πρέπει να τελειώσουμε τη δουλειά! αναφώνησε το δεύτερο γκόλεμ. «Πρέπει ακόμα να πολεμήσω και με δύο θαλάσσιες μάγισσες!» Το παιχνίδι δεν έχει τελειώσει ακόμα!
- Ναι, φυσικά, έλα! είπε ο Γκράντι. - Αλλά απλώς καθοδηγηθείτε από τη στρατηγική!
- Α, καλά! τον διαβεβαίωσε ο doppelgänger του.
Αυτό το golem πλησίασε μια από τις μάγισσες και η περιοδεία ξεκίνησε. Τελείωσε με το ίδιο αποτέλεσμα που ο ίδιος ο Grundy έφυγε από έναν παρόμοιο γύρο - το σκορ ήταν δέκα-πέντε υπέρ της μάγισσας. Η μάγισσα έλαμπε από ανέκφραστη χαρά και το κοινό έπεσε σε μια ζοφερή σιωπή. Ο Demon Xant φαινόταν λίγο κουρασμένος, κάτι που δεν ήταν πολύ καλός οιωνός.
Τώρα ήταν η ώρα για τον τελευταίο γύρο - μια μάγισσα έπρεπε να πολεμήσει ενάντια στη δεύτερη. Η καθεμία είχε είκοσι πόντους στο ενεργητικό της, τους οποίους μπόρεσε να πάρει πολεμώντας τα golem.
«Τώρα, αν με αφήσεις να πάρω τουλάχιστον μερικούς επιπλέον πόντους…» ψιθύρισε συνωμοτικά η μάγισσα της θάλασσας στον ντόπιό της.
Ο Γκράντι προσπάθησε να παραμείνει ήρεμος, τουλάχιστον εξωτερικά, αν και ένας τυφώνας αντικρουόμενων συναισθημάτων μαινόταν στην ψυχή του. Η τύχη του εξαρτιόταν πλέον από το πόσο σωστά προέβλεψε την πιθανή συμπεριφορά και των δύο μαγισσών – άλλωστε ο χαρακτήρας τους ήταν, στην ουσία, ο ίδιος!
Τώρα έρχεται η πιο, ίσως, η κρίσιμη στιγμή. Αλλά αν έκανε λάθος!
«Γιατί να σου παραδοθώ!» κράκαρε η δεύτερη μάγισσα στην πρώτη. «Θέλω να κερδίσω περισσότερους πόντους και να φύγω από εδώ!»
«Λοιπόν, αν συμπεριφέρεσαι τόσο αυθάδη», φώναξε ο αιτητής, «τότε θα σε χτυπήσω για να μη μου μοιάζεις πια!»
Οι μάγισσες, ρίχνοντας η μία στην άλλη βλέμματα μίσους, ζωγράφισαν τα σχέδιά τους και τα έδειξαν στο κοινό. Φυσικά, τίποτα άλλο εκτός από δύο κρανία δεν θα μπορούσε να είναι εκεί! Ο καθένας σημείωσε έναν βαθμό.
Οι μάγισσες, βρέχοντας η μία την άλλη με κατάρες, προχώρησαν στον δεύτερο γύρο. Το αποτέλεσμα είναι πάλι το ίδιο - και πάλι δύο αδέξια τραβηγμένα κρανία. Οι μάγισσες πέτυχαν έτσι από έναν ακόμη πόντο η καθεμία. Το κοινό κατέγραφε επιμελώς τα πάντα.
Αυτό συνεχίστηκε και στο μέλλον. Όταν τελείωσε η περιοδεία, οι κουρασμένες μάγισσες διαπίστωσαν ότι η καθεμία είχε σκοράρει έξι πόντους. Άλλη μια κλήρωση!
- Τώρα ας υπολογίσουμε τα αποτελέσματα και ας συγκρίνουμε τα πάντα! είπε θριαμβευτικά ο Γκράντι. «Οι μάγισσες σημείωσαν είκοσι έξι πόντους η καθεμία και οι γκόλεμ σημείωσαν είκοσι οκτώ πόντους. Τι έχουμε λοιπόν; Και έχουμε το αποτέλεσμα τα golem να έχουν περισσότερους πόντους!
Μια αναπνοή έκπληξης σάρωσε το κοινό. Συγκινημένοι θεατές άρχισαν να γράφουν στήλες με αριθμούς στα χαρτιά τους, ελέγχοντας την ορθότητα της καταμέτρησης. Πολλοί σε αυτό το διάστημα απλά δεν μέτρησαν τον αριθμό των πόντων που πέτυχαν, πιστεύοντας ότι γνώριζαν ήδη το αποτέλεσμα του παιχνιδιού. Και οι δύο μάγισσες άρχισαν να γρυλίζουν με αγανάκτηση, δεν είναι σαφές ποιον ακριβώς κατηγορούν για αυτό που συνέβη. Τα μάτια του δαίμονα Ξανθ φώτισαν ξανά με άγρυπνη φωτιά. Η εμπιστοσύνη του δικαιώθηκε!
«Σας ζητώ, αγαπητό κοινό, να δώσετε προσοχή στο γεγονός», σήκωσε το χέρι του ο Grundy, απαιτώντας από το κοινό να ηρεμήσει, «ότι κανένα από τα golem δεν κέρδισε ούτε έναν γύρο. Αλλά η τελική νίκη θα εξακολουθεί να είναι για έναν από εμάς, από τα golem. Τα αποτελέσματα θα είναι πιο εύγλωττα αν ο διαγωνισμός συνεχιστεί περαιτέρω! Θέλω να πω, αγαπητοί μου θεατές, ότι στην αιώνια μονομαχία, η στρατηγική μου θα αποδεικνύεται πάντα νικηφόρα!
Ο Demon Xant άκουσε με ενδιαφέρον τι είχε να πει ο Grundy. Επιτέλους άνοιξε το στόμα του βγάζοντας τζούρες ατμού.
– Ποια είναι ακριβώς η στρατηγική σας;
- Το λέω «Να είσαι σταθερός αλλά ειλικρινής»! εξήγησε ο Grundy. - Ξεκινάω το παιχνίδι ειλικρινά, αλλά μετά αρχίζω να χάνω, γιατί συναντώ πολύ συγκεκριμένους συνεργάτες. Επομένως, στον πρώτο γύρο, όταν αποδεικνύεται ότι η μάγισσα της θάλασσας αρχίζει να καταθέτει εναντίον μου, παραμένω αυτόματα ο ηττημένος στον δεύτερο γύρο - και ούτω καθεξής μέχρι το τέλος. Το αποτέλεσμα μπορεί να είναι διαφορετικό αν η μάγισσα αλλάξει την τακτική του παιχνιδιού της. Αλλά επειδή δεν μπορούσε καν να σκεφτεί κάτι τέτοιο, συνεχίσαμε να παίζουμε σύμφωνα με το προηγούμενο πρότυπο. Όταν άρχισα να παίζω με τον doppelganger μου, ήταν καλός μαζί μου και ήμουν καλός μαζί του στον επόμενο γύρο του παιχνιδιού. Επομένως, το παιχνίδι μας πήγε επίσης διαφορετικά και κάπως μονότονα, γιατί δεν θέλαμε να αλλάξουμε τακτική ...
«Αλλά δεν έχετε κερδίσει ούτε έναν γύρο! Ο δαίμονας απάντησε έκπληκτος.
- Ναι, και αυτές οι μάγισσες δεν έχουν χάσει ούτε έναν γύρο! Ο Γκράντι επιβεβαίωσε. - Αλλά τελικά η νίκη δεν πάει αυτόματα σε αυτόν που του απομένουν οι γύροι. Η νίκη πηγαίνει σε αυτόν που σημείωσε τους περισσότερους πόντους και αυτό είναι ένα εντελώς διαφορετικό θέμα! Κατάφερα να πάρω περισσότερους πόντους όταν παίζαμε με τον doppelgänger μου παρά όταν έπαιζα με τις μάγισσες. Η εγωιστική τους στάση τους κέρδισε μια στιγμιαία νίκη, αλλά μακροπρόθεσμα αποδείχθηκε ότι εξαιτίας αυτού και οι δύο έχασαν όλο το παιχνίδι. Συμβαίνει και αυτό συχνά!

Η μαθηματική θεωρία των παιχνιδιών που προέκυψε στη δεκαετία του σαράντα του ΧΧ αιώνα χρησιμοποιείται συχνότερα στα οικονομικά. Πώς όμως μπορούμε να χρησιμοποιήσουμε την έννοια των παιχνιδιών για να μοντελοποιήσουμε τη συμπεριφορά των ανθρώπων στην κοινωνία; Γιατί οι οικονομολόγοι μελετούν ποια γωνία παίρνουν πιο συχνά οι ποδοσφαιριστές και πώς να κερδίσουν στο Rock, Paper, Scissors, είπε στη διάλεξή του ο Danil Fedorovykh, Ανώτερος Λέκτορας στο Τμήμα Μικροοικονομικής Ανάλυσης HSE.

Ο Τζον Νας και η ξανθιά στο μπαρ

Ένα παιχνίδι είναι κάθε κατάσταση στην οποία το κέρδος του πράκτορα εξαρτάται όχι μόνο από τις δικές του ενέργειες, αλλά και από τη συμπεριφορά άλλων συμμετεχόντων. Αν παίζεις πασιέντζα στο σπίτι, από την άποψη ενός οικονομολόγου και θεωρίας παιγνίων, αυτό δεν είναι παιχνίδι. Υπονοεί ότι πρέπει να υπάρχει σύγκρουση συμφερόντων.

Στην ταινία A Beautiful Mind για τον John Nash, Ο βραβευμένος με Νόμπελστα οικονομικά, υπάρχει μια σκηνή με μια ξανθιά σε ένα μπαρ. Δείχνει την ιδέα για την οποία ο επιστήμονας έλαβε το βραβείο - αυτή είναι η ιδέα της ισορροπίας Nash, την οποία ο ίδιος ονόμασε δυναμική ελέγχου.

Το παιχνίδι- κάθε κατάσταση στην οποία οι αποδόσεις των πρακτόρων εξαρτώνται η μία από την άλλη.

Στρατηγική - περιγραφή των ενεργειών του παίκτη σε όλες τις πιθανές καταστάσεις.

Το αποτέλεσμα είναι ένας συνδυασμός των επιλεγμένων στρατηγικών.

Άρα, από τη σκοπιά της θεωρίας, μόνο οι άνδρες είναι οι παίκτες σε αυτή την κατάσταση, αυτοί δηλαδή που παίρνουν την απόφαση. Οι προτιμήσεις τους είναι απλές: μια ξανθιά είναι καλύτερη από μια μελαχρινή και μια μελαχρινή είναι καλύτερη από το τίποτα. Μπορείτε να ενεργήσετε με δύο τρόπους: να πάτε στην ξανθιά ή στη μελαχρινή «σας». Το παιχνίδι αποτελείται από μία κίνηση, οι αποφάσεις λαμβάνονται ταυτόχρονα (δηλαδή, δεν μπορείτε να δείτε πού πήγαν οι άλλοι και μετά να γίνετε σαν τον εαυτό σας). Εάν ένα κορίτσι απορρίψει έναν άντρα, το παιχνίδι τελειώνει: είναι αδύνατο να επιστρέψετε σε αυτήν ή να επιλέξετε άλλον.

Ποια είναι η πιθανή έκβαση αυτής της κατάστασης του παιχνιδιού; Δηλαδή ποια είναι η σταθερή του διαμόρφωση, από την οποία θα καταλάβει ο καθένας τι έκανε η καλύτερη επιλογή? Πρώτον, όπως σωστά επισημαίνει ο Nash, αν πάνε όλοι στην ξανθιά, δεν θα τελειώσει καλά. Ως εκ τούτου, περαιτέρω ο επιστήμονας προτείνει ότι όλοι πρέπει να πάνε στις μελαχρινές. Μετά όμως, αν είναι γνωστό ότι όλοι θα πάνε σε μελαχρινές, αυτός να πάει στην ξανθιά, γιατί αυτή είναι καλύτερη.

Εδώ βρίσκεται η πραγματική ισορροπία - ένα αποτέλεσμα στο οποίο κάποιος πηγαίνει στην ξανθιά και τα υπόλοιπα στις μελαχρινές. Αυτό μπορεί να φαίνεται άδικο. Αλλά σε μια κατάσταση ισορροπίας, κανείς δεν μπορεί να μετανιώσει για την επιλογή του: όσοι πάνε σε μελαχρινές καταλαβαίνουν ότι έτσι κι αλλιώς δεν θα έπαιρναν τίποτα από μια ξανθιά. Έτσι, η ισορροπία Nash είναι μια διαμόρφωση στην οποία κανείς δεν θέλει να αλλάξει τη στρατηγική που έχει επιλέξει ο καθένας. Δηλαδή, αντανακλώντας στο τέλος του παιχνιδιού, κάθε συμμετέχων καταλαβαίνει ότι ακόμη και γνωρίζοντας πώς είναι οι άλλοι, θα έκανε το ίδιο. Με άλλο τρόπο, μπορείτε να το ονομάσετε αποτέλεσμα, όπου κάθε συμμετέχων ανταποκρίνεται βέλτιστα στις ενέργειες των άλλων.

"Πέτρα ψαλίδι χαρτί"

Εξετάστε άλλα παιχνίδια για ισορροπία. Για παράδειγμα, στο "Rock, Paper, Scissors" δεν υπάρχει ισορροπία Nash: σε όλα τα πιθανά αποτελέσματα, δεν υπάρχει επιλογή στην οποία και οι δύο συμμετέχοντες θα ήταν ευχαριστημένοι με την επιλογή τους. Ωστόσο, υπάρχει ένα Παγκόσμιο Πρωτάθλημα και μια World Rock Paper Scissors Society που συλλέγει στατιστικά στοιχεία παιχνιδιού. Προφανώς, μπορείτε να αυξήσετε τις πιθανότητές σας να κερδίσετε εάν γνωρίζετε κάτι για τη συνήθη συμπεριφορά των ανθρώπων σε αυτό το παιχνίδι.

Η καθαρή στρατηγική σε ένα παιχνίδι είναι μια στρατηγική στην οποία ένα άτομο παίζει πάντα με τον ίδιο τρόπο, επιλέγοντας τις ίδιες κινήσεις.

Σύμφωνα με την World RPS Society, η πέτρα είναι η πιο συχνά επιλεγμένη κίνηση (37,8%). Βάλτε χαρτί 32,6%, ψαλίδι - 29,6%. Τώρα ξέρετε ότι πρέπει να επιλέξετε χαρτί. Ωστόσο, αν παίζεις με κάποιον που το ξέρει και αυτό, δεν χρειάζεται πλέον να επιλέγεις χαρτί, γιατί το ίδιο αναμένεται και από σένα. Υπάρχει μια περίφημη περίπτωση: το 2005, δύο οίκοι δημοπρασιών Sotheby's και Christie's αποφάσισαν ποιος θα έπαιρνε ένα πολύ μεγάλο κλήρο - μια συλλογή από Πικάσο και Βαν Γκογκ με τιμή εκκίνησης 20 εκατομμύρια δολάρια. Ο ιδιοκτήτης τους κάλεσε να παίξουν Rock, Paper, Scissors και εκπρόσωποι των οίκων του έστειλαν τις επιλογές τους μέσω ΗΛΕΚΤΡΟΝΙΚΗ ΔΙΕΥΘΥΝΣΗ. Οι Sotheby's, όπως είπαν αργότερα, χωρίς πολλή σκέψη, επέλεξαν χαρτί. Κέρδισε τον Christie's. Λαμβάνοντας μια απόφαση, στράφηκαν σε έναν ειδικό - την 11χρονη κόρη ενός από τα κορυφαία στελέχη. Είπε: «Η πέτρα φαίνεται να είναι η πιο δυνατή, γι' αυτό και οι περισσότεροι την επιλέγουν. Αλλά αν παίξουμε με έναν όχι εντελώς ηλίθιο αρχάριο, δεν θα πετάξει την πέτρα, θα περιμένει να το κάνουμε και θα πετάξει το χαρτί. Αλλά θα το σκεφτούμε και θα πετάξουμε το ψαλίδι».

Με αυτόν τον τρόπο, μπορείτε να σκεφτείτε μπροστά, αλλά δεν θα σας οδηγήσει απαραίτητα στη νίκη, γιατί μπορεί να μην γνωρίζετε την ικανότητα του αντιπάλου σας. Επομένως, μερικές φορές, αντί για καθαρές στρατηγικές, είναι πιο σωστό να επιλέγουμε μικτές, δηλαδή να παίρνουμε αποφάσεις τυχαία. Έτσι, στο «Rock, Paper, Scissors» η ισορροπία, που δεν έχουμε ξαναβρεί, βρίσκεται ακριβώς σε μικτές στρατηγικές: επιλέξτε καθεμία από τις τρεις επιλογές με πιθανότητα 1/3. Εάν επιλέγετε μια πέτρα πιο συχνά, ο αντίπαλος θα προσαρμόσει την επιλογή του. Γνωρίζοντας αυτό, θα διορθώσεις το δικό σου, και η ισορροπία δεν θα βγει. Αλλά κανένας από εσάς δεν θα αρχίσει να αλλάζει συμπεριφορά αν όλοι επιλέξουν απλώς πέτρα, ψαλίδι ή χαρτί με την ίδια πιθανότητα. Αυτό συμβαίνει γιατί στις μικτές στρατηγικές είναι αδύνατο να προβλέψεις την επόμενη κίνησή σου με βάση προηγούμενες ενέργειες.

Μικτή στρατηγική και αθλήματα

Υπάρχουν πολλά πιο σοβαρά παραδείγματα μικτών στρατηγικών. Για παράδειγμα, πού να υπηρετήσετε στο τένις ή να πάρετε / να κάνετε πέναλτι στο ποδόσφαιρο. Εάν δεν ξέρετε τίποτα για τον αντίπαλό σας ή απλώς παίζετε ενάντια σε διαφορετικούς ανθρώπους όλη την ώρα, η καλύτερη στρατηγικήθα είναι λίγο πολύ τυχαία. Ο καθηγητής του London School of Economics Ignacio Palacios-Huerta το 2003 δημοσίευσε μια εργασία στην American Economic Review, η ουσία της οποίας ήταν να βρεθεί η ισορροπία Nash σε μικτές στρατηγικές. Ο Palacios-Huerta επέλεξε το ποδόσφαιρο ως αντικείμενο της έρευνάς του και, σε σχέση με αυτό, παρακολούθησε περισσότερα από 1.400 πέναλτι. Φυσικά, στον αθλητισμό, όλα τακτοποιούνται πιο δύσκολα από ό,τι στο Rock, το Paper, το Scissors: λαμβάνει υπόψη το δυνατό πόδι του αθλητή, το χτύπημα σε διαφορετικές γωνίες όταν χτυπά με όλη του τη δύναμη και άλλα παρόμοια. Η ισορροπία Nash εδώ συνίσταται στον υπολογισμό των επιλογών, δηλαδή, για παράδειγμα, στον καθορισμό των γωνιών του στόχου που πρέπει να σουτάρετε για να κερδίσετε με μεγαλύτερη πιθανότητα, γνωρίζοντας τις αδυναμίες σας και δυνάμεις. Τα στατιστικά στοιχεία για κάθε ποδοσφαιριστή και η ισορροπία που βρέθηκε σε αυτό σε μικτές στρατηγικές έδειξαν ότι οι ποδοσφαιριστές ενεργούν περίπου όπως προβλέπουν οι οικονομολόγοι. Δεν αξίζει να υποστηρίξουμε ότι οι άνθρωποι που εκτελούν πέναλτι έχουν διαβάσει εγχειρίδια για τη θεωρία παιγνίων και έχουν ασχοληθεί με αρκετά δύσκολα μαθηματικά. Το πιθανότερο είναι να υπάρχει διαφορετικοί τρόποιμάθετε πώς να συμπεριφέρεστε βέλτιστα: μπορείτε να είστε λαμπρός ποδοσφαιριστής και να αισθάνεστε τι να κάνετε ή μπορείτε να είστε οικονομολόγος και να αναζητήσετε ισορροπία σε μικτές στρατηγικές.

Το 2008, ο καθηγητής Ignacio Palacios-Huerta συνάντησε τον Abraham Grant, τον προπονητή της Chelsea που τότε έπαιζε στον τελικό του Champions League στη Μόσχα. Ο επιστήμονας έγραψε ένα σημείωμα στον προπονητή με συστάσεις για τη διαδικασία των πέναλτι, που αφορούσε τη συμπεριφορά του αντίπαλου τερματοφύλακα - Έντουιν βαν ντερ Σαρ από τη Μάντσεστερ Γιουνάιτεντ. Για παράδειγμα, σύμφωνα με στατιστικά στοιχεία, σχεδόν πάντα απέκρουσε τις βολές σε μέσο επίπεδο και πιο συχνά έσπευσε στη φυσική πλευρά για ένα πέναλτι. Όπως ορίσαμε παραπάνω, είναι ακόμα πιο σωστό να τυχαιοποιήσετε τη συμπεριφορά σας λαμβάνοντας υπόψη τη γνώση για τον αντίπαλο. Όταν το σκορ ήταν ήδη 6-5 στα πέναλτι, ο Nicolas Anelka, ο επιθετικός της Τσέλσι, έπρεπε να σκοράρει. Δείχνοντας τη δεξιά γωνία πριν χτυπήσει, ο van der Sar φαινόταν να ρωτάει τον Anelka αν επρόκειτο να χτυπήσει εκεί.

Η ουσία είναι ότι όλα τα προηγούμενα σουτ της Τσέλσι έχουν δοθεί στα δεξιά του puncher. Δεν ξέρουμε ακριβώς γιατί, ίσως λόγω της συμβουλής ενός οικονομολόγου να χτυπήσει προς μια αφύσικη κατεύθυνση για αυτούς, γιατί σύμφωνα με στατιστικά στοιχεία, ο van der Sar είναι λιγότερο έτοιμος για αυτό. Οι περισσότεροι από τους παίκτες της Τσέλσι ήταν δεξιόχειρες: χτυπούσαν την αφύσικη δεξιά γωνία για τον εαυτό τους, όλοι τους, εκτός από τον Τέρι, σκόραραν. Προφανώς, η στρατηγική ήταν να χτυπήσει και εκεί η Ανέλκα. Αλλά ο van der Sar φαίνεται να το καταλαβαίνει αυτό. Ενήργησε έξοχα: έδειξε προς την αριστερή γωνία, λέγοντας, «Θα τον νικήσει εκεί;», από το οποίο η Ανέλκα, μάλλον, τρομοκρατήθηκε, γιατί τον μαντέψανε. Την τελευταία στιγμή αποφάσισε να ενεργήσει διαφορετικά, χτύπησε σε φυσική κατεύθυνση για τον εαυτό του, κάτι που χρειαζόταν ο Βαν ντερ Σαρ, ο οποίος πήρε αυτό το χτύπημα και εξασφάλισε τη νίκη της Μάντσεστερ. Αυτή η κατάσταση διδάσκει τυχαία επιλογή, γιατί διαφορετικά η απόφασή σας μπορεί να υπολογιστεί και θα χάσετε.

«Το δίλημμα του φυλακισμένου»

Πιθανώς το πιο διάσημο παιχνίδι με το οποίο ξεκινούν τα πανεπιστημιακά μαθήματα θεωρίας παιγνίων είναι το Prisoner's Dilemma. Σύμφωνα με τον μύθο, δύο ύποπτοι για ένα σοβαρό έγκλημα πιάστηκαν και κλείστηκαν σε διαφορετικά κελιά. Υπάρχουν ενδείξεις ότι κρατούσαν όπλα, και αυτό τους επιτρέπει να φυλακιστούν για κάποιο σύντομο χρονικό διάστημα. Ωστόσο, δεν υπάρχουν στοιχεία ότι διέπραξαν αυτό το τρομερό έγκλημα. Ο ερευνητής λέει σε κάθε άτομο τις συνθήκες του παιχνιδιού. Αν και οι δύο εγκληματίες ομολογήσουν, και οι δύο θα πάνε στη φυλακή για τρία χρόνια. Αν ομολογήσει κανείς, και ο συνεργός σιωπήσει, αυτός που ομολογεί θα βγει αμέσως και ο δεύτερος θα φυλακιστεί για πέντε χρόνια. Αν, αντίθετα, ο πρώτος δεν ομολογήσει και ο δεύτερος τον παραδώσει, ο πρώτος θα μείνει στη φυλακή για πέντε χρόνια και ο δεύτερος θα αφεθεί αμέσως ελεύθερος. Αν κανείς δεν ομολογήσει, θα πάνε και οι δύο φυλακή για ένα χρόνο για οπλοκατοχή.

Η ισορροπία Nash εδώ είναι στον πρώτο συνδυασμό, όταν και οι δύο ύποπτοι δεν σιωπούν και κάθονται και οι δύο για τρία χρόνια. Το σκεπτικό του καθενός είναι το εξής: «Αν μιλήσω, θα κάτσω τρία χρόνια, αν σιωπήσω, πέντε χρόνια. Αν ο δεύτερος είναι σιωπηλός, καλύτερα να πω κι εγώ: καλύτερα να μην κάτσεις παρά να κάτσεις ένα χρόνο. Αυτή είναι η κυρίαρχη στρατηγική: είναι κερδοφόρο να μιλάς, ανεξάρτητα από το τι κάνει ο άλλος. Ωστόσο, έχει ένα πρόβλημα - η παρουσία μιας καλύτερης επιλογής, επειδή το να καθίσετε για τρία χρόνια είναι χειρότερο από το να καθίσετε για ένα χρόνο (αν εξετάσουμε την ιστορία μόνο από τη σκοπιά των συμμετεχόντων και δεν λάβουμε υπόψη την ηθική θέματα). Αλλά είναι αδύνατο να καθίσουμε για ένα χρόνο, γιατί, όπως καταλάβαμε παραπάνω, είναι ασύμφορο και οι δύο εγκληματίες να σιωπούν.

Βελτίωση Pareto

Υπάρχει μια περίφημη μεταφορά για το αόρατο χέρι της αγοράς, που ανήκει στον Άνταμ Σμιθ. Είπε ότι αν ο κρεοπώλης προσπαθήσει να κερδίσει χρήματα για τον εαυτό του, θα είναι καλύτερα για όλους: θα κάνει νόστιμο κρέας που θα αγοράσει ο φούρναρης με χρήματα από την πώληση ψωμιών, το οποίο, με τη σειρά του, θα πρέπει επίσης να κάνει νόστιμο ώστε να πουληθούν . Αλλά αποδεικνύεται ότι αυτό το αόρατο χέρι δεν λειτουργεί πάντα, και υπάρχουν πολλές τέτοιες καταστάσεις όταν ο καθένας ενεργεί για τον εαυτό του και όλοι είναι κακοί.

Επομένως, μερικές φορές οι οικονομολόγοι και οι θεωρητικοί παιγνίων δεν σκέφτονται τη βέλτιστη συμπεριφορά κάθε παίκτη, δηλαδή όχι την ισορροπία Nash, αλλά το αποτέλεσμα που θα είναι καλύτερο για ολόκληρη την κοινωνία (στο «Δίλημμα» η κοινωνία αποτελείται από δύο εγκληματίες ). Από αυτή την άποψη, το αποτέλεσμα είναι αποτελεσματικό όταν δεν υπάρχει βελτίωση Pareto, δηλαδή είναι αδύνατο να γίνει κάποιος καλύτερος χωρίς να κάνει τους άλλους χειρότερους. Εάν οι άνθρωποι απλώς ανταλλάσσουν αγαθά και υπηρεσίες, αυτό είναι μια βελτίωση Pareto: το κάνουν οικειοθελώς και είναι απίθανο κάποιος να αισθανθεί άσχημα για αυτό. Αλλά μερικές φορές, αν απλώς αφήσετε τους ανθρώπους να αλληλεπιδρούν και να μην παρεμβαίνουν καν, αυτό στο οποίο καταλήγουν δεν θα είναι το βέλτιστο Pareto. Αυτό συμβαίνει στο Δίλημμα του Φυλακισμένου. Σε αυτό, αν επιτρέψουμε σε όλους να ενεργούν με τρόπο που είναι ωφέλιμο για αυτούς, αποδεικνύεται ότι όλοι είναι κακοί για αυτό. Θα ήταν καλύτερο για όλους αν ο καθένας δεν ενεργούσε βέλτιστα για τον εαυτό του, δηλαδή σιωπούσε.

Τραγωδία της κοινότητας

Το Prisoner's Dilemma είναι μια ιστορία με στυλ παιχνιδιού. Είναι απίθανο να περιμένατε να βρεθείτε σε παρόμοια κατάσταση, αλλά παρόμοια αποτελέσματα υπάρχουν παντού γύρω μας. Σκεφτείτε το "Δίλημμα" με μεγάλη ποσότηταπαίκτες, αποκαλείται μερικές φορές η τραγωδία της κοινότητας. Για παράδειγμα, υπάρχουν μποτιλιαρίσματα στους δρόμους και αποφασίζω πώς θα πάω στη δουλειά: με αυτοκίνητο ή με λεωφορείο. Οι υπόλοιποι κάνουν το ίδιο. Αν πάω με το αυτοκίνητο και αποφασίσουν όλοι να κάνουν το ίδιο, θα υπάρχει μποτιλιάρισμα, αλλά θα φτάσουμε εκεί με άνεση. Αν πάω με λεωφορείο, θα υπάρχει ακόμα μποτιλιάρισμα, αλλά θα νιώθω άβολα και όχι πολύ γρήγορα, οπότε αυτό το αποτέλεσμα είναι ακόμη χειρότερο. Εάν, κατά μέσο όρο, όλοι παίρνουν το λεωφορείο, τότε εγώ, έχοντας κάνει το ίδιο, θα φτάσω εκεί αρκετά γρήγορα χωρίς κυκλοφοριακή συμφόρηση. Αν όμως κάτω από τέτοιες συνθήκες πάω με αυτοκίνητο, θα φτάσω κι εγώ γρήγορα, αλλά και με άνεση. Άρα, η παρουσία μποτιλιαρίσματος δεν εξαρτάται από τις ενέργειές μου. Η ισορροπία Nash εδώ βρίσκεται σε μια κατάσταση όπου ο καθένας επιλέγει να οδηγήσει. Ό,τι κι αν κάνουν οι υπόλοιποι, καλύτερα να διαλέξω αυτοκίνητο, γιατί δεν είναι γνωστό αν θα υπάρξει μποτιλιάρισμα ή όχι, αλλά σε κάθε περίπτωση θα φτάσω εκεί με άνεση. Αυτή είναι η κυρίαρχη στρατηγική, οπότε στο τέλος όλοι οδηγούν ένα αυτοκίνητο και έχουμε ό,τι έχουμε. Έργο του κράτους είναι να κάνει ένα ταξίδι με λεωφορείο η καλύτερη επιλογήτουλάχιστον για κάποιους, άρα υπάρχουν εισόδους με πληρωμή στο κέντρο, πάρκινγκ κ.ο.κ.

Μια άλλη κλασική ιστορία είναι η λογική άγνοια του ψηφοφόρου. Φανταστείτε ότι δεν γνωρίζετε εκ των προτέρων το αποτέλεσμα των εκλογών. Μπορείτε να μελετήσετε το πρόγραμμα όλων των υποψηφίων, να ακούσετε τη συζήτηση και μετά να ψηφίσετε τον καλύτερο. Η δεύτερη στρατηγική είναι να έρθετε στο εκλογικό τμήμα και να ψηφίσετε τυχαία ή για αυτόν που εμφανιζόταν πιο συχνά στην τηλεόραση. Ποια συμπεριφορά είναι η βέλτιστη εάν η ψήφος μου δεν καθορίζει ποτέ ποιος θα κερδίσει (και σε μια χώρα 140 εκατομμυρίων ανθρώπων, μια ψήφος δεν θα αποφασίσει ποτέ τίποτα); Φυσικά, θέλω η χώρα να έχει έναν καλό πρόεδρο, αλλά ξέρω ότι κανείς άλλος δεν θα εξετάσει προσεκτικά τα υποψήφια προγράμματα. Επομένως, μην χάνετε χρόνο σε αυτό - την κυρίαρχη στρατηγική συμπεριφοράς.

Όταν καλείσαι να έρθεις σε ένα subbotnik, δεν θα εξαρτηθεί από κανέναν ξεχωριστά αν η αυλή θα είναι καθαρή ή όχι: αν βγω έξω μόνος μου, δεν θα μπορώ να τα καθαρίσω όλα, ή αν βγουν όλοι έξω, τότε θα μην βγεις έξω, γιατί όλα είναι χωρίς να αφαιρεθώ. Ένα άλλο παράδειγμα είναι η ναυτιλία στην Κίνα, για την οποία έμαθα στο εξαιρετικό βιβλίο του Steven Landsburg The Couch Economist. Πριν από 100-150 χρόνια, μια μέθοδος μεταφοράς αγαθών ήταν κοινή στην Κίνα: τα πάντα ήταν διπλωμένα σε ένα μεγάλο σώμα, το οποίο έσερναν επτά άτομα. Οι πελάτες πλήρωσαν εάν τα αγαθά παραδόθηκαν στην ώρα τους. Φανταστείτε ότι είστε ένας από αυτούς τους έξι. Μπορείτε να πιέσετε δυνατά και να τραβήξετε όσο πιο δυνατά μπορείτε, και αν το κάνουν όλοι αυτό, το φορτίο θα φτάσει στην ώρα του. Εάν κάποιος μόνος του δεν το κάνει αυτό, όλοι θα φτάσουν επίσης στην ώρα τους. Όλοι σκέφτονται: «Αν όλοι οι άλλοι τραβούν σωστά, γιατί να το κάνω εγώ, και αν όλοι οι άλλοι δεν τραβάει με όλη τους τη δύναμη, τότε δεν μπορώ να αλλάξω τίποτα». Ως αποτέλεσμα, με τον χρόνο παράδοσης, όλα ήταν πολύ άσχημα και οι ίδιοι οι μετακομιστές βρήκαν μια διέξοδο: άρχισαν να προσλαμβάνουν τον έβδομο και να του πληρώνουν χρήματα για το μαστίγωμα των τεμπέληδων με ένα μαστίγιο. Η ίδια η παρουσία ενός τέτοιου ανθρώπου ανάγκασε τους πάντες να δουλέψουν σκληρά, γιατί διαφορετικά όλοι θα έπεφταν σε μια κακή ισορροπία, από την οποία κανείς δεν θα μπορούσε να βγει κερδοφόρα.

Το ίδιο παράδειγμα μπορεί να παρατηρηθεί στη φύση. Ένα δέντρο που μεγαλώνει σε έναν κήπο διαφέρει από αυτό που μεγαλώνει σε ένα δάσος στο στέμμα του. Στην πρώτη περίπτωση, περιβάλλει ολόκληρο τον κορμό, στη δεύτερη, είναι μόνο στην κορυφή. Στο δάσος, αυτή είναι η ισορροπία Nash. Αν όλα τα δέντρα συμφωνούσαν και μεγάλωναν εξίσου, θα κατανείμουν εξίσου τον αριθμό των φωτονίων και όλοι θα ήταν καλύτερα. Αλλά είναι ασύμφορο για οποιονδήποτε συγκεκριμένο να το κάνει. Επομένως, κάθε δέντρο θέλει να μεγαλώσει λίγο ψηλότερα από τα άλλα.

Συσκευή δέσμευσης

Σε πολλές περιπτώσεις, ένας από τους συμμετέχοντες στο παιχνίδι μπορεί να χρειαστεί ένα εργαλείο που θα πείσει τους άλλους ότι δεν μπλοφάρει. Ονομάζεται συσκευή δέσμευσης. Για παράδειγμα, η νομοθεσία ορισμένων χωρών απαγορεύει την πληρωμή λύτρων σε απαγωγείς προκειμένου να μειωθεί το κίνητρο των εγκληματιών. Ωστόσο, αυτή η νομοθεσία συχνά δεν λειτουργεί. Εάν ο συγγενής σας έχει συλληφθεί και έχετε τη δυνατότητα να τον σώσετε παρακάμπτοντας το νόμο, θα το κάνετε. Φανταστείτε μια κατάσταση όπου ο νόμος μπορεί να παρακαμφθεί, αλλά οι συγγενείς αποδείχθηκαν φτωχοί και δεν έχουν τίποτα να πληρώσουν τα λύτρα. Ο δράστης σε αυτή την κατάσταση έχει δύο επιλογές: να απελευθερώσει ή να σκοτώσει το θύμα. Δεν του αρέσει να σκοτώνει, αλλά δεν του αρέσει πια η φυλακή. Το απελευθερωμένο θύμα, με τη σειρά του, μπορεί είτε να καταθέσει ώστε να τιμωρηθεί ο απαγωγέας είτε να παραμείνει σιωπηλός. Το καλύτερο αποτέλεσμα για τον δράστη είναι να αφήσει το θύμα που δεν θα το παραδώσει. Το θύμα θέλει να αφεθεί ελεύθερο και να καταθέσει.

Η ισορροπία εδώ είναι ότι ο τρομοκράτης δεν θέλει να τον πιάσουν, πράγμα που σημαίνει ότι το θύμα πεθαίνει. Αλλά αυτό δεν είναι μια ισορροπία Pareto, γιατί υπάρχει μια παραλλαγή στην οποία όλοι είναι καλύτεροι - το θύμα γενικά παραμένει σιωπηλό. Αλλά για αυτό είναι απαραίτητο να το κάνουμε έτσι ώστε να είναι ωφέλιμο για αυτήν να παραμείνει σιωπηλός. Κάπου διάβασα την επιλογή όταν μπορεί να ζητήσει από τον τρομοκράτη να κανονίσει μια ερωτική φωτογράφηση. Εάν ο εγκληματίας φυλακιστεί, οι συνεργοί του θα δημοσιεύσουν φωτογραφίες στο Διαδίκτυο. Τώρα, αν ο απαγωγέας μείνει ελεύθερος, αυτό είναι κακό, αλλά οι φωτογραφίες στο δημόσιο τομέα είναι ακόμη χειρότερες, οπότε είναι μια ισορροπία. Είναι ένας τρόπος για να μείνει ζωντανό το θύμα.

Άλλα παραδείγματα παιχνιδιών:

Μοντέλο Bertrand

Εφόσον μιλάμε για οικονομία, σκεφτείτε ένα οικονομικό παράδειγμα. Στο μοντέλο του Bertrand, δύο καταστήματα πωλούν το ίδιο προϊόν, αγοράζοντας το από τον κατασκευαστή στην ίδια τιμή. Αν οι τιμές στα καταστήματα είναι ίδιες, τότε τα κέρδη τους είναι περίπου ίδια, γιατί τότε οι αγοραστές επιλέγουν το κατάστημα τυχαία. Η μόνη ισορροπία Nash εδώ είναι η πώληση του προϊόντος στο κόστος. Αλλά τα καταστήματα θέλουν να βγάλουν χρήματα. Επομένως, αν κάποιος ορίσει την τιμή των 10 ρούβλια, ο δεύτερος θα τη μειώσει κατά μια δεκάρα, διπλασιάζοντας έτσι τα έσοδά του, αφού όλοι οι αγοραστές θα πάνε σε αυτόν. Ως εκ τούτου, είναι επωφελές για τους συμμετέχοντες στην αγορά να μειώσουν τις τιμές, διανέμοντας έτσι τα κέρδη μεταξύ τους.

Πέρασμα σε στενό δρόμο

Εξετάστε παραδείγματα επιλογής μεταξύ δύο πιθανών ισορροπιών. Φανταστείτε ότι η Petya και η Masha οδηγούν ο ένας προς τον άλλο κατά μήκος ενός στενού δρόμου. Ο δρόμος είναι τόσο στενός που και οι δύο πρέπει να τραβήξουν. Αν αποφασίσουν να στρίψουν αριστερά ή δεξιά μακριά τους, απλά θα διασκορπιστούν. Αν ο ένας στρίψει δεξιά και ο άλλος αριστερά ή το αντίστροφο, θα συμβεί ατύχημα. Πώς να επιλέξετε πού να πάτε; Για να βρείτε ισορροπία σε τέτοια παιχνίδια, υπάρχουν, για παράδειγμα, κανόνες ΚΙΝΗΣΗ στους ΔΡΟΜΟΥΣ. Στη Ρωσία, όλοι πρέπει να στρίψουν δεξιά.

Στο παιχνίδι Chiken, όταν δύο άτομα οδηγούν το ένα προς το άλλο με μεγάλη ταχύτητα, υπάρχουν επίσης δύο ισορροπίες. Αν και οι δύο στρίψουν στην άκρη του δρόμου, δημιουργείται μια κατάσταση που ονομάζεται Chiken out, αν και οι δύο δεν σβήσουν, τότε πεθαίνουν σε ένα τρομερό ατύχημα. Αν ξέρω ότι ο αντίπαλός μου οδηγεί ευθεία, είναι ωφέλιμο για μένα να φύγω για να επιβιώσω. Αν ξέρω ότι ο αντίπαλός μου θα φύγει, τότε είναι κερδοφόρο για μένα να πάω κατευθείαν για να λάβω 100 δολάρια αργότερα. Είναι δύσκολο να προβλέψουμε τι θα συμβεί στην πραγματικότητα, ωστόσο, ο καθένας από τους παίκτες έχει τη δική του μέθοδο για να κερδίσει. Φανταστείτε ότι έφτιαξα το τιμόνι έτσι ώστε να μην μπορεί να στρίψει και το έδειξα στον αντίπαλό μου. Γνωρίζοντας ότι δεν έχω άλλη επιλογή, ο αντίπαλος θα αναπηδήσει.

Εφέ QWERTY

Μερικές φορές μπορεί να είναι πολύ δύσκολο να μετακινηθείτε από τη μια ισορροπία στην άλλη, ακόμα κι αν αυτό σημαίνει ότι θα ωφεληθούν όλοι. Η διάταξη QWERTY δημιουργήθηκε για να επιβραδύνει την ταχύτητα πληκτρολόγησης. Γιατί αν όλοι δακτυλογραφούσαν πολύ γρήγορα, οι κεφαλές της γραφομηχανής που χτυπούσαν στο χαρτί θα κολλούσαν η μία στην άλλη. Ως εκ τούτου, ο Christopher Scholes τοποθέτησε γράμματα που συχνά στέκονται δίπλα-δίπλα στην πιο μακρινή απόσταση. Εάν μεταβείτε στις ρυθμίσεις πληκτρολογίου στον υπολογιστή σας, μπορείτε να επιλέξετε τη διάταξη Dvorak εκεί και να πληκτρολογήσετε πολύ πιο γρήγορα, καθώς δεν υπάρχει πρόβλημα με τα αναλογικά πατήματα τώρα. Ο Dvorak περίμενε ότι ο κόσμος θα αλλάξει στο πληκτρολόγιό του, αλλά εξακολουθούμε να ζούμε με το QWERTY. Φυσικά, αν μεταβαίναμε στη διάταξη Dvorak, η μελλοντική γενιά θα μας ήταν ευγνώμων. Όλοι θα καταβάλλαμε προσπάθεια και θα ξαναμάθαμε, και το αποτέλεσμα θα ήταν μια ισορροπία στην οποία όλοι πληκτρολογούν γρήγορα. Τώρα είμαστε και σε ισορροπία - σε μια κακή. Αλλά δεν είναι ωφέλιμο για κανέναν να είναι ο μόνος που επανεκπαιδεύεται, γιατί θα είναι άβολο να δουλεύεις σε οποιονδήποτε υπολογιστή εκτός από προσωπικό.