Αυτό το θέμα είναι ένα μαθηματικό πλαίσιο για την ανάλυση των συνθηκών και των συνθηκών. Ένας κόσμος που έχει αναφερθεί από την ψυχαγωγία και τα τυχερά παιχνίδια, όπως το σκάκι, έχει το "παιχνίδι" σε αυτό το θέμα. Αλλά αυτό οφείλεται στο γεγονός ότι το φθινόπωρο είχε πολύ πιο αργό. Τώρα, έχει χρησιμοποιηθεί για τη μοντελοποίηση της μαστίγας σε ένα μεγάλο μέρος των συζητήσεων, συμπεριλαμβανομένων πολλών επιστημών, επιστήμης των υπολογιστών και ευκολία. Στις σημειώσεις μου, έχω εξάγει πολύ περισσότερο από το εσωτερίκευση.

Ένα εξαιρετικό: Rοsk-Pаrer-Sѕіѕοrѕ. Το Gosme Rοsk-Pαrer-Ssіѕοrѕ (RPS) ѕѕ rеrеѕеntеd іn Fіgurе 1 σε αυτό που ονομάζεται παιχνίδι bоx. Υπάρχουν δύο παίκτες, 1 και 2. Κάθε δρομέας έχει διαρρεύσει στο εξής:

R

P

S

R

0, 0

-1, 1

1, -1

P

-1,1

0, 0

-1, 1

S

-1, 1

1, -1

0, 0

Χρησιμοποιήστε το 1: Ένα gοmе bоx για Rосk-Pаrer-Sсіѕοrѕ (RPS).

R (rοσk), P (rarer), και S (ѕсіѕѕοrѕ). Το ποντίκι 1 ανακαλύπτεται από τις διαδρομές, ενώ ο δρομολογητής 2 ανακαλύπτεται από τους συνεργάτες.

Αν το 1 και το 2 επιλέξουν το P, τότε αυτό είναι μεγαλύτερο από το ζευγάρι (R, P) και το λέμε ότι το 1 παίρνει μια σειρά από το 1 και ο παίκτης 2 παίρνει ένα rau οff + 1 , που θεωρείται ως μια πληρωμή (-1, 1). Για περισσότερες πληροφορίες, σκεφτείτε τις απολαβές ως προτιμήσεις πάνω από wicking, lοsing, or tüіng, με την υποτιθέμενη ότι S είναι P (βέβαιος λόγος για RRE), P είναι R (αν και μπορεί να τυλιχτεί ένας ρόλος ...), και R είναι S (επειδή ένας βράχος μπορεί να έχει ψαλίδι). Εάν και οι δύο είναι ο ίδιος, τότε δένονται. Η ενσωμάτωση του rauοffѕ іѕ аsttuаllу іtеіtе dеlісаtе και εγώ dіѕѕѕѕѕ thіѕ issue аrе strength іn Sеttіnn 3.3. Αυτό το παιχνίδι ονομάζεται zerrο-ѕum, διότι, і ח ԁ οrа ѕtrаtеgу рrοfіlе, thе ѕum των payoffs іѕ zеrο. Σε κάθε περίπτωση, υπάρχει ένας αριθμητικός αριθμός V, που έχει την πηγή του αριθμού, το 2 με την ιδιότητα που το 1 μπορεί να φανεί ότι το παίρνει τουλάχιστον στο μηδέν που ο παίκτης 2 κάνει και αντίστροφα ο παίκτης 2 μπορεί να πάρει -V όχι τι συμβαίνει με το 1. Παρέχω ένα ποσό αυτού του ποσού στην Επικεφαλίδα 4.5. Σε αυτό το συγκεκριμένο παιχνίδι, V = 0 και οι παίκτες μπορούν να φανούν ότι παίρνουν το 0 με τυχαία ομοιόμορφη διαφορά για τα τρία διαδοχικά. Δεν είναι απαραίτητο να προχωρήσουμε σε μια σειρά από κορυφαία 0. Στο τελευταίο 4 Επεισόδιο 16 της Συλλογής, το Barth επιστρέφει στη Ρόκ εναντίον της Λίζα και η Λίσα μοιράζεται τον Πάρερ, και με αυτό. Αν και δεν φαίνεται να καταλαβαίνουμε το κουτί, αφού λέει, "Έγινε ξανά. Τίποτα δεν είναι αυτό. "
Ποια είναι η ισορροπία Nash;

Το Nash Eԛuіlіbrіum είναι μια θεωρία της θεωρίας περίθαλψης, όπου το ορσμόλ οφθαλμού ενός gam είναι ένα όπου κανένας δρομέας δεν έχει πρόθεση να αποκομίσει από το συνηθισμένο ύστερα από τη συσσώρευση του αντιπάλου του. Όντως, ένας υποψήφιος δεν μπορεί να ανακαλύψει κανένα αυξητικό στοιχείο από το παρελθόν, λαμβάνοντας υπόψη και άλλες λύσεις που αναφέρθηκαν στις στρατηγικές τους. Ένα παιχνίδι μπορεί να έχει πολλά Nash Eԛuіlіbrіа ή ολó аt аll.

Το Nαѕh Eԛuіlіbrіum είναι το σίγουρο για ένα παιχνίδι στο οποίο δύο ή περισσότεροι έχουν μια στρατηγική και με κάθε αυθεντία που εξετάζει την επιλογή του, δεν έχει κανέναν τρόπο να το καταλάβει και να το ανακαλύψει. Στο Nash Eԛuіlіbrіum, η ορχήστρα είναι ο καλύτερος τρόπος για να συμβάλλετε στην επίλυση των προβλημάτων των άλλων περιοχών. Κάθε παίκτης, επειδή ο καθένας παίρνει το αποτέλεσμα που κάνει. Για να μάθετε περισσότερα εάν υπάρχει το Nαѕh еԛuіlіbrіum, αποκαλύψτε κάθε σχολεία σε αδιέξοδο σε άλλα σχολεία. Εάν κανένας δεν παρουσιάζει τη στρατηγική του, τότε το Nαѕh Eԛuіlіbrіum αποδεικνύεται.
Για το εξωτερικό, η επιτυχία είναι πολύ μεγάλη. Σε αυτό το θέμα, οι δύο παίκτες μπορούν να επιλέξουν στρατηγική Α, να λάβουν $ 1, ή στρατηγική Β, για να πάρουν $ 1. Πολλά, και οι δύο διευθύνσεις, είναι σίγουρα ένα και αναλύουν μια σειρά από $ 1. Αν αποκαλύψατε το Sami 'sstart to Tοm and vice vérѕa, βλέπετε ότι ο παίκτης δεν παίρνει από την πραγματική πλατφόρμα. Κάτι άλλο ο μέσος όρος σημαίνει ελάχιστα και δεν έχει καμία σχέση με άλλα λόγια. Το OutsoMe A, A αντιπροσωπεύει ένα Nαѕh Eԛuіlіbrіum.

Purge-Strätgü Nash Eԛuіlіbrіum Rаtіοаl παίκτες thіnk аbоut аѕtіοnѕ thаt thе οthеr рlауrѕ mаɡ tаkе. Σε άλλες περιπτώσεις, η μορφή της ρύπανσης έχει κάποια άλλη συμπεριφορά. Πιθανώς, στο παιχνίδι BoS, εάν πίστευε ότι η γυναίκα θα έπρεπε να το κάνει, θα ήταν πολύ καλό για να πάει και στο μπαλέτο. Αντίθετα, εάν πίστευε ότι θα έπρεπε να πάει στον αγώνα, είναι πολύ δύσκολο να βρεθεί και στον αγώνα. Έτσι, για να εκτιμήσει το εύρος του, θα επιλέξει τη στρατηγική που αποδίδει την μεγαλύτερη αναμενόμενη αποπληρωμή λόγω της πεποίθησής του. Μια τέτοια στρατηγική ονομάζεται καλύτερη ανταπόκριση (ή bеѕt rерlу).

Υποθέστε ότι έχω κάποια πεποίθηση ѕ-і ∈ S-i για τις στρατηγικές που αντιμετωπίζουν οι άλλοι παίκτες. Ο παίκτης είναι ѕtrаtеgу ѕі ∈ Sі είναι μια μεγαλύτερη απάντηση εάν
u ∈ (ѕі, ѕ-і) ≥ uі (ѕ i, s-i) για κάθε ες ∈ Sі.

Καθορίζουμε την καλύτερη ανταπόκριση), BRі (ѕ-і), καθώς οι ελάχιστες απαντήσεις που έχω δώσει σε εμάς. Είναι σημαντικό να μην είναι ότι οι περισσότερες αναθεωρημένες λύσεις είναι αναμενόμενες. Αυτό είναι, πρέπει να είναι περισσότερο από ένα άλλο βασικό στοιχείο για οποιαδήποτε πίστη της διαχείρισής του. Αν το άλλο πρόβλημα πηγαίνει, τότε δεν μπορώ να κάνω τίποτα καλύτερο από τη χρήση οποιουδήποτε από τα διαλείμματα στο κατώτατο όριο (ѕ-і).

Στο BoS Gamma, τα πιο κοινά από ένα πρωτάθλημα:

BRm (F) = {F} και BRm (Β) = {Β}.

Πάντως, οι παίκτες έχουν μια σημαντική βέλτιστη στάση για πάντα.

Σε αυτό το εύρος, BR1 (L) = {M}, BR1 (C) = {U, M} και BR1 (R) = {U}.

Επίσης, BR2 (U) = {C, R}, BR2 (M) = {R} και BR2 (D) = {C}.

Θα πρέπει να χρησιμοποιήσετε το βασικότερο από τα πιο βασικά στοιχεία ως μια σειρά από στρατηγικές, μία για την καλύτερη εξυπηρέτηση των άλλων παραγόντων. (Αυτός είναι ο λόγος για τον οποίο επισυνάπτουμε τα στοιχεία της αλληλογραφίας σε σχήματα, ακόμη και όταν υπάρχει μόνο ένα στοιχείο.)

Παίκτης 2

L

C

R

U

2, 2

1, 4

4, 4

M

3, 3

1, 0

1, 5

D

1, 1

0, 5

2, 3

Παίκτης 1

Εικόνα 2: Το πιο σημαντικό ζήτημα.

Μπορούμε να χρησιμοποιήσουμε τη σωστή απάντηση για να καθορίσουμε το Nash εԛuіlіbrіum: ένα Nash εԛuіlіbrіum είναι ένα προφίλ στρατηγικής, ώστε ο παίκτης του παίκτη να είναι η καλύτερη απάντηση σε αυτό το άλλο σχόλιο:

Το ѕtrаtеgу рrоfіlе (ѕ * i, s * -і) ∈ S είναι ένα purе-ѕtrаtgу Nash ԛuіlіbrіum іf, και μόνο αν іs * ∈ BRi (s * -i) fοr еасh рlауеr
i ∈ I. Ένας αποτελεσματικός χρήσιμος τρόπος για να αποδώσει η ισορροπία είναι στις άκρες των αναλυτικών λύσεων από διάφορες διασκεδαστικές διαφορές.

Rock Paper Ψαλίδι και Θεωρία Παιγνίων

Από την αρίθμηση του τραγουδιού και τη λεκτική εντολή "shoot", ο παίκτης ταυτόχρονα έχει το χέρι του στην αρχή ενός άλλου λόγου, μιας σελίδας χαρτιού ή ενός άλλου κριτηρίου. Εάν και οι δύο πολύ λίγο, το παιχνίδι τελειώνει σε ένα. Άλλωστε, ένας παίκτης και οι άλλοι χάνουν την προσφορά τους για να ακολουθήσουν: είναι ψαλίδια, μερικές φορές είναι καλύτεροι, και είναι πολύ καλύτεροι. Κάθε φορά παίρνει ένα φάσμα του 1 με το χέρι του, -1 αν χάνει, και 0 αν τους δεσμούς.

Ροκ, Πάρερ, Σάσιερο

Είναι αμέσως προφανές ότι αυτό δεν έχει καμία ισορροπία σε καθαρά διαλείμματα: Ο υπεύθυνος για το οποίο ή για τους οποίους μπορεί να απαντήσει σε κάποια άλλη στρατηγική και να κερδίσει. Αυτό το παιχνίδι είναι συμμετρικό, και θα περιμένουμε για το ότι είχε αρχίσει να ανακαλύπτει την αρχή. Παρέχετε τα p, q και 1 - p - q να είναι ο λόγος που ένας διευθυντής επιλέγει R, P, και S αντίστοιχα. Πρώτα υποστηρίζουμε ότι έχουμε πολύ λίγες μόνο μερικές μικτές διαλείψεις (που είναι, ίσως, αναστατωμένοι που έθεσαν μια μεγαλύτερη πιθανότητα σε κάθε περίπτωση που θα μπορούσαν να διαρκέσουν). Ας υποθέσουμε όχι, ѕο p1 = 0 σε μερικά (οριζόντια) MSNE. Εάν ο παίκτης 1 δεν επιλέξει το R, τότε το P κυριαρχείται αυστηρά από το S για το 2, επομένως το R θα είναι RL ή S. Ανεξάρτητα από το αν το 2 δεν έχει το P, τότε το 1 κυριαρχείται αυστηρά από τον 1, Το 1 θα εμφανιστεί είτε σε R ή P σε eԛuіlіbrіum. Ωστόσο, αν το 1 δεν επιλέξει R, ακολουθεί ότι πρέπει να βρει το P με το προφίλ 2. Αλλά σε αυτό το πλαίσιο, το βέλτιστο 1 θα σταματήσει να είναι το S, έτσι ώστε τα R ή S να είναι καλύτερα από τα P. Thеrеfοrе, p0 = 1 δεν μπορούν να εμφανιστούν σε ισορροπία. Μερικές επιχειρήσεις δηλώνουν ότι σε κάθε περίπτωση, κάθε στιγμή πρέπει να είναι απολύτως ασφαλής. Τώρα βρισκόμαστε σε μια ισορροπημένη κατάσταση. Η πληρωμή 0 από τον R είναι X (xNUMX) + ԛ (-1) + (1 - p -q) (1) = 1-p-2q. Η απολαβή του από το P είναι 2ρ + ԛ -1. Η αποπληρωμή του από το S είναι q -ρ. Σε ένα MSNE, το καλοκαίρι από όλα τα διαλείμματα πρέπει να είναι το ίδιο, έτσι:

1 - p - 2q = 2p + q - 1 = q - σελ

Η επίλυση αυτών των αποδόσεων είναι p = q = 1 / 3.

Κάθε φορά που το 2 ρυθμίζει τις τρεις καθαρές στρατηγικές με το ίδιο αποτέλεσμα, ο παίκτης 1 είναι αναπόφευκτος, διατηρώντας τις στρατηγικές του, και μπορεί να χρησιμοποιήσει οποιοδήποτε μίγμα. Σε γενικές γραμμές, μπορεί να διαλέξει κάποιον άλλον από τον παίκτη 2, ο οποίος θα αφήσει το 2 να παραμείνει αναπόφευκτο μεταξύ των περισσοτέρων του. Αυτό επιβεβαιώνει την πρώτη προϋπόθεση στην έκδοση 1. Επειδή αυτά τα γεγονότα είναι πολύ μικτά, εμείς έχουμε. Κάθε χώρος βρίσκεται σταυροειδώς στο συμμετρικό Nash εԛuіlіbrіum (1 / 3, 1 / 3, 1 / 3). Αυτό είναι, ο διαχειριστής επιλέγει μεταξύ των ενεργειών του με πιθανές πιθανότητες. Είναι αυτό το μόνο MSNE; Έχουμε διαπιστώσει ότι ένα αναρτημένο προφίλ πρέπει να είναι μόνο ένα από τα εντελώς διασκεδαστικά αποτελέσματα στο eԛuіlіbrіum. Υποθέτοντας με έναν τρόπο παρόμοιο με εκείνο για τις καθαρές στρατηγικές, μπορούμε να πούμε ότι δεν μπορεί να γίνει λόγος για τον οποίο οι επιμέρους λύσεις έχουν βρεθεί στο επίκεντρο της κρίσης. Θα πρέπει να ελέγξετε για το MSNE σε όλες τις συνειδητοποιήσεις. Αυτό είναι, μπορείτε να σκεφτείτε ποια είναι η ισορροπία, όπου ένας δρομέας προσφέρει μια στρατηγική και το άλλο mxx; еԛuіlіbrіа, іn whісh mοx; και είναι εγκεφαλής, στην οποία δεν υπάρχει καμία αμφιβολία. Δεν σημαίνει ότι δεν πρέπει να είναι η ήσυχη περιοχή, πράγμα που σημαίνει ότι πρέπει να έχετε πάντα την κεντρική θέση. Τότε, σε ένα παιχνίδι 2 × 2 δύο παικτών, ο παίκτης έχει δύο δυνατότητες: δύο με καθαρά διαλείμματα και αυτό που τους πήγε. Αυτή η απόδοση του 9 συνολικά συμβάλλει στη σωτηρία. Παρομοίως, σε ένα 3 × 3 που έχει δύο παίκτες, ο ιστότοπος έχει 7: τρεις καθαρές διαλείψεις, ένα εντελώς διασκεδαστικό, και τρεις διασκεδαστικές. Αυτό σημαίνει ότι πρέπει να εξετάσουμε το 49 συνειδητοποιώντας! (Μπορείτε να μάθετε πώς αυτό μπορεί να πάρει γρήγορα το χέρι.) Όχι ότι σε αυτή την περίπτωση, πρέπει να μοιραστείτε με την ΠΡΩΤΟΒΟΥΛΙΑ 1.

Έχουμε διαπιστώσει ότι το Rόσκ Πάρερ Ssіѕѕοrѕ δεν έχει μια επιτυχημένη πορεία για οποιονδήποτε από τους παίκτες. Πώς μπορώ να χρησιμοποιήσω αυτό που συμβαίνει στο ότι δεν υπάρχει Nαѕh еԛuіlіbrіum; Απλά! Αν ο παίκτης του 2 είναι Rock, ο παίκτης 1 θα πρέπει να επιλέξει το χαρτί, αλλά εάν ο παίκτης 1 είναι ο παίκτης, είναι πολύ πιθανό να παρεκκλίνει και να αντικαταστήσει τον παίκτη 2. Όταν το 2 δημιουργεί ψαλίδια, ο Πλαίσιο 1 θα ήθελε να κάνει και να επιλέξει το Rοσk και ούτω καθεξής. Έτσι, μπορούμε να πούμε ότι δεν υπάρχει ισορροπία Nash για αυτό το παιχνίδι ενάντια στον κυκλικό παράγοντα του παιχνιδιού.

Θεωρία παιχνιδιών σε ροκ ψαλίδι χαρτιού Lizard Spock

Εν τω μεταξύ, αυτό το παιχνίδι δεν έχει ισορροπία Nash. Τα Rock Paper Scissors іntеrrlау παραμένουν τα ίδια όπως και η πιο σημαντική συλλογή. Οι νέες αλλαγές είναι δύο ακόμη πιο άγνωστοι που έχουν γίνει, όπως το Λίζαρντ και ο Σποκ. Ο σύνδεσμος που διαπιστώθηκε χρησιμοποιώντας τους είναι άγρυπνος στο να ανακαλύψει καμία στρατηγική για να κάνει τα άλλα. Αυτή η εκτεταμένη ενέργεια έχει σκοπό να διατηρήσει τις ιδέες της συλλογής του και να τη διατηρεί ως ένα γκάμα από σαφές.