Τετάρτη 15 Αυγούστου 2018

Το δίλημμα του φυλακισμένου, το διασημότερο πρόβλημα της θεωρίας παιγνίων


Αγγελική Μπομπούλα

Το δίλημμα του φυλακισμένου είναι το πιο διάσημο πρόβλημα της θεωρίας παιγνίων του κλάδου των μαθηματικών που εξετάζει τις στρατηγικές επιλογές λογικά σκεπτόμενων παικτών οι οποίοι εμπλέκονται σε ανταγωνιστικές καταστάσεις και δείχνει πως δυο απόλυτα «λογικά» άτομα μπορούν να μην συνεργαστούν, ακόμη και όταν έχουν μεγαλύτερο συμφέρον να το κάνουν.

Το δίλημμα του φυλακισμένου επινοήθηκε και αναλύθηκε από τους Merill Flood και Melvin Dresher, την εποχή του Ψυχρού Πολέμου, στην Καλιφόρνια του 1950, όταν δούλευαν για λογαριασμό της Rand Corporation ( του ερευνητικού κέντρου που ήθελε μελέτες στη θεωρία των παιγνίων για να τις χρησιμοποιήσει σε ενδεχόμενο πυρηνικό πόλεμο). Οι δυο μαθηματικοί ανακάλυψαν ένα απλό μαθηματικό μοντέλο σε μορφή παιγνίου στο οποίο οι παίκτες μπορούν είτε να συνεργαστούν μεταξύ τους, είτε να προδώσουν ο ένας τον άλλον.

Ο τίτλος και η εκδοχή με τις καταδικαστικές αποφάσεις φυλάκισης οφείλονται στον μαθηματικό Albert William Tucker, καθηγητή του νομπελίστα John Nash, που ήθελε να κάνει τις ιδέες του προσιτές σε ψυχολόγους του Stanford.

Η δομή του «Διλήμματος του Φυλακισμένου» αναδεικνύει την ισορροπία μεταξύ συνεργασίας και ανταγωνισμού και αποτελεί ένα πολύ χρήσιμο εργαλείο για την στρατηγική λήψης των αποφάσεων.

Μπορεί ακόμη να εφαρμοστεί σε διάφορους τομείς: από τις επιχειρήσεις, την οικονομία, τα δημοσιονομικά και τις πολιτικές επιστήμες έως τη φιλοσοφία, την ψυχολογία, τη βιολογία και την κοινωνιολογία.
Οι βάσεις του διλήμματος του φυλακισμένου

Το σενάριο του διλήμματος του φυλακισμένου έχει ως εξής:

Δυο ύποπτοι (Α και Β) έχουν συλληφθεί ως μέλη μιας συμμορίας για ένα έγκλημα και κρατούνται σε χωριστά δωμάτια σε ένα αστυνομικό τμήμα, χωρίς να έχουν δυνατότητα επικοινωνίας μεταξύ τους. Οι μηνυτές έχουν έλλειψη επαρκών αποδείξεων για να τους καταδικάσουν με τη βασική κατηγορία. Ταυτόχρονα ο ανακριτής προσφέρει στους φυλακισμένους μια συμφωνία, έχοντας πει στον καθένα τα ακόλουθα:

Εάν ομολογήσεις και συμφωνήσεις να καταθέσεις εναντίον του άλλου υπόπτου, ότι διέπραξε έγκλημα, οι κατηγορίες εναντίον σου θα αποσυρθούν και θα αφεθείς ελεύθερος ατιμώρητος.

Εάν δεν ομολογήσεις και το κάνει ο άλλος ύποπτος, θα καταδικαστείς με τη μέγιστη ποινή των 3 ετών.

Εάν ομολογήσετε και οι δυο, θα καταδικαστείτε με 2 χρόνια κάθειρξη.

Εάν κανείς από τους δυο δεν ομολογήσει και οι δυο θα κατηγορηθείτε για πταίσμα και θα καταδικαστείτε με 1 χρόνο φυλακή.

Η ουσία του διλήμματος του φυλακισμένου είναι τι θα κάνουν οι ύποπτοι και η θεωρία παιγνίων ρωτά ποια είναι η αναμενόμενη ορθολογικά «βέλτιστη» στάση του καθενός από τους φυλακισμένους.

Β σιωπά (συνεργάζεται) Β προδίδει(αποστατεί)

Α σιωπά (συνεργάζεται)

Καθ’ ένας 1 χρόνο Α: 3 χρόνια

φυλακή Β: αφήνεται ελεύθερος

Α προδίδει (αποστατεί)

Α: αφήνεται και οι δυο

ελεύθερος επιβαρύνονται

Β: 3 χρόνια δυο χρόνια

Ο Β είτε θα συνεργαστεί (μένει σιωπηλός), είτε θα αποστατήσει (ομολογεί). Εάν ο Β μείνει σιωπηλός, ο Α σκέφτεται πως πρέπει να ομολογήσει, γιατί το να αφεθεί ελεύθερος, είναι καλύτερα από το να πάει 1 χρόνο φυλακή. Αν ο Β ομολογήσει, ο Α σκέφτεται πως πρέπει επίσης να ομολογήσει, γιατί το να πάει φυλακή 2 χρόνια είναι καλύτερο από το να πάει 3. Έτσι, σε κάθε περίπτωση , ο Α σκέφτεται πως τον συμφέρει να ομολογήσει. Αντίστοιχα σκέφτεται και ο Β.

Ξεκάθαρα, η καλύτερη στρατηγική είναι να ομολογήσεις, αδιαφορώντας για το τι θα κάνει ο άλλος ύποπτος, μας λέει η θεωρία των παιγνίων.

Ωστόσο, παρ’ όλο που και οι δυο «λογικά»- σκεφτόμενοι το συμφέρον τους- αποφασίζουν να ομολογήσουν εναντίον του συνενόχου τους, ο καθένας βρίσκεται σε χειρότερη θέση, από το να έμεναν και οι δυο σιωπηλοί. Και οι δυο ήλπιζαν πως ο άλλος δεν θα μιλούσε και θα αφήνονταν ελεύθεροι. Ωστόσο ο εγωισμός τους δεν έφερε το καλύτερο αποτέλεσμα και για τους δυο, δηλαδή να μην καρφώσει ο ένας τον άλλον και να κάνουν μόνο 1 χρόνο φυλακή.

Τα αποτελέσματα είναι δυσμενέστερα από ότι αν ο καθένας διάλεγε να ελαχιστοποιήσει το διάστημα της ποινής του συνεργού του, με το κόστος να ξοδέψει ο ίδιος περισσότερο χρόνο στη φυλακή.

Παρ’ όλο που η θεωρία παιγνίων υποστηρίζει πως οι απόλυτα «λογικοί» θα προδώσουν τον άλλον, στην ουσία διαπιστώνουμε πως ο εγωισμός και η ιδιοτέλεια κοστίζουν.

Αλλά γιατί δυο απόλυτα λογικοί άνθρωποι δεν πέτυχαν το βέλτιστο και για τους δυο αποτέλεσμα και δεν κατάφεραν να κρατήσουν τη σιωπή τους και να πάνε φυλακή με ποινή μόνο ενός έτους; Αν συγκρίνουμε τις επιλογές που έχει ο κάθε κρατούμενος, θα διαπιστώσουμε πως για κάθε επιλογή του να μιλήσει ή να μη μιλήσει, η επιλογή με το καλύτερο αποτέλεσμα είναι να καρφώσει τον συνένοχο. Με δεδομένη κάθε επιλογή του αντιπάλου, το αποτέλεσμα του ανταγωνισμού επικρατεί έναντι του αποτελέσματος της συνεργασίας. Το παράδειγμα δείχνει πως το «κοινό συμφέρον» δεν είναι πάντα η επιλογή απόλυτα λογικά σκεπτόμενων ανθρώπων και πως συχνά απόλυτα «λογικές» επιλογές μπορεί να οδηγήσουν σε ζημία όλους τους εμπλεκόμενος.
Συνέπειες του διλήμματος του φυλακισμένου

Το δίλημμα του φυλακισμένου δείχνει ότι όταν ένα άτομο επιδιώκει το δικό του προσωπικό συμφέρον, η έκβαση είναι χειρότερη από ότι εάν είχαν συνεργαστεί και οι δυο. Στο ανωτέρω παράδειγμα, η συνεργασία -όπου Α και Β μένουν και οι δυο σιωπηλοί και δεν ομολογούν-μπορεί να επιφέρει στους δυο ύποπτους ποινή φυλάκισης 1 χρόνο.

Εάν και οι δυο επιλέξουν να καταθέσουν εναντίον του άλλου υπόπτου, θεωρώντας δεδομένο ότι ο άλλος δεν θα το κάνει, αντί να αφεθούν ελεύθεροι, όπως ο καθένας ελπίζει, θα πάνε 2 χρόνια φυλακή.

Στο παράδειγμα του φυλακισμένου, το να συνεργαστείς με τον άλλον ύποπτο, προκαλεί μια αναπόφευκτη ποινή 1 έτους, όταν το να ομολογήσεις έχει σαν αποτέλεσμα να αφεθείς ελεύθερος ή στη χειρότερη περίπτωση επιφέρει μια ποινή 2 ετών.

Αλλά αν δεν ομολογήσεις κουβαλάς το ρίσκο να σου επιβληθεί η μέγιστη ποινή των 3 χρόνων, εάν η εμπιστοσύνη του Α πως ο Β θα παραμείνει επίσης σιωπηλός, αποδεχτεί λανθασμένη και ο Β ομολογήσει (και αντίστροφα).

Το δίλημμα, όπου το κίνητρο να μην συνεργαστείς είναι τόσο ισχυρό, ακόμη και αν η συνεργασία μπορεί να αποφέρει τα καλύτερα αποτελέσματα, μπορεί να τεθεί με πολλούς τρόπους στις επιχειρήσεις και την οικονομία.

Το παζλ εξηγεί μια σύγκρουση μεταξύ της προσωπικής λογικής και της λογικής της ομάδας. Μια ομάδα της οποίας τα μέλη επιδιώκουν τη λογική του προσωπικού συμφέροντος μπορεί να καταλήξει χειρότερα από μια ομάδα της οποίας τα μέλη κινούνται και δουν εναντίον της λογικής του προσωπικού συμφέροντος.

Το δίλημμα του φυλακισμένου αποδεικνύει πως είναι δύσκολο ιδιοτελή, εγωιστικά πρόσωπα να συνεργαστούν για το κοινό καλό.

Στην ουσία πρόκειται για μια επιλογή ανάμεσα σε μια εγωιστική συμπεριφορά και έναν κοινωνικά επιθυμητό αλτρουισμό.

Η θεωρία των παιγνίων αναφέρει πως σε μια τέτοια αντιπαράθεση η προδοσία είναι η κυρίαρχη στρατηγική, δεδομένου πως προσφέρει την ελαφρώς υψηλότερη πληρωμή σε ένα ταυτόχρονο παιχνίδι. Οι οικονομολόγοι αναφέρονται σε αυτό ως «Ισορροπία Nash» μετά την απονομή του βραβείου Νόμπελ στον John Nash και τη βραβευμένη με Όσκαρ βιογραφική ταινία «A Beautiful Mind».
Φιλοσοφικά-ηθικά διλήμματα

Σε κάθε πρόβλημα της Θεωρίας Παιγνίων υποθέτουμε πως οι εμπλεκόμενοι παίκτες είναι απόλυτα λογικοί.

Οι οικονομολόγοι στους δυο φυλακισμένους βλέπουν τον homo economicus, τον άνθρωπο που η συμπεριφορά του έχει ως κίνητρο την μεγιστοποίηση του κέρδους και την ελαχιστοποίηση του κόστους.

Πως όμως καθορίζεται ως «ορθολογική» η επιλογή του να κοιτάζει ο καθένας το καθαρά προσωπικό του συμφέρον, ανεξάρτητα από αρχές και αξίες που επιτάσσουν τη σιωπή και το «μη δόσιμο» του συνενόχου; Οι ίδιοι οι φιλόσοφοι ήρθαν αντιμέτωποι με τα ηθικά διλήμματα που προκύπτουν.

Η λογική του παιχνιδιού υποδεικνύει πως «αν προδώσεις τον άλλον θα κερδίσεις» ωφελούμενος από την χωρίς ανταπόδοση πιθανή αλτρουιστική συμπεριφορά του άλλου.

Περισσότερο κερδισμένος είναι αυτός που θα προδώσει τον συνένοχο του, αφού προηγουμένως έχει κερδίσει την εμπιστοσύνη του, ώστε αυτός να μην τον προδώσει. Αν εμπιστευτείς και δεν προδώσεις τον συνένοχο σου, ενώ αυτός σε προδώσει το αποτέλεσμα είναι να σου επιβληθεί η μεγαλύτερη ποινή.

Στο δίλημμα του φυλακισμένου αν και οι δυο επιλέξουν να προδώσουν χάνουν τα ίδια.

Φυσικά υπάρχει πάντα η εκδοχή του αμοιβαίου αλτρουισμού, όπου και οι δυο συμμετέχοντες επιλέγουν την εμπιστοσύνη και την πληρωμή ενός τιμήματος για αμοιβαίο όφελος. Παρότι σπάνια, η εκδοχή αυτή συμφέρει και τους δυο.

Βραχυπρόθεσμα κερδίζει εκείνος που θα προδώσει πρώτος, αλλά μακροπρόθεσμα η έλλειψη ηθικών αναστολών θα μπλοκάρει μελλοντικές συνεργασίες με το ίδιο ή άλλα άτομα. Συνεργασία σημαίνει αμοιβαίο όφελος, προδοσία, αμοιβαία απώλεια.
Επαναλαμβανόμενο παιχνίδι

Μια επεκτεινόμενη εκδοχή του παιχνιδιού καθιερώθηκε υπό την μορφή προγραμμάτων ηλεκτρονικών υπολογιστών, από τον Αμερικανό μαθηματικό και πολιτικό επιστήμονα Robert Axelrod που βρήκε στο Δίλημμα του Φυλακισμένου μια πιθανή απάντηση στο ερώτημα που τον απασχολούσε: υπό ποιες συνθήκες δυο θεμελιωδώς εγωιστικά όντα μπορούν να επιλέξουν να συνεργαστούν;

Στο επαναλαμβανόμενο παιχνίδι μεταξύ των ίδιων φυλακισμένων η στρατηγική είναι απλή: Ο παίκτης ξεκινά συνεργαζόμενος με τον αντίπαλο και κατόπιν πράττει ότι έπραξε ο αντίπαλος στο προηγούμενο γύρο. Συνεργάστηκε, θα συνεργαστεί. Πρόδωσε, θα προδώσει.

Ο Axelrod το 1981 δημοσίευσε με τον Βρετανό εξελικτικό βιολόγο William Donald Hamilton ένα άρθρο στο περιοδικό Science, αποδεικνύοντας πως η συνεργασία είναι η απαραίτητη εξελικτική σταθερή στρατηγική που επιτρέπει στα είδη να επικρατήσουν και να επιβιώσουν.
Εφαρμογή σε αληθινούς κρατούμενους

Το παιχνίδι έχει παιχτεί πολλές φορές και η θεωρία είναι σωστή: Η προδοσία είναι το κυρίαρχο αποτέλεσμα. Αλλά όχι απαραίτητα κι όχι πάντα. Δυο οικονομικά πανεπιστήμια του Αμβούργου διεξήγαγαν μια μελέτη με σκοπό να αναλύσουν τις διάφορες συμπεριφορές μεταξύ δυο ομάδων. Μια ομάδα κρατουμένων στις γυναικείες φυλακές της Κάτω Σαξωνίας στη Γερμανία επιλέχτηκε να παίξει το ίδιο παιχνίδι με ομάδα φοιτητών, στους οποίους προσφέρονταν χρήματα, ενώ στις κρατούμενες καφές και τσιγάρα.

Οι ερευνητές διαπίστωσαν, πως μόνο το 37% των φοιτητών συνεργάστηκαν, ενώ οι κρατούμενες συνεργάστηκαν σε ποσοστό 56%. Με βάση τα ζευγάρια, μόνο το 13% των φοιτητών κατάφερε να πάρει το καλύτερο δυνατό αποτέλεσμα και τη συνεργασία, ενώ το αντίστοιχο ποσοστό των κρατουμένων ήταν 30%.

Η μελέτη διέψευσε όσους υπέθεταν πως οι κρατούμενες ζώντας σε ένα δυσμενές περιβάλλον θα ομολογούσαν περισσότερο από τους μαθητές, αποδεικνύοντας δεν είναι αναξιόπιστες και καιροσκόποι, σύμφωνα με το στερεότυπο.
Μοντέλο για πολλές καταστάσεις

Μπορεί να φαίνεται παράδοξο, αλλά βρισκόμαστε αντιμέτωποι με το δίλημμα του φυλακισμένου καθημερινά σε όλα τα επίπεδα (άτομα, οργανισμοί, χώρες).

Το δίλημμα του φυλακισμένου μπορεί να χρησιμοποιηθεί σαν μοντέλο για πολλές καταστάσεις του πραγματικού κόσμου, όπου εμπλέκεται η συμπεριφορά της συνεργασίας πχ εκεί όπου δυο οντότητες θα μπορούσαν να κερδίσουν σημαντικά οφέλη από τη συνεργασία αλλά θεωρούν δύσκολο ή ακριβό να συντονίσουν τις στρατηγικές τους ώστε να την πετύχουν.

Ας υποθέσουμε πως λογική επιδίωξη των κυβερνήσεων δυο γειτονικών χωρών (Α και Β), θα έπρεπε να ήταν η ευημερία των πολιτών με δαπάνες για το σύστημα υγείας, για σχολεία, για δρόμους κλπ. ώστε και οι δυο να επωφελούνται. Αν όμως η χώρα Α εξοπλίζεται στρατιωτικά, ενώ η Β επενδύει στην ειρήνη, τότε αν η Α επιτεθεί στη Β, τότε αυτή θα χάσει τα πάντα, αφού θα είναι εντελώς απροετοίμαστη. Πρόκειται δηλαδή για το γνωστό δίλημμα. Αν επενδύσουν και οι δυο στην ειρήνη κερδίζουν και οι δυο. Αν όμως είναι γνωστό πως η Α ακολουθεί επιθετική πολιτική, τότε και Β πρέπει να εξοπλίζεται. Η χειρότερη περίπτωση είναι να ακολουθούν και οι επιθετική πολιτική.