דילמת האסיר

דילמת האסיר (אנגלית: Prisoner's dilemma) היא בעיה פרדוקסלית בתורת המשחקים שפורסמה בשנת 1950 על ידי מריל פלאד ומלווין דרשר מ"תאגיד ראנד" בארצות הברית. הדילמה מדגימה מצב בו התנהגות רציונלית לחלוטין, מנקודת מבטו של הפרט, תוביל לתוצאה שאינה אופטימלית, כלומר אינה יעילה פארטו. בשל פשטותה, משמשת הדילמה כדוגמה קלאסית לבעיות בהן עוסקת תורת המשחקים.

הדילמה הבסיסית

גרסה נפוצה לבעיה זו: המשטרה עצרה שני עבריינים שביצעו פשע משותף, ומפרידה ביניהם לצורך חקירה. אם תצליח המשטרה להביא להרשעתם, ייכנס כל אחד מהם לכלא ל-15 שנה, אך בחוסר ראיות הם יועמדו לדין על עבירה משנית שבגינה ייכנס כל אחד מהם לכלא לשנה אחת. למשטרה אין די ראיות להעמידם לדין, ולכן היא מציעה לכל אחד מהם להעיד נגד רעהו, וכפרס מובטח לעד עונש מופחת: אם שני האסירים יקבלו את הצעת המשטרה, ייכנס כל אחד מהם לכלא לחמש שנים, ואם רק אחד מהם יעיד ורעהו ישתוק, העד יצא מיד לחופשי וחברו ייכלא ל-15 שנה. ניתן לסכם סיטואציה זו בטבלה הבאה, שמסכמת את העונשים שייגזרו על אסיר א (אדום) ואסיר ב (כחול) בהתאם לפעולתם:

אסיר ב
שותק מלשין
אסיר א שותק שנה אחת, שנה אחת 15 שנה, אפס שנים
מלשין אפס שנים, 15 שנה חמש שנים, חמש שנים

כל העובדות הללו ידועות לשני האסירים, אך אין באפשרותם לתקשר האחד עם השני. הדילמה שעומדת בפני כל אחד מהם היא "איזו טקטיקה לנקוט - לשתוק או להעיד?". אסיר א' מסתכל בטבלה וחושב: "בלי תלות בטקטיקה שבה יבחר ב', כדאי לי להעיד, משום שבכל מקרה אם אעיד, עונשי יהיה קטן מאשר אם אשתוק" ולפיכך "הודאה" היא אסטרטגיה שלטת עבורו. גם אסיר ב' מנתח את המצב בצורה דומה. החלטה רציונלית של שניהם מובילה לכך ששניהם בוחרים להעיד, ונכנסים לכלא לחמש שנים. אילו שתקו שניהם, היה כל אחד מהם נכנס לכלא לשנה בלבד.

הפרדוקסליות שבדילמה נובעת מכך שהחלטה רציונלית מביאה לתוצאה שאינה הטובה ביותר. כדי להגיע לתוצאה הטובה ביותר עבור שניהם נדרשים השחקנים לשיתוף פעולה (קרי, שתיקה של שניהם), אך מכיוון שדרך הפעולה המשתלמת יותר לכל שחקן לבדו היא תמיד לא לשתף פעולה (כלומר, להעיד), בוחר כל אחד מהשחקנים לא לשתף פעולה.

גם אם יוכלו האסירים לתקשר זה עם זה, כל עוד אין הם חותמים על הסכם מחייב, שמבטיח שהחותמים עליו ינהגו בהתאם להצהרתם, דרך הפעולה הרציונלית ממשיכה להיות הלשנה הדדית. רק הסכם שהפרתו גוררת סנקציה שיהוו משקל נגד לרווח שבבגידה יבטיח שיתוף פעולה הדדי.

הדילמה ממחישה מצב שאינו נדיר, לפיו שיתוף פעולה יביא תועלת רבה יותר לשני הצדדים מאשר גישה שבה כל צד פועל על דעת עצמו. הנה כמה דוגמאות אקטואליות לנושא זה:

  • במדע המדינה משמשת דילמת האסיר להמחשת מצב שבו שתי מדינות נכנסות למרוץ חימוש (ובעיקר מרוץ לחימוש גרעיני). לכל מדינה יש שתי אפשרויות: להגדיל את תקציב הביטחון שלה או להגיע להסכם עם יריבתה לפירוק החימוש. בכל מדינה מקנן החשש שיריבתה תפר את ההסכם, ולכן כל אחת מהן נוטה לכיוון של מרוץ חימוש. כל מדינה נראית כפועלת באופן רציונלי, אך התוצאה היא בלתי רציונלית בעליל. דוגמה למרוץ חימוש מסוג זה הוא המלחמה הקרה.
  • בתחום הכלכלה, ניתן להוכיח, שכאשר הריבית הנומינלית במשק גדולה מ-0, וכל גורם במשק דואג רק לטובת עצמו, התוצאות עבור המשק כולו אינן אופטימליות. פתרון אפשרי לבעיה זו הוא להוריד את שער הריבית ל-0[1].
  • דוגמה כללית מספרו של ויליאם פאונדסטון: תארו לעצמכם מצב בו אין אכיפה על תשלום ברכבות. תמיד משתלם לנוסעים לא לשלם (כלומר גם אם השאר בוחרים לשלם או "לגנוב" נסיעות), אך מצב זה יוביל לפשיטת רגל וסגירת הרכבת, בעוד שעדיף לכל אחד לשלם כדי לשמור על קיומה של הרכבת.

דילמת האסיר האלטרואיסט

דילמת האסיר עוסקת בשיתוף פעולה, ואינה אומרת דבר על מטרתה של הפעולה, שיכולה להיות גם אנוכית (כפי שהיא מוצגת בניסוח המקורי) וגם אלטרואיסטית. כדי לראות זאת נביט בניסוח הבא של הדילמה: נניח כי השוטרים מציעים לכל אחד משני האסירים את העסקה הבאה: אם אחד האסירים יתוודה ויקח את כל האשמה על עצמו, חברו ישוחרר. אם לעומת זאת שני האסירים ישתקו, שניהם יקבלו עונש מאסר על בסיס הראיות שכבר קיימות. אם שני האסירים יתוודו, שניהם יקבלו את אותו עונש, שהוא גדול מהעונש שהיו מקבלים אם היו שותקים, אך קטן מהעונש שהיה מקבל אסיר שהיה מתוודה לבדו:

אסיר ב
מכחיש מודה
אסיר א מכחיש חמש שנים, חמש שנים אפס שנים, 15 שנים
מודה 15 שנים, אפס שנים עשר שנים, עשר שנים

בתנאים אלו מתקבלת דילמת האסיר כאשר האסירים מתעניינים איש בתועלת של רעהו, ולא במאסר שהם עצמם יקבלו. זוהי דוגמה למצב שבו מתקבלת דילמת האסיר מפעולה שמונחית מטעמים אלטרואיסטיים.