במצבים רבים בחיים אנו נדרשים לשתף פעולה עם אחרים, לא פעם נגד האינטרס המיידי של עצמנו. עלינו לצמצם את השימוש בדלקים מזהמים כדי לבלום את שינויי האקלים שמסכנים את עתידנו; לתת זכות קדימה לאחרים ברמזור; להתחסן נגד קורונה גם אם אנחנו בטוחים שנעבור את המחלה בקלות, כדי להגן על קבוצות הסיכון; לתקף כרטיסים באוטובוס מרצוננו החופשי, מכיוון שאם כולם יסעו בחינם התחבורה הציבורית תקרוס, ועוד שלל החלטות קטנות וגדולות.
כל אלה הן דוגמאות של מצבי "דילמת האסיר", מונח ששייך לתחום המתמטי הקרוי "תורת המשחקים". משחק, לצורך העניין, הוא כל מצב שמעורבים בו שני צדדים פועלים או יותר, הקרויים "שחקנים". השחקנים בוחרים דרכי פעולה מתוך אסטרטגיות בעלות חוקים מוגדרים היטב, וכך קובעים בצורה ברורה וניתנת לכימות את תוצאות המשחק. תורת המשחקים מניחה שהשחקנים פועלים מתוך שיקולים רציונליים בלבד, ומעוניינים להשיג תוצאה כמה שיותר טובה עבור עצמם, בהתאם לתנאי המשחק ולכלליו.
דילמת האסיר מתארת משחק שבו שני שחקנים צריכים לבחור, בנפרד, בין שתי ברירות, שנקרא להן כאן "שיתוף פעולה" או "בגידה". מכיוון שלכל שחקן יש שתי ברירות, יש בסך הכול ארבעה מצבים אפשריים: שני השחקנים משתפים פעולה, שניהם בוגדים, או שני מקרים שבהם אחד מהם משתף פעולה והשני בוגד.
הדילמה הבסיסית
מקור השם "דילמת האסיר" בא מהצורה הקלאסית שבה נוהגים להציג את הבעיה. הסיפור הוא כזה: התרחש פשע והמשטרה עצרה שני חשודים בביצועו. אבל למשטרה יש בעיה – אין לה די ראיות כדי להרשיע אותם בפשע הגדול עצמו, אלא רק בפשע קטן ומינורי יותר. הדרך היחידה להשיג הרשעה בפשע הגדול היא לגרום להם להודות שביצעו אותו. השניים נחקרים בנפרד וכל אחד מהם יכול לבגוד בשותפו ולהלשין עליו, או לשתף איתו פעולה ולשתוק. אם שניהם ישתפו פעולה זה עם זה וישתקו בחקירתם, כל אחד מהם יקבל עונש מתון יחסית – למשל שנת מאסר אחת, כי המשטרה תוכל להרשיע אותם רק בביצוע הפשע הקל יותר. אם אחד מהם ילשין על חברו והשני ישתוק, המלשין יזכה למעמד של עד מדינה ויצא לחופשי, ואילו חברו יורשע בביצוע הפשע החמור ויישלח לכלא לעשרים שנה. ואם שניהם ילשינו זה על זה, שניהם יורשעו בפשע החמור וכל אחד מהם יישלח לחמש שנות מאסר – עונש מופחת מכיוון שסייעו לחוקרים והודו בביצוע הפשע. זוהי כמובן דוגמה היפותטית לחלוטין שנועדה להמחיש את הרעיון, ואין להסיק ממנה על עבודת המשטרה בפועל או על הדרך הראויה לחקירת חשודים.
הבעיה של שני הפושעים היא, שהמשטרה חוקרת כל אחד מהם בנפרד ובאותו זמן, כך שאין להם דרך לדעת מהי ההחלטה שיקבל חברו. במצב הזה עדיף לכל אחד מהם לבגוד בשותפו, בלי קשר להחלטה שקיבל השותף. מדוע? נסתכל על האפשרויות השונות: אם השותף בחר לשתוק, לאסיר שלנו כדאי לדבר ולצאת לחופשי במקום לשבת שנה בכלא כי העדיף לשתוק גם הוא; אם השותף מדבר, ודאי שעדיף לו להודות בפשע כדי לשבת בכלא רק חמש שנים ולא עשרים שנה. הפושע השני מפעיל אותו שיקול דעת, וכך שניהם מאשימים זה את זה ונכנסים לכלא לחמש שנים כל אחד.
בתורת המשחקים קוראים למצב כזה שיווי משקל נאש: מצב שבו כל שחקן יודע שאם הוא לבדו יפעל בדרך אחרת, יש לו רק מה להפסיד. אך במקרה הזה שיווי המשקל שהושג אינו התוצאה האופטימלית עבור אף אחד מהשחקנים. הרי אילו היו בוטחים איש ברעהו ושותקים בחקירה, כל אחד מהם היה יושב שנה אחת בלבד, ולא חמש שנים!
האם זו סתירה? פרדוקס? האם טעינו בחישוב? לא ולא. ההסבר הוא פשוט: יש הבדל בין "מצב אופטימלי" ל"מצב יציב". שיקולי עלות-תועלת אישיים יובילו אותנו למצב יציב, שבו אנחנו לא תלויים באחרים ולא חייבים לסמוך עליהם. כך כל פושע שהלשין וידא שגורלו האישי יהיה הטוב ביותר בלי קשר למה שחברו יבחר לעשות, ולאף פושע לא משתלם לשנות את התנהגותו. אך לעיתים, כמו בדילמת האסיר, המצב היציב אינו המצב האופטימלי, מכיוון שהמצב האופטימלי מחייב כל שחקן לתת אמון בחברו ולשים את גורלו בידיו.
זוהי, על רגל אחת, המלכודת של דילמת האסיר. זהו מצב עניינים שבו אם כל שחקן פועל בדרך הטובה ביותר עבורו, מתקבל "שיווי משקל נאש" שבו התוצאה אינה אופטימלית לאיש.
כשהסיפור חוזר על עצמו
זה היה המצב הבסיסי, שכלל משחק חד-פעמי. מה יקרה אם אותם שחקנים יצטרכו לחזור על אותו משחק פעמים רבות, כפי שקורה לא פעם במצבי קבלת החלטות אמיתיים? מתברר שהשינוי הזה בנסיבות המשחק משנה גם את מהלכו. כעת, כיוון שהציפייה היא שתמיד יהיה סיבוב נוסף, כל שחקן יוכל להעניש את עמיתו על בגידה בכך שיבגוד בו בעצמו בסיבוב הבא – אפשרות שלא הייתה קיימת בסיבוב משחק יחיד. במצב הזה הדינמיקה של הדילמה נהיית הרבה יותר מעניינת. שני השחקנים יכולים לנסות ליצור זה עם זה אמון הדדי כדי לשתף פעולה ולשפר את מצבם לעומת התרחיש שבו הם בוגדים שוב ושוב בכל הסיבובים. המשחק הזה קרוי "דילמת אסיר חוזרת" (איטרטיבית).
מהי האסטרטגיה המיטבית בדילמת אסיר חוזרת? בניסוי שערך איש מדע המדינה רוברט אקסלרוד התבקשו מומחים ליצור תוכנות מחשב שישחקו זו מול זו מאתיים משחקי דילמת האסיר, כך שכל תוכנה תשחק על פי האסטרטגיה שנראית למתכנניה מיטבית בתנאים הללו. התקבלו מגוון הצעות ממומחים בתחומים שונים, שנעו בין אסטרטגיות פשוטות כמו שיתוף פעולה קבוע או החלטות אקראיות, לאסטרטגיות מורכבות ביותר. הזוכה הייתה דווקא אחת מהגרסאות הפשוטות והאינטואיטיביות ביותר, "עין תחת עין": התוכנה התחילה בשיתוף פעולה, ואז חזרה על המהלך האחרון של יריבה. אם התוכנה האחרת בגדה, היא בחרה לבגוד בה בסיבוב הבא; אם שיתפו איתה פעולה, היא תשתף פעולה במהלך הבא שלה, וכך עד הסוף.
הגישה הזאת הוכיחה את עצמה היטב. התוכנה שיתפה פעולה עם יריבים "נחמדים" שנטו לשתף פעולה, והענישה יריבים בוגדניים. אך אף שהיא הייתה הזוכה הגדולה בטורניר, אי אפשר לקבוע שאכן מדובר באסטרטגיה אופטימלית. למעשה, אין באמת אסטרטגיה אופטימלית במשחק מתמשך של דילמת האסיר, כי המון תלוי בדרך שיבחרו השחקנים האחרים, כפי שאפשר לראות בגרסה אינטראקטיבית של המשחק.
קרובי המשפחה של האסיר
תורת המשחקים מציעה כמה משחקים שקרובים לדילמת האסיר, אך נבדלים ממנה מהותית. נזכיר כאן שניים מהם, שנחשבים חשובים גם הם מאחר שיש בחיים מצבים רבים שדומים להם.
המשחק הראשון מכונה "משחק השפן". ההבדל בינו לבין דילמת האסיר הוא שהמצב הגרוע ביותר, לשני השחקנים, הוא כששניהם בוגדים. בדוגמה הקלאסית שני נהגים נוהגים זה מול זה באותו כביש. התוצאה הגרועה ביותר לשניהם היא זו שבה איש מהם לא יסטה הצידה ותתרחש התנגשות חזיתית בין המכוניות; התוצאה הטובה ביותר עבור השחקן הבודד היא כשהיריב סוטה הצידה ומוכרז פחדן (שפן), בעוד זה שהמשיך לנסוע במרכז הכביש הוא המנצח, שהוכיח את האומץ שלו.
המציאות מזמנת מצבים רבים מסוגו של משחק השפן. אחד התרחישים הנפוצים המוכרים לכולם הוא זה שבו שתי מפלגות בקואליציה "עושות שריר" בוויכוח פוליטי וכל אחת מהן מאיימת ללכת לבחירות אם דרישותיה לא יתקבלו. שתיהן מעדיפות למנוע בחירות, אך כל אחת מקווה שהשנייה תתקפל ברגע האחרון וכך היא תוכל להראות לבוחריה שהיא דבקה בעקרונותיה. דוגמה אחרת היא מה שקורה כששתי מדינות שאינן רוצות במלחמה מאיימות זו על זו. אומנם מלחמה היא התוצאה הגרועה ביותר האפשרית, אך כל אחת רוצה שהשנייה תעשה ויתורים ואף אחת אינה רוצה להיראות חלשה. כך שתיהן מקשיחות את עמדותיהן בתקווה שיריבתן תישבר, עד שבסוף עלולה לפרוץ מלחמה שאף צד לא באמת רצה.
המשחק השני, שבו יכולים לשחק מספר גדול יותר של שחקנים, נקרא "ציד איילים", והוא נבדל מדילמת האסיר בכך שיש בו שתי נקודות שיווי משקל: אחת מהן היא כשכולם משתפים פעולה, כמו בדילמת האסיר, והשנייה היא כשכולם בוגדים. השם "ציד איילים" נולד מתרחיש העוסק בציידים במסע ציד. הם יכולים לצוד אייל, שיספק שפע של מזון לכולם, אך לשם כך כולם חייבים לשתף פעולה. בכל רגע נתון יכול כל צייד לבגוד בחבריו ולצוד ארנבת בכוחות עצמו. הוא יקבל פחות בשר ממה שהיה מקבל לו היו צדים אייל, אבל הארנבת היא שלל ודאי, והוא לא תלוי באף אחד כדי לצוד אותה. אך ברגע שאחד הציידים צד ארנבת, האייל נבהל מהירייה ובורח.
כך קורה שלצייד הבודד משתלם לצוד ארנבת, כי הרי מספיק שאחד מחבריו לא ישתף פעולה בציד, והוא יישאר רעב, ואילו שיתוף הפעולה הוא הימור. מצד שני, זה הימור שיכול להשתלם. הבגידה משמעה אומנם להסתפק בפחות, אבל ללכת על בטוח. אם כולם משתפים פעולה, ובוטחים לחלוטין זה בזה, אין לאף אחד סיבה לעשות משהו אחר, והם יצודו אייל. זוהי נקודת שיווי משקל. אך ברגע שאחד הציידים הולך לצוד ארנבת, ההחלטה הסבירה היחידה שנותרה לכל האחרים היא לנהוג באותה צורה וללכת לצוד ארנבת. זוהי נקודת שיווי המשקל השנייה.
דילמת האסיר בעולם החי
לדילמת האסיר ותרחישים קרובים יש לא מעט חשיבות בעולם החי: קיימים מצבים רבים, הנוגעים ליחסי גומלין בין בעלי חיים, שאפשר לדמות לדילמת האסיר. גם למסקנות מהדיון הקודם, על האסטרטגיות הרלוונטיות לדילמת האסיר, יש חשיבות: האבולוציה הובילה בעלי חיים רבים לאמץ אסטרטגיות משחק מתוחכמות בתרחישי "דילמת אסיר" מהחיים. בלא מעט מהמקרים השחקנים משחקים זה עם זה שוב ושוב, ונותנים הזדמנות ליצירת יחסי אמון - כמו שראינו בדילמת האסיר החוזרת.
בהקשרים האלה יש משמעות מיוחדת לקיומה של "אסטרטגיה יציבה אבולוציונית". בתחרות של תוכנות המחשב, בכל תור השחקנים משחקים אלה מול אלה, אך לקראת התור הבא הרכב האוכלוסייה משתנה. שחקנים שקיבלו את הניקוד הנמוך ביותר נכחדים, ובעלי הניקוד הגבוה יותר מתרבים על חשבונם ואיתם מתרבים הגֵנים שלהם, כלומר האסטרטגיה המשחקית שהם נוקטים. זה מדמה כמובן את מערכות היחסים והכוח בעולם החי, שבו אורגניזמים ובעלי חיים "משחקים" אלה מול אלה. המנצחים הם אלה שזוכים להעמיד צאצאים ולהתרבות, ועל ידי כך להוריש לצאצאיהם את הנטיה לנקוט את האסטרטגיה שבה הם בחרו.
בעולם האמיתי הכל כמובן "מלוכלך" יותר: לא כל הפרטים משתתפים תמיד באותו משחק, חוקי המשחק יכולים להשתנות במפתיע, התוצאות נתונות להשפעת גורמים רבים, יש אלמנטים רבים של אקראיות, ועוד. אולם בבסיסו, משחק דילמת האסיר מצליח ללכוד משהו מהגרעין של יחסי שיתוף פעולה בין בעלי חיים. אולי זו הסיבה שאנחנו רואים בהתנהגותם של בעלי חיים רבים אסטרטגיות שמזכירות מאוד את גישת "עין תחת עין": הם יהיו תוקפניים אם יתקפו אותם, אבל ישתפו פעולה עם חברי להקה ידידותיים.
מיכאל גורודין ואורי טייכמן, מכון דוידסון לחינוך מדעי, הזרוע החינוכית של מכון ויצמן למדע