על שודדים ומשחקים (טור 197)

בס”ד

בטור 20 עסקתי קצת בשאלה מהי רציונליות, ומתוך כך נגעתי גם במשמעותה של תורת המשחקים. ראינו שם שאדם בוחר לעצמו פונקציית תועלת, והרציונליות שלו נבחנת לאורה. אמירות על אנשים כאילו הם פועלים בצורה לא רציונלית, בדרך כלל מפספסות את הנקודה הזאת. אדם שפעל בדרך שאינה מובנת לך לא בהכרח עשה טעות. ייתכן שהוא חותר למטרות אחרות מאלו שלך. כך למשל שמעתי לא פעם ביקורת על אדם שקונה כרטיס הגרלה בעשרה ₪ כשיש לו סיכוי של אחד למיליון להרוויח אלף ₪, והטענה הייתה שהוא נוהג בצורה לא רציונלית כי תוחלת הרווח שלו היא שלילית. אבל אין שום הכרח להניח שפונקציית התועלת שלו קשורה לתוחלת הרווח הכספי. ייתכן שהוא מוכן לשלם על התקווה להרוויח, או אפילו על עצם הסיכוי להרוויח (כי אלף ₪ מאד יכולים לעזור לו והוצאה של עשרה ₪ לא משמעותית מבחינתו). יש שיטענו שעצם זה שהוא מוכן לשלם אומרת שזה כנראה שווה לו, ואז בעצם יוצא שאין בכלל אדם לא רציונלי.

מכאן ניתן לגזור את תפקידה ומגבלותיה של תורת המשחקים. תורה זו מניחה שחקנים רציונליים לגמרי שמטרתו של כל אחד מהם היא למקסם את הרווח האישי שלו. ושוב, עולה כאן הביקורת שמקסום הרווח דורש הגדרה מה מבחינת אותו אדם נחשב רווח, ולזה אין תשובה מתמטית. כל אדם בוחר בפונקציית הרווח (או התועלת) לפי הבנתו, נטיותיו וערכיו. רק בהינתן פונקציית תועלת ספציפית יכולה להיות תשובה מתמטית לשאלה כיצד נכון לנהוג (וגם אז לא תמיד).

אדם לא רציונלי הוא אדם שמניח פונקציית תועלת מסוימת, ובכל זאת לא פועל בצורה מיטבית כדי להשיגה. זו ההגדרה המדויקת יותר לאנשים לא רציונליים. תורת המשחקים יכולה לחשוף אדם כזה, ובלבד שהיא יודעת לאשורה את פונקציית התועלת שלו. אם אותו אדם יכול היה לפעול טוב יותר כדי להשיג את התועלת לה הוא מצפה (או להשיג תועלת רבה יותר), אזי הוא פעל בדרך לא רציונלית.

אמנם עדיין יש מקום לפלפול הבא שמערער גם על ההגדרה הזאת: ייתכן שאותו אדם מחליט שלא שווה לו להשקיע זמן במחשבה או לימוד כדי למקסם את הרווח שלו. הוא מעדיף לחסוך את הזמן והמאמץ גם במחיר של סיכוי להרוויח פחות או אפילו להפסיד. פונקציית התועלת שלו כוללת גם את הרצון לחסוך זמן ומאמץ. אם כן, אפילו במצב כזה הוא פועל בדרך רציונלית. כפי שכבר הזכרתי, לפי כיוון המחשבה הזה נראה שכל אדם לעולם נוהג בדרך רציונלית, שהרי אם הוא פעל כפי שפעל כנראה שזה מה שהוא רצה וזה היה שווה לו.

אולי הגדרה מדויקת יותר לאי רציונליות תהיה הבאה: אדם שנוהג בדרך לא רציונלית הוא אדם שכשתציג בפניו את הפתרון ה”נכון” (כלומר פתרון אחר כלשהו) הוא עצמו יחזור בו ויודה שטעה. רק מצב כזה אומר לנו בוודאות שהתנהגותו לא תאמה את פונקציית התועלת שלו עצמו. אבל שימו לב, אם הוא יאמר לנו שהוא אכן טעה מבחינת התוצאה אבל הוא צדק בכך שלא בדק כי הוא העדיף לחסוך זמן ומאמץ, פירוש הדבר שהוא לא באמת חוזר בו מהחלטתו. במצב כזה הוא עדיין יכול להיחשב כמי שנהג בדרך רציונלית.

בסוף השבוע האחרון השתתפתי בכנס כלשהו, ואחד האנשים שם הציג בפניי חידה חביבה. רציתי לעסוק בה כדי להדגים עוד כמה שאלות מהסוג הזה.

ושודד יחלק שלל: החידה

חמישה שודדים רוצים לחלק ביניהם שלל של 100 מטבעות זהב. הם מחליטים על המכניזם הבא: הצעיר ביותר (שודד א) מציע הצעת חלוקה כלשהי. אם יש רוב לטובת הצעתו היא מתבצעת וכל אחד הולך לדרכו. אם ההצעה לא מתקבלת (כלומר שאין רוב לטובתה. תיקו ומטה) אזי הורגים אותו, וחוזרים על התהליך שוב: הצעיר ביותר מבין הנותרים (שודד ב) מציע דרך לחלק את כל המטבעות לארבעה חלקים, וחוזר חלילה. השאלה היא מהי התוצאה שתתקבל? כלומר: מי יחיה ומי ימות (לא בקיצו), וכמה כסף יהיה לכל אחד?

ההנחה היא כמובן שכולם שחקנים רציונליים לגמרי ומטרתו היחידה של כל אחד מהם היא מיקסום הרווחים שלו וכמובן להישאר בחיים. ההישארות בחיים קודמת לרווחים הכספיים (לא בגלל שהחיים חשובים חס ושלום, אלא מפני שאם מישהו מת פירוש הדבר שאין לו כסף. הרווח הכספי שלו הוא מינימלי.[1] אני מזכיר שמדובר כאן בסוכנים רציונליים שרצים אחרי רווח כספי בלבד).

ושודד יחלק שלל: הפתרון האינטואיטיבי

האינטואיציה הראשונית אומרת שהשודד המבוגר ביותר (שודד ה) יזכה במירב הכסף שהרי יש בידו כוח להתנגד עד שיקבל את מבוקשו. הוא גם לעולם לא נמצא באיום מוות מחבריו. אצלו יש רק את שאלת הרווח הכספי ולכן הוא יותר נינוח. לעומת זאת, הצעיר (שודד א) הוא בעל הכוח המועט ביותר, ולכן היינו מצפים שהוא ימות או לכל היותר יישאר בחיים ללא כסף (וכידוע עני חשוב כמת).

ושודד יחלק שלל: בין מתמטיקה לפיזיקה

מתמטיקאי שניגש לבעיה כזאת מחפש פתרון ל-n שודדים, כאשר n (כלשהו, אפילו מספר מרוכב J), ואז פותרים בקלות את הבעיה עבור n=5. קלי קלות. אלא שמוטל עליו קודם כל למצוא פתרון לבעיה הכללית, מה שקצת רחוק מלהיות קלי קלות. כאן מגיע לעזרתו הפיזיקאי. כל פיזיקאי מתחיל יודע שכדי לפתור בעיה מסובכת יש להתחיל מהבעיה הפשוטה ביותר מאותו טיפוס (כך למשל כשפיזיקאים רוצים להבין התנהלות של חמור, הם מתחילים בחמור נקודתי), ואז להכליל.

מהי הבעיה הפשוטה ביותר מהטיפוס שלנו? בעיה של שני שודדים. את הבעיה הזאת קל מאד לפתור: כל סכום פחות ממאה מטבעות שיציע הצעיר לקשיש יביא למותו (כי כך הקשיש ייקח את כל המטבעות אליו). לבחורון שלנו אין ברירה אלא להציע לקשיש מראש את כל המטבעות וכך לפחות להישאר בחיים. ההנחה היא שלא רוצחים סתם כך, אלא רק למען המטרה הנעלה של בצע כסף.[2]

ושודד יחלק שלל: בין הכללה לרקורסיה

טוב, אז שני שודדים מתחלקים בצורה של (0,100). מה הפתרון לבעיה של חמישה שודדים? ההכללה לא מיידית ולכן המתודולוגיה של הפיזיקאי לא ממש עובדת. אבל למרבה השמחה, כאן המתמטיקאי חוזר לתמונה. הוא מבין שאין צורך לעשות הכללה ממקרה פשוט למורכב, אלא פשוט להמשיך את תהליך הרקורסיה כלומר להתקדם ולבנות את המבנה המורכב מתוך המקרה הפשוט (שזה תהליך מתמטי מדויק ולא הכללה מדעית ספקולטיבית).

נחליט כעת ששני השודדים שמצאנו את הפתרון עבורם הם בעצם שודד ד ושודד ה. אם כן, תיארנו כאן את סוף התהליך, כלומר הבנו מה קורה אם שלושת הראשונים קיפחו את חייהם ונותרו רק שני האחרונים. כעת המצב נראה אופטימי יותר, שכן ניתן להתחיל לבנות תהליך של רקורסיה שמניח את הפתרון הזה ושואל מה יקרה כשיצטרף עוד שודד צעיר למשחק.

ושודד יחלק שלל: הפתרון המלא

בהנחה שנהרגו שלושת הצעירים ונותרו שני המבוגרים, אנחנו כבר יודעים שהפתרון הוא שהזקן (שודד ה) לוקח 100 והצעיר (שודד ד) 0. עכשיו מצטרף למשחק שודד ג. כאמור, כולם כבר יודעים מה יקרה אם שודד ג ימות (במינוח של תורת המשחקים זהו “משחק עם מידע מלא”). כפי שראינו, במקרה כזה החלוקה תהיה (0,100). לכן שודד ג חייב לפתות אחד מהם בהצעה טובה יותר כדי שיצטרף אליו וביחד תתקבל הצעתו ברוב. רק במקרה כזה לא יהרגו אותו. הוא מחפש כמובן את ההצעה שתשאיר אותו בחיים ועם רווח מקסימלי. את שודד ה אין לו סיכוי לשכנע, אלא אם ייתן לו את כל 100 המטבעות (שכן זה אמור להיות רווח גבוה יותר מזה שיקבל אם יהרוג אותו ויישארו רק שניים). אבל אז שודד ד יכול להתנגד כי הוא יודע שבצעד הבא הוא גם מקבל 0. מעבר לזה, הרי שודד ג יכול לשחד דווקא את שודד ד בזול ולוותר על שודד ה היקר יותר. לכן ברור שיותר אופטימלי מבחינתו להציע לשודד ד מטבע אחת וכך לגייס אותו לצדו, ולשודד ה להציע אפס. שודד ה כמובן יתנגד להצעה, אבל הוא יימצא במיעוט נגד שני הצעירים ממנו. כך הצעתו של שודד ג זוכה ברוב, והתוצאה כעת היא: (99,1,0). זהו הפתרון לשלושה שחקנים רציונליים עם מידע מלא.

נמשיך את הרקורסיה. כעת שודד ב מגיע, והוא צריך להציע הצעה שתפתה עוד שניים להצטרף אליו. כעת כבר ברור לכולנו שעליו לוותר על שודד ג היקר ולהציע לו 0. שודד ג כמובן יתנגד להצעה, אבל את שני האחרים שודד ב עומד לגייס לטובתו. איך הוא עושה זאת? הוא מציע לכל אחד מהם מטבע אחד יותר מהפתרון הקודם כדי שיהיה כדאי להם לקבל את הצעתו ולעצור כאן.[3] לכן הפתרון בשלב זה הוא: (97,0,2,1).

כעת הגענו לבעיה האמתית שלנו, כששודד א, זעירא דמן חבריא (הצעיר שבחבורה), מצטרף למשחק. מה עליו להציע לחבריו כדי לפתות שניים מהם להצטרף אליו? שוב, הוא כמובן יוותר על שודד ב היקר, ויציע לו אפס. הוא צריך שניים נוספים לצדו, ושני הכי זולים הם שודד ג שמתפתה להצעה של מטבע אחת ושודד ה שמתפתה להצעה של שניים. על שודד ד הוא יכול לוותר כמובן (גם הוא יקר יחסית). אם כן, הפתרון לבעייתנו הוא: (97,0,1,0,2). יש להצעתו רוב, שכן שודדים ג וה’ יצביעו איתו.

חידה לקורא

הלכנו מהסוף להתחלה, אבל זו הדרך לפתור חידה כזאת. הקורא היקר יכול כעת לנסות ולנסח בדרך זו פתרון כללי עבור n שודדים. אני מנחש שזה לא טריוויאלי אבל לא מסובך מאד. אני גם חושב שכאן יועיל המבט של הפיזיקאי כדי להבין מראש מה יקרה אם נמשיך את הרקורסיה עוד ועוד ולהציע ישר את ההכללה לפתרון הכללי.

משמעותם של פתרונות נוגדי אינטואיציה

שימו לב שקיבלנו פתרון שבו דווקא המציע הראשון, שהוא לכאורה בעל הכוח הפחות ביותר, מקבל את מירב המטבעות. כל האחרים מקבלים סכומים קטנים ודומים. זה מנוגד לאינטואיציה הראשונית שתיארתי למעלה. משמעות הדבר היא שאם תנסו לעשות מהלך כזה בפועל, אם תהיו שודד ה ותציעו הצעה כזאת לחבריכם המבוגרים יותר, סיכוי סביר שהם ייעלבו ויערפו את ראשכם מיד. לא תהיה לכם אפילו הזדמנות להסביר להם את האטרקטיביות הרבה של ההצעה הזאת עבורם. אגב, הם ייווכחו בזה בעצמם, כשיגיעו למצב שבו גם בלי להיות איש תורת המשחקים אתה מבין את האילוצים ואת משמעותם. זה בוודאי קורה כשיש שני שודדים, אבל אולי כבר כשיש שלושה כולם יכולים להבין לאן הדברים הולכים. חלקם יפסידו את מה שיכלו להרוויח מההצעה הראשונה, אבל זה יהיה כבר מאוחר מדיי.

כעת יבוא איש תורת המשחקים, יסביר להם (בעולם הבא כמובן) את המהלך שתואר כאן, וישאל אותם מדוע לא נקטו בדרך האופטימלית. סביר להניח שהם יתחרטו על מה שעשו ויבינו שהיה עליהם ללמוד ולחשב ולא להרוג ישר את המציע. בסופו של דבר כולם הפסידו (ראו בהמשך דיון על קואליציות). אם כן, לפי הצעתי למעלה זהו מקרה שבו אכן הם נהגו בדרך לא רציונלית מובהקת. האם ניתן להצדיק את התנהגותם באמצעות פונקציית תועלת אחרת? רק בדוחק. למשל, הם העריכו שלא הרבה תלוי בהכרעה הנכונה (לכל היותר יפסידו כמה מטבעות) ולכן לא היה שווה להם להשקיע זמן ללמוד תורת המשחקים ולהגיע לפתרון האופטימלי. ההערכה הייתה כמובן שגויה, אבל זו הייתה ההערכה שלהם ולכן זה מה שקובע לעניין השיפוט של התנהגותם כרציונלית. אבל זה דחוק, כאמור, כי כעת הם ודאי יודו שהיה שווה להם ללמוד, שכן מדובר בחיים של חלקם ולא רק בכמה מטבעות זהב. סביר יותר שזו הייתה טיפשות/עצלות ולא סתם פונקציית תועלת שונה.

האם תורת המשחקים מועילה?

כאן הגענו לביקורת נפוצה על תורת המשחקים. הטענה היא שהתורה מניחה שחקנים רציונליים לגמרי שפועלים על מנת למקסם את הרווח. אבל בחיים האמתיים זה לא המצב. בני אדם אינם שחקנים רציונליים, ולכן תורת המשחקים אינה כלי טוב כדי לנבא את התנהגותם ולהחליט כיצד עליי לנהוג במשחק שנערך מול בני אדם אחרים. אם אניח שהם רציונליים לגמרי כנראה אטעה, ואז אפעל לא נכון.

זו ביקורת מאד נפוצה בתחומים מעשיים. לדוגמה, הבורסה לא תמיד מגיבה לפי שיקולים כלכליים טהורים. יש שם הרבה פסיכולוגיה. מי שיקבל החלטות לגבי השקעות משיקולים כלכליים בלבד לא בהכרח ירוויח, ובכל אופן ירוויח פחות ממי שמתחשב גם בפסיכולוגיה. גם בעימותים בין מדינות (צפון קוריאה, סוריה, איראן), אנחנו מנסים לחזות את התנהגותן לפי שיקולים רציונליים  של אינטרסים, אבל פעמים רבות מתבדים. לפעמים זה מפני שלא הבנו את פונקציית התועלת שלהם (ואז הם דווקא רציונליים ואנחנו לא)[4], אבל לעתים זה בגלל שהם (כמונו) באמת לא פועלים בדרך רציונלית. מקרים אלו מעלים את התהייה האם לתורת המשחקים יש ערך מדעי, כלומר האם היא  מועילה לנבא פעולות של אנשים או גורמים שונים במגרש המשחקים ומתוך כך לקבל נכון את החלטותינו שלנו?

על שיקולי קואליציה, הסכמים והאמנה החברתית

כשעוסקים במגרשים מורכבים (מדינות, חברות גדולות) תורת משחקים יותר ישימה כי הגופים נוטים להתייעץ ולפעול רציונלית. אבל במקרים אלו יש להתחשב גם בקואליציות אפשריות שיכולות לשנות את הפתרונות באופן משמעותי. חשבו למשל על המצב של חמשת השודדים שלנו, אם מותר היה לעשות קואליציות. שחקן ה יודע שבסופו של דבר בפתרון הרגיל הוא ירוויח רק 2. אז הוא מציע לשחקן ב וד’ שירוויחו 0 לעשות קואליציה, לאיים על שאר המציעים במוות ולדרוש את מלוא הכסף, ואז להתחלק ביניהם בשווה ברווח. לחלופין, ואפילו יותר פשוט, ארבעת האחרונים מתאגדים להתנגד להצעה של הראשון ולהרוג אותו ואז להתחלק בשווה. כולם מרוויחים משמעותית לעומת הפתרון ה”אופטימלי” (שבמסגרתו הם מקבלים 0, 1, או 2). זה כמובן משנה לגמרי את התמונה, ובחיים תמיד יכולה להיות אפשרות של קואליציות, וכל שחקן צריך להתחשב גם באפשרויות הללו (בתורת המשחקים, חיפוש פתרונות בהתחשב באפשרות של קואליציות זהו ענף בפני עצמו).

הבעיה היא כמובן מי לידינו יתקע שהשותפים להסכם אכן יעמדו בו? הרי כללי המשחק נותרים בעינם. יכולים שלושת או ארבעת חברי הקואליציה להסכים למדיניות שתיארתי בתקיעת כף, ואחרי שהם הורגים את הראשון לבגוד בשותפיהם ולעשות קואליציה אחרת (למשל שלושת האחרונים נגד שודד ב) או להצביע לפי אינטרס וללא שיקולי קואליציה (כל אחד לפי חישובי הכדאיות שלו). לאף אחד מהם אין ערובה שהאחרים יעמדו בהסכם, כל עוד יש אפשרות לעשות משהו כדאי יותר. חשבו: אם הם מוכנים לרצוח כדי להרוויח עוד מטבע, אין סיבה שלא יפרו הסכם בשביל אותו דבר עצמו. אז אי אפשר באמת לבנות על קואליציות שלא בנויות על כדאיות. לך תבנה על שודדים…

זה מזכיר לי את ההסברים שמחייבים התנהגות מוסרית מכוח הסכם (פיקטיבי), מה שמכונה “האמנה החברתית”. השאלה מי מחייב אותי לעמוד באמנה הזאת? ההסכם הזה עצמו? אם ההנחה היא שבלי ההסכם הייתי רוצח, אז כיצד אפשר לסמוך עליי שכשחתמתי הסכם אשמור עליו?! הפרת הסכם היא  פחות חמורה מרצח, לא? לכאורה, כל עוד אין לי אינטרס ברור לשמירת ההסכם יש חשש שלא אשמור עליו. אבל אם יש לי אינטרס כזה – מה צורך בהסכם? אני אתנהג כך גם בלי הסכם בגלל שיקולי תועלת. נראה לכאורה שלהסכמים יש ערך רק בכך שהם מביאים את המדיניות הכדאית לידיעת הצדדים ומוודאים שכולם מבינים שכדאי להם. אין להסכם ערך מוסף מוסרי. בהסתכלות הזאת, ההסכם רק מעביר מידע לצדדים ולא באמת מחייב אותם.

על החוק הבינלאומי

אם ההסכם נעשה תחת מטריה של מערכת נורמטיבית משותפת (כמו חוק מדינה או החוק הבינלאומי), זה משהו אחר. שם יש  מי שיאכוף את קיום ההסכמים ולכן יש ערך מוסף להסכם מעבר לערכים שהוסכמו. אגב, זה עצמו במקרים רבים יהיה טוב לכל הצדדים, שכן לולא החשש שהשני יפר הסכם כדאי לכולנו לשמור את ההסכם. כולנו נרוויח יותר. ראו על כך בטור 122 בדיון על דילמת האסיר והצו הקטגורי.[5] אבל התיאוריה בדבר האמנה החברתית, שבמסגרתה היא מוצגת כבסיס הכי יסודי למוסר ואין ביסודה מערכת נורמטיבית אפקטיבית כללית יותר שתאכוף אותה, נראית כמו איוולת אתית-לוגית.

לכן הסכמים בינלאומיים, כמו הסכם שלום בין מדינות, או הסכם בינינו לבין הפלסטינאים, צריכים להתבסס גם על אינטרסים וכדאיות ולא רק על הגינות. מי שמוכן לרצוח אותי בשביל רווח כזה או אחר יהיה מוכן גם להפר הסכם בשביל אותו דבר.

כפי שכבר הזכרתי, אנשים ומדינות אינם בהכרח סוכנים רציונליים לגמרי, ומתברר שבפועל להסכמים דווקא יש כוח. גם בלי אינטרס יש משקל כלשהו לכך שיש בינינו הסכם. רק חשבו על מצב שבו אנחנו או הפלסטינאים מפרים הסכם שחתמנו עליו. מיד עולות טענות שונות על חוסר ההגינות שבזה. אבל לפני ההסכם ממש הרגנו אחד את השני, וזה היה בסדר. מה שאנחנו עושים כעת הוא רק הפרת הסכם ולא רצח, זה לכל הדעות מעשה הרבה פחות חמור מרצח, ובכל זאת עולות טענות על חוסר מוסר וחוסר הגינות (אי אפשר להאמין להם).

המעמד של הסכמים נובע כנראה מהמעטפת הבינלאומית שמוודאת שמי שמפר הסכמים ישלם על כך מחיר. יש כאן מערכת נורמטיבית בבסיס ההסכם ורק בגללה יש לו משמעות. הרי לכם שיקול לטובת קיומו של משפט בינלאומי. הוא נותן ערך מוסף מעבר לשיווי המשקל שיתקבל רק ממארג האינטרסים ההדדיים.[6]

האם תורת המשחקים היא ענף של הפסיכולוגיה או של המתמטיקה?

מומחים בתחומים שונים נוטים להציג את התחום שלהם כיישומי מאד. כך שומעים מתמטיקאים שמסבירים כיצד התחום שלהם מועיל מאד במחקר בפיזיקה, מה שמניסיוני במקרים רבים אינו נכון (הפיזיקה משתמשת בענפים של המתמטיקה, אבל בדרך כלל מה שעושים מתמטיקאים הוא אזוטרי ולא מועיל מבחינת הפיזיקאים). גם מומחים לתורת המשחקים נוהגים להסביר שהתחום שלהם מועיל ויישומי בהקשרים מציאותיים רבים. אבל מניסיוני, התועלת המעשית מתורת המשחקים היא ממש בשוליים.

ברוב המקרים תורת המשחקים מגיעה לפתרון הנכון (במובן התיאורי: כלומר מנבאת נכון את מה שיקרה) רק במקום שבו הבעיה פשוטה דיה (כי אז אנשים רגילים מבינים גם הם את הפתרון ונוהגים כך בפועל), ואז כמובן לא צריך אותה. יתר על כן, גם במקרים הפשוטים לא תמיד אנשים ינהגו על פיה (כי יש להם הטיות ומניעים פסיכולוגיים נוספים). במקרים המסובכים תורת המשחקים כמעט לא מועילה בכלל, או מפני שהבעיה לא פתירה מתמטית, ועוד יותר מפני שבמציאות אנשים לא יפעלו על פי הוראותיה. יוצאים מן הכלל הזה גופים גדולים, כמו ממשלות או חברות מסחריות. גופים כאלה יכולים יותר להרשות לעצמם היוועצות במומחה כי יש להם די משאבים ונגישות למומחים, ומעבר לזה במקרה שלהם הרבה מאד מוטל על הכף (ולכן כדאי להם להתייעץ).

התמונה שהצגתי עד כאן מניחה שתורת המשחקים היא ענף של הפסיכולוגיה, שכן היא מצפה ממנה לתאר נכון ולנבא את מה שאנשים עושים. כאמור, בעניין זה היא די נכשלת. אבל אפשר לראות אותה כענף של המתמטיקה שעניינו לפתור בעיות מתמטיות טהורות, בלי קשר לשאלה מה בפועל יעשו אנשים במצבים כאלה. אם לתורת המשחקים אין יומרה מדעית-תיאורית, כלומר לתאר את מה שקורה בעולם בפועל, אז אין בעיה בזה שהיא לא מצליחה לעשות זאת. במובן הזה היא לא שייכת לפסיכולוגיה אלא למתמטיקה.

תפקידי ייעוץ

אמנם גם אם מדובר במתמטיקה, יכול להיות תפקיד מעשי לתורת המשחקים. מי שבא להתייעץ לגבי צעד כלשהו שעליו לעשות, תורת המשחקים יכולה לומר לו מה יכול לקרות, או מה הצעד האופטימלי שהוא יכול לנקוט בו כדי למזער נזק או למקסם רווח. ושוב, גם זה בערבון מוגבל, שכן בדרך כלל התוצאה המעשית תהיה תלויה גם בשחקנים האחרים, והשאלה האם הם יפעלו כפי שמצופה מהם (באופן רציונלי). כך למשל אנשי תורת המשחקים יצרו אלגוריתם בשם “הקבלה הנדחית” (deferred acceptance) שבמקור מטרתו הייתה ליצור שידוכים יציבים, ויישמו אותו על שידוכים אופטימליים בין רופאים או עורכי דין מתמחים למקומות התמחות, או מועמדים לתואר שני בפסיכולוגיה ומחלקות אקדמיות.[7] מצב כזה הוא מצב שבו ההחלטה של כל הצדדים מתקבלת על ידי האלגוריתם המתמטי (כשהוא מקבל כקלט את הרצונות והכישורים), ואז כמובן לא מתעוררות הבעיות שתיארתי. זהו תפקיד מתבקש ומועיל של תורת המשחקים. זה הופך משחק שכולל עימות למשחק קואליציה שבו כולם יחד מנסים להגיע למטרה משותפת (שכמובן דרוש להגדיר אותה). צריך להבין שלא כל מתמחה יגיע למקום שבו הוא חפץ, ולכן השחקן היחיד משלם מחיר על קבלת הדין של חישובי הקואליציה כולה. זה נותן פתרון כללי לכולם באופן שיהיה בו יתרון מסוים (הוא לא יהיה גרוע), כמו יציבות (יתרון לוקלי, שבו לכל שחקן לא כדאי לזוז ממצבו) בדוגמה של השידוכים, אבל הוא בהחלט לא הפתרון האופטימלי לכל שחקן לחוד.

דוגמה: משמעותו של האלגוריתם עבור מידות הדרש ההגיוניות

כאשר פיתחנו את האלגוריתם של מידות הדרש ההגיוניות (ראו בספר הראשון בסדרת לוגיקה תלמודית), עלתה שאלה מאד מבלבלת.[8] האלגוריתם שלנו יוצא מטבלת נתונים ומסיק ממנה את הדין במשבצת החסרה. לדוגמה, טבלה של קל וחומר נראית כך:

מכניזם/דין נישואין קידושין
כסף 0 1
חופה 1 ?

יש לנו אוסף של דינים ידועים (במקרה זה שלושה), ואנחנו רוצים לגזור מהם דין נעלם (האם חופה מחילה קידושין). הקל וחומר מורה לנו למלא במשבצת הנעלמת 1. הראינו שם שיש אלגוריתם חד ערכי שיכול למלא כל משבצת כזאת בכל טבלה מכל גודל. הראינו שהאלגוריתם הזה מתאים לחשיבה שלנו ושל חז”ל בכל המקרים שנבדקו (עד טבלאות של 8 על 5 כמדומני, בכל צורות המילוי).

ואז עלתה שאלה מה בין זה לבין היסק דדוקטיבי? האם אנלוגיות (כמו בניין אב) או היסקים כמו קל וחומר והצד השווה, שכולם אינם היסקים לוגיים הכרחיים, הם בעצם כן הכרחיים? הרי יש לנו אלגוריתם סגור שנותן לנו תשובה שנכונה בהכרח לכל חידה כזאת. לכאורה יש כאן דדוקציה גמורה, כלומר המסקנה נובעת בהכרח ובאופן חד ערכי מההנחות.

האסימון נפל לנו בהרצאה שנתנו באוניברסיטת תל אביב. בדיון שהתקיים אחריה, הזכיר מישהו את השאלה שהצגתי כאן: האם תורת המשחקים מטרתה לתאר את התנהגות של בני אדם או להגיע לתוצאה הנכונה (האופטימלית)? זה בעצם שיקוף של הדילמה שתיארתי כאן, האם תורת המשחקים היא ענף של המתמטיקה או של הפסיכולוגיה. מכאן הייתה קצרה הדרך להבין שגם אם האלגוריתם שלנו הוא דדוקטיבי, כלומר יש לו תוצאה מוכרחת עבור כל סט נתונים וכל שאלה, התוצאה הזאת אינה בהכרח התוצאה הנכונה אלא התוצאה שאליה יגיע אדם שחושב כמונו. האלגוריתם הזה אינו דרך להגיע לתוצאה הנכונה אלא לתוצאה שאליה יגיע יצור שחושב כמו בני אדם אבל בלי כשלים והטיות מקומיים שיכולים להטעות אדם בשר ודם.

המסקנה הייתה שהתוצאה של האלגוריתם שלנו יכולה להיות שגויה, ובמובן הזה אין כאן דדוקציה. מה שהאלגוריתם מוודא הוא שהתוצאה היא התוצאה שאליה אמור להגיע אדם שחושב בצורה שאנחנו חושבים בלי שגיאות יישום. הוא מכליל ועושה אנלוגיות כמונו. כמובן שהכללות ואנלוגיות אינן כלים הכרחיים, ואנחנו טועים לא מעט, אבל זה הכי טוב שיש לנו. האלגוריתם מוודא שלתוצאה הכי טובה הזאת אכן נגיע. אם התוצאה הזאת נכונה או לא, זו כבר שאלה עד כמה אמינים כלי החשיבה שלנו (שהרי ההתאמה בינם לבין העולם אינה וודאית ולא גורפת).

חידה לסיום

לסיום, חשבתי על חידה שאשאיר אותה לקוראים. חמשת השודדים שלנו עומדים סביב מאה המטבעות. הם צריכים להחליט על סדר ההצעות. בחידה הקודמת זה היה מהצעיר למבוגר, אבל כעת זה נפתח מחדש. כל אחד אמור להציע הצעה לגבי סדר ההצעות, וההצעה שזוכה לרוב מתקבלת. הוא יכול להציע הצעה שבמסגרתה הוא נבחר להיות המציע הראשון (כמובן כולם רוצים להיות הראשון כי כפי שראינו הוא מרוויח 97 מטבעות), ותמורת זה הוא מוכן לחלק  סכום כלשהו לעמיתיו כדי שיצביעו בעדו. אם שום הצעה לא מתקבלת חוזרים למכניזם שתיארתי למעלה (מהצעיר למבוגר). בהנחה שכולם שחקנים רציונליים שמטרתם למקסם רווחים, מה יהיה סדר המציעים ומה תהיה תוצאת המשחק?

שימו לב שבאופן עקרוני כולם באותו מעמד, ולכן היינו מצפים לפתרון סימטרי (לא יהיה אחד מועדף). אבל הכלל שאם לא מתקבלת הצעה אחרת חוזרים להצעה המקורית (הצעות לפי סדר הגיל) שוברת את הסימטריה הזאת. לראשון אין עניין לקבל הצעת חלוקה שונה אפילו אם הוא מוצב בה ראשון, כי גם אם לא מתקבלת שום הצעה הוא חוזר להצעה המקורית שגם בה הוא מרוויח 97 מטבעות.

לא חשבתי על הבעיה הזאת, אבל על פניה היא נראית לי מעניינת ולא פשוטה. בהצלחה.

[1] ודמות ראיה לדבר בסוגיית הגמרא ביומא שמסבירה מדוע פיקוח נפש דוחה שבת על פי הסברא של ר”ש בן מנסיא: “חלל עליו שבת אחת כדי שישמור שבתות הרבה”. פירוש הדברים הוא שערך החיים באמת לא דוחה את השבת, אלא שאם הוא ניצל הוא יכול לשמור הרבה שבתות, וזה מה שדוחה את השבת הזאת. חידה לקורא: מדוע זה לא הסבר הכרחי לסברת ר”ש בן מנסיא?

[2] וגם לזה דמות ראיה מהסיפור הידוע על ר”ח מבריסק שהזמין אליו פעם את ראש כנופיית השודדים היהודיים בבריסק. כשהגיע שאל אותו ר”ח האם הם שוברים דלת כשיש להם צורך בכך? הלה ענה: “בוודאי, אחרת איך ניכנס?!” ר”ח המשיך ושאל מה הם עושים אם בעל הבית מתנגד? והלה ענה: “מרוצצים את גולגלתו כמובן”. והאם אין מגבלה על מה שהם לוקחים בשללם? השודד עונה: “כמובן שלא. באנו בשביל להרוויח ולא לעשות צדקה וחסד”. ואז שואל אותו ר”ח ואם אתם רעבים, האם אתם פותחים את המקרר ולוקחים אוכל? השודד מזועזע כולו, ועונה: “חס ושלום רבי, הרי ייתכן שהאוכל שם לא כשר”. לתמיהתו של ר”ח כיצד הם מרשים לעצמם לשבור, לגנוב, לרושש את האדם ואף להרוג אותו בעת הצורך, אבל לא אוכלים אוכל שאינו כשר, נענה הלה ואמר: “כל אלו זה פרנסה, אבל איזה היתר יש לנו לאכול לא כשר?! מה נענה ביום הדין?!”

[3] אפשר היה להגדיר גם אפשרות להימנע בהצבעה במצב ששתי התוצאות שקולות עבור מישהו. במצב כזה די היה לשודד ב להציע סכום שווה לאחד מהם כדי שיימנע.

[4] הנה עוד דוגמה להתנהגות לא רציונלית שקשה להסבירה באמצעות פונקציית תועלת שונה.

[5] ראו שם את ההפנייה לתכנית הטלוויזיה golden ball והדיון על שיקולי קואליציה.

[6] לגבי האיוולת בטענה המוסרית על אי כיבוד הסכמים, ההסבר הזה לא יועיל. המעטפת הבינלאומית היא סיבה אינטרסנטית לשמור על הסכם, אבל לא טענה מוסרית. אמנם בטור 122 קשרתי את המוסר (של קאנט) לשיקולי אינטרס תוצאתיים (דילמת האסיר), ראו שם.

[7] תודה לבני שלמה על הדוגמה הזאת.

[8] ראה דיון על כך בסוף הספר הנ”ל.

17 מחשבות על “על שודדים ומשחקים (טור 197)”

  1. לגבי החידה בהערה אחת, נראה לי שלא מדובר בהשוואת השבתות בהן החולה יהיה בחיים לבין השבת הזו, אלא שזו פשוט דרך פיוטית לומר שהחיים שלו יותר חשובים. היה אפשר לומר: “חלל עליו שבת אחת כדי שיאכל הרבה גלידות”.
    הנפקא מינה בין ההסברים היא לגבי אדם שב”סכנה” לצאת בשאלה, האם צריך לחלל עליו שבת: לפי הפירוש הראשון – כך יקיים שבתות הרבה, אך לפי הפירוש השני, לא מדובר בחייו ולכן זה לא רלוונטי

    1. אני ממש לא מסכים. לשיטתך זה כמו הנימוק של שמואל “וחי בהם”. יתר על כן, למה הנימוק הזה נדחה? הרי זה שאין ספק מוצי אמידי ואי הוא בשבתות מול שבתות.
      אני כן מסכים שלא כתוב כאן שהחיים הם רק אמצעי לשמירות שבת, ודומני שהסברתי זאת כאן פעם. אפשר לחפש. הבאתי את זה כאן רק כדוגמה ציורית לבדיחה שכתבתי.

    2. ר’ שמעון בן מנסיא הוא תנא, כך שיכול להיות שההסבר שלי נכון וששמואל אכן פירש כמותו. הגמרא ( ופוסקים – חלקם פסקו את העקרון שלו) אכן הבינו אחרת.

    3. כפי שכתבתי, ההסבר שלך לא נכון. הגמרא עצמה דוחה את הצעתו של ר”ש בן מנסיא ומשאירה את של שמואל. מכאן מוכח שזה לא אותו הסבר. שמואל עצמו אומר ששלו עדיף מכולם, ושוב רואים שזה לא אותו הסבר.
      ומה שחלק מהפוסקים הביאו להלכה גם את דעת רשב”מ (בעצם זו גמרא מפורשת בשבת) זה מפני שבוודאי פיקו”נ דעתו תקפה. היא נדחתה רק בגלל שהיא לא מסבירה מדוע ספק פיקו”נ דוחה שבת.

  2. לגבי הטיעון של האמנה החברתית אולי המהות מאחוריו היא כמו ההיגיון בהסכמה מכללא (implicit condition). כלומר, יש למדינה לגיטימציה לדרוש מאזרחיה תשלום מיסים ושירות בצבא ולספק תמורת זאת שירותי מדינה תקינים (משטרה, צבא, בתי משפט, בתי סוהר, כבישים וכו). לכאורה קשה איך המדינה יכולה לכפות על האזרחים הסכם שכזה, הרי הם לא הסכימו לקחת בו חלק. התשובה היא שהואיל והמצב החלופי הוא אנרכיה, ברור שכל אדם סביר יסכים להסכם הזה, ולכן גם מבלי שיש נתינת הסכמה בפועל, ניתן להתייחס לאזרחים כאילו הם כן הסכימו בפועל – זוהי הסכמה מכללא.

    לגבי הערך המוסף שבחתימת הסכם בין שני ציבורים, מכיוון שציבור לא מת (אלא רק פרטיו מתחלפים), אז גם ציבור לא יכול בדר”כ לרצוח ציבור אחר או להירצח (חוץ ממקרה של רצח עם כמו בשואה), אבל ציבור כן יכול לשקר או לא לעמוד בהתחייבות שלו, וזו עבירה של הציבור עצמו, והיא יותר חמורה כנראה מזה שהציבור רוצח כמה פרטים של הציבור השני. מעבר לזה, יש בהסכם ערך מוסף שדומה לנדרי זרוזין (כמו קבלת הציבור בהר סיני – נעשה ונשמע, והרי ממילא הם מחויבים מצד ציווי הקב”ה). בנוסף, ההסכם נועד לכבול את הפרטים של כל צד לעמוד בהסכם מעצם קבלת הציבור שאליו הוא משתייך. מבלי שנחתם הסכם, כל פרט יכול לעשות ככל העולה על רוחו, אבל מרגע שנחתם הסכם, גם המיעוט שמתנגד להסכם בתוך כל ציבור נעשה מחויב לו.

    1. ברור שזוהי הסברא שביסוד האמנה, אני רק שואל למה שאזרח שבלי זה היה רוצח יימנע מלרצוח רק בגלל שהוא חתום על אמנה. וכי הפרת הסכם חמורה מרצח?
      ושוב אחזור לקושי דלעיל: גם אם ההסכם מחייב את הפרט, אם אותו פרט היה רוצח בלי זה, מדוע שהפרת הסכם תהיה חמורה בעיניו יותר מרצח. לגבי נדרי זירוזין על רצח הייתי שואל את אותה שאלה.

    2. אני חושב שהאמנה לא באה להצדיק את איסור רצח, אלא את גביית המיסים.

      לגבי הפרט, עכשיו שהציבור שאליו הוא משתייך קיבל על עצמו להימנע מלרצוח פרטים בציבור השכן, ברגע שהוא רוצח פרטים בציבור השכן הוא מסתבך עם הציבור שלו, ולכן הציבור שלו יפעיל עליו סנקציה, מה שלא היה לפני חתימת ההסכם. כלומר, לאחר חתימת ההסכם, המיעוט שמתנגד להסכם ופועל שלא בהתאם אליו מסתבך לא רק עם הציבור השני, אלא עם הציבור שלו, וזה כבר יותר מרתיע.

  3. רוב האניטרקציות האנושיות כוללות משחקים חוזרים אין סופיים. במצב הזה נקודת שווי המשקל מאפשרות אסטרטגיות אחרות כגון מידה כנגד מידה וכדומה.

    בכל אופן תלמידי כלכלה ובוגרים של ישיבות ליטאיות ידועים לשמצה בעודף הרציונאליות שלהם. אפשר לשמוע סיפורים על בניינים שבהם שכנים דורשים תשלום על הסכמה לסגירת מרפסת וכדומה.

    אני לא מסכים שתורת המשחקים חסרת שימוש לחלוטין. ענפים מדעיים כגון ביולוגיה אבלוציונית, כלכלה ומדעי המדינה הם במידה רבה משחקיים. למעשה היחס ביניהם די דומה ליחס בין פיזיקה לאינפי. כמובן שמרגע שתורת המשחקים קבלה ניסוח פורמאלי היא פרסה כנפיים.

    דרך אגב מבחינה היסטורית התנהגות רציונאלית מבטאת התנהגות המונחת על ידי התבונה ולא על ידי הדימיון, תאוות גופניות או הפחד מהמוות. במילים אחרות רציונאליות קובעת את פונקציית התועלת ולא רק פועלת באופן מיטבי על בסיס פונקציית תועלת נתונה. הרב כאן מקבל את ההגדרה המודרנית של יום (ופרטגורס והסופיסטים לפניו) למרות שהפילוסופיה של הרב דווקא מניחה את ההגדרה ההיסטורית.

    1. כוונתי לשימוש בחיים. לא במדע. אבל גם במסגרת מדעית אני מעריך שהשימושים (הלא טריוויאליים) לא רבים.
      איני יודע למה התכוונת באמירה שהפילוסופיה שלי מניחה את ההגדרה ההיסטורית. בכל אופן מדובר בהגדרות גרידא.

    2. למעשה השימושים המדעיים הם לא מעטים. ניתוחים של מונופולים ומחקר מיקרו כלכלי הם משחקיים (המונופול מכליל את פונקציית הביקוש של הצרכנים בתוך ההתנהלות שלו). כל תיאוריית האיתות ואפקט ההכבדה היא משחקית (מדוע לטווס יש זנב ארוך או מדוע נוער חילוני צורך אלכהול). ניתוח של התנהלות מפלגות פוליטיות ובוחרים היא משחקית (מדוע מפלגות מעדיפות להתמקם במרכז). ניתוח מאזן כוחות במרחב הבין לאומי שביבי משתמש בו כל הזמן בין הסונים לשיעיםהוא משחקי (ניתוח קדום כבר מהמאה השבע עשרה במקביל למאזן כוחות הפיזיקאלי של גלילאו וניוטון). תורת המשחקים הכלילה את כל הניתוחים הללו על בסיס מתמטי איתן אבל ניתוחים כאלו רוחשים במרחב כבר כמה מאות שנים (לפני שווי משקל נאש דיברו בכלכלה על שווי משקל של השווקים). אפשר לחלק את המדע בין מדעים לא משחקיים המניחים את עיקרון ההתמד ( פיזיקה, כימיה גיאולוגיה ומיקרו ביולוגיה) למדעים משחקיים (מקרו ביולוגיה, כלכלה ומדעי המדינה) למדעים העוסקים בפונקציית התועלת עצמה (סוציולוגיה, מדעי הרוח).

      זה נכון שמדובר בהגדרות אבל ההגדרות מסגירות עמדה פילוסופית: האם התבונה היא מכשירית בלבד או גם קובעת מטרות המתורגמות לפונקציית תועלת. העמדה השניה יכולה להכיל את העמדה הראשונה (התבונה גם קובעת מטרות וגם מראה כיצד להשיג אותם) אבל העמדה הראשונה לא מכילה את השניה. באופן מסורתי וגם בשפת היום יום גישה רציונאלית מניחה את העמדה השניה. אדם רציונאלי פועל משיקולי התבונה בלבד ולא נותן מקום לאמונות תפלות, הפחד מהמוות או הדחפים הגופניים שלו. אדם רציונאלי גם פועל באופן אופטימאלי למען המטרות שלו ולכן הוא גם דוגל בעמדה השניה. ממה שהתרשמתי באתר הרב מתנגד לפעולה על סמך שיקולים לא תבוניים ומכאן עולה שהרב מניח את העמדה השניה. ניתוח תועלתני לעומת זאת מגדיר רציונאליות על פי העמדה הראשונה של התבונה המכשירית כפי שהרב מרחיב בפוסט וזה יוצר בלבול. המחאה שלי איננה נגד הרב אלא נגד אלו שבחרו את המינוח לכתחילה וכתוצאה מכך יצרו את הבלבול. עדיף היה לקרוא לזה גישה אופטימאלית או תועלתנית.

    3. הדוגמאות שהבאת כאן רובן שייכות למה שאני קראתי השימוש הטריוויאלי. מההכבדה ועד ההתמקמות במרכז אלו תופעות שאדם עם שכל ישר יכול להסביר גם בלי תיאוריה מתמטית. לזה בדיוק התכוונתי כשאמרתי שבד”כ ידע בתורת המשחקים לא דרוש ברוב המקרים. קצת שכל ישר עושה את אותה עבודה. ככל שאני מתרשם, מעטים המקרים שצריך ידע מקצועי כדי לפענח או להסביר תופעה. בוודאי ביומיום.

      מה שאתה מכנה תבונה אינו בהכרח רציונליות. אני בעד פעולות שאתה מכנה תבוניות, אבל איני מכנה זאת רציונליות במובן שמשמש בתורת המשחקים. בתורת המשחקים ההגדרה הנכונה יותר היא חתירה סבירה להשגת מטרותיי, בלי קשר למטרות כשלעצמן. ההבדל הוא בשאלה האם ניתן להגן על התזה הזאת. אני אכן חושב שמיסטיקה היא בד”כ חשיבה לא נכונה, אבל אין לי טיעון ברור שמוכיח זאת. לכן לא נכון להכניס את זה תחת רציונליות בהקשר של תורת המשחקים. לעומת זאת, בהינתן המטרות (=פונקציית התועלת) אני יכול להוכיח שאדם פועל בצורה מיטבית או לא להשגתן. זה מה שעושה תורת המשחקים. לכן לדעתי תורת המשחקים צריכה להשתמש בהגדרה שלי.

  4. אני חושב שזה לא נכון. במקרה עם 3 שודדים שודד ג לא צריך להציע כלום לשודד ד. הוא בכל מקרה יצביע עבורו לפי הנחתך שלא הורגים ללא מטרה להרוויח, הרי אם ג ימות – ד יאלץ לתת הכל ל-ה’ ויצא בלי כלום ולכן אין לו סיבה להרוג את ג’.

    מאותה סיבה שודד ד תמיד יצביע בעד החלוקה (אין לו סיכוי אף פעם להרוויח משהו) ולכן גם במקרה של 4 שודדים שודד ב יכול לשמור הכל לעצמו. לכן ל-ג’ אין סיבה להרוג את א’ – כי ב’ בתור הבא יקח הכל – ולכן גם ג’ וגם ד’ ישאירו את א’ בחיים.

    זה נכון גם לכל מסר של שודדים – הצעיר ביותר תמיד יכול לקחת הכל ולסמוך שלא יהרגו אותו.

    כל זה בגלל ההנחה הלא נכונה שלא הורגים סתם. אם נניח שהשודדים רוצים
    א. לחיות
    ב. להרוויח כמה שיותר
    ג. במקרה של אותו רווח – יעדיפו את האפשרות להרוג כמה שיותר
    הכל יבוא על מקומו בשלום וזה יהיה כמו הניתוח שלך (99,1,0 וכו’)

    1. לא שמתי לב שבתיקו גם הורגים את בעל ההצעה (ולכאורה לכן שודד ב לא יסתפק בשודד ד ויצטרך לשחד מישהו). מה שכתבתי עדיין נכון כי השודד הזקן ביותר תמיד בעד (כשישארו רק 3 הצעיר יקח הכל והוא לא יקבל כלום ולכן אין לו סיבה להרוג) ולכן במקרה של 4 שודדים, 2 הזקנים משאירים בחיים את המחלק
      והמסקנה שכנראה ההנחה שלא הורגים סתם לא נכונה כמו שאמרתי

  5. אכן. לא צריך את ההנחה שלא הורגים סתם והיא גם לא נכונה. ההנחה היא שבמקרה שקול יש חשש שיהרגו (או וודאות שיהרגו) אותי ולכן כדי לפתות מישהו אני צריך לדאוג להצעה טובה יותר מהאלטרנטיבה.

השאר תגובה