New on the site: Michi-bot. An intelligent assistant based on the writings of Rabbi Michael Avraham.

פרדוקס המעטפות (טור 288)

בס”ד

מוקדש באהבה לבניי המתמטיקאים, נחמן ויוסי.

בטור הקודם הייתה התעוררות מפתיעה של העניין הציבורי למרות שגם שם עסקתי בשאלה תיאורטית (מעניין למה). זה בדיוק מה שמעודד אותי להמשיך ולעסוק בשאלות כאלה, ואני סמוך ובטוח שסערות הטוקבקים ימשיכו גם כאן.

בתחילת טור 286 הזכרתי שבני נחמן שלח לי מאמר של גיל (R. D. Gill) מאוניברסיטת ליידן, שמטפל בפרדוקס המעטפות הידוע, ושמו בישמעאל הוא “Anna Karenina and the two envelope problem”. בטור ההוא נתתי סקירה על עקרון אנה קרנינה במישור הלוגי וההסתברותי, וכעת אני מגיע לפרדוקס המעטפות. לקשר בין אנה קרנינה לבין הפרדוקס (אם בכלל יש כזה) אחזור בסוף הטור.

אקדים ואומר שהטור קצת ארוך ולא קל. יש בו כמה סטיות לטובת תובנות מתודולוגיות שנראו לי חשובות בעיקר עבור חובבים (אנשי מקצוע כנראה לא צריכים את רובן). ועוד עליי להקדים גילוי נאות שאני רחוק מלהיות מומחה בהסתברות. מה שיש לפניכם הוא הרהורים שלי על העניין (עם הערות משני בניי). אני חש שיש בהם ערך, אבל אולי אני טועה. לכן כאן יותר מתמיד אשמח לכל הערה ממי שיטרח לקרוא. אני חושב שניתן לראות כאן עד כמה התחום של הסתברות וסטטיסטיקה מבלבל, וזה כשלעצמו לקח חשוב מאד.

פרדוקס המעטפות

את הפרדוקס הזה הציג לראשונה בארי ניילבוף (Nalebuff), מומחה לתורת המשחקים מאוניברסיטת ייל, ומאז הוא נדון במאמרים רבים בתחומים שונים (תורת ההסתברות, כלכלה מתמטית, לוגיקה ופילוסופיה). ניסוח בהיר ונחמד של הפרדוקס מופיע במאמר של מריוס כהן ב-YNET[1]I. מוגשות לך שתי מעטפות אטומות וזהות, שבתוך כל אחת מהן סכום כסף. ידוע לך שהאחת מכילה סכום כפול מזה שבשנייה. אתה כמובן לא יודע איזו משתי המעטפות הזהות מכילה את הסכום הגבוה יותר. מוצע לך לבחור מעטפה, ומכיוון שהן זהות ואין לך שום מידע, ברור שכל אחת מהמעטפות היא מועמדת זהה לבחירה שלך. אתה בוחר באחת מהן באופן אקראי. אלא שכעת, כשאתה מחזיק במעטפה שבחרת, מוצעת לך הצעה להחליף את המעטפה שבידך ולקחת את השנייה. האם תעדיף לעשות זאת, או שמא עדיף לך להישאר עם זו שבידך?

חישוב א: על פניו נראה שאין שום עדיפות לאחת על פני השנייה, ולכן אין סיבה להחליף. ניתן אפילו לחשב את תוחלת הרווח שלך בהינתן שאנחנו מחזיקים במעטפה A: הסיכוי שיש בה סכום X הוא 1/2, והסיכוי שיש בה 2X גם הוא 1/2. לכן תוחלת הרווח מבחירת מעטפה A היא: 0.5X+0.5*2X=1.5X. אלא שזו תוחלת הרווח גם אם נבחר במעטפה השנייה (B), ולכן אפריורי ברור שאין סיבה להחליף ביניהן.

חישוב ב: אבל ניתן לעשות כאן גם חישוב אחר. נניח שאני מחזיק בידי מעטפה שהסכום בתוכה הוא X. מה יש במעטפה השנייה? או 0.5X או 2X. יש לי שתי אפשרויות שביניהן עליי להשוות: להישאר עם המעטפה הנוכחית או להחליף. אם אשאר איתה אקבל את הסכום X שבתוכה. אם אחליף, יש לי סיכוי 1/2 להרוויח X וסיכוי 1/2 להפסיד 0.5X. חישוב התוחלת למצב כזה הוא:

0.5X-0.5*0.5X=0.25X כלומר ההחלפה אמורה להניב לי 0.25X. כדאי להחליף.

בשולי דבריי אעיר שניתן לחשוב על הפרדוקס הזה גם אם השחקן פותח את המעטפה שבידו ורואה באיזה סכום מדובר, ואחר כך מחליט האם להחליף. לכאורה שני החישובים הללו נותרים על כנם גם במקרה כזה. גם כשפותחים את המעטפה הראשונה ומוצאים בה סכום X, עדיין השחקן אינו יודע האם הסכום הזה הוא הקטן או הגדול מבין השניים, ולכן לכאורה המידע הזה לא רלוונטי. חשבו על החשבון אחרי פתיחת המעטפה, ותראו שניתן לחזור עליו בדיוק באותה צורה. במעטפה השנייה יש 2X או 0.5X בסיכויים שווים, ולכן עדיין תוחלת הרווח הגדולה יותר תתקבל אם הוא יחליף את המעטפה. כלומר כאן פתיחת המעטפה לא באמת משנה משהו, והפרדוקס נותר בעינו.

שתי בעיות בחישוב השני

מה הבעיה בחישוב השני? ניתן לראות אותה משתי זוויות שונות: א. כיצד התוצאה הזאת מתיישבת עם החישוב הקודם שאמר שאין הבדל איזו מעטפה נבחר? כעת מתברר שדווקא עדיף היה לבחור את השנייה. זה לא בהכרח מצביע על בעיה דווקא בחישוב השני, אלא רק שיש בעיה באחד מהחישובים. ב. זו כבר בעיה בחישוב השני דווקא. אחרי ההחלפה נוכל לעשות שוב את אותו חישוב, ולקבל שוב את התוצאה שעדיף להחליף את המעטפה ולחזור לראשונה. כלומר לא באמת עדיף לבחור את השנייה. אז מדוע מלכתחילה נכון היה להחליף, אם אחרי ההחלפה מתברר שזה היה צעד מיותר? בניסוח אחר: נניח שיש עוד שחקן שמחזיק במעטפה השנייה וגם הוא יכול להחליט להחליף. לפי החישוב הזה גם הוא צריך לרצות להחליף ולקבל לידיו את הראשונה. אבל לא ייתכן שעל בסיס אותו מידע יתקבלו לפי אותה צורת חשיבה שתי החלטות הפוכות, האחת מעדיפה את המעטפה הראשונה והשנייה את השנייה.

בעיית מונטי הול

התמונה הזאת מזכירה את פרדוקס מונטי הול. מציגים בפני השחקן שלוש דלתות. מאחורי אחת מהן נמצא פרס יקר ערך (מכונית יקרה), ומאחורי כל אחת משתי האחרות עומדת עז. השחקן אמור לבחור דלת ולפתוח אותה. אם מאחוריה תימצא המכונית הוא זכה במכונית. אם לא (הוא מצא שם עז) – הוא הולך לביתו אבל וחפוי ראש. נניח שאותו אדם בחר דלת ולא פתח אותה. המנחה, שבעצמו יודע היכן נמצאת המכונית, פותח בפניו דלת אחרת שמאחוריה עז (מדובר שהוא פותח בכוונה את דלת שמאחוריה עז, ולא שהוא פתח באקראי את אחת הדלתות וכך יצא לו)[2]. כעת הוא שואל את השחקן האם הוא מעדיף לפתוח את הדלת שבחר מלכתחילה או להחליף ולפתוח את הדלת השלישית.

שוב, לכאורה יש סימטריה בין הדלתות, אבל חישוב פשוט מראה שזו טעות. הסיכוי שהמכונית נמצאת מאחורי הדלת הראשונה שנבחרה הוא כמובן 1/3. אחרי שהמנחה פתח את הדלת השנייה זה כמובן לא משנה את הסיכוי האפריורי, שהרי בין אם הדלת שנבחרה היא הנכונה ובין אם לאו תמיד יש למנחה עוד דלת עם עז לפתוח והוא פותח אותה.[3] לכן הפתיחה של הדלת השנייה לא משנה במאומה את הסיכוי שהדלת שנבחרה בהתחלה היא נכונה. אם כן, גם אחרי פתיחת הדלת על ידי המנחה הסיכוי שהמכונית ניצבת מאחורי הדלת שנבחרה ראשונה נותר 1/3. אלא שכעת כשנפתחה הדלת השנייה, השחקן יכול לעבור לדלת השלישית ולבחור בה. הסיכוי שלו לזכות במצב כזה הוא 2/3, שכן כעת כבר ידוע שהדלת השנייה אינה דלת הפרס. לכן או שזו הדלת הראשונה שנבחרה או שזו השלישית. ומכאן שעדיף לו להחליף ולבחור בדלת השלישית, שכן כך הסיכוי שלו לזכות הוא 2/3, וזה גבוה מ-1/3 (שזהו הסיכוי לזכות אם יישאר עם הדלת הראשונה).

חשוב להבין שמונטי הול אינו “פרדוקס” אלא “בעיה”. זו אכן התשובה הנכונה (כדאי לו להחליף את הדלת). זה מוזר ומעניין, כי אינטואיטיבית זו לא נראית התשובה הנכונה. אבל זה סתם כשל מחשבתי. אין כאן שום פרדוקס, אלא רק תוצאה לא אינטואיטיבית של חישוב הסתברותי. יש לא מעט כאלה.[4]

ההבדל בין שני המצבים

מה ההבדל בין הבעיה הזאת לבעיית המעטפות? כאן אין אפשרות לחזור ולהציע לו להחליף שוב, לכן כאן אי אפשר לנסח את הפרדוקס. יתר על כן, בניגוד לבעיית המעטפות, כאן בין השלב הראשון (שבו הוא בחר בדלת הראשונה) לבין השלב השלישי (כשהוא צריך להחליט האם להחליף את בחירתו) נוסף לו מידע (שהדלת השנייה היא שגויה). הבחירה השנייה שלו נעשית על בסיס מידע מלא יותר מהבחירה הראשונה, ולכן לא מפתיע שכעת הסיכוי שלו לזכות גדל. לכן גם אין פלא שבמקרה כזה הסימטריה בין הדלתות נשברת. לעומת זאת, במקרה של המעטפות אין שום תוספת מידע בין השלב של הבחירה במעטפה הראשונה לבין הרגע בו עליו להחליט האם להחליף (גם אם הוא פותח את המעטפה לא נראה שנוסף לו מידע רלוונטי. אמנם ראו על כך להלן). לכן שם לא יכול להיות הבדל בין המעטפות.

המסקנה היא שלכאורה פרדוקס המעטפות על שתי גרסאותיו (אם השחקן פותח או לא פותח את המעטפה הראשונה) הוא אכן פרדוקס, ואילו בעיית מונטי הול היא סתם תוצאה לא אינטואיטיבית.

האם פרדוקס המעטפות הוא באמת פרדוקס?

למעלה הסקתי שבעיית המעטפות היא פרדוקס, בניגוד לבעיית מונטי הול. הסיבה לכך היא שיש שם שתי דרכי חישוב ששתיהן נראות נכונות, אבל הן נותנות תוצאות שונות (האחת מלמדת שיש סימטריה בין המעטפות והשנייה מלמדת שנכון יותר להחליף).

אמנם יכולה לעלות כאן הטענה הבאה. הרי ברור שאחת הדרכים לא נכונה. לא ייתכן שלבעיה מתמטית יהיו שני פתרונות שונים ששניהם נכונים. לכן בעצם מדובר בבעייה ולא בפרדוקס. אמנם אנחנו לא בהכרח יודעים איזה משני הפתרונות הוא נכון, אבל ברור שזה רק אחד מהם.

יתר על כן, במקרה של המעטפות אנחנו אפילו יודעים איזה משני הפתרונות הוא הנכון. ברור ששתי המעטפות הן במעמד שווה ואין סיבה להחליף מעטפה. ראינו למעלה שהחישוב השני הוא בעייתי ולא יכול להיות נכון. לכן ברור שהחישוב ב שנותן עדיפות להחלפה הוא החישוב השגוי, וחישוב א הוא הנכון. אלא שלא ברור באיזו נקודה בדיוק נמצאת הבעיה בחישוב ב. אם כן, יש לנו הוכחה מי מהשניים הוא החישוב השגוי, אבל בינתיים איננו יכולים להצביע על הפגם בחישוב השגוי (ב).

האם מצב כזה הוא פרדוקסלי? לאור מה שהסברתי, נראה לכאורה שגם המעטפות זו רק בעיה ולא פרדוקס.

מהו פתרון לפרדוקס: דוגמת אכילס והצב

אבל זה לא לגמרי מדויק. כדי להבין זאת, ניטול כמשל את פרדוקס אכילס והצב. נניח שאכילס רץ במהירות 10 מטר לשנייה, והצב זוחל במהירות 5 מטר לשנייה (זה צב 4X4 קופה). בגלל ההפרש באתלטיות, אכילס הנדיב באדם נותן לצב להתחיל את המרוץ 10 מטר לפניו. משנשמעת יריית הפתיחה, אכילס מתחיל לגמוע את המרחק, ואחרי שנייה אחת הוא נמצא בנקודה שממנה החל הצב את המרוץ. אלא שהצב בינתיים התקדם עוד 5 מטר. טוב, אכילס כמובן ממשיך לרוץ, ותוך חצי שנייה הוא נמצא בנקודה הקודמת שבה היה הצב, אלא שזה התרחק בינתיים עוד 2.5 מטרים. וכך אחרי עוד רבע שנייה אכילס מגיע לנקודה הזאת אבל הצב כבר התקדם עוד 1.25 מטר וכן הלאה. נמצא שאכילס לעולם לא משיג את הצב.

גם כאן יכול אדם לומר שלא מדובר בפרדוקס, שהרי ברור שאכילס משיג את הצב. יש חישוב פשוט שמראה זאת. אבל זה אינו פתרון לפרדוקס. כל עוד לא הראית מה הפגם בחישוב שהצגתי כאן לא פתרת את הפרדוקס. העובדה שאתה יודע מהי התשובה הנכונה לא מהווה פתרון לפרדוקס. להיפך, זו הסיבה שבגללה מדובר בפרדוקס: אתה יודע שהחישוב השני לא נכון אבל אינך מצליח להצביע היכן בדיוק הטעות.[5] הפתרון חייב להציג את הטעות בדרך החישוב השנייה, כלומר להראות היכן יש שם טעות. הוא הדין ביחס למעטפות. גם אם אנחנו יודעים מהי האמת, זה לא פתרון לפרדוקס. כדי לפתור אותו עלינו להצביע על הטעות בחישוב האלטרנטיבי. כל עוד לא עשינו זאת ניתן אולי לומר שאנחנו יודעים את האמת אבל לא שפתרנו את הפרדוקס.

אגב, ביחס לאכילס והצב הטעות בחישוב השגוי שהצגתי היא פשוטה. החישוב שהצגתי הוא לגמרי מדויק, אבל המסקנה (שאכילס לא משיג את הצב) לא נובעת ממנו. אם נעשה את החישוב הנכון נגלה שאכילס משיג את הצב אחרי 2 שניות, כאשר הוא עבר 20 מטר.[6] כעת נוכל לראות בקלות שהתיאור שהצגתי למעלה אינו אלא פירוק של 2 השניות הראשונות של המרוץ (עד שאכילס מגיע אל הצב) לאוסף אינסופי של קטעים הולכים וקטנים. שנייה ועוד חצי שנייה ועוד רבע שנייה ועוד שמינית שנייה וכו’. אם תסכמו את כל הטור הזה תקבלו סך הכל 2 שניות.[7] גילינו שכל התיאור הזה מתייחס רק לשתי השניות הראשונות של המרוץ. ואכן, בשתי השניות הראשונות של המרוץ אכילס לא משיג את הצב. הוא משיג אותו בדיוק כשחולפות שתי שניות, ואז הוא חולף על פניו ודוהר הלאה. שימו לב שכעת אנחנו לא רק יודעים מי מהשניים הוא החישוב השגוי אלא גם מבינים היכן הטעות בחישוב האלטרנטיבי. עכשיו ניתן לומר שהפרדוקס פתור.

האם יש פתרון דומה לפרדוקס המעטפות?

הצעה ראשונה לפתרון

מריוס כהן במאמרו מתאר פתרון שעל פניו נראה קוסם מאד. בשתי המעטפות הללו יש שני סכומים נתונים: X ו-2X. כעת אני בוחר מעטפה אחת, ושתי האפשרויות הן שיש בתוכה X ואז בשנייה יש 2X, או שיש בתוכה 2X ובשנייה יש X. כשתסתכלו על זה כך תגלו שבין אם מחליפים או לא, תוחלת הרווח שמקבלים בשני המצבים שווה. או שבידי המעטפה של 2X ואז ההחלפה תניב הפסד של X, או שבידי יש X ואז ההחלפה תניב רווח של X. כלומר שתי האפשרויות הן או להרוויח X או להפסיד X בהסתברות 1/2, ולכן תוחלת הרווח שצפויה מההחלפה היא אפס.

האם זהו פתרון?

האם זה לא פתרון פשוט לבעיה? במבט ראשוני יש בפתרון הזה קסם והוא נראה חמוד ומתבקש, אבל משהו כאן בכל זאת מטריד. על פניו נראה שכהן בסך הכל מציג פתרון לבעיה שונה מזו שהגדרנו למעלה. הוא לא פותר את הפרדוקס אלא מציג סיטואציה שבה הבעיה פשוט לא מתעוררת. מה בדיוק שונה בין שתי הסיטואציות? חישוב ב מלמעלה מניח סכום נתון במעטפה שלי, ושתי אפשרויות לגבי הסכום במעטפה השנייה. ואילו כהן מציע מצב שבו יש שתי אפשרויות לגבי שתי המעטפות. אם כן, הבעיה הראשונה מניחה ידע (אמנם לא מפורש) על הסכום במעטפה שלי (X), וחוסר ידע לגבי הסכום במעטפה השנייה (או 2X או 0.5X). הבעיה השנייה מניחה ידע חלקי (לא מפורש) לגבי שתי המעטפות (באחת X ובשנייה 2X, אך לא ידוע איזה סכום באיזו מעטפה), ולכן יש שם שתי אפשרויות לגבי הסכומים בשתי המעטפות.

אבל במבט נוסף רואים שאלו לא שתי סיטואציות שונות אלא שתי צורות ניתוח של אותו מצב. הרי הידע שבידי השחקן בשני המצבים הוא זהה. שימו לב שהסכום שבמעטפה שלי אינו באמת ידוע (הוא סומן כ-X). לכן השאלה היא רק כיצד נכון יותר לנתח את המצב, אבל חישוב ב מלמעלה והחישוב של כהן הן שתי צורות חישוב שעוסקות באותו מצב עצמו. אם כן, מה שכהן הראה הוא שיש עוד צורת חישוב, נכנה אותה מכאן והלאה חישוב ג, שנותנת את התוצאה הנכונה (זכרו שראינו למעלה שא’ הוא התשובה הנכונה), אבל שימו לב שהוא לא מצביע על הפגם בחישוב ב. הוא לא  מסביר מדוע דווקא החישוב הזה הוא הנכון וחישוב ב לא. אזכיר שלמעלה כבר עמדתי על כך שפתרון לפרדוקס דורש גם הצבעה על הפגם בפתרון השגוי. בקיצור, נותרנו עם השאלה מדוע לבחור דווקא בצורת הניתוח ג, או מה רע בחישוב ב? את זה הוא לא הסביר לנו, ולכן קשה לראות בזה פתרון. זו גם הייתה תחושתי למקרא הפתרונות שהציע גיל במאמרו.

חישוב ד

כדי לחדד את הקושי, אביא כעת עוד צורת חישוב אפשרית, חישוב ד למנייננו. אני מחזיק בידיי מעטפה ומולי יש עוד אחת זהה. נניח שבמעטפה השנייה יש סכום X. כעת יש שתי אפשרויות: או שבמעטפה שלי יש 2X או שיש בה 0.5X. כעת תוחלת הרווח של ההחלפה היא שלילית כמובן, והמסקנה היא שלא כדאי לי להחליף (אלא להיפך, לשחקן אחר שיחזיק במעטפה ההיא כדאי יהיה להחליף איתי). אבל שוב לא מדובר כאן במצב שונה אלא בחישוב שונה לאותה סיטואציה עצמה. זו כבר צורת החישוב הרביעית, והיא מובילה  למסקנה שונה: חישוב א מוביל לאדישות להחלפה. חישוב ב מוביל לעדיפות להחלפה. חישוב ג (של כהן) מוביל גם הוא לאדישות (כמו חישוב א). וחישוב ד מוביל לעדיפות לאי החלפה (ולא לאדישות). שימו לב שחישוב ד מוביל אותנו לתוצאה שטרם הייתה לנו. הרי לכם שהצגת חישוב נוסף לא פותרת את הפרדוקס, אלא אולי מעצימה אותו.

כדי לחדד זאת יותר, אציין כי כהן מסיים את מאמרו בתהייה האם במקרה שבו פותחים את המעטפה הראשונה החישוב יהיה שונה? יש על כך דיון ער בספרות שעוסקת בפרדוקס הזה, והזכרתי זאת כבר למעלה. שימו לב שהחישוב ד כבר אינו רלוונטי למצב הזה. אם פתחתי את המעטפה שלי אין שתי אפשרויות לסכום שיש בתוכה. כעת פתוחים בפניי רק שלושת החישובים הראשונים. האם לגביהם התוצאה של מצב שבו השחקן פותח את המעטפה תהיה שונה? חישוב א ייתן כמובן אותה תוצאה. וכך גם חישוב ב וג’. ההבדל בין המצבים נוצר רק בחישוב ד. מבחינת שלושת החישובים הראשונים היינו אומרים שהבעיה שבה שחקן פותח את המעטפה זהה לגמרי לבעיה שבה הוא לא פותח אותה, כפי שהנחתי למעלה. אבל חישוב ד (אם הוא נכון, וכאמור הוא כנראה לא נכון) מראה שיכול להיות הבדל בין המקרים הללו.

לפני שנתקדם, אעיר הערה כללית על פרדוקסים.

האם יש פרדוקסים בעולם?

רבים מעוררים את השאלה האם יש בכלל פרדוקסים אמיתיים בעולם. בסופו של חשבון האמת היא תמיד אחת, ואם יש לנו שתי דרכים שנראות לנו נכונות ובכל זאת נותנות תוצאות שונות – בהכרח רק אחת מהן נכונה אלא שאנחנו לא יודעים מי מהן. אך כפי שראינו למעלה, גם אם יש תשובה נכונה אחת, וכעת מתברר שזהו תמיד המצב, פרדוקס הוא חישוב שידוע כשגוי אלא שאיננו יודעים להצביע על נקודת הכשל שבו. כלומר זהו תמיד פרדוקס. פרדוקס אינו מצב שבו יש שתי תשובות שונות ששתיהן נכונות (מצב פלורליסטי). תמיד רק אחת מהן נכונה, והפרדוקס הוא חוסר היכולת להצביע מיהי הנכונה, או מהי הבעיה בחישוב השגוי.

כמובן שזה לא המצב ביחס לשני טיעונים אתיים שמובילים למסקנות שונות. כאן ייתכן מצב פלורליסטי, ולכן לא בהכרח מדובר בפרדוקס אלא אולי רק בפנים שונות של האתיקה. יכול אדם להעלות טיעון לטובת חיסול ממוקד של מחבל שפוגע יחד איתו גם באדם חף מפשע, שכן חיי אזרחינו קודמים, ובו בזמן גם טיעון מנוגד שאומר שאסור להציל עצמי בנפש חברי (למעט מצב שבו הוא רודף). האם יש סתירה בין הטיעונים? בהחלט לא. הם מציגים שני צדדים של הבעיה, ושניהם גם יחד נכונים. בשורה התחתונה צריך לקבל החלטה, כלומר להעדיף את האחד על אחר, אבל גם בשלב ההכרעה לא בהכרח מתברר שאחד מהם שגוי. בתחום האתי שני “חישובים” שנותנים תוצאות שונות מצביעים על ריבוי פנים של הבעיה, ולכן זהו קונפליקט (כיצד לנהוג בפועל) ולא פרדוקס (סתירה). אבל ביחס לעובדות, או לתוצאה מתמטית, המצב שונה. כאן אין אפשרות לדבר על שתי פנים או היבטים שונים של העניין. אם יש שני פתרונות שונים מדובר בסתירה, וברור שבפועל רק אחד מהם נכון.

במובן הזה, פרדוקס הוא סוג של חידה. יש לנו שתי דרכי חישוב שנותנות תוצאות שונות (או שתי דרכי חשיבה שנותנות מסקנות שונות). ברור לנו שאחת מהן שגויה, ובמקרים רבים ברור לנו גם מי מהן. החידה היא להניח את האצבע על החישוב השגוי, ובעיקר על הפגם בדרך השנייה (השגויה). אכן, נראה שאין בנמצא פרדוקסים “אמיתיים” (מצב פלורליסטי), אבל יש פרדוקסים שמהווים חידה מאתגרת,[8] וזה עיקר תפקידם.

בעיה לא מוגדרת

אך ישנה בכל זאת אפשרות אחת שבה נוצר מצב פלורליסטי (יותר מפתרון נכון אחד) גם ביחס לעובדות או ביחס לבעיה מתמטית, וזאת כאשר הבעיה או המצב לא מוגדרים עד הסוף. לדוגמה, חשבו על הבעיה הבאה: נתונה משוואה ממעלה ראשונה עם שני נעלמים: X+Y=5. יכול אדם להציע פתרון (1,4) או את  הפתרון (2,3), וכמובן יש עוד פתרונות רבים. איזה משניהם נכון? שניהם נכונים. איך ייתכן שלבעיה  מתמטית יש שני פתרונות שונים ושניהם נכונים? האם כאן לא נכון שאין פרדוקסים אמיתיים? שימו לב שהפתרונות הללו סותרים זה את זה, ובכל זאת, מצב כזה מוכר וידוע לכולנו ולא נראה שהוא מעורר בעיה מיוחדת. הסיבה לכך היא שהבעיה הזאת לא מוגדרת עד הסוף (היא לא מוגדרת באופן שיש לה פתרון יחיד). אם היינו מוסיפים עוד תנאים ומגדירים את הבעיה עד הסוף, היה לה פתרון יחיד. לדוגמה, ניתן להוסיף עוד משוואה בלתי תלויה שקושרת את אותם שני נעלמים.[9]

כדי לשעשע אתכם בימי הקורונה, חשבו על הבעיה הבאה. אדם ניצב בנקודה כלשהי על פני כדור הארץ. הוא פוסע קילומטר אחד צפונה, לאחר מכן קילומטר אחד מזרחה, ולבסוף חוזר קילומטר אחד דרומה, ומגיע בחזרה בדיוק לנקודת המוצא. מהי הנקודה הזאת? לפני שאתם קוראים הלאה, נסו רגע לחשוב על כך בעצמכם.

טוב, ודאי חשבתם על הפתרון המובן מאליו, והוא הקוטב הדרומי. האדם עולה משם צפונה קילומטר (לכל כיוון שירצה), לאחר מכן הולך מזרחה קילומטר (כל זה נעשה במעגל שכל הנקודות בו מרוחקות קילומטר מהקוטב הדרומי), ואז מכל נקודה שאליה הוא יגיע, אם הוא יילך קילומטר אחד דרומה הוא יחזור בדיוק לקוטב הדרומי. פשוט, נכון? אבל למען האמת יש עוד אוסף של אינסוף פתרונות, פחות אינטואיטיביים. בואו נעצור רגע, ונסו לחשוב על כך עוד פעם.

טוב, הנה הם. חשבו על מעגלי רוחב קצת מתחת לקוטב הצפוני. ככל שיורדים מהקוטב דרומה היקף מעגל הרוחב שמכיל את הנקודה שאליה הגענו כמובן גדל. כעת נוכל להגדיר את הפתרונות הנוספים. נרד מהקוטב הצפוני דרומה (לכל כיוון שנרצה) ונעצור בנקודה שמעגל הרוחב שעובר דרכה הוא בעל היקף של קילומטר אחד בדיוק. כעת התייצבו על אחת מהנקודות במעגל הזה, ורדו דרומה עוד קילומטר אחד. אוסף הנקודות שמתקבל כך מסודרות במעגל שנמצא קילומטר מתחת למעגל הקודם, וקל לראות שכולן מקיימות את דרישות החידה.

אם כן, גם הבעיה המתמטית הזאת, שבבירור עוסקת במציאות, אינה מוגדרת היטב (יש לה אינסוף פתרונות). אם נותנים לי את הבעיה איני יכול לענות תשובה חד משמעית. כדי להגדיר את הבעיה באופן מלא, כלומר כך שיהיה לה רק פתרון אחד, יש להוסיף לה אילוצים, למשל: שהנקודה נמצאת על קו אורך מסוים, או שהיא נמצאת דרומה לקו המשווה וכדומה. הרי לנו שגם בעיה שעוסקת במציאות (והיא גם מתמטית) יכולה להיות בעלת יותר מפתרון אחד, אם היא אינה מוגדרת עד הסוף.

התיאור הזה אולי נותן לנו כיוון לפתרון אפשרי לפרדוקס המעטפות. אם ראינו שיש כמה דרכי חישוב שנותנות תוצאות שונות, וכולן נראות נכונות (כלומר לא מצאנו פגם באף אחת מהן), אז או שטעינו, ואם לא – אז האפשרות היחידה היא שגם כאן הבעיה לא מוגדרת היטב. המסקנה היא שעלינו לבדוק היכן יש דרגת חופש בבעיה שלנו, ואם נגלה דרגת חופש כזאת, אולי נוכל להגדיר אותה עד הסוף, ואז נגלה שרק אחת מדרכי החישוב הללו נכונה. לחלופין, כל אחת מדרכי החישוב מניחה משהו אחר, כלומר מטפלת בבעיה שונה.

איפה יכול להיות בבעיית המעטפות מרווח שדורש הגדרה? לכאורה הכל ידוע והכל מוגדר היטב. המועמד המתבקש הוא הסיכוי לקבל סכום קטן או גדול יותר במעטפה השנייה. משום מה הנחנו ששני הסיכויים הללו שווים וערכם 1/2. האם ה-1/2 הזה באמת עולה בהכרח מהגדרת הבעיה? כאן יכולה להימצא דרגת חופש שתעזור לנו לפתור את הפרדוקס. למה אנחנו מניחים שהסיכוי לשני הסכומים במעטפה השנייה הוא שווה? כנראה מפני שבאין ידע אחר זו ההנחה המתבקשת. אם כן, הרי לכם מרווח (היעדר מידע) אפשרי שבו ניתן לתלות את הבעיה. זו טענתו של גדי אלכסנדרוביץ בפוסט שלו על בעיית המעטפות (ולהלן נראה שהיא לא הכרחית לפתרון הבעיה שלנו).

הצעה שנייה לפתרון: ההתפלגות

כאשר אנחנו מייחסים סיכויים למצבים שונים, הדבר הוא תוצאה של התפלגות נתונה כלשהי. ההתפלגות מתארת את הסיכוי שיש לכל מאורע במרחב המאורעות שלנו. מתוך ההתפלגות ניתן לחשב את הסיכוי לכל מאורע פשוט או מורכב. לדוגמה, בהטלת קובייה ניתן לקבל שש תוצאות. אם הקובייה היא הוגנת, כי אז ההתפלגות היא אחידה, כלומר יש אותו סיכוי לקבל כל אחת משש התוצאות. אם לדוגמה נשאל כעת מה הסיכוי לקבל תוצאה זוגית, התשובה היא 1/2 (3 פעמים 1/6). לעומת זאת, אם הקובייה אינה הוגנת, למשל הסיכוי לקבל 1 או 3 הוא 0.1, והסיכוי לקבל כל אחת משאר האפשרויות הוא 0.2 (הכל מסתכם ל-1 כמובן), זוהי התפלגות לא אחידה. במקרה כזה, הסיכוי לקבל תוצאה זוגית הוא 0.6. שימו לב למסקנה שעולה מכאן. נניח ששואלים אתכם לגבי קובייה נתונה  מה הסיכוי לקבל תוצאה זוגית, התשובה אינה 0.5 אלא שהבעיה אינה מוגדרת. כדי להשלים את ההגדרה שלה עליכם לקבל את ההתפלגות (האם הקובייה הוגנת, ואם לא – כיצד היא מתנהגת). רק בהינתן ההתפלגות ניתן לחשב באופן חד משמעי את הסיכויים לכל אירוע. אחרת, יהיו כמה חישובים שכולם יכולים להיות נכונים, כלומר הבעיה אינה  מוגדרת היטב.

ניתן להציג זאת באופן שונה. תוחלת הרווח של המשחק או ההגרלה מוגדרת להיות התוצאה הממוצעת שאליה נגיע אם נחזור עליהם שוב ושוב (אינסוף פעמים, או הגבול שלה אם מגדילים את מספר המשחקים כרצוננו). הסכום שיש לי ביד פר משחק (כלומר הסכום הכללי שאליו שואפת תוצאת כל המשחקים מחולק במספר המשחקים, כאשר מספר המשחקים שואף לאינסוף) הוא התוחלת. כעת עלינו לשאול את עצמנו מה פירוש לחזור על הטלת המטבע או על משחק המעטפות שוב ושוב? בהקשר של הקובייה יש לדעת את טיבה של הקובייה. בהקשר של המעטפות, עלינו לדעת כיצד נקבע תוכן המעטפות שלפני השחקן בכל פעם. ברור שכדי להגדיר את זה עלינו לקבוע את ההגרלה שלפיה נקבעים הסכומים שבתוך המעטפות ואיך נבחרות צמד המעטפות למשחק. למשל, קובעים שסכום X ייצא בהגרלה הזאת בסיכוי P, עבור כל סכום אפשרי X, מסדרים שני צמדים של מעטפות (אחד עם האפשרות ש-X הוא הגדול והשני שהוא הקטן) ואז בוחרים צמד מעטפות באופן אקראי ומשחקים איתו. זו בדיוק הגדרת ההתפלגות. המסקנה היא שבלי ההתפלגות אי אפשר לדבר על סיכויים ולכן גם לא על תוחלת.[10]

אם כן, טוען גדי לאלכסנדרוביץ, כעת מתבקש לשאול כיצד חושבו הסיכויים לקבל סכום כזה או אחר בשתי המעטפות. מה שנתון לנו הוא רק היחס בין הסכומים, אבל מאומה על הסכומים עצמם (ערכו של X). אם כן, הרי לכם מרווח בבעיה שצריך להגדירו כדי שהבעיה תהיה מוגדרת היטב: התפלגות הסיכויים לקבל סכומים במעטפות השונות. למשל, אם ההתפלגות לקבל סכום יורדת ככל שהסכום עולה, או אז לא נכון להניח סיכוי שווה להחלפה שנותנת סכום גבוה והחלפה שנותנת סכום נמוך. הרי לכם שכאן כבר נשברה אחת ההנחות שלנו בפרדוקס (=הסיכוי השווה לשתי האפשרויות). בהינתן התפלגות מסוימת של הסיכויים לקבל סכום X במעטפות, או אז הבעיה מוגדרת היטב, ולכן הדבר נותן ביד השחקן כלי לחשב את תוחלת הרווח, והאם כדאי לו להחליף מעטפה. אם אותו שחקן לא יודע את ההתפלגות אזי חסר לו מידע ולכן הוא לא יכול לענות לשאלה. הבעיה אינה מוגדרת עד הסוף. אמנם יש התפלגות כלשהי והוא רק לא יודע מהי, אבל אז שוב הוא טועה כי אין בידו את כל המידע. זה לא פרדוקס. לכל היותר, זה יכול רק לומר שאין לשחקן כזה אסטרטגיה מנצחת חד ערכית במצב אי הידיעה שבו הוא נמצא.

אם תחשבו על המקרה שבו השחקן פותח את המעטפה ורואה את הסכום שבתוכה, תוכלו להבין ביתר קלות את הבעיה. אם הוא מצא שם 200 ₪, הוא אמור להשתמש בהתפלגות כדי לחשב את הסיכוי למצוא 100 ₪ או 400 ₪ במעטפה השנייה, ואין סיבה אפריורית להניח שהסיכויים הם שווים. להיפך, אם הסיכוי לסכום גבוה במעטפה יורד (מה שסביר ברוב המקרים המעשיים) כי אז הסיכוי שבמעטפה השנייה יהיה 400 קטן מהסיכוי שיהיה בה 100. ההתפלגות תאמר לי מה היחס בין הסיכויים וזה יקבע את האסטרטגיה המנצחת. לדוגמה, אם הסיכוי לקבל 400 הוא 10% והסיכוי לקבל 100 הוא 90%,[11] אזי תוחלת הרווח מההחלפה היא:
60 – = 100*0.9 – 300*0.1
כלומר לא כדאי לו להחליף. אבל אם הסיכוי לקבל 400 הוא 40%, אזי למרות שהסיכוי לכך נמוך יותר מהסיכוי להפסיד 100 עדיין כדאי יהיה לו להחליף. תוחלת הרווח מההחלפה במקרה כזה היא:
60 = 100*0.6 – 300*0.4.
אתם רואים שההתפלגות קובעת את התוצאה.

גדי אלכסנדרוביץ טוען שהפתרון לבעיה נעוץ בכך שלא הגדרנו את ההתפלגות ולכן הבעיה אינה מוגדרת. אבל הוא מוסיף וטוען שגם אם לוקחים בחשבון את ההתפלגות הבעיה עדיין לא נפתרת. אפשר להגדיר בעיה שבה ההתפלגות לקבל כל סכום היא אחידה (הסיכוי לכל סכום הוא אותו). התוצאה היא שבמצב כזה אכן כדאי להחליף את המעטפה, אלא שאז כדאי להחליף אותה שוב. כאן אנחנו נקלעים לפרדוקס למרות שהבעיה מוגדרת היטב (יש התפלגות נתונה). אלא שזו טעות. חשוב להבין שהתפלגות אחידה על פני כל הסכומים (כלומר מספר אינסופי של סכומים) אינה מוגדרת, שכן הסיכוי לכל סכום הוא 0. לכן בעיה כזאת עדיין אינה מוגדרת. אם כן, לכאורה פתרנו את הפרדוקס. הבעיה אינה מוגדרת היטב, וההנחה שהסיכוי לכל אחת משתי התוצאות הוא זהה היא הנחה לא מבוססת.

אבל גם זה לא נכון, שהרי ניתן לחשוב על מצב שבו הסיכוי הוא כן שווה (למשל כשאין מספר אינסופי של אפשרויות). יתר על כן, ארבעת החישובים מלמעלה נתנו תוצאות שונות למרות שכולם הניחו סיכוי שווה. כלומר התזה הזאת לא תסביר לנו את הסתירה בין החישובים שעשינו.

וריאציה על הבעיה

אלכסנדרוביץ שם מביא גרסה שונה של הבעיה, בשם פרופ’ נגה אלון. עיקרה הוא התפלגות שכן ניתנת להגדרה ובכל זאת משאירה את הבעיה בעינה. זה יחדד לכם את מה שכתבתי כאן, שהבעיה לא באמת נפתרת גם אם מכניסים את עניין ההתפלגות.

נניח שהמשחק מוגדר כך שהסכומים שמוכנסים למעטפות יכולים להיות רק חזקות של 10: 10 ₪, 100 ₪, 1000 ₪ וכדומה. כעת נקבע את ההתפלגות באופן הבא: הסיכוי לקבל זוג מעטפות עם סכומים של 10 ו-100 הוא 1/2. הסיכוי לקבל 100 ו-1000 הוא 1/4 וכן הלאה. באופן כללי יותר, הסיכוי לקבל את הזוג (10n , 10n+1) הוא 1/2n. זוהי התפלגות חוקית (שכן סכום הסיכויים של כל האפשרויות הוא 1). כעת כבר הכל בבעיה מוגדר, ולכן החישוב צריך להיות חד ערכי ותוצאתו מייצגת את המסקנה הנכונה.

נדון בבעיה שבה השחקן פותח את המעטפה הראשונה ואז צריך להחליט האם להחליף. השחקן מצא בה סכום של 10n ₪. במעטפה השנייה יכולים להיות או 10n-1 או 10n+1. הסיכויים לשתי התוצאות הללו הם: 1/2n-1 לתוצאה הראשונה 1/2n לתוצאה השנייה. במצב כזה ההסתברות שבמעטפה השנייה יש סכום קטן פי 10 מהסכום במעטפה שלנו היא כפולה מההסתברות שבמעטפה השנייה סכום גדול יותר. אם כן, בהסתברות 1/3  נרוויח מהחלפת המעטפות, ובהסתברות 2/3 נפסיד.[12] תוחלת הרווח מההחלפה במצב כזה ניתנת לחישוב פשוט והיא יוצאת כמובן חיובית (כי הסכום הגדול הוא פי 10 והסיכוי להגיע אליו הוא רק 1/2 מהגעה לסכום הקטן). במקרה זה החישוב נותן:10n-1י*24, כלומר אם מצאתם במעטפה שלכם 100 ₪ תוחלת הרווח מההחלפה היא 240 ₪, כדאיות ההחלפה משמעותית, וזה כמובן עולה עם הסכום.

אלא שכעת ניתן לשאול מה רע בתוצאה הזאת? אולי באמת זוהי התוצאה על אף שאינה אינטואיטיבית. האם זהו פרדוקס או סתם תוצאה לא אינטואיטיבית? כאן עלינו לחזור לחישובים א, ב וג’, ולראות שאפשר להפעיל כאן את כולם (את ד לא, כי הוא לא רלוונטי למקרה שפותחים את המעטפה הראשונה). במילים אחרות, יש סימטריה בין המעטפות (אין סיבה להניח שפתחתי דווקא את הקטנה מבין השתיים). לחלופין, חברי שמחזיק גם הוא במעטפה משלו יגיע לאותה מסקנה וגם הוא ירצה להחליף. לא הגיוני שהמסקנה הרציונלית היא שכל אחד משנינו צריך להחליף את המעטפה. לכן זהו פרדוקס (ולא רק תוצאה לא אינטואיטיבית).

אלכסנדרוביץ שם מציע הצעה שלפיה אין לזהות את המושג “כדאי להחליף” עם ההפרש בין תוחלות הרווח של שתי האפשרויות. הוא גם מראה שחישובי התוחלת למצבים אלו (גם להחלפה וגם לאי ההחלפה) נותנים תוצאות אינסופיות. אבל, כפי שהוא עצמו טוען, בשורה התחתונה משהו כאן לא נראה הגיוני, והוא נותר בצריך עיון.

בסוף הסעיף הקודם כבר הסברתי מדוע הצעה זו לא יכולה לתת פתרון לפרדוקס. כאן אוסיף על כך עוד בעיה. כדי להגיע לאינסופים שלו, אלכסנדרוביץ עושה חישובי תוחלת שכוללים את הסיכוי לקבל מעטפה עם סכום מסוים, ואז חישוב של תוחלת הרווח להחלפה או אי החלפה במקרה הזה, ואז ממצע על כל הסכומים. אבל לדעתי השאלה שנדונה כאן היא אחרת (הסתברות מותנה): בהינתן שקיבלנו סכום כלשהו (נניח לצורך הדיון שפתחנו את המעטפה), האם תוחלת הרווח להחלפה היא חיובית או שלילית? החישוב הזה כבר נעשה למעלה ואין בו שום דבר אינסופי (לא בשני החישובים ולא בהפרש ביניהם).

במילים אחרות, הניסוי שהוא מציע לחזור עליו אינסוף פעמים הוא לבחור זוג מקרי של מעטפות מאוסף זוגות שסודרו בשכיחות שתוארה על ידי ההתפלגות למעלה. לבדוק את כדאיות ההחלפה ואז למצע על כל הזוגות. לעומת זאת, אני מציע לבחור זוג מעטפות מסוים ולפתוח אחת מהן. אם יצא לי סכום של 100 ₪ לבדוק כדאיות של ההחלפה. אם לא יצא 100, לסגור שוב את המעטפה להחזיר את השתיים לצבר, לערבב ולבחור עוד זוג. לבדוק רק את המקרים שבהם קיבלנו 100 ₪ ולמצע על כל הרווחים מכל המקרים. למיטב הבנתי, בדוגמה שהוא הציע התוצאה תהיה רווח של 240 ₪ למקרה אם מחליפים. לכן הצעתו לא באמת פותרת את הבעיה.

הצעה שלישית לפתרון: בחזרה להצעה הראשונה

אם כן, התחשבות בהתפלגות לא הושיעה אותנו. אני מוצא עצמי חוזר שוב להצעה שתוארה במאמרו של מריוס כהן. אם נצליח להסביר מדוע החישוב ג הוא הנכון ולא ב, זה יהווה פתרון לפרדוקס, גם בניסוח שלנו.

נדמה לי שהניתוח שעשיתי בסוף הפסקה הקודמת יכול להסביר זאת היטב. החישובים ב וד’ מניחים סכום מסוים במעטפה אחת (או זו שלי או האחרת) ושתי אפשרויות לסכום במעטפה השנייה. לחזור על הניסוי הזה אינסוף פעמים פירושו לעשות ניסוי שבו הסכום במעטפה שלי הוא נתון. אבל זה לא המקרה שבו אנו עוסקים. להיפך, כפי שתוכלו לראות בסוף הסעיף הקודם, אנחנו מגרילים צמד מעטפות, ומתוך הצמד הזה אנחנו בוחרים אחת, ואז מתלבטים האם כדאי לנו להחליף. אם כן, החישוב של מריוס כהן הוא באמת זה שמתאר את המצב לאשורו. החישוב שלו מניח שיש לנו צמד מעטפות שבהן יש שני סכומים נתונים. מה שפתוח כרגע הוא השאלה באיזו מהשתיים אני מחזיק (הגדולה או הקטנה). לכן דווקא החישוב ג הוא החישוב הרלוונטי לנדון דידן. חישובים ב וד’ מתייחסים למצב שבו אני בוחר מעטפה אחת עם סכום נתון, ואז מגריל מעטפה שנייה ובה סכום קטן פי שתיים או גדול פי שתיים. אבל במקרה כזה באמת כדאי להחליף, ואין כאן שום פרדוקס.

חשבו על המשחק הבא.[13] יש לי מעטפה ביד, פתחתי אותה ויש בה 100 ₪. כעת מוצעת לי הגרלה שבה בסיכוי 1/2 אקבל 200 ₪ ובסיכוי 1/2 אקבל 50 ₪. השתתפות בהגרלה דורשת ממני 100 ₪ (הסכום שבמעטפה שלי). האם כדאי לי לשלם את הסכום הזה? התשובה היא כמובן חיובית. כאין אין דילמה וגם לא פרדוקס. במקרה כזה התוחלת ברורה ובוודאי כדאי להשתתף בהגרלה (כלומר להחליף את המעטפות). זהו המצב במקרה שבו הסכום במעטפה שלי קבוע וידוע. כאן החישוב ב הוא באמת החישוב הנכון. חישובים א וג’ עוסקים במקרה אחר, ולכן התוצאה שלהם שונה. חישוב ד, עוסק במקרה שלישי (הפוך), שבו הסכום במעטפה האחרת נשמר קבוע ומגרילים את המעטפה שבידי.

האם באמת יש להיזקק להתפלגות?

אם אני צודק, כי אז שורש הפתרון לא נעוץ בכלל בשאלת ההתפלגות. התיאור של המשחק מכיל בתוכו שלושה משחקים שונים שלא נכנסנו להבדלים ביניהם, אבל לכל אחד מהם מתאים חישוב אחר. למשחק כפי שהבנו אותו מתאים החישוב ג ולכן בו לא כדאי להחליף (תוחלת ההחלפה היא 0). במשחקים אחרים, כמו זה שתיארתי כאן, מתאימים חישוב ב שאז כן כדאי להחליף (תוחלת ההחלפה חיובית) או חישוב ד שאז כדאי לא להחליף (תוחלת ההחלפה שלילית).

אם כן, בשורה התחתונה צודק אלכסנדרוביץ שבאמת מדובר בבעיה לא מוגדרת. אבל מה שחסר אינו בדיוק ההתפלגות אלא התיאור של הסיטואציה אינו שלם. כמובן שניתן לראות גם בזה חוסר בהתפלגות, שכן לכל אחת מהסיטואציות יש כמובן התפלגות שונה של התוצאות. לכן איני יודע אם הפתרון שלי כאן שונה במהותו מזה של אלכסנדרוביץ או לא. אני כן חושב שכעת אין צורך להישאר בצריך עיון כפי שקרה אצלו. וזה, כפי שראינו, מחזיר אותנו לפתרון של מריוס כהן, אלא שכעת גם ברור מדוע נכון לבחור בחישוב ג ולא בחישוב ב. לכן כעת ניתן לראות בזה פתרון לפרדוקס.

הצעה רביעית לפתרון: גיל

בני נחמן הסב את תשומת ליבי לכך שגיל בפרק 1.3 של מאמרו הנ”ל מראה שהבעיה כלל אינה קשורה להתפלגות, וכל הדיון של אלכסנדרוביץ (בבעיה המקורית, לא בזו של נגה אלון) בטעות יסודו. בעיית שתי המעטפות שתיארתי בהתחלה מדברת על שתי מעטפות נתונות שהסכומים בהן ידועים לגמרי. הם לא מוגרלים בשום צורה שהיא. ההגרלה היחידה בתהליך היא הבחירה בין המעטפות.

כדי לראות זאת, נעקוב אחרי הניסוח של גיל שם. חשבו על שתי מעטפות זהות כך שבמעטפה A יש 100 ₪ ובמעטפה Bי 200 ₪. אני בוחר במעטפה אחת מהן באקראי (ואיני יודע האם זו מעטפה A או B), וכעת עליי להחליט האם להחליפה במעטפה השנייה. כעת נראה שאפילו במצב כזה, שאין בו שום הגרלה והתפלגות של הסכומים, ניתן להגדיר את הפרדוקס. לשם כך, נגדיר את הסכום במעטפה שבה בחרנו כ-S. אם זו מעטפה A אז S=100 ואם זו B אז S=200. כל אחד מהמאורעות הללו הוא בעל הסתברות 1/2 כי הבחירה בין המעטפות היא אקראית. בדיוק בגלל זה אין כאן שום משמעות להתפלגות (הסיכוי 1/2 לכל אפשרות נובע מהבחירה במעטפה ולא מהגרלת הסכומים במעטפות).

הסכום במעטפה השנייה יסומן כ-T. אנחנו יודעים שיש שתי אפשרויות: T=0.5S (אם S=200), או T=2S (אם S=100). גם כאן ההסתברות לכל אחת מהאפשרויות היא 1/2 (כי הבחירה במעטפה הראשונה היא אקראית).

כעת לפי נוסחת ההסתברות (התוחלת) השלימה מקבלים:

E (T) = E (T | T = 2S) · P (A) + E (T | T = S/2) · P (B)

הסכום T (כלומר הסכום במעטפה שנותרה מולי) מחושב כסכום של שתי אפשרויות: הסכום במעטפה ההיא אם S=100 (כלומר שבחרתי במעטפה A) ועוד הסכום במעטפה ההיא אם S=200 (כלומר שבחרתי במעטפה B).

אם נציב את הגדלים הרלוונטיים נקבל:

E (T) = 2S · 1/2 + S/2 · 1/2 = S + S/4 = 5S/4

קיבלנו שהסכום במעטפה ההיא גדול ברבע יותר מהמעטפה בה בחרתי. כלומר כדאי לי להחליף.

אבל ברור שגם במקרה זה התוצאה הזאת לא תיתכן. יש סימטריה בין המעטפות, ולכן לא ייתכן שהמעטפה ההיא תניב רווח גדול יותר בממוצע מזו שבחרתי בה. הרי לכם הפרדוקס גם בלי להניח שום הגרלה על הסכומים במעטפות, ובלי צורך להיזקק להתפלגויות של הסכומים.

גיל טוען ששורש הבעיה הוא שחישבנו את הגודל הלא נכון. מה שחישבנו כאן הוא התוחלת של T כשלעצמה, בעוד שהיה עלינו לחשב את התוחלת המותנה E(T/S) II. הרי מדובר בתוחלת של T כאשר ידוע שבמעטפה שבידינו כעת יש S, וזו מעצם הגדרתה היא תוחלת מותנה. גיל בפרק 1.3 מראה שחישוב התוחלת המותנה נותן:

 E (T/S=a) = a

כלומר אין רווח נוסף בהחלפה. חשוב להבין שהחישוב כאן אינו אלא חישוב ג שהוצג בתחילת הטור. הטעות הייתה שחישבנו תוחלת מוחלטת בעוד שהיה עלינו לחשב תוחלת מותנה.

החישוב של E(T) II שנעשה בנוסחה הקודמת אינו אלא חישוב ב, שהוא חישוב של תוחלת הרווח במקרה שהציג בני יוסי (שבוחרים מעטפה ומגרילים את הסכום במעטפה השנייה). במקרה כזה באמת התוחלת אינה מותנה כי ההגרלה היא בלתי תלויה, ולכן כפי שהסברתי במקרה כזה באמת כדאי להחליף. אבל החישוב הנכון למקרה שלנו, שבו בוחרים מעטפה והסכום במעטפה השנייה נקבע בתלות במעטפה שנבחרה, הוא החישוב של התוחלת המותנה, שהוא חישוב ג, וכפי שראינו מסקנתו היא שאין רווח נוסף בהחלפה.

אנחנו רואים שוב שהפרדוקס ניתן להצגה גם בלי להיזקק להתפלגויות. אין כאן הגרלה אקראית של הסכומים שבמעטפות ולכן טענתו של אלכסנדרוביץ לגבי מקרה זה (שהתפלגות אחידה על מספר אינסופי של סכומים אינה מוגדרת) אינה רלוונטית לדיון. כמו כן, רואים כאן שבסופו של דבר ניתן להראות שהפרדוקס לא קיים גם בלי להיזקק להתפלגות. במובן הזה, נדמה לי שהפתרון הזה דומה למה שהצעתי בסעיף הקודם. משמעות הפתרון היא שבהינתן הסיטואציה המדויקת ניתן להציג חישוב עקבי גם בלי להיזקק להתפלגות, וגם בהנחה שהסיכוי לשתי האפשרויות הוא באמת 1/2. לעומת זאת, כאשר עוסקים בבעיה שהציג נגה אלון, שם באמת יש להיזקק להתפלגות, ולכן זוהי בעיה שונה. נדמה לי ששם יפעל הפתרון שלנו.

מה לכל זה לאנה קרנינה?

בתחילת הטור הזכרתי את המאמר שקיבלתי מבני נחמן, שמציע פתרונות לפרדוקס המעטפות וקושר אותם לעקרון אנה קרנינה (שנדון בטור 286). ניסיתי לחשוב מה באמת הקשר בין שני אלו.

בסופו של דבר, ככל שהבנתי אין הרבה קשר. גיל רק ניסה להראות שיש הרבה הצעות שונות לפתור את הפרדוקס, כמו שיש דרכים שונות להיות אומלל. כלומר פתרונות לא נכונים יש הרבה, אבל פתרון נכון יש רק אחד. העניין הזה קצת מזכיר לי את המימרא החביבה של הרב מידן שאמר כי הוא מכיר 22 תירוצים מדוע קוראים מגילת רות בשבועות אבל רק תירוץ אחד מדוע קוראים מגילת אסתר בפורים. כוונתו לומר שכשיש ריבוי תירוצים די ברור שמשהו בכל אחד מהם לא מספק. כשהתירוץ הוא ברור ונכון אין צורך לחפש עוד תירוצים.

אבל כאן, אם אני צודק, הפתרונות השונים כולם מסתובבים סביב אותה נקודה: ההתפלגות וחוסר השלימות של הבעיה. ניתן לתקוף את זה מזוויות שונות, ובדרך כלל כל הצעה עוסקת במקרה אחר (וכפי שראינו היא נכונה לגביו), אבל בבסיס יש משהו משותף לכולם. כאמור, אין פרדוקסים אמיתיים ביחס למתמטיקה או לעובדות. במציאות יש תמיד תשובה נכונה אחת. אם אנחנו פוגשים חישובים שונים שנראים נכונים, כי אז נראה שאנחנו פשוט עוסקים במצבים מציאותיים שונים (הבעיה לא מוגדרת עד הסוף). כעת ניתן לראות שכל הפתרונות שהצגתי מתלכדים ומשלימים זה את זה. המשפחה יכולה להיות מאושרת בדרך מוגדרת היטב, אם היא עושה זאת בדרך הנכונה.

[1] המאמר לקוח מגליליאו.

[2] אם הוא סתם פתח את אחת הדלתות האחרות ובמקרה יצא שיש מאחוריה עז, הניתוח שונה (במצב כזה הסיכוי לזכות הוא 1/2 בשתי האפשרויות, בין אם יחליף ובין אם לאו).

[3] כאן נכנסת ההנחה שהזכרתי למעלה שהפתיחה של המנחה אינה אקראית, אלא מדובר בפתיחה מכוונת של דלת עם עז.

[4] נדמה לי שדניאל כהנמן כתב פעם על השאלה האבולוציונית המרתקת כיצד יש לנו חשיבה הסתברותית כל כך כושלת (מזה הוא עשה את עיקר פרנסתו), למרות שאלו כישורים חיוניים מאד להישרדות שלנו. כנראה שהוא וטברסקי הם גורמים מטעם אל האבולוציה שנשלחו כדי לתקן את המצב. אחריהם כבר כולנו נעלה על דרך המלך האבולוציונית. זכייתו של כהנמן בפרס נובל גם היא אקט אבולוציוני מובהק, ש”מטרתו” (מילה לא חוקית בשיח האבולוציוני. השימוש תמיד מושאל) להביא את הכשלים הללו למודעות של כולנו ובכך לשפר את חשיבתנו ההסתברותית. לא בכדי, העולמות שבהם כהנמן וטברסקי לא גילו את הכשלים הללו ו/או שבהם כהנמן לא זכה בפרס נובל נכחדו.

[5] אם כי כפי שהערתי למעלה, גם אם לא היינו יודעים מי מהחישובים הוא הנכון, עצם העובדה שיש שני חישובים סותרים מספיקה כדי להגדיר את הבעייה כפרדוקס. הידיעה מי מהם הוא הנכון רק מעצימה אותו.

[6] המיקום של אכילס בזמן t מתואר על ידי 10t. המיקום של הצב בזמןt  הוא 10+5t. כאשר t=2 שניהם עברו 20 מטר, כלומר זאת הנקודה שבה אכילס חולף על פני הצב.

[7] וכך גם אם תסכמו את המרחקים, 10 מטר ועוד 5 ועוד 2.5 ועוד 1.25 וכו’, שמסתכם ל-20 מטר.

[8] גדי אלכסנדרוביץ בפוסט שלו על פרדוקס המעטפות מגדיר זאת כהוכחה בדרך השלילה, כי הוא מתייחס לפרדוקסים שנוצרים מהגדרות גרועות, ובמקרים אלו הפרדוקס הוא הוכחה בדרך השלילה לכך שההגדרה שגויה או עמומה. אבל לא כל הפרדוקסים הם כאלה. למשל פרדוקס המעטפות, כמו שהוא עצמו מעיר שם, לא קשור להגדרה (בהמשך נראה שהוא קשור לחוסר מוגדרות של הבעיה, ולא של מונח כזה או אחר), ולכן אני מעדיף להתייחס לפרדוקסים כחידה. זו אמירה כללית ונכונה יותר.

[9] שימו לב שגם בנעלם אחד ייתכן מצב דומה. למשל, משוואה ריבועית היא בעיה שלא מוגדרת עד הסוף. טלו את המשוואה: x2-5x+4=0 . יש לה שני פתרונות: x=1,4, וכמובן שניהם נכונים. כדי להגדיר את הבעיה עד הסוף (כך שיהיה לה פתרון יחיד) יש להוסיף אילוץ, למשל: x>2. במצב כזה הפתרון הנכון היחיד הוא x=4.

כמובן שסמנטית אפשר לראות את הבעיה כמוגדרת היטב, והפתרון שלה הוא קבוצת מספרים ולא מספר יחיד (זהו גם המצב באי שוויון, כמו: x>2).

[10] נדמה לי שזה יכול להיות תלוי בהגדרת ההסתברות, ששנויה במחלוקת בין אנשי המקצוע (הפילוסופיה של ההסתברות). יש שרואים בהסתברות חישוב של שכיחות של תוצאות, ואילו אחרים רואים בה חישוב שמוגדר מתמטית למשחק בודד.

[11] מדובר בהסתברויות מותנות בכך שבמעטפה שבידי יש 200. אחרת הסיכויים לא מסתכמים ל-1 כמובן.

[12] החישוב המדויק הוא לפי נוסחת בייס. לא נכנסתי לזה כי התוצאה מובנת מאליה.

[13] במסגרת דיון עם בני יוסי על פרדוקס המעטפות הוא העלה את המשחק הזה.


Discover more from הרב מיכאל אברהם

Subscribe to get the latest posts sent to your email.

Leave a Reply

Back to top button