מבט נוסף על תוחלת כקריטריון לקבלת החלטות (טור 255)
בס”ד
בטור 252 עמדתי על טעותו של פארפיט שהציע קריטריון של תוחלת בחישוב התועלת של צעד במסגרת של פעולה קולקטיבית. הסברתי שם שישנם מצבים שבהם התוחלת אינה הקריטריון הרלוונטי לקבלת החלטה. כאשר סטיית התקן גדולה (התוצאות מפוזרות מאד), או כאשר הסיכוי לקבל את הממוצע הוא אפסי אין טעם להעריך את שווי המשחק (הרווח הצפוי) לפי התוחלת. שם עלינו להעריך את הרווח הצפוי בהגרלה הבודדת ולא את התוחלת. בעקבות הטור ההוא קיבלתי שאלה הסתברותית מבלבלת, שמעסיקה ומבלבלת כמה חבר’ה כל היום, ולכן החלטתי לכתוב את הטור הזה.
היחס בין הרווח הצפוי לתוחלת
כדי לקצר אדגים את הטענה היסודית לגבי ההבדל בין רווח צפוי לתוחלת דרך הדוגמה הפשוטה שהבאתי בטור ההוא. נניח שאנחנו מטילים מטבע לא הוגנת. הסיכוי לקבל עץ הוא אחד למיליון, אבל אם התוצאה היא עץ אני מרוויח מיליון מיליארדי דולרים. אם התוצאה היא פלי (הסיכוי לכך גבוה מאד, כמעט 1) אני מפסיד אלף דולר. תוחלת הרווח בהגרלה כזאת היא: 1000 – 109 דולר (הרווח כפול הסיכוי לשתי התוצאות). האלף זניח לגמרי, ולכן ניתן לומר שהתוחלת היא 109 דולר. מהי תוחלת? זהו הרווח הממוצע לכל הגרלה אם נחזור על ההגרלה הזאת אינסוף פעמים. כלומר אם נחזור על ההגרלה שוב ושוב נקבל המון תוצאות (רווחים). אם נסכם את כולם ונחלק במספר ההגרלות, ככל שמספר ההגרלות גדל הרווח הממוצע לכל הגרלה (שימו לב! לאחת, לא לכולן יחד) יתקרב לסכום של 109 דולר.[1]
מציעים לכם כעת לשחק במשחק הזה, כלומר לקנות כרטיס להגרלה חד פעמית. כמה תהיו מוכנים לשלם עבור הכרטיס הזה? שימו לב שכאן אינכם עושים אינספור ניסיונות אלא רק אחד. התוצאה תהיה אחת בלבד, או לכאן או לכאן. ובכל זאת, מקובל לחשוב (כך גם הניח פארפיט בטור הנ”ל) שהתוחלת מבטאת פחות או יותר את ערך ההשתתפות בהגרלה. כך למשל במטבע הוגנת סביר לשלם הון עתק כדי להשתתף בהגרלה הזאת, כי תוחלת הרווח היא ענקית. כאמור, גם בהגרלה שמשתמשת במטבע לא הוגנת כפי שתיארתי, התוחלת לא שונה מהותית (היא עדיין ענקית). לכן לכאורה היינו מצפים שגם כאן אנשים ישלמו סכום עתק.
אבל זה לא נכון. אדם סביר לא יהיה מוכן לשלם מאומה על ההגרלה במטבע הלא הוגנת. מדוע? חשבו על התוצאות של הגרלה כזאת. הרי כמעט בטוח שהתוצאה תהיה שאפסיד אלף דולר. הסיכוי שארוויח את ההון שתיארתי בהגרלה בודדת הוא אפסי לגמרי. אם זה יקרה אני כמובן אצא עשיר כקורח, אבל אין לכך שום סיכוי ריאלי. לכן לא סביר להשקיע מאומה בהגרלה כזאת. אם מישהו מאד אוהב סיכונים אולי יש מקום להשקיע סכום כלשהו שהוא נמוך מאד ביחס ליכולותיו, אבל אדם סביר לא ייכנס למשחק הזה בשום סכום. ניתן לומר שסף הכניסה הסביר למשחק הזה הוא אם משלמים לי (!) על ההשתתפות כאלף דולר (זה יכסה את ההפסד הוודאי שצפוי לי).
יסוד ההבדל הוא שבהגרלה עם מטבע הוגנת תוחלת הרווח היא גם בערך הרווח הצפוי (או: די צפוי). אבל במשחק שתיארתי (עם המטבע הלא הוגנת) תוחלת הרווח (=הרווח הממוצע פר הגרלה) אינה הרווח הצפוי. הרווח הצפוי נקבע על ידי התפלגות התוצאות לקבל סכומים שונים (בעצם חלק ההתפלגות שמתאר את התוצאות הצפויות בסיכוי גבוה), וכאן הסיכוי שאפסיד אלף דולר הוא 1 (פחות משהו זניח לחלוטין). לכן אני הולך כאן להפסד ודאי. זכרו שאני משחק רק פעם אחת, ובפעם הזאת ודאי אפסיד אלף דולר. אז למה להיכנס להגרלה? ברור שאם היו מציעים לי להמשיך לאינסוף הגרלות זה היה כדאי גם במחיר של מיליארד דולר להגרלה (רק למי שיש “כיס עמוק” שיכול להחזיק מעמד עד שירוויח כמובן), שהרי שם מה שקובע הוא התוחלת.[2] אבל בהגרלה אחת, או במספר קטן של הגרלות (כאן גם מיליון הגרלות זה מספר מאד קטן), מה שקובע הוא הרווח הצפוי, והוא נמוך בהרבה.
כמה הוא הרווח הצפוי? שלא כמו התוחלת שמוגדרת היטב מבחינה מתמטית ויש דרך שיטתית לחשב אותה, הרווח הצפוי הוא גודל לא מתמטי (כי יש המון אפשרויות מה ייצא בהגרלה הבודדת), ולכן הוא יהיה תלוי במצבו של השחקן ובאהבת הסיכון שלו ובהתפלגות התוצאות האפשריות לכל הגרלה. כל אחד יחליט על הרווח הצפוי מבחינתו אבל סביר להגדיר אותו סביב סדר גודל של מינוס אלף דולר (זה הרווח שצפוי בהגרלה הזאת בסיכוי כמעט 1).
ההגרלה בקלפים
השאלה שנשאלתי היא הבאה: נניח שמציעים לך את משחק ההגרלה הבא: יש לפניך חפיסה של מיליון קלפים שממוספרים לפי הסדר. אתה בוחר אקראית אחד מהם, וזוכה בסכום ששווה למה שכתוב על הקלף. למשל, אם עלה בגורל הקלף 123,385, אזי אתה זוכה ב-123,385 ₪. כעת מציעים לך אותה הגרלה על חפיסה שונה: כל קלף זוכה בשקל אחד יותר ממספרו, והאחרון זוכה בשקל אחד (במקום במיליון). תוחלת הרווח בשתי החפיסות שווה לגמרי כמובן. מהי? נחשב את הממוצע על ידי הכפלת הסכום הזוכה בסיכוי לזכות בו וסיכום על כל האפשרויות. הסיכוי לזכות בכל סכום הוא אחד למיליון (זה הסיכוי שיעלה קלף מסוים כלשהו בהגרלה). לכן בעצם יש לנו סכום של כל הסכומים מאחד למיליון, מחולק במיליון. התוצאה היא 500,000.5 ₪. כזכור, התוחלת היא הרווח הממוצע פר הגרלה אם עושים אינסוף הגרלות. אבל מהו הרווח הצפוי? כאן נקבל תוצאה שונה עבור שני המקרים. בכל הקלפים פרט לאחרון הרווח בהגרלה השנייה גדול באחד מהראשונה. רק בקלף האחרון הרווח יורד דרמטית ממיליון לאחד. אבל הסיכוי לקבל בהגרלה את הקלף האחרון הוא אפסי (אחד למיליון), ולכן ברור שייצא לנו אחד הקלפים האחרים. אם כך, הרווח הצפוי להגרלה בודדת (או עבור מספר קטן דיו של הגרלות) גדול באחד בחפיסה השנייה. לכן ודאי שכדאי יותר להשתתף בהגרלה השנייה, שכן אנחנו נרוויח שקל יותר בסיכוי 1, זאת למרות שיש סיכוי אפסי לגמרי שנפסיד הרבה, אבל אין להתחשב בו. זה פשוט לא יקרה.
חשבו על הסיכון שאנחנו לוקחים כשאנחנו נכנסים למכונית לנסוע נסיעה לא הכרחית. אם נמות זה ודאי לא שווה, ובכל זאת אנחנו נוסעים. הסיכוי שנמות הוא אפסי (זה פשוט לא יקרה), ולכן גם עבור רווח לא מאד משמעותי אנחנו לוקחים אותו. בניגוד לפתגם הידוע והשגוי, “לי זה לא יקרה” היא אמת הסתברותית פשוטה והגיונית בתכלית.[3]
הקושיא
כעת מגיעה הקושיא. אם תסתכלו על שתי חפיסות הקלפים שתיארתי, תראו שבעצם מדובר בשתי חפיסות זהות לחלוטין. בחפיסה הראשונה קלף מספר 1 מרוויח 1 קלף 2 מרוויח 2 וכן הלאה. בחפיסה השנייה קלף מספר 1 מרוויח 2 קלף מספר 2 מרוויח 3 וכן הלאה עד קלף מספר 999,999 (מיליון פחות אחד) שמרוויח מיליון, וקלף מספר מיליון מרוויח 1. אז בואו נקרא לקלף מספר מיליון בחפיסה השנייה קלף 1, ונזיז את שמות כל שאר הקלפים באחד קדימה. קיבלנו בדיוק את החפיסה הראשונה. אז כיצד אותה הגרלה על אותה חפיסה מניבה רווח צפוי שונה? במילים אחרות, בכל אחת משתי החפיסות יש קלף אחד שמרוויח כל סכום בין 1 למיליון, ובשתי ההגרלות בוחרים באופן אקראי את אחד הקלפים מהחפיסה. אז כיצד ייתכן שהתוצאה היא שונה?
שימו לב, שתוחלת הרווח (הרווח פר הגרלה כשעושים אינסוף הגרלות) בשני המקרים זהה כמובן, אבל כפי שראינו למעלה הרווח הצפוי בהחלט לא זהה. אותה הגרלה בחפיסה השנייה
תניב רווח של שקל אחד יותר. כל עוד מספר ההגרלות קטן (בפרט בהגרלה בודדת), כדאי יותר להיכנס אליה. איך זה ייתכן?
מי ששאל אותי את השאלה אמר לי שהוא אפילו עשה ניסוי עם מחולל מספרים רנדומי (תוכנה שבוחרת מספר באופן אקראי) בין 1 למיליון, ובאמת יצא לו שההגרלה על החפיסה השנייה נתנה רווח גבוה יותר (כל עוד עשית מספר לא גדול של הגרלות). כלומר הרווח הצפוי בהגרלה על החפיסה השנייה שונה מהרווח הצפוי בהגרלה על החפיסה הראשונה. כיצד זה ייתכן כשמדובר באותה סיטואציה בדיוק? וכי מספרי הקלפים משנים משהו? אלה סתם שמות. למה זה חשוב שבחפיסה השנייה הקלף המיליון הוא שנותן לי את הרווח אחד ובחפיסה הראשונה הקלף הראשון נותן לי אותו. הרי ההגרלה אקראית.
ניתוח ראשוני
כשהשואל שאל אותי ודיווח לי על התוצאות, אמרתי לו שאין לי ספק שמשהו בתהליך ההגרלה שלו אינו אקראי לגמרי. הוא שומר בצורה כלשהי תלות בזהות של הקלפים (כלומר במספר הסידורי של הקלף כפי שהוגדר בחפיסה הראשונה). די מהר הבנתי שהוא כנראה עושה את ההגרלה באופן הבא: הוא מעלה מספר בגורל (על ידי תוכנת המחולל האקראי), ואז שואל את האדם שמולו באיזו חפיסה הוא היה בוחר. בחירה בחפיסה השנייה תמיד נתנה רווח גדול יותר, כי הרווח מקלף בחפיסה השנייה תמיד גדול בשקל אחד מאותו קלף בראשונה (למעט אם יוצא בהגרלה הקלף האחרון, מספר מיליון, אבל זה כאמור לא קורה).
אבל זה כמובן משחק מכור. הרי אחרי שיצא קלף n כלשהו (שהבוחר לא רואה אותו), אזי בכל המקרים (למעט אחד) בחירה בחפיסה השנייה תניב שקל יותר. לכן ברור שכדאי לו לבחור בחפיסה השנייה. מדובר כאן בהגרלה בודדת (או מספר קטן של הגרלות) ולכן הקריטריון הוא הרווח הצפוי ולא התוחלת, והרווח הצפוי גדול באחד לעומת החפיסה הראשונה.
מה היה עליו לעשות?
אמרתי לו שאם הוא רוצה להשוות בין שתי ההגרלות הוא אמור לערוך את ההגרלה באופן אחר. להניח שתי חפיסות בפני המשתתף, ולערוך הגרלה ולבחור קלף מהחפיסה הראשונה, ולערוך עוד הגרלה אחרת לבחירת קלף מהשנייה. כעת עליו לשאול את המשתתף באיזו משתי התוצאות הוא בוחר? הרווח מההגרלה הראשונה או השנייה? כאן אין שום הבדל בין שתי ההגרלות (שהרי בשני המקרים אתה בוחר באופן אקראי לגמרי קלף אחד מתוך שתי חפיסות זהות), ולכן אין ספק שגם תוכנה של מחולל אקראי לא תראה הבדל ביניהם.
הסבר
המסקנה היא שהשאלה האם ההגרלה השנייה עדיפה על הראשונה, תלויה באופן עריכת ההגרלה. אם אתה עושה גורל על מספר סידורי של קלף ואז בוחר חפיסה, ברור שעדיפה ההגרלה השנייה. אבל אם אתה עושה שתי הגרלות בלתי תלויות ברור שאין עדיפות לאף אחת מהן.
ההבדל בין שני המקרים הוא שבמקרה הראשון אתה משמר את המספר הסידורי של הקלפים (כלומר את הזהות של כל קלף כפי שהוגדרה בחפיסה המקורית). זו לא הגרלה אקראית ובלתי תלויה בין שני המקרים. לכן לא נכון להשוות את התוצאות. אתה מגריל את אותו קלף עצמו עם אותה זהות (אותו מספר סידורי), ולכן מהגדרת התהליך ברור שהרווח גדול בקלף מהחפיסה השנייה. למרות מראית העין שמדובר בהגרלה אקראית, הקורלציה (התלות) בין סדר הקלפים בחפיסות הופכת את ההשוואה לבעייתית.
שימו לב שמה שאמרתי כאן נכון גם אם נערבב היטב את הקלפים בכל חפיסה לפני ההגרלה. זה לא ישנה מאומה, שכן על כל קלף כתוב מספר, וכשאתה בוחר באופן מקרי קלף מתוך החפיסה הראשונה אתה לא בוחר קלף את מספר סידורי של קלף (בחרת את השם שכתוב עליו ולא את מקומו בחפיסה המעורבבת). בעצם בחרת מספר בין 1 למיליון באופן מקרי, וכעת אתה שואל מהו הרווח העדיף מהקלף הזה אם נתייחס לחפיסה הראשונה או השנייה (אנחנו לא עושים עוד הגרלה על השנייה). התוצאה היא שהסכום בשנייה יהיה גדול יותר, וכנ”ל. מיקומו בחפיסה של הקלף שאותו בחרת ממש לא משנה. מה שמשנה היא הזהות שלו (המספר שרשום עליו). לכן העובדה שבחרתי בו באופן מקרי לא חשובה כלל ועיקר כשעושים השוואה בין הרווחים בשתי החפיסות.
מסקנות
ראשית, הדוגמה הזאת מחזקת את הטענה שהרווח הצפוי במספר קטן של הגרלות (או בהגרלה בודדת) לא בהכרח תלוי בתוחלת הרווח. הקריטריון למספר קטן של הגרלות הוא הרווח הצפוי ולא התוחלת. כשהסיכוי לקבל את התוצאה של התוחלת הוא סביר אז יש קשר בין שני אלו.
מעבר לזה, ניתן גם לראות כאן עד כמה הסתברות וסטטיסטיקה זה תחום מבלבל. התרגום של החישוב הסטטיסטי למקרה במציאות (או להגרלה שנעשית בפועל) הוא עדין ותלוי בפרמטרים שונים. מה שנראה לנו אקראי מתברר שאינו לגמרי כזה. ישנם כמובן עוד אלמנטים מבלבלים רבים בהסתברות וסטטיסטיקה, ואין פלא שבמכון לרציונליות של האוניברסיטה העברית עושים מזה את עיקר פרנסתם.
[1] אם הסכומים מצטברים אנחנו נכנסים לשאלת ההילוך האקראי, אבל לא אכנס לזה כאן.
[2] לא לגמרי מדויק. בגלל שיש הפסדים, ויש כאן בעצם הילוך אקראי של רווחים מצטברים החישוב מסובך יותר. ראו הערתו של נדב שנרב על הטור הנ”ל.
[3] אמנם במצבים קולקטיביים השיקול של “לא זה לא יקרה” אינו נכון (לפחות מוסרית). למשל, להיכנס למקלטים כשיורים טילים. הסיכוי שאפגע הוא אפסי לגמרי ולכן אין שום סיבה הגיונית להיכנס למקלט. אבל אם כולם יעשו את החישוב הזה מישהו ייפגע. לכן כאן הצו הקטגורי אומר לכל אחד מאיתנו להיכנס בכל זאת למקלט (בהנחה שכל אחד שייפגע זו פגיעה בחברה כולה, מורלית ואסטרטגית מול האויבים).
Discover more from הרב מיכאל אברהם
Subscribe to get the latest posts sent to your email.