התפלגות ספרת המאות במניין שבטי ישראל במדבר

שו"תקטגוריה: כלליהתפלגות ספרת המאות במניין שבטי ישראל במדבר
אורן שאל לפני 2 שנים

שלום הרב,
שמעתי רעיון מחוקר המקרא מאור עובדיה ששמע מהחוקר ד"ר נריה קליין שספרת המאות במניין שבטי ישראל במדבר לא מתפלגת אחיד. אלו מספרי המניינים:

במדבר א'

במדבר כ"ו (ערבות מואב)

ראובן: מניין ראשון – 46,500, מניין שני – 43,730

שמעון: מניין ראשון – 59,300, מניין שני – 22,200

גד: מניין ראשון – 45,650, מניין שני – 40,500

יהודה: מניין ראשון – 74,600, מניין שני – 76,500

יששכר: מניין ראשון – 54,400, מניין שני – 64,300

זבולון: מניין ראשון – 57,400, מניין שני – 60,500

אפרים: מניין ראשון – 40,500, מניין שני – 32,500

מנשה: מניין ראשון – 32,200, מניין שני – 52,700

בנימין: מניין ראשון – 35,400, מניין שני – 45,600

דן: מניין ראשון – 62,700, מניין שני – 64,400

אשר: מניין ראשון – 41,500, מניין שני – 53,400

נפתלי: מניין ראשון – 53,400 מניין שני – 45,400

סך הכול: מניין ראשון – 603,550, מניין שני – 601,730

ניתן לראות שספרת המאות היא אף פעם לא אחת מהספרות 0,1,8,9 (שתי הספרות הקיצוניות מכל צד). מבחינה סטטיסטית הסיכוי שהגרלה של סדרה של 24 ספרות לא תצא אף פעם אחת מהספרות הללו היא 0.6 בחזקת 24 או אחת ל 212 אלף בערך. כלומר סיכוי קטן מאוד. מה לדעתך המשמעות של הדבר הזה? או מה ניתן ללמוד ממנו?
בברכה,

השאר תגובה

1 Answers
mikyab צוות ענה לפני 2 שנים

לא רואה מה ניתן ללמוד מזה. הסתברויות כאלה לא אומרות הרבה. כל צירוף שהיה יוצא שם היה נדיר, כמו בהטלות קוביה.

אורן הגיב לפני 2 שנים

יש חוק סטטיסטי בשם חוק בנפורד שאומר שהספרה המובילה במספרים מסוימים אמורה להיות בשכיחות גבוהה יותר 1 מאשר שאר הספרות. השכיחות של 1 היא בערך 30% ושל 9 היא בערך 5%. להלן קישור להסבר על החוק מויקיפדיה: https://he.wikipedia.org/wiki/%D7%97%D7%95%D7%A7_%D7%91%D7%A0%D7%A4%D7%95%D7%A8%D7%93

רשויות החוק משתמשות בחוק הזה כדי לאתר אנשים שמרמים בדוחות המס שלהם כי בדר"כ כשאנשים ממציאים מספרים הם לא מצייתים לחוק בנפורד ומתפלגים באופן אחיד, ואילו מספרים אמיתיים כן מצייתים לחוק בנפורד בדוחות מס. והרי לפי מה שענית כל אדם שנתפס מרמה בדוח המס שלו יכל לטעון שכל צירוף שהיה יוצא בדוח המס המזויף שלו היה נדיר באותה מידה כמו בהטלות קוביה ולכן אין להסיק מהחריגות הסטטיסטית שלו מסקנות כלשהן. כלומר, במה המקרה לעיל של השבטים שונה מההתייחסות לחוק בנפורד בדוחות מס.

mikyab צוות הגיב לפני 2 שנים

אין לי זמן להיכנס לזה כעת, אבל על פניו נשמע לי מאד מפוקפק. בכל אופן יש שם הסתייגויות, כמו התרחבות לכמה סדרי גודל, הבדל בין ספרה מובילה וספרות שאחריה, וכל אלו צריכות להיבדק כאן (אין כאן כמה סדרי גודל למשל).

אורן הגיב לפני 2 שנים

אני לא טוען שחוק בנפורד חל כאן (הוא לא). אני רק הבאתי אותו כדוגמא לכך שמסיקים מסקנות מחריגות סטטיסטית של נתונים, ולא טוענים שם שאי אפשר לעשות זאת בגלל שכל סדרה של נתונים היא חריגה סטטיסטית באותה מידה (כמו סדרה של הטלות קוביה). אני מנסה לטעון שאם המספרים שמתוארים בתורה אכן היו מייצגים מניין אמיתי של השבטים, ספרת המאות של המניין הזה הייתה אמורה להתפלג באופן אחיד. אם תעשה ניסוי ותגריל סדרה של 24 ספרות ותבדוק באיזו סדרה חסרות הספרות 0,1,8,9, הדבר יקרה אחת ל200,000 סדרות. לכן לכאורה אפשר להסיק מכאן שהמספרים שמתוארים בתורה הם לא מספרים אמיתיים (וזאת גם הייתה מסקנת החוקרים שהזכרתי לעיל).

מיכי הגיב לפני 2 שנים

הבאת הדגמה מצוינת לטיעון שלי. זה חישוב מוטה. מה הסיכוי שתהיינה חסרות 4 ספרות כלשהן? הרבה יותר גבוה. מה מיוחד בספרות הללו? מאומה. לכן הסיכוי שתהיינה חסרות 4 הספציפיות האלו הוא מספר חסר משמעות. זה כמו הסיכוי שסדרת הספרות תהיה בדיוק 1,7,1,4,4,9,8,8,8,1,5… גם הוא אפסי.
מה היית אומר אם היו מופיעות כל הספרות למעט 4? הסיכוי גם לכך קטן (בערך 5%). היית מסיק מכך מסקנה כלשהי? וזה לא בגלל ההבדל בין 5% לסיכוי הקטנטן שחישבת, אלא בגלל שהחישוב הזה חסר משמעות.
חשוב על בעיית היומולדת: https://he.m.wikipedia.org/wiki/%D7%A4%D7%A8%D7%93%D7%95%D7%A7%D7%A1_%D7%99%D7%95%D7%9D_%D7%94%D7%94%D7%95%D7%9C%D7%93%D7%AA.
כידוע, בכיתה של 23 איש הסיכוי שיהיו 2 עם אותו יומולדת הוא גבוה (מעל 50%). אבל הסיכוי ששניהם ייוולדו ב-5.6 הוא אפסי לגמרי. יש לך כיתה של 23, ושניים מהם נולדו בתאריך 5.6. זה ודאי נס, לא? לשיטתך זה לא יכול להיות מקרה. אתה מבין שזו שטות.

אורן הגיב לפני 2 שנים

עשיתי שוב חישוב של מה הסיכוי שתהיינה חסרות 4 ספרות כלשהן וגם הוא יוצא מאוד נמוך עדיין. פשוט הכפלתי את התוצאה שלי ממקודם במספר הקבוצות של 4 ספרות שאפשר לבחור מתוך 10 אפשריות. השתמשתי בנוסחת המקדם הבינומי של 10 מעל 4 ויצא לי 210. כלומר, החישוב החדש מראה שהסיכוי שיהיו חסרות 4 ספרות כלשהן הוא אחד ל1,005. זה עדיין סיכוי מאוד נמוך.

הפוסק האחרון הגיב לפני 2 שנים

המשמעות של הדבר הזה היא שאלוהים לא ספר בני אדם ואז כתב את התורה אלא להיפך

מיכי הגיב לפני 2 שנים

על כך אענה אותו דבר. מה מקודש דווקא בארבע ספרות? מה הסיכוי שחסרות n ספרות? אין ייחוד דווקא בארבע. זה לא משנה כלום.
חזור ליומולדת. יש קבוצה של עשרה (לא 23) ובתוכה שניים עם אותו יומולדת, או אפילו שלושה. מה אתה למד מזה? כלום. זה מה שעלה כאן בגורל.

mikyab צוות הגיב לפני 2 שנים

נכון שאם כולם היו נולדים באותו יומולדת זה כן היה אומר משהו. ההבדל אינו רק כמותי. זה הופך את היום הזה למשהו ממיוחד, וכשיש משהו מיוחד זה אומר דרשני. בכל המצבים האחרים אין שום דבר מיוחד בתוצאה, ולכן היא נדירה אך לא חריגה.
בטיעון הפיין טיונינג למשל, המצב שונה. הצירוף של ערכי הקבועים יוצר חיים וביולוגיה ובני אדם. זה צירוף מיוחד ולכן נדירותו אומרת דרשני. אבל אם היה צירוף ערכים אחר שלא היה יוצר כלום. עדיין הצירוף היה מאד נדיר (כי כל צירוף הוא נדיר באותה רמה), וזה לא היה מעורר שום שאלה. משהו הרי היה צריך לצאת שם בהגרלה.

אורן הגיב לפני 2 שנים

אז למה כשמנתחים דוחות מס ורואים שהתפלגות הספרה המובילה שונה מהתפלגות בנפורד מסיקים שהדוחות מזויפים? הרי לשיטתך זה רק מקרה נדיר אך לא חריג ולא מיוחד.

מיכי הגיב לפני 2 שנים

כתבתי שאיני יכול כעת להיכנס לענייני בדפורד. צריך להיכנס להבין מה העניין.
גם בלי עיון, אני די בטוח שאף אחד לא מסיק מזה מסקנות. לכל היותר זה מעורר חשד ואז עורכים בדיקה. אם הם מסיקים מזה לבד על זיוף זה פשוט טמטום. אין להכחיש שלפעמים יש טמטום במערכת,
כמו הכנסת האישה לכלא על סמך תסמונת מינכהאוזן ע'י שליח.

אורן הגיב לפני 2 שנים

לגבי מה שכתבת לעיל: "על כך אענה אותו דבר. מה מקודש דווקא בארבע ספרות? מה הסיכוי שחסרות n ספרות? אין ייחוד דווקא בארבע. זה לא משנה כלום."

אני לא טוען שיש משהו מקודש בארבע ספרות. אני טוען שספרת המאות אמורה להתפלג באופן אחיד כך שיש סיכוי שווה לכל ספרה להופיע. ברגע שאנחנו רואים שיש חריגה חזקה מההתפלגות המצופה זה מעורר חשד כבד שיש פה גורם שהיטה את ההתפלגות באופן מכוון.

מיכי הגיב לפני 2 שנים

הבנתי זאת. וכפי שכתבתי, איני מסכים. חשוב על דוגמת היומולדת.
אגב, אם כל הספרות היו מופיעות, גם לזה הסיכוי די קטן.

מיכי הגיב לפני 2 שנים

אחדד יותר. כדי שתופעה תדרוש הסבר לא מספיק שהסיכוי שלה הוא קטן (שהיא נדירה). היא צריכה גם להיות מיוחדת. כל שרשרת תוצאות בהטלת קוביה היא נדירה, אבל לא מיוחדת זאת להבדיל משרשרת ארוכה שכולה 5.
אין שום דבר מיוחד בהיעדר ארבע ספרות, וגם לא בארבע הספציפיות הללו. לכן לחישוב הזה אין שום משמעות.

אורן הגיב לפני 2 שנים

לצורך הדיון אם ספרת המאות הייתה רק הספרה 3 לצורך העניין, גם אז לא היית רואה בזה משהו מיוחד?

mikyab צוות הגיב לפני 2 שנים

אז זה היה הופך למשהו שהוא גם מיוחד ולא רק נדיר. כמו הדוגמה עם הספרה 5 בהטלות הקוביה. אבל זו בדיוק שאלת הגבול (ממתי זה הופך למיוחד ולא רק נדיר) ואיני יודע לענות על כך. תעתועי הסטטיסטיקה.

אורן הגיב לפני 2 שנים

בוא נניח לצורך הדיון שגם ההתפלגות הנוכחית היא בגדר מיוחדת. מה לדעתך ניתן ללמוד מזה? או איך אפשר להסביר את זה?

mikyab צוות הגיב לפני 2 שנים

זו עוד שאלה שעומדת ברקע הדיון. למה כל זה חשוב?
נדמה לי שכוונתו לטעון מכאן שהמספרים הללו לא באו לתאר את מספרי האנשים אלא משהו אחר. כי מספרי האנשים זה נתון טבעי והיה צריך להתפלג רגיל. אבל אם זה מיוחד אז יש כאן שימוש של המחבר במספרים הללו כדי להעביר מסר אחר ולא לתאר מספרי אנשים. אבל כאמור לדעתי כל זה לא רלוונטי כאן כי זה לא מיוחד.

אורן הגיב לפני 2 שנים

עוד בעיה סטטיסטית קיימת בהתפלגות ספרת העשרות. בכל המקרים היא 0 חוץ משני מקרים שהיא 5 במניין הראשון בשבט גד ו3 במניין השני בשבט ראובן. אם היה מדובר בעניין של עיגול אז הייתי מצפה שהספרות 3 ו 5 לא היו מופיעות, ואם לא מעגלים את ספרת העשרות, איך ייתכן שהיא יצאה בדיוק 0 22 מתוך 24 פעמים?

mikyab צוות הגיב לפני 2 שנים

נכן. זה בלט גם לעין שלי.
חשבתי שאולי בשני המקרים הללו לא היה עיגול אלא זה היה המספר המדויק. כשכבר מעגלים עושים זאת כבר למאות כי זה פשוט יותר.

אורן הגיב לפני שנה 1

בהמשך לדיון הזה, לאחרונה נתקלתי במחקר על האופן שבו בני אדם בוחרים מספרים באופן רנדומלי. במחקר ביקשו מ8500 סטונדנטים לבחור מספר בין 1 ל10 ולהלן ההתפלגות שהתקבלה:
הספרה אפס – 0.5% או 47 איש
הספרה 1 – 3.4% או 294 איש
הספרה 2 – 8.5% או 731 איש
הספרה 3 – 9.7% או 834 איש
הספרה 4 – 9.7% או 833 איש
הספרה 5 – 12.3% או 1058 איש
הספרה 6 – 9.8% או 843 איש
הספרה 7 – 28% או 2405 איש
הספרה 8 – 10.8% או 933 איש
הספרה 9 – 5.3% או 460 איש
המספר 10 – 1.9% או 166 איש

להלן קישור למקור:
https://www.reddit.com/r/dataisbeautiful/comments/acow6y/asking_over_8500_students_to_pick_a_random_number/

ניתן לראות שהספרות הנפוצות ביותר הן הספרות במרכז התחום – שלוש עד שמונה, והספרות 1,2,9,10 (שתי הספרות הקיצוניות מכל צד) הכי נדירות (נתעלם מאפס כרגע כי הוא לא אמור להיות בתחום).
להזכירך, הראיתי לעיל שספרת המאות במניין שבטי ישראל היא אף פעם לא אחת מהספרות 0,1,8,9 (שתי הספרות הקיצוניות מכל צד). על זה כתבת לי: "זה חישוב מוטה. מה הסיכוי שתהיינה חסרות 4 ספרות כלשהן? הרבה יותר גבוה. מה מיוחד בספרות הללו? מאומה."

אבל לאור המחקר לעיל, דווקא אפשר ללמוד שהספרות בקצוות יותר נדירות דווקא כאשר אדם הוא זה שבוחר אותן (ולא כאשר הן תוצאה של מאורע אקראי כמו מספר האנשים בשבט מסוים). מה דעתך?

mikyab צוות הגיב לפני שנה 1

ראשית, הממצא הזה עצמו יכול להיות תלוי בתרבות, כלומר במקום ובזמן. לכן לא ברור עד כמה הוא תקף לזמנים עתיקים ולתרבויות אחרות.
אם זה נכון לכל מקום וזמן, זה יכול אולי לשנות את המסקנה, אבל לא ברור באיזו עוצמה. אתה מנסה לברר האם הנתונים הללו נכתבו על ידי מישהו או נוצרו כנתונים טבעיים. לשם כך עליך להשתמש בנוסחת ההסתברות השלימה (נוסחת בייס). הממצא הזה נותן לך את הסיכוי המותנה שאם אדם בוחר זוהי ההתפלגות. אתה מתעניין בסיכוי המותנה ההפוך: אם זוהי ההתפלגות מה הסיכוי שאדם בחר זאת. כדי לקבוע את זה עליך לדעת עוד כמה הסתברויות. וכמובן גם את ההסתברות שזה יתרחש במקרה (ושים לב, כפי שהערתי למעלה, לא מדובר בהסתברות שהספרות הללו תהיינה חסרות אלא שיהיו שלוש או ארבע ספרות כלשהן חסרות. אין בספרות הללו שום דבר מיוחד).

. הגיב לפני שנה 1

הרב, האם בחישוב ההתפלגות השלמה:
למעשה ראוי לשים את חוק בנפורד עבור ההיפותזה שמדובר סה"כ בעיגול, ואת בחירת בנ"א שאורן הביא עבור ההיפותזה השנייה (מספרים טיפולוגיים)?
כמו כן, כמה גם נכון לתת להסתברות עצמה של כל היפותזה? ומה עם החזקה של האדם המאמין שמדובר במשהו אמיתי כל עוד לא יוכח אחרת.

כמו כן, במידה והמספר הוא טיפולוגי אז הוא בעל משמעות מסויימת אבל זה לא כמו המחקר שמדבר על בחירה רנדומלית של ספרות אז למעשה הסיכוי שיצא הינו 1. אבל אם ככה זה תמיד ינצח… כך שאיך מייצרים נוסחה מתאימה לכאן?

אורן איך יכול להיות שהספרה 8 נעדרת לאורך כל המספרים? אם היא דווקא בין הכי שכיחות?

mikyab צוות הגיב לפני שנה 1

לא הבנתי את רוב השאלות. ככלל אומר שאיני יודע לתת מספרים, וכמובן כל אחד ייתן מספרים אחרים.

. הגיב לפני שנה 1

אמרת שכדי לדעת מבחינה סטטיסטית האם רשימת המספרים אמיתית או טיפולגית, יש לבחון את זה דרך נוסחאת ההסתברות השלמה.
ז"א שיש לנו שני היפותזות.1. מדובר ברשימה אמיתית (או אמיתית שעברה עיגול וקירוב). 2. מדובר ברשימה "טיפולוגית".

עכשיו כדי לחשב זאת צריך לדעת מה הסבירות של כל אפשרות.
ז"א:
P(E) = P(E/A)P(A) + P(E/~A)P(~A)
להבנתי,
P(E) – הוא מאוד נדיר ובר חישוב כפי שנעשה למעלה. אחת ל 212 אלף.
בעיקרון: p(A) ו p(¬A) קשור להנחה האפריורית שלך בעניין כתיבת התורה כמה הסופר היה ראליסטי.
P(E/A) קשור לחוק בנפורד.

אבל,
כיצד תמלא את P(E/~A) הרי לא מדובר בזריקת מספרים רנדומליים אלא במספר טיפולוגי ואתה לא יודע מה הוא מסמל…

אורן הגיב לפני שנה 1

לא הבנתי מה שאלת לגבי ההיעלמות הספרה 8. מאיזה מספרים היא נעלמה?

אורן הגיב לפני שנה 1

עכשיו יכול להיות שהבנתי מה שאלת בעצם. הטענה שלי היא שבכל תחום שניתן לאדם להגריל מספר, נניח מa עד b, אז ההתפלגות לא תהיה אחידה, אלא ככל שהספרים יתקרבו לקצוות, שכיחותן תרד. במקרה של ספרת המאות במניין שבטי ישראל הספרה 8 היא שנייה מהקצה, ובמקרה של הניסוי עם הסטודנטים, הספרה 8 היא שלישית מהקצה.

. הגיב לפני שנה 1

הספרה 8 לא נמצאת בשום מספר ולא רק בספרת המאות גם לא באלפים ועשרות אלפים. (במספרים שבשאלה)
הנק' שכאן אתה לא טוען שהכתב עשה הגרלה בעלמא ומילא כמויות. אם כי זה אפשרות אחרת.
כאן אתה מציע לקרוא אותם כמספרים בעלי משמעות נוספת כפי מה שהיה מקובל במרחב. אבל אם ככה כיצד החישוב שלך עוזר?
כמו כן, נראלי שההתפלגות האקראית של המספרים הללו נכונה בימינו לאו דווקא פעם, צריך לבדוק את כל המספרים במקרא ובעולם העתיק… נניח מה היה קורה בזמן הפרמטיבי שהמנייה הסתכמה בהבדלה בין אחד, שניים והרבה… שם מדובר על שבטים שקשה להם לזכור גוונים בהרבה.

אורן הגיב לפני שנה 1

זה שספרה אחת חסרה זה הרבה יותר סביר סטטיסטית מאשר 4 ספרות שחסרות.
ייתכן שעשה פה שילוב בין בחירת מספרים על סמך משמעות מסוימת יחד עם בחירה שרירותית. כלומר ייתכן שספרת המאות נבחרה אקראית, ואילו ספרות האלפים ועשרות האלפים נבחרו כדי להעביר מסר מסוים.

בכל אופן, החישוב שלי מנסה להראות שלא מדובר פה במספרים אמיתיים שהיו בשבט פלוני אלא במספרים שנבחרו בדרך כלשהי (אקראית או מוכוונת משמעות).

השאר תגובה

Back to top button