הקשר בין שפה וחשיבה

שו"תקטגוריה: פילוסופיההקשר בין שפה וחשיבה
אלמוני שאל לפני 4 שעות

שלום הרב מיכאל
 
לאחרונה, בעקבות עליית הבינה המלאכותית, חזרתי לחשוב על הקשר בין שפה וחשיבה. אני לא יודע אם יש תועלת בניסיון לנחש אם לצ'ט ג'יפיטי ודומיו יש תודעה, כי אני לא יודע איך אפשר לבדוק כזה דבר אפילו לגבי אנשים אחרים מלבדי, שלא לדבר על מחשב, אבל העובדה שמנועי הבינה המלאכותית הם בבסיסם מנועי שפה, שלפחות לפי מיעוט הבנתי הרבה מהם מבוססים על סטטיסטיקה (מה המילה הכי מסתברת בהמשך המשפט, בהתבסס על כמויות אדירות של מידע שמוזן למחשב), עורר בי את השאלה כמה מתוך התקשורת האנושית היא באמת חשיבה או שהיא פשוט שימוש מיומן וריק בשפה. לא צריך את צ'ט ג'יפיטי בשביל לדעת את זה – מספיק לקרוא טורי דעה בעיתונים, אבל זה כן מעורר את השאלה.
 
כמה דברים עולים לי:
 
1. יש הבדל בין שפה וחשיבה, אי אפשר לומר שהם אותו הדבר. ספיר-וורף ניסו לטעון שזה אותו הדבר וההשערה הזו הופרכה באלף דרכים שונות. מצד שני החיתוך לא בהכרח ריק (כמובן, עם תלות בהגדרה של המילה "חשיבה"), ובעיני זה מעלה את השאלה מהי בעצם חשיבה – והיכולת של הבינה המלאכותית לחקות חשיבה באמצעות שפה מחדדת את השאלה הזו. מצד אחד אני חושב שאכן השפה מסייעת מאד לחשיבה כי היא מאפשרת להגדיר דברים ולסדר את המושגים בראש, אבל המילים אינן זהות למושגים שהן מייצגות, שהרבה פעמים קיימים אצלי בראש גם בלי שיש לי דרך לתאר אותם. בנוסף, שימוש מיומן בשפה אכן חושף את התוכן של הקונספטים האלו – וכשאני אומר שפה אני מתכוון גם לתחביר לוגי וסימונים מתמטיים שהם גם סוג של שפה. אבל לא די בהם. איפה נכנס האלמנט של חשיבה? האם רק באותם רגעים סינתטים-אפריוריים או שיש משהו מעבר לכך? האם חשיבה אנליטית היא בכלל חשיבה או שהיא רק שימוש זהיר ומיומן בשפה?
 
2. השפה עצמה מורכבת מרובד טכני של תחביר ואוצר מילים, אבל התחביר עצמו משקף תהליכי חשיבה והמשגה של העולם. אני לא בלשן גדול בכלל אבל למיטב ידיעתי חומסקי ניסה למצוא את המבנים הבסיסיים שכל שפה מתבססת עליהם – הבנתי שהיום הוא פחות פופולרי אבל הרעיון בבסיסו נראה נכון. התוצאה של זה היא ששימוש מיומן בשפה לא רק יכול לחקות חשיבה אלא באמת אולי יכול להצליח לסדר את המושגים בצורה שתביא לתוצאות שלא ידענו עליהם קודם – או שידענו אבל לא ידענו שאנחנו יודעים (כמו שכתבתי קודם) – לא רק ככלי עזר אלא כמשקף של מבנים קיימים. כמה מתוך החשיבה שלנו היא הדבר הזה? יתכן ששוב אני פשוט מדבר על חשיבה אנליטית מול סינתטית, ואז עולה התהיה איפה נמצאת החשיבה הסינתטית הזו והאם לדעתך יתכן שמחשב יפגין חשיבה כזו. או במילים אחרות – מהי מערכת היחסים בין חשיבה ובין תודעה?
 
3. משל החדר הסיני מראה שאפשר לחקות חשיבה בלי חשיבה אמיתית מאחוריה. אני חושב שהבינה המלאכותית מחדדת את המשל הזה ומקצינה אותו, כי היא מראה שאפשר – לפחות קונספטואלית (בהנחה שהמחשב חסר תודעה) ממש לחשוב ולהגיע לתוצאות חדשות בלי חשיבה "אמיתית", כלומר בלי תודעה. בעיני זה הופך את התודעה האנושית למושג עוד יותר תמוה ועוד יותר "מיותר" מבחינה אבולוציונית, למרות שמבחינתנו היא פחות או יותר שקולה למושג "חיים". 
 
4. תהיה שעולה לי גם בעקבות התנסות של כמה שנים במדיטציות זן, שבה אפשר ממש לראות איך התודעה "מפרישה מחשבות" – כאילו המחשבות הן פשוט דבר שקורה ליצור בעל תודעה ושהן לא תוצר רצוני. מתי חשיבה מפסיקה להיות כזו ומתחילה להיות תהליך מודע? זה מחדד לי שוב את הניסיון להבחין בין חשיבה ותודעה.
 
נראה לי שאלו נושאים שמצדיקים טור בבלוג שלך, לא? כי אני חושב שצריך לעשות סדר (גם לעצמי) בכל השאלות הפילוסופיות החשובות האלו שהבינה המלאכותית מעלה – שוב, לא ביחס לבינה המלאכותית לכשעצמה אלא לגבי עצמנו, כמה מתוך החשיבה שלנו היא אמיתית וכמה מתוכה היא שטף אסוציאטיבי של מילים בתוך מבנים תחביריים ריקים, וכמה מתוך המבנים התחביריים האלו אכן ריקים (כי הרי חלקם לפחות מעידים על קונספטואליזציה מועילה מאד של העולם).
 
חשבתי על כל זה הבוקר וכל הזמן תהיתי מה יש לך להגיד על הנושאים האלו.. סליחה אם הכתיבה כאן לא מספיק מסודרת, נראה לי שחזרתי על אותה השאלה בדרכים שונות.
 
 

השאר תגובה

1 Answers
מיכי צוות ענה לפני 4 שעות

תודה על המכתב. אכן שאלות מטרידות. יש כאן כמה שאלות נכבדות מאד. שינוי הכיוון מהדיון ב-AI לדיון בנו הוא מעניין ומתבקש. אני לא באמת חושב שזה דיון שונה, אלא שני צדדים של אותה מטבע.
ממבט ראשוני, יש כאן כמה שאלות שונות. לא רק שלא חזרת על אותה שאלה כמה פעמים אלא שבכל סעיף בודד מופיעות כמה שאלות שונות שלא תמיד הבחנת ביניהן. השאלה איזה חלק מהחשיבה שלנו הוא אנליטי (ומה הגדרת אנליטי לעניין זה? האם לקחת בחשבון את כל ההנחות שלנו? רק את ההנחות המודעות? את כל מה שטבוע בנו – שזה אולי הכל לדעת המכניסטים?), האם מה שאנליטי הוא בכלל חשיבה? היחס בין החשיבה כהליך (מנטלי או נוירוני, משמעות ושימוש – ויטגנשטיין והחדר הסיני) לבין תוכן שמצד עצמו ראוי להיקרא חשיבה (אולי רק תוכן סינתטי?). האם המנטלי מגיח מהפיזי או אפיפנומנה, או שהוא מניע את הפיזי? ועוד כמה.
 
על רובן כבר כתבתי לא פעם מזוויות אלו ואחרות. רק כעת שראל ויינברגר (בוגר הישיבה) ערך עמו ראיון בנושאים אלו במסגרת קורס מקוון שהוא בונה בבר אילן: https://youtu.be/TnKOuuz_NTM?si=xJR4onzYHFCOjhNL
הראיון נערך בעקבות טורים 590-592 שהוקדשו לנושאי ה-AI ויחסו אלינו.
טורים 35, 175, עוסקים בהבדל בין שיקול דעת לבין תהליכים מכניים (לפני עידן ה-AI החדש).
ההתייחסות לשאלות של חשיבה ושפה ולוורף נדונות בסדרת הטורים 379-381.
 
אני מתכנן בקרוב לכתוב עוד משהו על עוד היבט שעלה לי בקריאה על תופעה מעניינת ב-AI. אבל לארגן את כל הדברים הללו ידרוש ממש ספר להערכתי, ואני כרגע לא עוסק בכתיבת ספרים (לא מאמין כבר במדיום הזה)  וגם לא  מספיק מתמצא בחידושים בתחום ה-AI עצמו.
אבל אחשוב אם יש עוד משהו שיש לי בו ערך מוסף (כלומר שחשיבה פילוסופית יכולה להוביל לחידוד והמשגה, בלי להיות מעודכן בפרטי החידושים העכשוויים).
 

אלמוני הגיב לפני 4 שעות

תודה רבה! סליחה שלא עניתי מייד, אני מגיע למייל רק בערב ואתמול לא הספקתי.

אכן השאלות שלי נכתבו בצורה מעורבבת – כתבתי את זה מוקדם בבוקר ובחיפזון, ואני מסכים שיש הרבה שאלות שונות בתוך אותו הסעיף. אני חושב שהדבר העיקרי שהטריד אותי מעבר לשאלות שניסחת זה האלמנט של השפה. מבחינתי, כשדיברתי על "אנליטי" התכוונתי גם להנחות היסוד וגם לגזירות הלוגיות, אבל לא לאופן שבו הגענו לנסח או ידענו את הנחות היסוד. בהקשר של מה שהעסיק אותי בעיקר – זה כאמור, עניין השפה. המחשבה התחדדה אצלי כשקראתי משהו של רועי צזנה שכותב על הנושא הרבה והוא אמר שגם המנועים החזקים הם בעיקרם מנועי שפה, כולם. ואז זה פתאום נותן לשפה מעמד שונה ממה שייחסתי לה עד עכשיו. כביכול עולה האפשרות שמספיק ללמד את המחשב לדבר כמו שצריך כדי שתעלה משם מחשבה ממש – או לכל הפחות תהליך שמחקה במדוייק מחשבה ממשית ומודעת, או לפחות מספיק במדוייק לכל צורך מעשי. ואז אני תוהה לעצמי מה יש בשפה שמאפשר את זה? האפשרויות שעלו לי היו:

1. השפה היא ייצוג של תהליכים לוגיים או מחשבתיים אחרים, ולכן מספיק שנצליח להשתמש בשפה כראוי כדי שניצור תהליך לוגי. הייצוג הופך למהות: או ממש, בהנחה שלמחשב יש תודעה, או רק כאשר יש אדם מודע שקורא את המילים ומבין מה כתוב בהן. אבל בכל אופן אי אפשר להבדיל בין השניים אלא אם כן אתה האדם המדבר/חושב את הדברים. נדמה לי שזה אחד הדברים שהניע את ראסל ליצור שפה מתמטית שלא יהיו בה פרדוקסים: לנקות את השפה מהאלמנטים הלא לוגיים שלה ככה שהשפה והלוגיקה הופכות לשקולות. זה אמנם בלתי אפשרי אבל יתכן שזה אפשרי מספיק לצרכים מעשיים.
2. השפה עצמה בנויה על המשגות מובלעות שיש לנו ועל יחסים בין אובייקטים, במרחב, בזמן ויחסים סיבתיים, וזה מוטמע למשל בתחביר הטבעי שבמוח שחומסקי מדבר עליו, ולכן ברגע שלומדים לדבר זה כולל מניה וביה גם תהליכים של חשיבה. החשיבה מוטמעת בתוך התחביר. זה עדיין אומר שמבחינת המחשב יתכן שאנחנו בסעיף 1, אבל מבחינת האדם המדבר, השפה היא כבר לא נפרדת מהלוגיקה – לא כמייצגת אלא כי באמת השפה עצמה היא תהליך לוגי. כמובן לא מושלם כי אני יכול לנסח משפטים אבסורדיים בשפה.
3. גם השפה האנושית היא לא באמת חשיבה כמו שהשפה של המנוע היא לא באמת חשיבה – היא יכולה להיות אבל חשיבה היא תהליך נפרד שמתנהל במקביל לניסוח הדברים במילים. השפה יכולה לסייע לתהליך הזה או להפריע לו או פשוט לשקף אותו, והיא יכולה להתנהל במנותק ממנו לגמרי.

אני אשתדל לקרוא את הטורים ששלחת לי ולצפות בראיון, אבל זה ייקח לי קצת זמן כי אני עובד מהבוקר עד הלילה ואין לי סמארטפון, אבל אני אשתדל ואנסה לחשוב על זה עוד קצת..

אגב, חשבת אולי להפיק פודקאסט? זה קצת יותר מורכב מהקלטת שיעורים לדעתי ואם תמצא שותף שתוכל להקליט איתו ולנהל איתו שיחה אינטליגנטית על סוגיות פילוסופיות – זה יכול להיות מוצלח מאד, הרבה יותר מספר, כי היום אנשים צורכים הרבה מאד מידע באופן הזה ולא בקריאה.

תודה רבה!

מיכי צוות הגיב לפני 4 שעות

אני מתלבט לגבי שאלות השפה שהעלית. אני חושב שמאחורי השפה יש רעיונות, והמכניות שבה פועלת תוכנת AI לא אומרת שהיא עוסקת בשפה. גם שם השפה היא ייצוג, אלא שהדברים המיוצגים לא נמצאים ב"הכרתה" של התוכנה אלא אצל המתכנת.
האימון של התוכנה נעשה דרך תשובות ופידבקים למקרים, ואלו לא נקבעים לשונית. לדוגמה, מאמנים תוכנה לזהות פנים של מישהו. האימון הוא דרך דוגמאות ומתן פידבק חיובי או שלילי לזיהוי נכון ולא נכון שלה. אתה מבין שהפידבק נקבע לפי השאלה האם היא זיהתה נכון או לא, כלור לפי התוכן. זה לא סתם סינטקטס צורני וזהו. לכן זה מעצב את הרשת באופן שיענה על הסמנטיקה. זו לא פעולה לשונית גרידא, הגם שהיא מיוצגת על ידי שפה. גם אצלנו הרעיונות מיוצגים על ידי שפה, אבל יש מאחוריה רעיונות. האדם בחדר הסיני מקבל פידבקים מדוברי סינית ולא סתם קשרים סינטקטיים.

לגבי הפודקסט, זה רעיון מעניין. אחשוב עליו, אם כי בזמן האחרון יש לי המון הזמנות לפודקסטים קיימים ואולי זה כבר עונה על הצורך הזה.

אלמוני הגיב לפני 4 שעות

חשבתי על התשובה שלך – אני מסכים בעיקרון כי זו היתה הדרך שבה חשבתי על הדברים עד לאחרונה, שאפשר לשחק עם המילים באמצעות המחשב, אבל התוכן – המשמעות – נשארת אצלנו והשפה איננה אלא מייצג. אבל התפיסה הזו מתערערת אצלי כעת בגלל שנראה שמנועי הבינה המלאכותית שהם מבוססי שפה מצליחים לחקות חשיבה בצורה כל כך טובה עד שנראה שכבר קשה להבדיל בין מה שהם עושים ובין חשיבה אנושית רגילה, ולמיטב ידיעתי כל המנועים האלו הם בעיקרו של דבר מבוססי שפה (גם המנועים המתקדמים). כלומר, גם לפני עשר שנים היו לנו רשתות נוירונים שיודעות לפתור בעיות באמצעות מאסה עצומה של דוגמאות, אבל המפנה בפיתוח מנועי בינה מלאכותית התחיל עם מנועי השפה. כך לפחות למיטב ידיעתי שהיא לא רבה. אם זה נכון אני ממשיך לתהות האם התמונה שאתה מציג – שהיא התמונה שהיתה גם לי עד לאחרונה – היא אכן נכונה או שיש בשפה משהו שהוא יותר מייצוג גרידא. יש להדגיש שאני לא חושב ששפה זהה לחשיבה והעליתי את האפשרות הזו רק כי זו אפשרות שצריך לשקול כשמנסים לחשוב על הנושא, אבל לא קשה לשלול אותה גם מבחינה רעיונית וגם מבחינה פנומנולוגית (אני יודע מתוך עצמי שאפשר לחשוב בלי מילים ואפשר לדבר בלי לחשוב). אבל אם זה נכון – אז השאלה שהתחלתי איתה לפני שבועיים חוזרת בשבילי: עד כמה כאשר אני עצמי משמיע טיעון יש מאחוריו חשיבה, או שאולי החשיבה מגיעה רק אחרי השמעת הטיעון או אפילו אז לא – כלומר, זה מעורר לחשוב מתי השפה לכשעצמה מצליחה "לחשוב לבד" ומתי לא. כדוגמה אני יכול לתת משהו דומה אבל שונה – מתמטיקה. אם אתה נותן לי תרגיל במתמטיקה, נניח לחקור פונקציה, אז אני יכול להתבונן בפונקציה ולתאר אותה די טוב מתוך הבנה של מה היא עושה ולהגיד לך איך היא תיראה. זו חשיבה. אבל אני גם יכול לשבת עם האלגוריתם ולגזור ולבנות משוואות ולהעביר אגפים ולהציב מספרים וכו' – תהליך שיכול להיות אך ורק מכני (וכל עוד מקפידים על סינטקס נכון נראה ליש לא נטעה ותמיד נגיע לתוצאות) – ולהגיע לאותן תוצאות גם בלי להבין מה אני עושה, כמו שתלמידי 3 יחידות פותרים בלי לדעת מה הם עושים. אז במתמטיקה, השפה החזקה שפותחה שם "חושבת" בשבילם. ברור שזו דוגמה שמתאימה למה שאתה כתבת – השפה לא באמת חושבת אלא מקפלת בתוכה תהליכים שפותחו במשך מאות שנים של חשיבה והם רק השורה התחתונה, וגם המשמעות שניתנת להם היא רק במחשבה של הפותר. אבל אין ספק שיש לשפה המתמטית עוצמה רבה ששקולה במידה רבה לחשיבה, מבחינת התוצאות שהיא מפיקה – ובמקרים רבים היא גם תחליף את החשיבה, כאשר הפונקציה מסובכת מדי ואין לי שום דרך לחזות את ההתנהגות שלה, כמו במצב של דינמיקה כאוטית, ואז אנחנו סומכים על השפה בלבד אם רוצים תוצאות ספציפיות. ואז נשאלת השאלה – מה קורה עם השפה הטבעית? האם גם בה יש מידה מסויימת של העוצמה הזו? אני מרגיש שמנועי השפה מרמזים שאולי כן, ואז מאד מסקרן אולי לחשוב מה יש בשפה, במילים – השפה הטבעית, לא המתמטית המלאכותית שיצרנו בכוונה כדי שתחשוב בשבילנו – שמאפשר את זה.

ראיתי שהתחלת לכתוב כמה טורים על הנושא ואני מצפה לראות אם בסוף תהיה התייחסות לכיוון הזה, אם בכלל אתה חושב שיש בו תועלת. מה שכן, תיקון קטן לטור הקודם – אני לא "תלמיד לשעבר", אני "תלמיד" 🙂

מיכי צוות הגיב לפני 4 שעות

אני מתכוון לכתוב את הטור אחרי הבא (הוספתי עוד אחד, מעבר לתכנון, לפניו) על זה. ככלל, איני רואה במנועי שפה משהו מיוחד מעבר לכל מכונה אחרת. הביצועים כמובן הרבה יותר עוצמתיים, אבל כל הטענה היא ששימוש ומשמעות אינם אותו דבר. דוגמת התלמיד וחקירת הפונקציה המכנית מחדדת זאת היטב. לכן גם במקום שהשימוש/הסינטקס מצליח להגיע לאותן תוצאות כמו בני אדם, זה לא אומר שיש שם חשיבה (כמו אצל התלמיד). כאמור, גם למים יש יכולות אדירות בפתרון משוואות נאווייר סטוקס (נכון שלא בתחומים אחרים, אבל זה הבדל כמותי).
בעיניי מנועי שפה לא באמת מאתגרים את תפיסת האדם, וזה מה שהסברתי בשני הטורים הללו. בטור הבא אני מתכנן לעסוק בשאלה ההפוכה שאותה אתה העלית: לא האם המכונה היא אדם אלא האם אדם הוא מכונה. כלומר האם החשיבה שלנו היא מכנית גרידא. או למצער לשאול האם מנועי השפה מובילים יותר למסקנה הזאת (כנראה שכן). אבל השאלה האם המכונה היא אדם זו שאלה שונה. יש הבדל בין השוואת ביצועים (מבחן טיורינג) לבין החלטה שמדובר באדם ושיש חשיבה ומודעות.

מיכי צוות הגיב לפני 4 שעות

אני חושב שהדיון בסוף הטור האחרון על חשיבה בשלבים (דיפסיק) ממחיש את ההבחנה הזאת מצוין.

אלמוני הגיב לפני 4 שעות

את הטור האחרון עוד לא קראתי – אני מסכים בהחלט שעצם הגעה לתוצאות לא מעידה על מחשבה, לכן נתתי את דוגמת התלמיד והפונקציה, אבל אחד הדברים שמעניינים אותי מלבד השאלה האם האדם הוא מכונה זה מה יש בשפה שמאפשר את זה. אני יודע מה יש בשפת המתמטיקה שמאפשר הגעה לתוצאות, אבל מפתיע אותי לגלות שיש כנראה גם משהו כזה בשפה הטבעית. אבל אני אחכה לקרוא מה כתבת..

(אני עדיין לא יודע אם אפשר להגיע למסקנה שהחשיבה שלנו מכנית גרידא, אני עדיין נותן מקום לאפשרות שיש רכיב מסויים בחשיבה, שבא לידי ביטוי במצבים נדירים ולא בחשיבה שגרתית, שהוא לא מכני. אבל אין לי בסיס של ממש לטענה הזו מלבד החוויה השונה – יש הבדל בתחושה בין תובנה שמגיעה אחרי חשיבה מסודרת לבין תובנה שמגיעה מתוך השראה, אולי קצת כמו ההבדל בין מדע תקני ושינוי פרדיגמה אצל קון. אבל כמובן שיתכן שזו רק הרגשה אחרת ובעצם מדובר על מנגנון מכני לא מודע).

מיכי צוות הגיב לפני 4 שעות

אני לא רואה את זה כתכונה של השפה. מדובר בתוכן שהשפה מייצגת. התוכנה של ה-AI מאומנת על תכנים. זה שהיא מטמיעה ומעבדת אותם דרך שפה, זה נכון גם לגבינו. השפה מבטאת תכנים והקורלציות בין מילים אינן תכונה של השפה אלא של טקסטים שמבטאים תכנים ומשתמשים בשפה. התוכנה לא מגיעה לתשובותיה דרך שיקולי תחביר אלא דרך קורלציות בין מילים, ואלו נקבעות על ידי התכנים (בטקסטים האנושיים שעליהם מאמנים את המודלים).
צא וחשוב, אם היית מאמן את המודל על טקססטים שבנויים נכון תחבירית אבל מבטאים תכנים שגויים וטיפשיים, היית מקבל תוצאות שלא שוות כלום. ומכאן שמה שקובע הוא התוכן (שמבוטא בשפה) ולא המבנה הלשוני והשפה כשלעצמה.
כאמור, לשאלת החשיבה המכנית אגיע בטור הרביעי.

חד גדיא הגיב לפני 4 שעות

בשולי הדיון הזה ואולי כנספח אליו עם השלכות מסויימות: האם אדם שדובר בשתי שפות או יותר, כאשר אותו הגיג יעלה בדעתו בשפה אחת, הוא יהיה זהה – מבחינה תודעתית – לאותו הגיג בשפה אחרת. האינטואיציה אומרת לי שלא.

מיכי צוות הגיב לפני 2 שעות

לא הבנתי את השאלה. אתה שואל האם החשיבה שלנו נעשית בשפה או הרעיונות עצמם? מקובל לחשוב שזו מחלוקת תוס' והרשב"א, אבל מסברה ברור שאנחנו בד"כ חושבים בשפה אבל אני מניח שאפשר גם בלי שפה. ראה בסדרה מטור 379 והלאה.

השאר תגובה

Back to top button