סיפורו של פרויקט Cyc, החלום השאפתני ביותר בתולדות הבינה המלאכותית
- גור זיו
- לפני 4 שעות
- זמן קריאה 5 דקות
מה משותף לכל תוכנות הבינה המלאכותית המבריקות של ימינו? כולן היו נכשלות במבחן של ילד בן 5. במשך 40 שנה, מדען אחד ניסה ללמד מחשב את כל מה שמובן מאליו: שאי אפשר לקפל מים, ושאמהות מבוגרות מילדיהן. זהו סיפורו של פרויקט Cyc, הניסיון השאפתני, המבריק והעצוב ביותר בתולדות הבינה המלאכותית.
בשנת 1984, העולם היה מקום אחר. מחשבים אישיים היו קופסאות מגושמות, האינטרנט היה רשת אזוטרית לאקדמאים, והרעיון שמכונה תוכל לצייר, לכתוב שירה או לנהל שיחה נראה כמו מדע בדיוני טהור. אך בתוך העולם הזה, חוקר צעיר ומבריק בשם דאגלס "דאג" לנאט (Douglas "Doug" Lenat) החליט לצאת למסע שהיה שאפתני אפילו במונחים של מדע בדיוני. הוא לא רצה לבנות עוד תוכנת שחמט או מערכת מומחה צרה. הוא רצה לפתור את הבעיה הקשה והחמקמקה ביותר בתולדות הבינה המלאכותית: בעיית ההיגיון הבריא. לנאט הבין שמכונה שלמדה את כל חוקי הפיזיקה עדיין תהיה טיפשה להפליא אם לא תדע שאמא מבוגרת מהבת שלה, שאי אפשר לקפל מים, או שכשמישהו בוכה הוא כנראה עצוב. הוא יצא למסע מונומנטלי שיימשך ארבעים שנה - הניסיון לבנות מוח למחשב, אקסיומה אחר אקסיומה. זהו סיפורו של פרויקט Cyc, החלום הגדול ביותר והכישלון המפואר ביותר בתולדות הבינה המלאכותית.

כדי להבין את גודל השאיפה של לנאט, צריך לחזור לגישה ששלטה בבינה המלאכותית באותה תקופה, גישה המכונה כיום "בינה מלאכותית סמלית" (Symbolic AI). הרעיון היה פשוט ואלגנטי: אם חשיבה היא בסופו של דבר סוג של מניפולציה לוגית על סמלים, אז כל מה שאנחנו צריכים לעשות כדי ליצור מכונה חושבת הוא למפות את כל הידע האנושי לשפה לוגית פורמלית, ולתת למחשב להסיק מסקנות. לנאט הביט סביבו וראה ש"צוואר הבקבוק", כפי שכינה זאת, אינו כוח החישוב של המחשבים. "צוואר הבקבוק הוא רכישת הידע", אמר בראיון מאותה תקופה. הוא הבין שמומחה אנושי, רופא למשל, אינו מגיע לאבחנה רק על סמך הידע הרפואי שלו. הוא מגיע אליה בזכות מאגר עצום ובלתי נראה של ידע יומיומי על העולם, אותו "היגיון בריא" שכולנו רוכשים בלי לשים לב. "המטרה של Cyc", הסביר, "היא למעשה לבנות בסיס ידע רחב של היגיון בריא שיאפשר לתוכנות להיות פחות שבירות, להבין את ההקשר של מה שהמשתמש אומר".
וכך, ב-1984, במעבדות התאגיד MCC באוסטין, טקסס, לנאט החל במשימה שנראתה כמעט מטורפת: הוא וצוותו החלו להזין למחשב, באופן ידני, את כל הידע המובן מאליו של האנושות. הם לא השתמשו בנתונים סטטיסטיים או באלגוריתמים של למידה. הם פשוט ישבו וכתבו. הם פיתחו שפה לוגית ייעודית, CycL, ובעזרתה החלו למפות את העולם. הם הגדירו מהו "כיסא", ומה ההבדל בינו לבין "רהיט". הם כתבו את הכלל הלוגי שאם ישות A נמצאת בתוך ישות B, וישות B נמצאת בתוך ישות C, אזי ישות A נמצאת בתוך ישות C. הם הזינו את העובדה הפשוטה שלבני אדם יש רק ראש אחד, ושמים נוטים לזרום למטה. מיליוני עובדות, כללים, קשרים והיסקים, כאלה שאף אחד מעולם לא טרח לכתוב כי הם היו מובנים מאליהם.
העבודה הייתה סיזיפית ואיטית להחריד. הצוות, שהורכב מ"מהנדסי ידע" - פילוסופים, בלשנים ומומחי מחשב - היה נתקל בשאלות פילוסופיות עמוקות על בסיס יומי. איך מגדירים "אהבה" באופן לוגי? מה ההבדל בין "להאמין" למשהו לבין "לדעת" משהו? הפרויקט הפך לחקירה אפיסטמולוגית ענקית על טבע הידע האנושי. כעבור עשור, ב-1994, הפרויקט הפך לחברה עצמאית בשם Cycorp, ולנאט המשיך להוביל אותה באותה נחישות. הוא האמין שאחרי שיזינו מסה קריטית של כ-100 מיליון כללים, Cyc יגיע לנקודת המפנה, ויוכל להתחיל ללמוד בעצמו על ידי קריאת טקסטים, בדיוק כמו ילד שמגיע לבית הספר עם בסיס ידע מהבית. הנקודה הזו, כך האמין, הייתה במרחק של כמה שנים ספורות.
אך השנים חלפו, ונקודת המפנה לא הגיעה. בינתיים, עולם הבינה המלאכותית עבר מהפכה שקטה שהלכה והתעצמה. גישה חדשה, המבוססת על רשתות נוירונים ולמידה עמוקה, החלה לצבור תאוצה. הגישה הזו זנחה לחלוטין את הניסיון ללמד את המחשב כללים לוגיים. במקום זאת, היא נתנה למחשב כמויות אדירות של נתונים - מיליוני תמונות, מיליארדי משפטים - ונתנה לאלגוריתם "ללמוד" את הדפוסים הסטטיסטיים בעצמו. הגישה הזו לא "הבינה" דבר במובן האנושי, אבל היא הצליחה להשיג תוצאות מדהימות בזיהוי תמונות, בתרגום שפות, ובמשחקים מורכבים. בעוד לנאט והצוות שלו המשיכו להקליד בסבלנות אין קץ את העובדה ש"אי אפשר לעמוד על תקרה", מודלים כמו אלו של גוגל ופייסבוק למדו לזהות חתולים בסרטוני יוטיוב בדיוק של 99%.
הפרויקט של לנאט, שפעם נחשב לחזית המחקר, הפך בהדרגה לבדיחה, לאנקדוטה היסטורית על גישה נאיבית ויהירה. הוא נתפס כפיל לבן, פרויקט זומבי שממשיך להתקיים במנותק מהמציאות המדעית. ובכל זאת, לנאט לא ויתר. הוא המשיך להאמין בעליונות של גישתו, וטען שהמהפכה של הלמידה העמוקה היא אשליה. "כמעט כל העבודה בבינה המלאכותית כיום היא למידת מכונה המבוססת על ביג דאטה", אמר בראיון נוקב למגזין Wired בשנת 2019, שנים ספורות לפני מותו. "זה מרשים מאד, אבל זה עדיין מתאם סטטיסטי. זו לא הבנה. יש הבדל גדול בין מתאם לסיבתיות. מערכות למידת מכונה עושות את הראשון. אנחנו [ב-Cyc] מנסים לעשות את השני".

לנאט צדק, כמובן. מודלי השפה הגדולים של ימינו, על אף יכולותיהם המרשימות, עדיין חסרים היגיון בריא בסיסי. הם יכולים לכתוב מאמר מורכב על פיזיקה קוונטית, אבל אז להיכשל בשאלה פשוטה כמו "אם אשים שני גרביים במגירה, ואז אוסיף עוד שניים, כמה גרביים יהיו לי?". הם אינם מבינים את העולם, אלא רק מחקים את התבניות בשפה שמתארת אותו. הם עדיין שבירים, ונוטים להמציא "הזיות" בדיוק מהסיבה שלנאט זיהה לפני 40 שנה: אין להם מודל פנימי של איך העולם עובד.
אז האם פרויקט Cyc היה כישלון? התשובה, כמו הפרויקט עצמו, מורכבת. אם המטרה הייתה ליצור בינה מלאכותית כללית שתחשוב כמו אדם, התשובה היא כן, כישלון מהדהד. המשימה של מיפוי כל הידע האנושי התגלתה כאינסופית, והגישה הסמלית התקשתה להתמודד עם העמימות והגמישות של המציאות. אך אם מסתכלים על הפרויקט כניסוי המדעי הארוך והמעמיק ביותר שנעשה אי פעם על טבע הידע, הוא הצלחה מסחררת. במשך ארבעה עשורים, לנאט וצוותו התמודדו עם השאלות הפילוסופיות הקשות ביותר: מה זה אומר "לדעת"? מהם אבני היסוד הבסיסיות של המחשבה? מהו המידע המינימלי שצריך כדי להבין סיפור פשוט? במידה רבה, הם יצרו את "פרויקט הגנום האנושי" של המחשבה.
דאגלס לנאט נפטר באוגוסט 2023, והותיר אחריו את בסיס הידע המונומנטלי שבנה. הוא לא זכה לראות את חזונו מתגשם, אך הוא הותיר אחריו מורשת של שאפתנות אינטלקטואלית חסרת פשרות. כיום, כשעולם הבינה המלאכותית מתחיל להכיר במגבלות של הלמידה העמוקה ומחפש דרכים לשלב אותה עם מודלים של היגיון וסיבתיות, יש החוזרים להביט בעבודתו של לנאט. אולי, הם אומרים, התשובה אינה "או זה או זה", אלא שילוב של שתי הגישות. אולי המודלים הסטטיסטיים צריכים את "שלד" ההיגיון הבריא של Cyc כדי להפוך למשהו שבאמת מבין את העולם.
סיפורו של פרויקט Cyc הוא סיפור טרגי על איש שהקדים את זמנו, או שאולי פשוט בחר בדרך הלא נכונה להגיע אל אותו יעד נכסף. זהו סיפור על בדידותו של הגאון, על אדם שהמשיך לבנות קתדרלה של היגיון, לבנה אחר לבנה, בזמן שכולם סביבו כבר עברו לבנות גורדי שחקים מנתונים. וזהו, אולי, הלקח החשוב ביותר: הדרך ליצירת תודעה מלאכותית ארוכה ומסובכת משחשבנו, והיא דורשת לא רק אלגוריתמים מתוחכמים, אלא גם הבנה עמוקה של הדבר הפשוט והמסובך ביותר ביקום - ההיגיון הבריא של ילד בן חמש.
מקורות:








