איך זה מרגיש לתכנן רובוט שמבין אותך?
וכמה רחוק הבינה המלאכותית עוד יכולה לקחת אותנו? גידי שפרוט מראיין את ד"ר רעות צרפתי
בשיתוף LG
כשעשיתי דוקטורט בבלשנות חישובית ההורים שלי קצת דאגו. זה לא היה לפני הרבה זמן, אבל אף אחד עוד לא הבין למה זה טוב. לטלפון הסלולרי שהיה לי אז עוד היו מקשים מפלסטיק וכשכתבתי הודעה המכשיר היה מנסה לנחש את המילה שאני מקלידה – זה סוג קדום ובסיסי של למידה - כבר אז המכשיר ידע ללמוד ולחזות על סמך מודל סטטיסטי אילו מילים להציע לי אחרי שכתבתי מילים אחרות. כשהייתי כותבת "בוקר" הוא היה מציע לי "טוב" וכן הלאה. הדברים שאנחנו יודעים לעשות היום הרבה יותר מורכבים כמובן, אבל חיזוי המילה הבאה זה עדיין השיעור הראשון בעיבוד שפה טבעית.
זו אמנם משימה בסיסית, אבל לבינה המלאכותית יש עוד הרבה מה להשתפר בה. לעומת זאת, בני אדם לא צריכים לחשוב הרבה כדי לנחש נכון את המילה הבאה. כמובן שאפשר ליצור סביבה עמומה ומבלבלת גם לבן האנוש, אבל אם ניתן לו את ההקשר הנכון, הניחוש יהיה מדויק. כדוגמה אפשר לקחת את המשפט "חולצה מטיילת בוואדי". האם יש פה פריט לבוש שיצא לטיול או שזה דיווח על חילוץ של מטיילת מוואדי כלשהו? מספיק שנוסיף מילה כדי לדעת בדיוק מה הייתה כוונת המשורר: "חולצה מטיילת שנפצעה בוואדי" מיד שם אותנו על המשמעות המדויקת.
מה שאני עושה בחיים זה לפתח מודלים שמלמדים את המחשב לרכוש, להבין ולייצר שפה אנושית. זו למעשה החזית של עולם הבינה המלאכותית. לראות מודל שיצרתי לומד בעצמו ומיישם חוקים של השפה שאפילו לא חשבתי ללמד אותו - זה מרגש ומסעיר. זו התשוקה הגדולה שלי. בינה מלאכותית לא מסתכמת רק בהבנת שפה. יש רובוטיקה ומכוניות אוטונומיות ועוד המון תחומים. אבל היכולת להביע ולהבין באמצעות שפה היא התחום שבו בני האדם נחשבים לטובים יותר מכל השאר, זה "מותר האדם מן הבהמה". ליצור תוכנה שתציג יכולת תבונית כזאת באופן אמין, זה הבסיס לכל השאר.
הגעתי לתחום אחרי שכבר למדתי מדעי המחשב ועבדתי בהיי־טק. המשכתי ללימודי תואר שני בלוגיקה וכשלקחתי קורס בסמנטיקה גיליתי את העולם המרתק של הנוסחאות שמהן בנויה השפה. בקורס כל הזמן דיברו על אנגלית ואני רציתי לבדוק אם הנוסחאות והמודלים יעבדו גם בעברית. יש המון מחקרים שעוסקים באנגלית ובערבית ובסינית, אבל העברית היא שפה שנמצאת בשימוש אצל כמות קטנה של אנשים ולכן נחקרה פחות. ההבדל בינה לבין אנגלית לדוגמה הוא גדול, וזה לא רק כיוון הכתיבה: באנגלית אין בניינים כמו פעל, פיעל והתפעל ולא חייבת להיות התאמה בין יחיד־רבים וזכר־נקבה. התזה בתואר השני שלי שילבה את בעיית הבניינים בעברית לנוסחה שתעבוד עם מודלים שיודעים להבין אנגלית.
מאז לקחתי כשליחות את הנושא של הבנת העברית. בדוקטורט בניתי מודל שמנתח במקביל את מבנה המילה ואת תפקידה במשפט. המודל יודע לחלק משפט למילים, לפרק כל מילה ולהסביר את החלקים שלה ובמקביל לזהות את התפקיד של כל אחת מהמילים במשפט - מה הנושא, מה הפועל, מה התיאור מה שם העצם. והוא לא מוגבל רק לעברית - זה מודל שמסוגל ללמוד ולנתח כל שפה.
אם נדמה את העניין לבניה בלגו – אני מבקשת מהתוכנה לבנות בית מלגו, הקירות הם לבנים, הגג אדום, החלונות ירוקים. כדי לעשות את זה התוכנה צריכה להביא את אבני הלגו, למיין אותן לצבעים ואז להניח כל אחת במקומה לפי איזשהו סדר. אבל אם הייתי מבקשת מילד לבנות את הבית מלגו הוא היה מדלג על שלב המיון, בוחר בכל פעם את האבן הנכונה מהערימה ומניח אותה במקום. זה בדיוק מה שאני מצפה מהמודלים שעליהם אני עובדת – אני רוצה שהם ילמדו לבצע משימות מורכבות בבת אחת, כמו בני אדם.
התחום שאני חוקרת בימים אלו מנסה לעזור לאנשים שהם לא מתכנתים ליצור תוכנות מחשב באמצעות השפה המדוברת. הרי כולנו מתכנתים כל הזמן - להסביר למישהו בטלפון איך להכין פנקייק זה לא שונה מליצור תוכנה. נניח שמישהו רוצה לפתח אפליקציה שבלחיצה על כפתור תהפוך את מסך המחשב לירוק ותוסיף כיתוב שאומר 'שלום' - מה שצריך לעשות זה לפנות למתכנת בשפה כמו ג'אווה או פייטון, לספר לו על הרעיון ולתת לו כמה ימים כדי שהוא יתרגם את החזון למשהו שמחשב יבין. אני רוצה שהאיש עם הרעיון יוכל לכתוב בשפה יומיומית מה המחשב אמור לעשות, והמחשב יתרגם את הבקשה בעצמו. במילים אחרות, אם יש תרגום אוטומטי מעברית לאנגלית, איך זה שעדיין אין תרגום מעברית לשפות שבהן מתכנתים? יחד עם צוות המעבדה שלי באוניברסיטה הפתוחה וצוות ממכון וייצמן הוכחנו שזה יכול לעבוד. עכשיו אנחנו מתמקדים בלגרום לזה לעבוד טוב.
לתרגום משפה מדוברת לשפת מכונה יש הרבה יישומים: אתה יכול להגיד לשעון המעורר בטלפון שלך שיעיר אותך בכל יום בשש וחצי בבוקר חוץ מיום שבת וחוץ מיום שלישי בשבוע הבא כי אז אתה רוצה להתעורר בחמש כדי להספיק לטיסה. כיום אתה צריך להגדיר בשעון כל אחד מהימים או את כל הימים ואז להחריג את שבת ואת יום שלישי הבא. למה לא לדבר את זה אל המכשיר וזהו?
חלקים גדולים מהתחום הזה היו שייכים פעם לחוג לפילוסופיה או לעולמות תיאורטיים בלבד, ועם הזמן הפכו לחלק מהמציאות שלנו. אנחנו כבר רגילים לכלים כמו ווייז או לכל מיני עזרי ניווט שיש היום ברכב והם מוצאים בשבילנו את הדרך. אבל מה קורה כשמישהו אומר לך בעל פה איך להגיע אליו: "כשאתה מגיע לקיבוץ תפנה שמאלה אחרי השער ואז אחרי שני פסי האטה תפנה ימינה, אני מאחורי המכבסה". זו כבר לא נקודה על מפה. אנחנו עובדים עכשיו על מודל שיודע להגיע ליעד על סמך הוראות הגעה בעל פה. אבל זה לא מספיק. אם נשתול את האלגוריתם הזה ברובוט ונשלח אותו מנקודה א' לנקודה ב' והוא יתקע בדרך בקיר, אני רוצה שהוא ילמד לא לחזור על הטעות הזאת בלי שאני אצטרך להגיד לו. ואז אני רוצה שהוא ילמד שחציה של רמזור באור אדום זו טעות ונפילה לבור זו טעות – המטרה היא שהרובוט ילמד לבד להימנע מטעויות באמצעות כל מה שקורה סביבו.
זה נשמע כמו מדע בדיוני, אבל באמת שזה רק מדע. שנים של מחקרים וניסויים שיש בהם גם תקופות מייאשות ורגעים מתסכלים. העבודה הקשה מושקעת בשכבה שמשתמש הקצה לא רואה, לא מודע אליה. זה כמו קסם - אם האלגוריתם לא כתוב טוב אז אי אפשר לעשות את הקסם הזה, אם הוא עובד מצוין אז בכלל לא מבחינים בו והוא נלקח כמובן מאליו.
ד"ר רעות צרפתי. מרצה וחוקרת במחלקה למדעי המחשב באוניברסיטה הפתוחה, ראש המעבדה לעיבוד שפות טבעיות ובינה מלאכותית
הכתבה פורסמה ב-powered by
בשיתוף LG