אחד הנושאים הטכנולוגיים ה"חמים" ביותר בעידן הנוכחי מוכר בשם בינה מלאכותית – למידת מכונה בפי אנשי המקצוע. השימוש בכלי בינה מלאכותית נפוץ מאוד ובתחומים מסוימים אפילו שכיח ושקוף עבור משתמש הקצה בטכנולוגיה. רוב ה"קסם" נעשה מאחורי הקלעים.
המודלים הנפוצים ביותר של בינה מלאכותית רושמים הצלחה לא מבוטלת בחיזוי תוצאות על סמך נתונים. כלומר, בהתבסס על נתונים קיימים שהאלגוריתם "למד" (ובשפת אנשי המקצוע "התאמן" עליהם), הוא יכול להפיק תחזית. אבל מערכות בינה מלאכותית מתקשות בבואן להשיב על השאלה: "איך התוצאה הייתה משתנה אם הייתי בוחר לעשות כך או אחרת?". זהו תחום המחקר המרתק הנקרא "הסקה סיבתית" (Causal Inference) – היכולת של מערכות לומדות להבין אילו משתנים ישנו את התוצאה החזויה.
2 צפייה בגלריה
הדמיה
הדמיה
הדמיה
(צילום: shutterstock)
קיימים לא מעט מחקרים מדעיים בתחומים שונים – מרפואה ועד חקלאות - שהתמודדו עם הקושי הזה. למשל, מחקר שבחן אילו מבין התרופות שנותנים לחולי פרקינסון עבור מחלות אחרות בעצם עוזרות לטיפול בפרקינסון; או מחקר שבחן איזו תרופות ביולוגיות עבור שיגרון פרקים גורמות לתופעות לוואי כמו אנמיה, שבץ, או התקפי לב; מחקרים אחרים שבוצעו לאחרונה בדקו האם שינויים בשיטות ההשקיה בשדות משפיעים על כמות המזהמים שנשפכים במי ההשקיה העודפים או עד כמה החלטות הממשלה - על סגר, סגירת בתי ספר, ודומה - משפיעים על ההגעה לבדיקות סקר שגרתיות.
מחקר אחד, שבחן האם יש שימושים חלופיים לתרופות המיועדות לטיפול במחלות מסוימות, אף הוביל לתוצאה שחורגת מהשדה המדעי. המחקר בוצע בארה"ב, שם ישנן כיום למעלה מ-20 אלף תרופות המאושרות לשיווק. חוקרים של IBM יישמו את סט הכלים של הסקה סיבתית כדי לבנות מודלים ממוחשבים המחקים את התהליך של ניסויים קליניים שלא נעשו בפועל כדי לבדוק האם תרופות וטיפולים קיימים משפיעים על שימושים שעבורם הן לא נבדקו מעולם. התוצאה הייתה גילוי של שני טיפולים פוטנציאליים חדשים לדמנציה המלווים בדרך כלל את מחלת פרקינסון.

האם אכילת חביתה בבוקר תשפיע על ביצועי הריצה שלי?

איך בעצם עובדת הסקה סיבתית: כשבני אדם צריכים לקבל החלטה מושכלת הם צריכים להבין מה ישפיע על התוצאה הצפויה. בחיי היום-יום אנחנו עושים זאת מתוך הניסיון האישי שלנו. אבל מה קורה כאשר אנחנו צריכים להחליט לגבי משהו שחדש לנו, או משהו שקורה לעיתים נדירות? במקרה כזה אנחנו צריכים ללמוד מניסיונם של אחרים. זה למעשה מה שעושים מודלים של הסקה סיבתית: הם משתמשים בכלים שיכולים ללמוד מתוך התוצאות שקרו להרבה אנשים כדי לחזות מה תהיה ההשפעה של כל החלטה.
הנה ניסוי היפותטי שמדגים את האתגר. נשאלת השאלה: "האם כדאי לי לאכול ביצים לארוחת בוקר?" כדי לענות צריך ראשית להחליט מה היא התוצאה שאנו רוצים למדוד. האם את ההשפעה על ציונים בבית הספר? את הסיכוי ללקות בהתקף לב? את הביצועים בספורט? עבור כל אדם השאלה עשויה להיות שונה, ועבור כל אחת מהשאלות התשובה עשויה להיות שונה.
נאמר שנרצה להתמקד בהשפעה של אכילת ביצים בבוקר על ביצועים בספורט, ונניח שיש לנו מסד נתונים על הרגלי ארוחת הבוקר של הרבה אנשים ומה הייתה התוצאה שלהם בריצת 2000 מטר. בנוסף מדדו הרבה פרמטרים אחרים על ההיסטוריה של אותם אנשים, כמו פעילות ספורטיבית אחרת, שעות השינה, מצב בריאותי, סטטוס עישון, גיל, מין, וכדומה.
למידת מכונה "קלאסית" יודעת לקחת נתונים כאלה ולבנות מודלים שיחזו את התוצאה בהינתן כל הנתונים של כל אדם – כלומר מי צפוי לרוץ הכי מהר. הבעיה היא שלמידת מכונה קלאסית לא יכולה להתמודד עם מקרים שבהם יש נתון שמשפיע גם על התוצאה וגם על ההחלטה. למשל, מה יקרה אם אנשים שנוהגים לרוץ בערב קמים רעבים בבוקר ואוכלים יותר ביצים? סביר להניח שאלה שרצים הם גם בכושר יותר טוב ולכן הם ישיגו תוצאות טובות יותר בריצת ה-2000 מטר בכל מקרה. למודל קשה להפריד בין ההשפעה של אכילת ביצים בבוקר לבין ההשפעה של אנשים שנוטים לרוץ בערב ולכן, תחזית המודל הזה על השפעת אכילת הביצים לא תהיה אמינה.
2 צפייה בגלריה
 ישי שמעוני, מנהל הקבוצה ללמידת מכונה לרפואה ומדעי החיים במעבדת המחקר של IBM בחיפה
 ישי שמעוני, מנהל הקבוצה ללמידת מכונה לרפואה ומדעי החיים במעבדת המחקר של IBM בחיפה
ישי שמעוני, מנהל הקבוצה ללמידת מכונה לרפואה ומדעי החיים במעבדת המחקר של IBM בחיפה
(צילום: ענת אברמוב שמעוני)
מודלים של הסקה סיבתית יוכלו במקרה הזה לבחון אילו משתנים פרט לאכילת ביצים ישפיעו על הביצועים בריצת ה-2000 מטר ולבודד אותם כדי שנוכל להגיע באמת למסקנה הדרושה לנו: האם כדאי לי לאכול ביצים בבוקר כדי לשפר את התוצאה בריצת 2000 מטר – וכמובן שאלות אחרות שהן קצת יותר משמעותיות.
עד לשנים האחרונות למדעני נתונים לא היו כלים רבים בהם ניתן לייצר מודלים של הסקה סיבתית. במעבדות המחקר של IBM פיתחנו לאחרונה סט כלים שיאפשר לחוקרים, מפתחים ומדעני נתונים ליישם מודלים שכאלה. היישומים של היכולות הללו בעולם האמיתי יהיו קפיצת מדרגה טכנולוגית משמעותית, שתאפשר לנו לסייע למחשבים לתת לנו תוצאות מהימנות יותר או לסייע לנו לקבל החלטות טובות ומדויקות יותר במחקרים מדעיים בהתחשב במשתנים שסיפקנו למערכת. מערכות בינה מלאכותית מורכבות דומות לעיתים לסוג של קופסאות שחורות, שלא לגמרי ברור מדוע הגיעו למסקנות או סיפקו את ההמלצות שסיפקו. המחקרים בתחום הזה יאפשרו לנו גם להבין יותר טוב מדוע התקבלו ההמלצות או המסקנות שהתקבלו ולתת במדע ובמדענים אמון רב יותר.
הכותב הוא מנהל קבוצת למידה חישובית לרפואה ומדעי החיים במעבדת המחקר של יבמ בחיפה