מחקר מפתיע: מחשבים הצליחו לזהות הומור מדעי במחקרים

בשנים האחרונות נוצרו אלגוריתמים חכמים בתחומים שונים ומגוונים, המאפשרים למכוניות לנוע ללא נהג, לנקות את הבית, לצייר תמונות, להלחין מוזיקה ואפילו לשחק עצמאית במשחקי מחשב (כחול עמוק, למשל). אולם, ללמד מחשבים להבין, ליצור ולפענח הומור אנושי, או אפילו להתקרב לכך, נראים עדיין כמשימות בלתי אפשריות. מחקר חדש שבוצע בהובלת חוקרים מהאוניברסיטה העברית – פרופ' דפנה שחף, חן שני ונדב בורנשטיין מביה"ס להנדסה ולמדעי המחשב וממרכז אדמונד ולילי ספרא למדעי המוח (ELSC) - ביקש לפתור תת-בעיה בתחום ההומור החישובי, ולבחון האם מחשבים יכולים לזהות אוטומטית הישגים מדעיים מצחיקים, משעשעים וחריגים. המחקר יוצג במסגרת כנס ACL לעיבוד שפה טבעית ובלשנות חישובית שיתקיים בחודש הבא.
פרסי איג נובל 2019

"בעבודה זו אנו מציגים משימה חדשה לזיהוי הומור - זיהוי תרומות מדעיות משונות ומצחיקות. אנו שואבים השראה מפרס 'איג נובל' (Ig Nobel), פרס סאטירי המוענק מדי שנה לעשרה הישגים מדעיים ש'תחילה אמורים להצחיק אנשים ואז גורמים להם לחשוב', אמרו החוקרים. "בין הזוכים בעבר באיג נובל נכללו מאמרים תחת הכותרות: 'תרנגולות מעדיפות בני אדם יפים' ו'יופי הוא בעיני מחזיק הבירה: אנשים שחושבים שהם שיכורים מאמינים שהם גם מושכים'. מאמרים שזכו בפרס איג נובל מספקים נקודת מבט ייחודית על הומור. מצד אחד, ההומור מתוחכם, דורש מחשבה, כמו גם ידע והבנה מיוחדים של התרבות המדעית. מצד שני, לעתים קרובות, ניתן לאפיין אותם כמצחיקים דרך הכותרת בלבד, שהיא קצרה, עם תחביר פשוט וללא מבנה נרטיבי מורכב (בניגוד לבדיחות ארוכות יותר). לכן הם מקרה מבחן מעניין", הו.
החוקרת חן שני הוסיפה בהקשר זה כי "הומור הוא תחום לא מוגדר ומגוון. הרבה פעמים אנחנו אפילו לא מצליחים להבין מה הופך משהו למצחיק, או לא מסכימים על האם הוא מצחיק בכלל. איג נובל מאפשר לנו לבחון הומור מתוחכם ועדין (מדעי). עוד סיבה לחקור הומור במדע היא שהוא קשור מאוד ליצירתיות וחדשנות - לפעמים המאמרים המוזרים מציעים נקודות מבט חדשות שיכולות להוביל לפריצות דרך. למשל, אנדריי גיים זכה באיג נובל לפיזיקה על שימוש במגנטים בשביל לגרום לצפרדעים לרחף. לאחר עשור הוא זכה בפרס נובל לפיזיקה, כשוועדת פרס הנובל ספציפית ייחסה את הפרס להשתעשעות שלו במדע".
החוקרים יצרו בסיס נתונים ראשון מסוגו המכיל כותרות של מאמרים מדעיים מצחיקים. הם אספו 211 מאמרים שזכו ב-איג נובל ועוד 1,496 מאמרים הומוריסטייים שאיתרו באינטרנט (בעיקר בפורומים ובלוגים מקוונים). בנוסף, נדגמו גם דוגמאות למאמרים לא מצחיקים (מדגם אקראי של 1,707 פרסומים שונים). לאחר מכן הם סיווגו כל מאמר לאחד מהתחומים המדעיים הבאים: מדעי המוח, רפואה, ביולוגיה או מדעים מדויקים. לאחר מכן, החוקרים בנו מודל שמחבר בין למידת מכונה (machine learning) לבין תובנות מספרות חקר ההומור (פסיכולוגיה, בלשנות ועוד).
2 צפייה בגלריה 
פרופ' דפנה שחף, האוניברסיטה העברית
(צילום: נתי שוחט, פלאש 90, עבור האוניברסיטה העברית.)
לאחר סקירת הספרות, החוקרים בחרו להתמקד בארבעה אלמנטים עיקריים: (1) אלמנט ההפתעה - החוקרים אימנו מודלי שפה כדי לייצר למחשב ציפיות לגבי נושאים רגילים למחקר מדעי; (2) פשטות – החוקרים ציינו במאמרם כי "אנו משערים שכותרות של מאמרים מצחיקים נוטות להיות פשוטות יותר", ולכן חושבו אורכי כותרות ואורכי מילים. כמו כן, החוקרים השתמשו במדדים שונים לקושי של שפה, למשל הגיל שבו ילדים רוכשים מילה מסוימת ("כלב" לעומת "פוטוסינתזה"); (3) שפה גסה - האלגוריתם מנסה לחזות את מידת הבוטות של המחקר; (4) שפה מצחיקה – משום ששימוש במילים מצחיקות יכול לרמוז כי המאמר המכיל אותן משעשע. משתנה זה נבדק על ידי כמה מדדים, אחד מהם הוא אלגוריתם שהחוקרים אימנו לזיהוי בדיחות קצרות (one-liners).
בסופו של התהליך, אומרים החוקרים, המודל האלגוריתמי קיבל כקלט כותרות של מאמרים מדעיים והוציא כפלט ציון בינארי (מצחיק/רציני), ורמת ביטחון בציון הזה. לטענת החוקרים, על פי רמת הביטחון של המודל ניתן למיין מיליוני מאמרים לפי רמת "המצחיקות" שלהם, "כלומר, כמה המודל שלנו חושב שהמחקר המתואר במאמר מצחיק. בהינתן כותרת של מאמר אנחנו יכולים להעריך, דרך האלגוריתם, אם הוא מצחיק ובאיזו סבירות", מסבירים החוקרים. כדי להעריך את האלגוריתם, החוקרים ערכו ניסוי מחוץ לבסיס הנתונים המקורי שלהם, וזיהו תכנים מצחיקים בתוך מאגר בהיקף של מעל 600 אלף מאמרים. כלומר, המודל האלגוריתמי שלהם הצליח להציף מאמרים מצחיקים כמועמדים רלוונטים לפרס האיג נובל.
אבל לא הכול הלך חלק. לדברי החוקרים, הקושי ביצירת האלגוריתם היה ב"תרגום" ספרות לא-חישובית, שמגיעה מתחומים כמו פסיכולוגיה, פילוסופיה ובלשנות, למדדים מוגדרים שניתן לזהות בעזרת מחשב. למשל, יצירת ציפיות הצריך יצירתיות רבה, שכן אלה דברים שמאוד ברורים לנו כבני אדם (וכחוקרים), אבל מאוד לא טריוויאלים עבור מחשב. למרות הקשיים, תוצאות המחקר היו מרשימות. דוגמאות שהאלגוריתם המליץ עליהן, היו, למשל: מאמר ממדעי המוח על האם אנו מקרבים את האוכל אל הפה או את הפה אל האוכל; מאמר ממחקר על קופים שבודק האם שימפנזה ננסי אומר "לא" על ידי נענוע הראש; ומאמר מפסיכולוגיה שחקר למה ובאילו מצבים אנשים משקרים באינטרנט (למשל, יותר באתרי היכרות מאשר ברשתות חברתיות). המחקרים המשעשעים ביותר, אם תהיתם, הגיעו מתחום הפסיכולוגיה.
2 צפייה בגלריה 
מקרבים את הפה אל האוכל או את האוכל לפה?
(צילום: shutterstock)
הפתעה נוספת של החוקרים הייתה שנמצאו יותר מאמרים מצחיקים במדעי החברה ורפואה לעומת מדעים מדויקים. "אנו שמים לב שרוב המאמרים המסווגים על ידי המודל שלנו כמצחיקים שייכים למדעי החברה ("כלבים יכולים להבחין בפרצופים אנושיים מחייכים דרך ביטויים סתמיים") או לרפואה ("האם קופים יכולים לספר לנו על אמנזיה אנושית כשלמעשה אינם יכולים לדבר כלל?"), בהשוואה למדעים מדויקים ("קינמטיקה של אכילה עם כפית - להביא את האוכל לפה, או את הפה לאוכל?"). אנו מאמינים שזה קורה כי לעתים קרובות מדעי החברה ועולם הרפואה מציגים נושאים המוכרים יותר להדיוטות (הכותרות נכתבות בהתאם)", נכתב במאמר.
פרופ' דפנה שחף וחן שני סיכמו: "הומור זאת תופעה מאוד מסובכת ומגוונת, תלויית הקשר, אדם ותרבות. מחשבים שיודעים להתמודד עם הומור על כל גווניו זה עניין ששייך כרגע לעולמות המדע הבדיוני, אבל הם מסוגלים להתמודד כיום באופן לא רע עם משימות ספציפיות, כמו זאת שהצגנו במחקר הנוכחי. בנוסף למטרה המקורית שלנו (מציאת מועמדים לאיג נובל), היכולת לזהות מאמרים משעשעים נותנת לנו זווית חדשה ומעניינת לשאלות של חקר המדע (Science of Science). למשל, באיזה שלב של הקריירה חוקרים נוטים לבצע מחקר יותר חריג ומשעשע, האם מחקר כזה מקבל יותר חשיפה, ועוד".
לקריאה נוספת על עבודותיה המדעיות ומחקריה של פרופ' שחף