מה חסר למחשב? אינטואיציה אנושית
לאריסטידס, נער בן 13 מארה"ב, היה רק הסבר פשוט אחד כיצד הצליח למצוא את המבנה האופטימלי לחלבון: "זה פשוט נראה נכון". זהו תחום אחד שבו המחשב אינו מצליח להתחרות ביכולת האנושית לתפוש דברים: חסר לו מה שניתן לכנות - אינטואיציה
מאת: ישראל בנימיני
באוגוסט 2008 הופתעו הוריו של אריסטידס פולמן (Poehlman) בן ה-13 ממדינת וירג'יניה כאשר קיבלו הזמנה מפרופסור לביוכימיה למפגש בצדה האחר של ארצות הברית. הסיבה: קבוצת שחקני מחשב בראשותו של בנם (קבוצה שגם ההורים השתתפו בה) סיפקו את הפתרונות הטובים ביותר לסדרת בעיות סבוכות וחשובות בביוכימיה, בלי שהיתה להם כל הכשרה מדעית בנושא.
פרופ' דייויד בייקר (Baker) מאוניברסיטת וושינגטון בסיאטל שלח את ההזמנה כדי ללמוד כיצד אריסטידס והוריו פותרים בעיות של "קיפול חלבונים" – חיזוי המבנה התלת-ממדי של חלבונים לפי סדר חומצות האמינו המרכיבות אותו.
כאשר רואיין לואיס, אביו של אריסטידס, הוא הסביר את השיקולים המתוחכמים שגרמו לו לנסות שיפורים שונים במבנים התלת-ממדיים כדי לזכות ביותר נקודות במשחק. לאריסטידס, ששם הקוד שלו בקהיליית המשחק הוא "Cheese", היה רק הסבר פשוט אחד כיצד הצליח למצוא את הפתרונות הטובים ביותר: "זה פשוט נראה נכון".
ynet מדע: כל הכתבות על ציר הזמן
קפלו אותם!
שמו של משחק המחשב שבו הצטיין אריסטידס הוא Foldit. המשחק מציג לשחקנים מבנים תלת-ממדיים של חלבונים ומאפשר להזיז את חלקיהם השונים ולסובבם כדי לשנות את המבנה. הניקוד נקבע לפי התאמת המבנה שיצר השחקן לדרישות המורכבות של חוקי הביוכימיה, הכוללות את הזוויות המרביות המותרות לפיתול שרשרת חומצות האמינו, כוחות משיכה ודחייה בין חלקים שונים במבנה, נטייתן של כמה מחומצות האמינו להימשך למולקולות מים (הידרופיליות) ולכן "להעדיף" לפנות כלפי החלק החיצוני של החלבון, בעוד אחרות דוחות מים (הידרופוביות) ומתאימות יותר למיקום מרכזי, ועוד.
ככל שהמבנה עומד בצורה טובה יותר בחוקים אלה, האנרגיה של המבנה שנוצר תהיה נמוכה יותר: כמו כדור המונח בראש גבעה ונוטה להתגלגל במורדה, גם חלבון המקופל כך שאנרגיית המבנה שלו גבוהה יעבור בצורה ספונטנית, אם הדבר אפשרי, למבנה שהאנרגיה שלו נמוכה יותר.
לכן, כל שינוי עשוי לשפר עמידה בכמה מהמדדים (למשל, הרחקת חלקים הדוחים זה את זה מורידה את האנרגיה הכללית) תוך כדי פגיעה במדדים אחרים (למשל, אם אותה הרחקה גורמת לפיתול חזק מדי של שרשרת החומצות).
המשחק יוצר חוויית משתמש המזמינה להמשיך ולשחק מתוך הצבעה על אזורים בעיתיים במבנה, ומאפשר לחברי הקבוצה לתקשר ביניהם במהלך המשחק ולשתף פעולה גם כאשר הם נמצאים אלפי קילומטרים זה מזה.
חשיבותו של הקיפול
ל"קיפול חלבונים" – חיזוי המבנה התלת-ממדי שלהם – יש חשיבות גבוהה ביותר בביוכימיה. המבנה התלת-ממדי של החלבונים הוא המאפשר להם לבצע את תפקידיהם, ולכן פענוח המבנה הכרחי כדי להתקדם בחקר תחומים כמו ייצור דלק ביולוגי, אנטיביוטיקה וטיפולים נגד סרטן.
חלבונים הם מולקולות גדולות מאוד, ועשויים להכיל יותר מ-10,000 אטומים, כך שמספר האפשרויות בעבור המיקום היחסי של כל האטומים הוא ענק, מעבר לכל דמיון: אין דרך לבדוק את כל האפשרויות, לחשב בעבור כל אחת מהן את האנרגיה המתקבלת ולבחור את המבנה בעל האנרגיה המזערית ביותר.
אופטימיזציה – חיפוש בתוך מרחבים גדולים של אפשרויות במטרה למצוא אפשרות בעלת המאפיינים הטובים ביותר – היא אחד התחומים שבהם נחלה הבינה המלאכותית את ההישגים המעשיים המרשימים ביותר – בין השאר ביצירת לוחות זמנים למפעלים ולחברות תעופה, בתכנון להבי טורבינות וביצירת אסטרטגיות למשחקים.
לכן אין זה מפתיע כי תוכנות לניבוי מבנה של מולקולות משתמשות בשיטות שפותחו במחקרים בבינה המלאכותית, ואולי היה אפשר לצפות כי גם בתחום זה המחשב, בעזרת יכולתו לבדוק מיליוני צירופים בכל שנייה ובעזרת טכניקות חיפוש מתחום הבינה המלאכותית, יצליח למצוא את הפתרונות הטובים ביותר.
ציפייה זו לא התממשה במלואה: המחשב אינו מצליח להתחרות באינטואיציה האנושית וביכולת האנושית לתפוש יחסים תלת-ממדיים מורכבים – לראות מה צריך לסובב ולהזיז כדי להגיע למבנה ש"פשוט נראה נכון".
הדרך המקובלת לפענח מבנה של חלבון היא בשיטות מעבדתיות, ובייחוד בשיטת הקריסטלוגרפיה בקרני X. לרוע המזל, שיטות אלה יקרות ואיטיות. עד עתה נמצאו בעזרתן המבנים של כ-50,000 חלבונים. מספר זה קטן מאוד בהשוואה לכמות החלבונים העשויים להיות מעניינים בעבור מחקרים מדעיים ובעבור פיתוחים ביו-טכנולוגיים.
כידוע, הקוד הגנטי מכתיב את סדרת חומצות האמינו שמהן מורכב כל חלבון, כך שכל "קריאת הקוד" של יצור כלשהו – חיידק, צמח או אדם – מספקת לנו בעבור עשרות אלפי חלבונים מידע מלא על השרשרת של חומצות אמינו שממנה מורכב כל חלבון.
לאחר שנוצר החלבון, השרשרת "מתקפלת" לצורה בעלת אנרגיה נמוכה (בצורה ספונטנית, או לעתים בעזרת אינטראקציה עם חלבונים אחרים). אף ששרשרות אלה ידועות, תפקידיהם של רוב החלבונים המתגלים בקוד הגנטי אינם ידועים.
הצורה שבה מתקפל החלבון היא אחד הרמזים החשובים ביותר לגילוי התגובות והמערכות הביולוגיות שבהן משתתף אותו חלבון. כמו כן, הבנת המבנה מאפשרת התערבות בפעולתו של החלבון – למשל על-ידי יצירה של מולקולה החוסמת את האתר הפעיל – וכך לפתח טיפולים רפואיים חדשים.
במבחן המציאות
השיטות החישוביות לניבוי מבנה החלבון, עם עזרה אנושית או בלעדיה, אינן מבטיחות את נכונות הניבוי. ראשית, החישוב של אנרגיית מבנה החלבון משתמש בקירובים מסוימים, כך שהתוצאה אינה לגמרי מדויקת.
שנית, מבנה החלבון תלוי בסביבה: לדוגמה, קיימים חלבונים שהמבנה הסופי שלהם מתקבל לאחר אינטראקציה עם חלבונים אחרים. לכן, כדי להיות בטוחים כי המבנה המוצע הוא המבנה האמיתי של החלבון, יש להשוות אותו למבנה שפוענח בשיטות המעבדתיות.
אם יהיה אפשר להגיע לשיטות חישוביות בעלות אמינות גבוהה יותר, הדבר יתרום להאצה של מחקרים ופיתוחים רבים. לשם כך מיועדת תחרות במסגרת CASP (חלק מראשי התיבות של "ניסוי קהילתי בהערכה ביקורתית של טכניקות לניבוי מבנה חלבונים") המתקיימת כל שנתיים.
מארגני התחרות בוחרים חלבונים שאת המבנה שלהם בודקות מעבדות ברחבי העולם, ומעמידות חלבונים אלה כאתגרים לקבוצות המתחרות: ככל שהמבנה שהציעה הקבוצה יהיה קרוב יותר למבנה כפי שהתפענח בפועל, כך זוכה הקבוצה בניקוד גבוה יותר.
כדי לנבא את המבנה, הקבוצות מפעילות שיטות מתמטיות, בדרך כלל בסיוע של תוכנות הדורשות חישובים ארוכים על מחשבי ענק או על רשתות גדולות של מחשבים.
בדצמבר 2008, בכנס ביוכימיה באי סרדיניה שבאיטליה, חיכו כ-300 מדענים במתיחות לתוצאות תחרות זו. בקטגוריה הקשה ביותר ניצחה, כצפוי, קבוצתו של פרופ' דייויד בייקר (Baker) מאוניברסיטת וושינגטון בסיאטל, המובילה בסדרת תחרויות זו מאז 1998. ההפתעה הגדולה היתה מקור ההצלחה.
עד 2008, כלי העבודה העיקרי של קבוצת בייקר היתה תוכנה בשם Rosetta. התוכנה הופעלה על 86,000 מחשבים ברחבי העולם שבעליהם תרמו את זמן החישוב הפנוי שלהם לטובת ההתקדמות המדעית: התוכנה מופעלת כשומר מסך כאשר המחשב אינו בשימוש, ומבצעת חישובים מורכבים כדי לחפש בעבור כל חלבון מבנה תלת-ממדי בעל אנרגיה נמוכה ככל האפשר.
כאשר התוכנה של בייקר בודקת אפשרויות שונות בעבור מבנה החלבון, היא מציגה מודלים תלת-ממדיים של אפשרויות אלה על מסך המחשב. תצוגה זו נוצרה בתחילה כדי לספק עוד מניע לבעלי מחשבים להפעיל את התוכנה: בעשותם כך הם לא רק עוזרים לפתור בעיות חשובות, אלא גם מקבלים תצוגה אסתטית ודינמית באותם רגעים שבהם אינם זקוקים למחשב.
בייקר הופתע לשמוע מכמה מאותם בעלי המחשבים, כי תוך כדי צפייה במבנים השונים שבדקה התוכנה הם התאכזבו לראות כי התוכנה לא ניסתה אפשרויות שהאינטואיציה שלהם זיהתה כמבטיחות. הערות אלה הביאו את בייקר לגייס את מדען המחשב זוראן פופוביץ' (Popović) לפיתוח משחק המחשב Foldit, המאפשר לכל אדם להתנסות ב"קיפול חלבונים", ליצור מבנים תלת-ממדיים ולקבל משוב מהמחשב המעריך עד כמה המבנה שנוצר עונה לדרישות המורכבות של חוקי הביוכימיה.
התאריך האחרון להגשת הפתרונות בתחרות היה ה-28 ליולי 2008 – תאריך שנקבע כך שיקדם לקבלת פיענוחי המבנים מהמעבדות שעסקו בכך. בדקות האחרונות שלפני חצות אותו לילה עדיין נאבקה קבוצתו של Cheese (שמה של הקבוצה: "עוד שעה, עוד נקודה") בקבוצות שחקני Foldit אחרים, וברגע האחרון הביסו קבוצה בראשות מנהל שיווק מצרפת.
מאמציו של Cheese אכן הובילו להכרה בהישגיו ולהזמנתו למפגש עם פרופ' בייקר, אך המבחן האמיתי עדיין היה לפניו: השוואת הפתרונות עם הפענוחים האמיתיים שבוצעו במחצית השנייה של שנת 2008. תוצאות ההשוואה קבעו את תוצאות התחרות שפורסמו בכנס בסרדיניה, והוכיחו כי קבוצתו של הנער בן ה-13 אכן התקרבה מאוד לגילוי המבנים של חלק מהחלבונים שנכללו בתחרות.
רוזטה. 86,000 מחשבים ברחבי העולם (צילום מסך)
אינטואיציה אנושית – המרכיב הסודי?
אם כן, במתכון לקיפול מוצלח יש צורך בשילוב של אינטואיציה אנושית כמדריכה את תהליכי החישוב ובכללם גם את מנגנוני החיפוש – שמקצתם מבוססים על שיטות בינה מלאכותית.
לדוגמה, לאחר שהשחקן שינה את מיקומה של קבוצת אטומים מסוימת או של שרשרת ארוכה של חומצות אמינו, עשוי להיווצר מצב מבטיח אך הדורש שיפור נוסף.
במצב זה משתמשים שחקני Foldit בכלים הנקראים "נענוע" ו-"שקשוק", פעולות המדריכות את המחשב להתחיל מהמצב האחרון שיצר השחקן ולחפש תזוזות ושינויים המקטינים את האנרגיה הכללית של המבנה. התוכנה תמשיך בתהליך של בחינת תזוזות כאלה עד שהשחקן יבחר להפסיקה ולהתערב שוב בתכנון על-ידי הפעלת האינטואיציה שלו.
בייקר אינו מסתפק בהצלחות קבוצתו בתחרות CASP האחרונה. הוא מקווה ללמוד מהשחקנים האנושיים כיצד לשפר את הבינה המלאכותית שבתוך תוכנות ניבוי המבנה התלת-ממדי, ובכך להעניק לתוכנה לפחות מקצת מהאינטואיציה האנושית.
כיוון מחקר נוסף של בייקר הוא שימוש במשחק Foldit כדי לתכנן חלבונים חדשים, שאינם קיימים בטבע, כך שיתקפלו למבנה נדרש – לדוגמה, מבנה המתאים כדי לחסום אתר פעיל של אנזים או קולטן לצורך טיפול רפואי.
כידוע, קיפול חלבונים אינו התחום היחיד שבו – לפחות כרגע – האדם מצליח יותר מהמכונה. אתגרים כמו קריאת טקסט המוצג על רקע "מפריע" משמשים כדי לוודא כי גישה לאתרי אינטרנט באה מגולש אנושי ולא מ"רובוט" (תוכנה המתחזה לאדם כדי להשיג מטרות כמו איסוף מידע, גילוי סיסמאות או משלוח "דואר זבל".
בעבור אתגרים אחרים, כמו זיהוי עצמים המופיעים בתמונה או קטגוריזציה של מוזיקה לפי סגנונה והרגשות המובעים בה, הצורך במחשוב הוביל ליצירת "משחקים עם מטרה" (Games with a purpose) המגייסים שחקנים אנושיים כדי לפתור שאלות שהן קשות מדי בעבור הרמה הנוכחית של בינה מלאכותית.
משחק Foldit גם הוא שייך לקבוצת "משחקים עם מטרה", אך הוא שונה מהאחרים בכך שמבנה החלבון מפוענח על-ידי ניצול היתרונות הייחודיים של האדם ושל המחשב גם יחד: האדם בוחר אינטואיטיבית אפשרויות מבטיחות מתוך טריליונים של אפשרויות – מספר רב כל כך עד שהמחשב אינו מספיק לנסות אפילו חלק קטן מהן; אך ללא יכולתו של המחשב להשלים את השינוי בצורה מדויקת, המתחשבת בחוקי הפיסיקה והביוכימיה, וללא החישוב הבודק אם השינוי הביא להורדה ברמת האנרגיה הכללית, לא יוכל האדם להמשיך בתהליך.
תחום העיסוק של הבינה המלאכותית מוגדר לעתים ככזה הכולל אותם אתגרים שבהם האדם מצליח יותר מאשר המכונה. זוהי הגדרה דינמית, שלפיה חישובים מתמטיים היו חלק מהבינה המלאכותית לפני 1940 (ולכן המחשבים הראשונים כונו "מוחות אלקטרוניים").
זיהוי אותיות ומילים במסמכים מודפסים (OCR – Optical Character Recognition) יצא מתחומי הבינה המלאכותית בשנות השמונים, בעוד שזיהוי פני אדם מתקרב במהירות לזמן שבו מחשבים יהיו טובים יותר מכל אדם אך זיהוי עצמים אחרים בתמונות נראה עדיין קשה מדי בעבור מחשבים.
לפי הגדרה זו, קיפול חלבונים הוא עדיין אתגר בעל חשיבות תיאורטית ומעשית בעבור הבינה המלאכותית, אך בניגוד לחישוב, OCR וזיהוי פנים יש באתגר זה מקום לשיתוף פעולה במקום תחרות: שילוב של האינטואיציה האנושית כמדריכה את הבינה המלאכותית בחיפושיה הוא, לפחות בשלב זה של הטכנולוגיה, הדרך המבטיחה ביותר למציאת "קיפולים" נכונים.
ישראל בנימיני עובד בחברת ClickSoftware בפיתוח שיטות אופטימיזציה מתקדמות. הכתבה התפרסמה בגיליון אוקטובר של המגזין "גליליאו "