חלבונים הם אבני יסוד חשובים בגופנו, שמבצעים מגוון של פעולות. בהתאם לכך, תרופות רבות מתמקדות בחלבונים מסוימים שפעולתם נפגעה או השתנתה, ומנסות לנטרל אותם או להגביר את פעילותם. ההוראות ליצירת חלבונים שמורות בחומר התורשתי שלנו, ה-DNA, ומולקולות בשם mRNA הן מעין "עותק עבודה" של ההוראות לייצור החלבון, שיוצאות מגרעין התא אל הריבוזומים – בתי החרושת לייצור חלבונים – הנמצאים מחוץ לגרעין.
אחד התחומים הנחקרים ביותר בביולוגיה של התא הוא חקר המאפיינים של החלקים במולקולת ה-mRNA שנקשרים לחלבונים, ואיך הם מאפשרים לה להיקשר לחלבונים מסוימים. אך המחקר בתחום אינו פשוט: ראשית, מולקולות ה-mRNA אינן יציבות – הן מתפרקות בקלות וקשה לעשות עמן ניסויים. שנית, כדי לאתר רצף mRNA שנקשר לחלבון מסוים יש צורך לתכנן רצף כזה, לייצר אותו במעבדה ואז לבדוק את פעילותו. מדובר בתהליך ארוך ויקר, שמקשה על פיתוח תרופות או טכנולוגיות חדשות המבוססות על סיכול הקישור הזה.
מחקר שהתפרסם בכתב העת Nature Communication, בהובלת חוקרים מהטכניון ומאוניברסיטת בן גוריון, מציע כעת שיטה לחסוך את הבדיקה הסיזיפית במעבדה באמצעות מודל ממוחשב המבוסס על למידת מכונה.
זהה את הרצף
בלמידת מכונה מזינים למחשב בסיס נתונים נרחב ומניחים לו להסיק בעצמו מה משותף לכל הדוגמאות ולפתח מודל כללי שיאפשר לו לזהות פרטים דומים גם אם לא נכללו במאגר הנתונים הראשוני שלו. במקרה הזה אספו החוקרים נתונים על יכולת הקישור של עשרות אלפי צורות של RNA שיכולים להיקשר לחלבונים מסוימים. המחשב התבקש להסיק אילו תכונות חשובות לקישור בין RNA לחלבונים. על סמך זה הוא אמור להיות מסוגל לחזות אילו רצפי RNA חדשים, יוכלו להיקשר לחלבון מטרה מסוים, כולל מולקולות RNA מלאכותיות, שנוצרו במעבדה.
כדי ליצור כזה בסיס נתונים רחב, השתמשו החוקרים בשלושה חלבונים המכונים RBP, הידועים ביכולתם להיקשר לרצפים מסוימים של mRNA. החוקרים השתמשו בחיידקים לייצור החלבונים המהונדסים עם צבע פלואורסצנטי. במקביל הם יצרו עשרות אלפי גרסאות שונות של מולקולות mRNA ובדקו אם הן נקשרות לחלבונים. כל פעם שנוצר קישור בין החלבון לרצף mRNA מסוים, התאים זרחו בצבע מסוים, ובהיעדרו הם זרחו בצבע שונה.
המערכת הזו אפשרה לחוקרים לבנות בסיס נתונים רחב לגבי רצפים שונים של mRNA ויכולתם להיקשר לחלבונים. כך יכול המחשב לפתח מודל שיאפשר לחזות את היכולת של מולקולות mRNA חדשות להיקשר לחלבונים, גם אם לא הכיר את הרצפים שלהן.
כדי לבדוק אם המודל שפיתחו אכן פועל, לקחו החוקרים כמה ממולקולות ה-mRNA שהציעה המערכת הממוחשבת, ובדקו אותם במעבדה. הם החדירו אותן לחיידקים ולתאי אדם, וראו כי אכן, חלבוני ה-RBP הפלואורסצנטיים זיהו את המולקולות המלאכותיות שהחוקרים יצרו, נקשרו אליהן וזרחו בתוך התאים.
"יכולות חיזוי מדהימות"
החוקר ירון אורנשטיין מאוניברסיטת בן גוריון, ממובילי המחקר, אמר כי "היישום של למידה עמוקה הביא בשנים האחרונות ליכולות חיזוי מדהימות שלא העלנו בדעתנו. במחקר אימנו רשתות נוירונים עמוקות על עשרות אלפי דוגמאות מולקולריות שנאספו במעבדה וביצענו חיזוי מדויק על מיליוני מולקולות אחרות שלא היו בניסוי המקורי. כך יכולנו לסרוק באופן מהיר כמות עצומה של רצפים שאי אפשר לסרוק בניסוי בזמן סביר בטכנולוגיות ובמשאבים הקיימים בימינו".
לבסוף בחנו החוקרים אם אפשר להשתמש במודל שלהם כדי ליצור רצף mRNA שיזוהה על ידי יותר מחלבון אחד. מצב כזה עשוי לאפשר לדבריהם לייצר תרופות אנטי-ויראליות שיפעלו נגד יותר מנגיף אחד. אכן הם מצאו מולקולה שנקשרה לשני חלבונים שונים ממקור נגיפי.
לממצאים הללו יש יישומים אפשריים רבים, מפיתוח כלים ספציפיים לדימות של רצפי mRNA ומעקב אחריהם בתאים, ועד פיתוח של תרופות חדשות נגד נגיפים. לדברי רועי עמית מהטכניון, שהמחקר נעשה במעבדה שלו, "המחקר הדגים את האפשרות לגלות מולקולות RNA שיכולות להיקשר ליותר מנגיף אחד. ההדגמה נעשתה על מולקולות מעטפת של פאג'ים (נגיפים התוקפים חיידקים), אבל אנחנו מעריכים שאותה גישה עשויה לפעול גם על חלבוני מעטפת של נגיפים אנושיים כגון שפעת וקורונה. מולקולה שיכולה להיקשר לשני זנים או יותר של נגיפים תוכל לשמש בסיס לדור חדש של תרופות אנטי-ויראליות שיתנו מענה להתפרצות חדשה של מגפת קורונה, שפעת או כל נגיף אחר".