"פעם לא רצית להגיד שאתה מתעסק בבינה מלאכותית, היום אפילו השרברב שלי עושה AI"

אנחנו נפגשים כמה ימים לאחר תצוגת התכלית של חברת OpenAI למודל החדש שלה לעיבוד שפה, GPT-4o. במהלך התצוגה עקב העולם הטכנולוגי אחר מירה מוראטי, מנהלת הטכנולוגיות הראשית של OpenAI, מציגה את המודל שהפגין יכולות שיחה אנושית מרשימות. כמה דרוכים היו באותם רגעים בתל-אביב אנשי AI21 Labs – החברה המשמעותית ביותר בישראל בתחום של פיתוח מודלי בינה מלאכותית לעיבוד שפה, ש-OpenAI היא ממתחרותיה העיקריות? "אנחנו כמובן עוקבים, זה רלוונטי מאוד לתחום שלנו, אז אנחנו לא מתעלמים מהנושא", אומר ברוגע אורי גושן, מייסד ומנכ"ל משותף של AI21 Labs.
לא רוצים לפספס אף כתבה? הצטרפו לערוץ הטלגרם שלנו
"כמובן שיש מחשבות מה יהיה הדבר הבא, אנחנו לא חיים בוואקום", משלים פרופ' יואב שוהם, המייסד והמנכ"ל השני של החברה. "אני לא רוצה להגיד שאנחנו די יודעים מה ייצא, כי כולם שומרים על הכל קרוב לחזה, אבל בואי נגיד שזה לא ממש יפתיע אותנו. אבל אנחנו מפתחים טכנולוגיה עמוקה, ויש מעט מאוד חברות בעולם כמונו שבאמת מאמנות מודלים. אתה לא יכול בתחום כמו שלנו להתנהל רק כתגובה למה שאחרים עושים. חייב להיות לנו מצפן וכוכב צפון משלנו".
כתבות נוספות למנויים:
הישראלים שרוצים להשתלט לנו על המכוניות
"צריך להקים צבא של בוטים, זו חזית קריטית"
היחידה שניהלה את יירוט הטילים האיראניים
גושן: "לפני שהושק מודל GPT-3 (ב-2020 – ט"ג), יצא מאמר שמפרט את היכולות שלו, ואותו קיבלנו לפני כולם, כמו גם גישה למודל. תוך שעות החבר'ה שלנו קראו הכל ועשו פרזנטציה בנושא לחברה. זה היה עוד כשהיינו משהו כמו 40 איש (היום הם 270 עובדים – ט"ג). אף אחד לא חשב שזה יהיה כזה להיט. אני חושב שגם OpenAI בעצמם לא חשבו. זה נראה אז כמו עוד מהלך מעניין. השאר הוא היסטוריה".
ופתאום התחילו סביבכם להבין סוף סוף מה אתם עושים?
"זה לא היה מיידי. צריך לתת ל-Chat-GPT קרדיט על זה שהוא הנגיש את הטכנולוגיה לאנשים והפיל אסימונים. אנחנו בתחום שקצב השינוי והחידוש בו הוא באמת ללא תקדים, וזאת השגרה החדשה שלנו, שמלווה אותנו כבר שש שנים, מתחילת 2018 כשהתחלנו עם AI21 Labs. אנחנו רגילים לדרמה".
A21 Labs היא מחברות ההייטק היחידות בישראל שגם שרשרת המשברים שידענו כאן לא יכלה לשוק הרותח שבו היא פועלת – מודלי שפה גדולים (LLM), המהווים את המוח מאחורי הצ'אט-בוטים שהפכו לחלק בלתי נפרד מהחיים של כולנו (כמו ChatGPT ו-Gemini של גוגל), ושמאפשרים למחשבים לשוחח, לכתוב, לנתח ולהמליץ – כמעט כמו בני אדם, ועם חשש לא מבוטל שבקרוב אפילו טוב יותר מאיתנו. אבל הנהירה לכל דבר הקשור בבינה מלאכותית עוד לא התחילה כשמייסדי החברה, שוהם, גושן ופרופ' אמנון שעשוע, יצאו לדרך בתחילת 2018. הרעיון שחשבו עליו, של כלי בינה מלאכותית המבוסס על שפה טבעית שישנה את הדרך שבה בני אדם כותבים וקוראים, התחיל כמעבדת גאונים מנומנמת, אבל ב-2022, עם ההשקה של Chat-GPT על ידי OpenAI, שהזרימה לתחום הון עתק וקשב רב, הם טסו לגובה. 
3 צפייה בגלריה 
אורי גושן (משמאל) ופרופ' יואב שוהם
(צילום: אביגיל עוזי)
היום הם עומדים בראש חברה שקיבלה שווי של 1.4 מיליארד דולר, השלימה גיוס של 208 מיליון דולר בנובמבר האחרון, משתפת פעולה עם אמזון, גוגל ומיקרוסופט, ומתחרה בענקיות AI כמו OpenAI ,Anthropic ,Mistral ובמודלים שמפתחות גוגל, מטא ו-X (לשעבר טוויטר). וייתכן שבקרוב תתחרה גם בחברה שיקים איליה סוצקבר, יוצא OpenAI שהודיע השבוע על חברה חדשה בהקמתו, עם משרדים בפאלו אלטו ובתל אביב. לדירקטוריון של A21 Labs הצטרף טום ניידס, לשעבר שגריר ארה"ב בישראל וסגן מזכיר המדינה בממשל אובמה. שורת ההישגים האלה ביססה אותם כאחת מהחברות המסקרנות בעולם והחשובות בישראל. אלא שהם לא הספיקו להתרפק על ההישגים האלה, בעולם שבו המתחרים מכפילים את הערכות השווי שלהם ומגיעים לסכומים שמזכירים בועה מזמן אחר.
"בגלל שאני עתיק, אני זוכר את הבינה המלאכותית גם משנות ה-80", מספר שוהם (68), שכבר צפה במספיק מהפכות ב-28 שנותיו כפרופסור למדעי המחשב באוניברסיטת סטנפורד בארה"ב. "הקולגה שלי ג'ון מקארתי הוא זה שטבע את המונח Artificial Intelligence עוד בשנות ה-50, כשנולדתי בערך. בשנות ה-80 AI נחשבה הבטחה גדולה, בשנות ה-90 היה AI Winter ("החורף של הבינה המלאכותית"), כשכמעט היה אסור לך להודות שאתה מתעסק עם בינה מלאכותית, ועכשיו, בשנים האחרונות, אפילו השרברב שלי עושה AI, אבל זה AI מסוג מאוד אחר".
מה השתנה מהתקופה שעשית בה בינה מלאכותית בסטנפורד?
"מה שהשתנה זאת לא האלגוריתמיקה, כמו הגישה לכמות נתונים בלתי נתפסת, וכוח חישוב בלתי נתפס. אנחנו עושים סטטיסטיקה בסקאלות עצומות, ומה שמדהים גם אותנו הוא שכאשר עושים סטטיסטיקה בסדר גודל כזה, קורים דברים שלא ציפית להם. וזה בעצם מה שנתן תנופה לבינה המלאכותית המודרנית. עיבוד שפה טבעית (יישום טכניקות המאפשרות למחשבים לעבד, לנתח ולהגיב לשפה האנושית – ט"ג) זה מבט לאיך בן אדם חושב. קשה לעשות את זה, אבל יש בזה המון ערך".
ערך שזיהיתם שאפשר להפיק בחברה משלכם?
"פתחנו את החברה כי האמנו שלמידה עמוקה (Deep Learning, טכנולוגיה המאפשרת למערכות המחשב לחקות את פעילות המוח האנושי – ט"ג) היא תנאי הכרחי ל-AI מודרני אבל לא מספיק. אם ניקח לדוגמה פעולה פשוטה של חיבור וחיסור. מודלי שפה יודעים לעשות חשבון, אבל לא טוב כמו מחשבון פשוט משנות ה-70. כדי להגיע לרמת אמינות ודיוק גבוהה – חייבים תהליכי חשיבה והסקת מסקנות. ואנחנו הבנו שצריך לשלב בין שניהם. בשלוש השנים הראשונות התעסקנו רק בטכנולוגיה, ואז אמרנו: 'אוקיי, אנחנו לא רק מעבדת מחקר, אנחנו גם חברה, מה הביזנס שלנו?' והיה לנו ברור שאנחנו רוצים להיות חברה במודל של B2B, חברה שמוכרת לחברות".
הרבה לפני שכל מנכ"ל חיפש איך להכניס בינה מלאכותית למוצר שלו.
גושן: "ממש ככה. עוד לא היה את המושג GenerativeAI, בינה מלאכותית יוצרת. AI הייתה בעיקר באקדמיה, במעבדות ובחברות הגדולות. ואנחנו בכל זאת רצינו, כמו שיואב אמר, להביא ערך מסחרי ממשי לעולם. השלב הראשון שממנו התחלנו הוא לחשוב מחדש איך אנשים היום כותבים וקוראים. ככה פותח WordTune, כלי שעוזר לאנשים לבטא את עצמם טוב יותר. הוא תפס כמו אש בשדה קוצים".
3 צפייה בגלריה 
אורי גושן (משמאל) ופרופ' יואב שוהם
(צילום: אביגיל עוזי)
WordTune, שעל פי שוהם וגושן צבר עשרה מיליון משתמשים, דומה לכלי המתחרה של חברת Grammerly מהסיליקון ואלי, שבודק איות באמצעות בינה מלאכותית ומציע משפטים מתוחכמים ובהירים יותר מאלו שאדם שאינו דובר השפה יצליח לחשוב עליהם. "WordTune יצא בסוף 2020, וב-2021 כבר הוצאנו את הפלטפורמה שלנו, AI21 Studio, עם מודל השפה הראשון שהוצאנו, Jurassic-1, שבזמנו היה קצת יותר גדול וקצת יותר טוב בתחומים מסוימים מ-GPT-3. הוא יועד לארגונים והיה דריסת הרגל הראשונה שלנו בתחום".
שוהם היה אז "פרופסור בגמילה", כמו שהוא נוהג להגיד, וגושן, היום בן 39, היה מנכ"ל צעיר ללא תואר אבל אחרי אקזיט. השלישי שהצטרף, פרופ' אמנון שעשוע, הוא נשיא ומנכ"ל חברת מובילאיי ומייסד "אורקם" והבנק הדיגיטלי One Zero. שוהם מספר איך נוצר הקשר עם גושן: "אני כבר פתחתי אז ארבע חברות (בהן טריידינג דיינמיקס שעסקה במכרזים מקוונים ונמכרה ב-458 מיליון דולר לחברת אריבה – ט"ג), שתיים מהן נמכרו לגוגל (בהן אפליקציית ניהול זמן שפיתח עם דן אריאלי – ט"ג), וכשהאחרונה נמכרה החלטנו לחזור לארץ. כשחזרתי עבדתי עבור גוגל ארה"ב מישראל, אבל כבר קינן בי הרעיון למה שהפך להיות החברה הזאת. בזמנו השתתפתי גם במיזם ללימוד תכנות לאוכלוסיות מוחלשות, והכרתי שם את נגה, היום נגה גושן, בת הזוג של אורי, וככה הוא ואני הכרנו".
גושן: "לי הייתה חברה בתחום האנליטיקות שהתמזגה לתוך חברה ישראלית אחרת, 'סלוויז', שלימים נמכרה ל'קוואלקום', וב-2017 באמת התחלתי לחשוב על הצעד הבא. בשבוע הראשון שפתחנו את החברה, גם התחתנתי עם נגה".
שוהם: "אמנון שעשוע נכנס כמה חודשים אחרי שהתחלנו, והיה חיבור מיידי. את אמנון אני מכיר מהאקדמיה הרבה שנים, אבל אף פעם לא עבדנו ביחד, והאמת שהלכתי אליו כדי לגייס ממנו כסף ל'וויקוד', אותו מיזם של תכנות לאוכלוסיות מוחלשות. אני זוכר שישבתי במשרד שלו במובילאיי, ואחרי עשר דקות הוא אמר, 'אוקיי, תרמתי למיזם, מה עכשיו?' אמרתי לו, 'בוא אני אספר לך על החברה'. זה מאוד השתלב באיך שהוא ראה לאן בינה מלאכותית צריכה להתפתח, ואחרי כמה שיחות הוא ביקש להצטרף, אבל התנאי שלו היה שהוא לא רק ישקיע, אלא באמת יהיה שותף. ואני לא יודע איך יש לו זמן לזה, אבל הוא באמת מאוד מעורב בחברה, גם באסטרטגיה וגם בטכנולוגיה".
בפלטפורמה שלהם היו רשומים כ-50 אלף גופים ומפתחים שהשתמשו במודלי השפה שבנו, אבל לא חברות וארגוני ענק, שאליהם כיוונו. גושן: "הייתי באירוע בארצות-הברית, כינוס נורא מצומצם של 50 חברות יוניקורן. מנכ"לים של חברות שמוכרות מוצרים בתחום התשלומים או משאבי האנוש מספרים שהלקוחות שואלים אותם 'מה מפת ה-AI שלך לחמש השנים הקרובות?'. זה ממש מצופה מהם. אבל כדי שנצליח להיכנס לארגונים, הבנו שיש שני אלמנטים חשובים – אמינות ויעילות. היום בשוק של מודלי השפה יש מגבלה בתחום האמינות, במיוחד כשרוצים לתת פתרונות לשווקים ותחומים שהם קריטיים ומחיר הטעות בהם גבוה, כאלה שבהם אסור למודל לטעות. לכן המיקוד שלנו הוא עבודה על האמינות והיעילות. המודלים שלנו, 'ג'וראסיק', מביאים לשוק Task-Specific-Models – מודלים הממוקדים במשימות מסוימות ומתמחים בהן, וככה גם פחות סובלים מבעיות שיש במודלים הכלליים".
3 צפייה בגלריה 
סם אלטמן, מנכ"ל OpenAI
(צילום: אביגיל עוזי)
השנה הם השיקו מודל חדש בשם "Jamba". "מודלי השפה הדומיננטיים היום חזקים מאוד ויודעים לעשות הרבה דברים – בצורה לא מושלמת", מסביר שוהם. "מה שאנחנו רוצים לעשות זה לפצות על חוסר המושלמות. מודלים עם יכולות גבוהות יותר – מאוד יקר להריץ, וזה הופך בלתי אפשרי להשתמש בהם במציאות היומיומית. אם אתה בנק שצריך לשרת לקוח, שצריך לתת לו תשובה תוך נגיד שלוש שניות, אתה לא רוצה כלי שחוזר אחרי דקות ארוכות, וגם לא לשלם 100 דולר על כל תשובה שאתה נותן ללקוח. צריך לייעל את הדברים. אצלנו בחברה לוקחים מודלים שיצאו באקדמיה לפני משהו כמו שבעה חודשים והתגלו כיעילים, ומשלבים אותם עם מודלים בעלי יכולות דיוק גבוהות יותר למשל, ומשלבים ביניהם כדי לקבל את הטוב שבשני העולמות. המודל הזה, ג'מבה, הוא גם יעיל וגם טוב. ארגונים עדיין רוצים להתאים אליהם את המודלים על פי הצרכים והלקוחות שלהם, אבל לקחת מודל שמראש מותאם למשימה שהם רוצים לבצע – זה יעיל יותר מלעשות התאמה למודל כללי".
איך זה נראה למשל בבנק שרוצה לאמץ מודל שלכם?
"אם לבנק יש אנליסטים בתחום ההשקעות שכל היום קוראים דוחות, אז הבנק רוצה לצייד אותם בכלים שמסכמים את הדוחות בצורה הכי מדויקת ומהירה. הם יכולים לעבוד עם מודל כללי ולהתאים אותו, או לקחת את ה-Task-Specfic-Models שלנו, שטוב ספציפית בסיכום דוחות פיננסיים ומקרב אותם יותר לפתרון".
בניגוד למאפיינים האנושיים שנוספו לגרסה החדשה של Chat-GPT – שסם אלטמן, מנכ"ל OpenAI, השווה אותה לסרט "Her" – מודלים כמו שלכם נשארים קרים וענייניים.
שוהם: "כן, יש במקרים מסוימים מאמץ גדול לחקות מאפיינים אנושיים באינטונציה, בהשהיות קצרות של הדיבור. פיתחנו משחק שנקרא 'Human or Not?' ("אנושי או לא?") שבשבועיים הראשונים שיחקו בו שני מיליון שחקנים. זה מין מבחן טיורינג הכי גדול בעולם, יש לך שתי דקות לאינטראקציה עם הצד השני – את כותבת משהו והוא עונה, ואת צריכה לנחש אם זה בן אדם או בוט. עשינו מאמץ מודע להפוך את זה לקשה, להכניס טעויות מכוונות, לא לענות מהר מדי, להכניס כל מיני סלנג ואימוג'יז. וקשה מאוד לזהות. בארגונים גדולים לא בהכרח רוצים לטשטש את ההבדל בין האדם למכונה. קול אנושי ובדיחות הם לא שימושיים במקרה של מודל לדוחות פיננסיים לבנק, למשל".
ל-AI21Labs שותפות אסטרטגית עם אמזון, שמציעה למפתחים המשתמשים בשירותיה מודלים של חברות מובילות, ובהם של החברה הישראלית. "ללקוחות מוצרי הענן של אמזון יש יכולת לצרוך מודלים שלנו, וגם להתאים אותם לצרכים שלהם". בחודש שעבר הושקה באירוע המפתחים של מיקרוסופט שותפות עם AI21 Labs, כחלק משירות של מיקרוסופט המנגיש ללקוחותיה כמה מודלים, ובהם של החברה הישראלית. חיבור דומה נולד החודש גם עם ענקית הדאטה האמריקאית Snowflake.
מיקרוסופט הם משקיעים דומיננטיים של OpenAI. אמזון השקיעו בחברת פיתוח המודלים אנת'רופיק. לגוגל יש את המודלים שלה. כלומר, המתחרים שלכם מצוידים בהשקעות ענק, ואתם רצים במקביל אליהם בשווי נמוך יחסית, גם בהשוואה לחברות קטנות יותר כמו מיסטרל הצרפתית.
שוהם: "את אומרת, 'נו באמת, איך אתם באים עם שווי כזה עלוב של מיליארד וחצי דולר?' אנחנו מאמינים שצריך לגייס כסף כשאתה צריך אותו ויודע מה לעשות איתו, ואנחנו לא חושבים שמי שבהכרח מגייס בשווי הכי גבוה, עושה לעצמו טובה. יש היגיון בלגדול בקצב מסוים. לגדול בתוך מספר שנים מועט ביותר ממיליארד דולר – זה לא דבר שאתה רוצה לעשות ככה על הדרך".
גושן: "אנחנו מונחים על ידי מה שאנחנו מאמינים שנכון. גייסנו לא מעט כסף, 336 מיליון דולר, ולא חסר לנו כסף. כשנרצה ונצטרך עוד כסף, נגייס עוד. אבל לייצר כותרת שהוספנו עוד מיליארד דולר לשווי שלנו לא יקדם אותנו לשום מקום, לא ייתן ערך ללקוחות שלנו ולא יביא אותנו להצלחה".
זה יותר עניין של מיצוב מול המתחרים, שזינקו כל אחד לשווי של עשרות מיליארדי דולרים.
שוהם: "נושא המיתוג והמיצוב הוא חשוב, וזה נכון שיש אנשים שמסתכלים על שווי החברה כהערכת איכות, אבל הלקוחות החשובים מבינים שלא זה מה שחשוב. מה שחשוב זה אם יש לך טכנולוגיה טובה ואם אתה יודע לתת את השירות. אני לא יודע מה יהיה השווי שלנו בהמשך, וזה לא באמת מעסיק אותנו כמו הרצון לפתח את הטכנולוגיה ולספק את המוצרים".
אחת המטרות שלכם בשמירה על שווי פרופורציונלי היא לאפשר עסקאות מיזוג ורכישה בהמשך?
שוהם: "זאת שאלה טבעית, אבל בסדר הגודל שלנו אנחנו לא בונים חברה כדי להירכש, אחרת היינו יכולים להירכש כבר".
270 העובדים של החברה עוסקים רובם במחקר ופיתוח, ו-80 מתוכם עוסקים בשיווק ומכירות ויושבים בארה"ב. שוהם הוא גם יו"ר הוועדה המדעית של התוכנית הלאומית לבינה מלאכותית, וככזה הוא בדיוק האדם שאמור לדעת מה מצב הטאלנט של המהנדסים המוכשרים לתחום בישראל. "יש טאלנט טוב, אבל לא מספיק ממנו. אם תסתכלי כמה חוקרי בינה מלאכותית יש בארץ ביום נתון, תגיעי למאה חוקרים. צריך להיות כפול מזה", הוא אומר.
לעומת הסייבר, בבינה מלאכותית הצבא לא בהכרח מייצר יתרון.
"זאת גם נקודה, כי בניגוד לסייבר, שהרבה מהטכנולוגיה סביבו נוצרה בצבא ובגופים ביטחוניים ואז יצאה לאזרחות, כאן הכיוון הוא הפוך, וזה גם יקר ומצריך משאבים גדולים, בניגוד לסייבר. אז בישראל אנחנו צריכים להגדיר שחלק מהמטרות שלנו זה להגדיל את ההון האנושי בתחום. וכאן בחברה יש לנו פריבילגיה לגייס באמת את טובי המוחות. אני לא רוצה להישמע שחצן, כן? אבל אנחנו ייחודיים, ואין עוד חברה בארץ שעושה מודלי שפה בסדרי גודל כאלה, אז הרבה רוצים להצטרף אלינו. זאת החברה החמישית שאני מעורב בה כמנהל, ומעולם לא ראיתי מצבור כזה של כישרון במקום אחד, שזה אגב קצת מאתגר, כי לנהל כישרון אדיר זה לא טריוויאלי".
יואב, היית 28 שנים בסטנפורד, ועכשיו אתה רואה מכאן את המהומות בקמפוסים באוניברסיטאות העילית בארה"ב. מה אתה חושב על זה?
"גם אני לא הייתי מרוצה ממה שקרה בסטנפורד. זה מאוד מטריד, כי זה מראה על תהליכי עומק בחברה האמריקאית, בחברה המערבית ובדור הצעיר, שבאמת יש לו אידיאלים טובים אבל לפעמים הוא בור ומונחה על ידי קונספציות פשטניות של טוב ורע, כובש ונכבש. זה מנוצל על ידי כוחות אנטי ישראליים ולפעמים גם אנטישמיים, וזאת בעיה קשה מאוד. בינתיים אני לא רואה שם את הקולגות הישראלים שלי מנודים, ההפך. אנחנו תחום טכנולוגי, ובו מראות כמו שרואים בתקשורת הם פחות דומיננטיים מאשר בתחומים אחרים כמו מדעי הרוח והחברה".
מה מצב התוכנית הלאומית של ישראל למהפכת הבינה המלאכותית?
"תראי, אני לא מכיר מדינה בעולם שאין לה מאמץ לאומי כזה או אחר בתחום. אין מדינה שלא שמה לה את זה כמטרה. אני לא רוצה לקרוא לזה מרוץ חימוש, אבל כולם מבינים שזו טכנולוגיה שהיא אסטרטגית למדינה. ישראל לא תנצח כאן בזכות זה שיש לה יותר משאבים. יצא קול קורא לרכישת מעבדים גרפיים על ידי המדינה, כשבשלב הראשון היא תרכוש אלף מעבדים, ואם יהיה מזל אז אלפיים. את יודעת כמה מעבדים ערב-הסעודית קנתה עכשיו? 40 אלף. אז לא ננצח כי יש לנו יותר מלמישהו אחר, אבל כן ננצח בחדשנות ובאפליקציות שמשתמשות בבינה מלאכותית. אני רואה בישראל הרבה פרויקטים שהם מה שאני קורא 'moonshot', פרויקטי דגל שהם עם סיכון גבוה ורווח גבוה".
גושן: "יש סנטימנט חיובי באיך שישראל נתפסת בעולם בתחום פיתוחי הבינה המלאכותית. הייתי בפורום הכלכלה העולמי בדאבוס והזמין אותי להיפגש שר האוצר של הונג-קונג. בהתחלה לא הבנתי למה, ואז הבהירו לי שהם תופסים את ישראל כשוק חשוב בתחום, והבנתי שכבר יש לזה מודעות בינלאומית – יש כבוד בסיסי לכוח הטכנולוגי הישראלי".
פורסם לראשונה: 00:00, 21.06.24