"לפני ChatGPT הייתה הערכת חסר של ההתקדמות בתחום הבינה המלאכותית. ChatGPT היה כמו ניצוץ שהצית בקרב סטארטאפים אש של חדשנות סביב בינה מלאכותית יוצרת, והוביל לדינמיקה מחודשת של גיוס כספים" - כך אומר לוני ג'אפה, שותף באינסייט (Insight), אחת מקרנות ההון-סיכון הפעילות ביותר בישראל, בריאיון ל-ynet.
עוד כתבות שיעניינו אתכם:
ג'אפה, שמתמקד בהשקעות בתחום הדיפ-טק והבינה המלאכותית, מכיר היטב את הסטארט-אפ ניישן: בשנים האחרונות הוא היה מעורב בהשקעה בחברות כמו Run:AI ו-Deci, שמסייעות לייעל את תהליכי הפיתוח והאימון של מודלי בינה מלאכותית; ב-Hour One, שמפתחת כלים ליצירת סרטונים סינתטיים ואווטארים ריאליסטיים; וב-Swimm, שפיתחה פלטפורמה לתיעוד קוד. באופן טבעי, אחד התחומים שנמצאים במוקד תשומת הלב שלו בחודשים האחרונים הוא הבינה המלאכותית היוצרת (גנרטיבית) - הטכנולוגיה שמאחורי יישומים כמו ChatGPT ו-DALL-E2, שמסוגלים ליצור תוכן בכוחות עצמם לאחר שהתאמנו על מאגרי נתונים ענקיים.
"עברנו ממערכות של חיזוי - למשל מנגנונים של סיווג והמלצה, מה שאני קורא לו בינה מלאכותית קלאסית - למערכות של יצירה", מסביר ג'אפה את המהפכה שקרתה בתעשייה בחודשים האחרונים. "יש מערכות יוצרות מאוד מעניינות ועוצמתיות. ג'ספר, אחת החברות שהשקענו בהן, יכולה לעזור לך לכתוב פוסטים בבלוג, היישום Stable Diffusion יכול ליצור תמונות, ו-GitHub CoPilot יכול לסייע בכתיבת קוד. סביר להניח שנראה עוד טייסי משנה (Co-Pilots) מופיעים בשביל לעזור לנו בכתיבת טיוטות עם פונקציות שונות מעבר לתכנות - למשל כתיבת מסמכים רפואיים, חוזים משפטיים, תכנון שיעורים בבתי ספר ועוד".
"אלה היו כמה חודשים מרשימים מאוד", הוא מסכם את ההתפתחויות בתקופה האחרונה, שכוללות בין היתר את השקת GPT-4, מודל השפה העוצמתי של OpenAI; את השקת הגרסה החמישית של מחולל התמונות Midjourney, שמסוגלת ליצור תמונות ריאליסטיות כמעט לחלוטין; וכמובן את המהלכים של מיקרוסופט וגוגל להטמעת בינה מלאכותית יוצרת במוצרי הליבה שלהן, מיישומי הפרודוקטיביות ועד למנועי החיפוש. אבל על אף שהבינה המלאכותית היוצרת גורפת את מרב תשומת הלב בתקופה האחרונה, ג'אפה מדגיש כי "חשוב להמשיך לעקוב אחרי ההתקדמות המדהימה שהשגנו בבינה מלאכותית קלאסית, במיוחד בתחום זיהוי התמונות או בעולם הרפואה".
לפני שנה כולם בתעשייה דיברו על המטאברס ו-NFT, וראינו מה יצא מזה. עכשיו כולם מדברים על בינה מלאכותית יוצרת. למה שהפעם זה יהיה שונה?
"דבר אחד שהוא די שונה בינתיים הוא הכמות העצומה של משתמשים והכנסות של חלק מהעסקים בתחום. ChatGPT הגיע למיליון משתמשים תוך חמישה ימים - זה קצב אימוץ מהיר בטירוף, אפילו בהשוואה לחברות אינטרנט פופולריות מאוד כמו פייסבוק, שלקח לה עשרה חודשים להגיע למיליון משתמשים, או אינסטגרם, שלקח לה חודשיים וחצי להגיע למיליון משתמשים. ChatGPT, שמעתי, הגיע כבר למאה מיליון משתמשים, שזה מדהים. כ-1.2 מיליון מפתחים משתמשים ב-GitHub CoPilot. אנדריי קרפטי, שהיה אחראי על תחום הבינה המלאכותית בטסלה, אמר שמדובר בגיים צ'יינגר מבחינתו".
הרבה אנשים בעולם הטכנולוגיה תוהים אם וכיצד אפשר לעשות כסף מבינה מלאכותית יוצרת.
"אחת הטקטיקות הפשוטות ביותר היא לגבות תשלום על שירותים. זה רלוונטי בעולם ה-B2B (חברות שמוכרות מוצרים לעסקים - י"מ), אבל גם בעולם ה-B2C (חברות שמוכרות מוצרים לצרכנים - י"מ). אני לא מכיר את הדוחות הפיננסיים של OpenAI, אבל הרבה אנשים נרשמים ל-ChatGPT Plus, ותמורת 20 דולר לחודש מקבלים גישה למודל השפה GPT-4. זה לא יקר עבור שימוש באחת הטכנולוגיות העוצמתיות ביותר שהאנושות יצרה.
"יש עסקים שעושים מינויים ארגוניים ל-GitHub CoPilot כדי שהמתכנתים שלהם יהיו יותר פרודוקטיביים, אבל יש גם הרבה מתכנתים עצמאים שמשלמים על השירות. אני רואה את זה גם עם ג'ספר - יש עסקים שמוכנים לשלם כדי לאפשר לאנשי השיווק שלהם ליצור תוכן, אבל יש גם פרילנסרים בתחום הזה. אז כל אלה הן דרכים שבהן אפשר לעשות מונטיזציה, וזה חשוב כי העלויות של הרצת המודלים האלה הן כל כך גבוהות, שצריך להיות ערך מספיק גבוה כדי שזה יהיה הגיוני לשלם על זה".
אימונים יקרים
העלויות של אימון המודלים הן נקודה כואבת בעולם ה-AI: מדובר בתהליך ארוך שמצריך שימוש בחומרה יקרה שנמצאת לרוב בחוות השרתים של ספקיות הענן הגדולות, ועל מנת ליצור גרסאות חדשות ומשופרות של המודלים יש לעבור את התהליך הזה שוב ושוב. לא בכדי גייסה OpenAI סכום עתק של 13 מיליארד דולר ממיקרוסופט בשנים האחרונות. "עלות משמעותית נוספת היא מה שנקרא Inference (הסקה) - ההרצה של המודל", אומר ג'אפה. "ב-GPT-4 זה יכול לעלות עשרה סנט לכל שאילתה. עבור חלק מהשאילתות מדובר במחיר גבוה, אבל אם חסכת שעה של עבודה או שבע שעות תכנות של עובד שעולה מאות דולרים לשעה, זה לא כל כך יקר. זה באמת תלוי בסוג השימוש שלך - אם מדובר בפעילות שיש לה ערך גבוה מאוד או בפעילות הפסדית".
אתה מאמין שהעלות של אימון המודלים והרצתם תרד עם הזמן?
"המודלים הופכים לגדולים ומורכבים יותר, אז אני חושב שהעלות הכוללת של האימון לא תרד באופן ניכר בעתיד הקרוב. ייתכן שהיא אפילו תעלה. מצד שני, כיום אתה יכול למצוא מודל גדול בקוד פתוח, שדומה ביכולות שלו לחלק מהמודלים הקודמים של OpenAI, ולאמן אותו די בזול. עם זאת, הוא לא יהיה עוצמתי כמו המודלים האחרונים שמגיעים מהמעבדות המובילות, שהם הרבה יותר גדולים".
הריאיון עם ג'אפה התקיים יום לאחר שאילון מאסק ושורה של חוקרים בכירים בתחום ה-AI פרסמו מכתב שקורא לעצור את ההתקדמות בתחום לחצי שנה, על מנת לפתח פרוטוקולים שיבטיחו שהטכנולוגיה לא תגרום נזק לאנושות. "זה יצר דיון מעניין מאוד באינטרנט", עונה ג'אפה בזהירות כשהוא נשאל לדעתו בנושא. "אנחנו עוקבים מקרוב אחרי האבולוציה של הבינה המלאכותית היוצרת, וכמו עם כל טכנולוגיה חדשה יש כאן בעיות וסכנות שיזמים ועסקים צריכים להיות מודעים אליהן, אבל באופן כללי הייתי אומר שהעמדה שלנו היא שמדובר בטכנולוגיה טרנספורמטיבית שהיא יותר גדולה מההייפ, ויש לה פוטנציאל ליצור ערך עצום עבור ארגונים".
ג'אפה מבהיר כי הוא מודע למגבלות ולאתגרים הרבים של הטכנולוגיה - החל באמינות של המודלים שמפיקים לעיתים קרובות מידע שגוי, דרך סוגיית זכויות היוצרים שטרם נפתרה ועד לפרטיות ולאבטחה - אבל לדבריו, כל אלה הם גם הזדמנות עבור יזמים וסטארטאפים. "אלה אתגרים קשים, אבל אם תתמודד איתם בצורה טובה זה יכול להיות יתרון תחרותי", הוא מסביר. "יש הזדמנויות גם במובן הזה שיש הרבה בעיות לפתור, כך שיש יקום שלם של סטארטאפים שאפשר להקים על מנת לעשות את זה".
"חלק עצום מחברות הפורטפוליו שלנו הוסיפו תוך זמן קצר יכולות של בינה מלאכותית יוצרת למוצרים שלהן. יש כאן תופעה מעניינת: חברה שמעוניינת לפתח יכולות של בינה מלאכותית קלאסית צריכה לגייס מאות מהנדסי למידת מכונה, אבל יכולות של בינה מלאכותית יוצרת הן הרבה יותר פשוטות להטמעה במוצרים קיימים"
עד עכשיו ראינו מודלים של בינה מלאכותית בעיקר בתחום הטקסט והתמונות, ואנחנו מתחילים לראות אותם מגיעים גם לתחומי הווידאו והמוזיקה. מה הולך להיות הדבר הבא?
"אני חושב שתחום אחד שיהיה מעניין מאוד הוא מולטי-מודאליות - מודלים שמשלבים כמה יכולות, למשל טקסט ותמונות. OpenAI הכריזה ש-GPT-4 יכול לראות תמונה וליצור טקסט שמסביר מה רואים בה. אפשר להציג לו תמונה ולבקש ממנו להסביר למה היא מצחיקה, והוא יענה שזה בגלל שיש בה איש שנועל רק נעל אחת או משהו כזה, ואנשים נוהגים לנעול שתי נעליים. אפשר לדמיין מערכת שעושה אוטומציה של תהליך עבודה, וכל הזמן מקבלת צילומים של מה שנמצא על המסך ומייצרת לפי זה טקסט, שהוא הקלט לתוכנה שמאפשרת למחשב לבצע משימות שונות. תדמיין אדם עיוור או עם לקות ראייה שיכול להסתובב עם אוזנייה ומשקפיים שיגידו לו מה נמצא מסביבו. אני חושב שזאת חזית מעניינת מאוד, יש כאן כמות עצומה של יכולות פוטנציאליות. לפני שנה לא היה ברור אם חלק מהמערכות המולטי-מודאליות האלה יעבדו".
לדברי ג'אפה, המודלים המולטי-מודאליים עשויים להאיץ את הפיתוח של רובוטים הומנואידיים (דמויי אדם), מכיוון שהם יאפשרו למפתחים ללמד אותם לבצע פעולות באמצעות הוראות טקסטואליות שמבוססות על צפייה בסרטונים, במקום להסתמך על קוד. "עדיין צריך להתמודד עם סוגיות של אמינות והזיות (הכוונה היא לנטייה של מודלי שפה להמציא מידע - י"מ)", הוא מסייג, "אבל זה נראה מבטיח מאוד". עם זאת, ג'אפה מזכיר כי אחד האתגרים המרכזיים בפיתוח רובוטים הוא העובדה שהם שבריריים למדי, ואת זה הבינה המלאכותית לא יכולה לפתור.
האם העובדה שגוגל ומיקרוסופט מטמיעות יכולות של בינה מלאכותית יוצרת במוצרים שלהן תקשה על חברות קטנות יותר כמו ג'ספר או AI21 להתחרות?
"אני חושב שיהיה מעניין מאוד לראות מי ייהנה מהיתרון התחרותי המשמעותי ביותר. חלק מהאנשים מאמינים שרוב הכוח הכלכלי ילך לחברות שבונות את מודלי הבסיס הגדולים, בגלל שהם דורשים הרבה זמן, ידע, כסף ותשתיות. אחרים חושבים שמי שייהנו מיתרון תחרותי הן החברות שמטייבות את המודלים ומתאימות אותם למקרי שימוש ספציפיים, מכיוון שיש בבעלותן דאטה לאימון או פידבק מהמשתמשים שמשמש כדאטה. אחרים חושבים שהיתרון הכלכלי יימצא ביישומים של ספקי התוכנה, בגלל שהם ישלטו בחוויית המשתמש ובמהלך העבודה, יהיו חיוניים למערכות אחרות וכך יהפכו למעין פלטפורמות. אני חושב שקצת מוקדם לדעת איך הדברים יסתדרו. זה גם עשוי להשתנות לפי התחום הספציפי - ייתכן שיהיו ורטיקלים שבהם היתרון הכלכלי יהיה בתהליך הטיוב של המודלים ובקבלת הפידבק מהמשתמשים, ובתחומים אחרים מודלי הבסיס יעבדו כל כך טוב כבר מההתחלה שלא יהיה צורך בעוד שכבה מעליהם. אני חושב שאנחנו עדיין בערפל בהקשר הזה".
יכול להיות שחלק מהחברות מאמצות בינה מלאכותית יוצרת רק בגלל שזה אופנתי כיום?
"אני בטוח שזה נכון. מצד שני, אני רואה חלק עצום מחברות הפורטפוליו שלנו מוסיפות באופן מפתיע תוך זמן קצר יכולות של בינה מלאכותית יוצרת למוצרים שלהן, בצורה שמאוד מוצאת חן בעיני המשתמשים. דוגמה אחת היא Swimm, חברה ישראלית שפיתחה פלטפורמה לתיעוד קוד, שהוסיפה פיצ'ר שנותן למשתמשים הצעות כיצד לתעד את הקוד. זה פשוט הופך את המוצר להרבה יותר טוב. יש כאן תופעה מעניינת וחשובה: חברה שמעוניינת לפתח יכולות של בינה מלאכותית קלאסית צריכה לגייס מאות מהנדסי למידת מכונה, אבל יכולות של בינה מלאכותית יוצרת הן הרבה יותר פשוטות להטמעה במוצרים קיימים".