אתם לא קהל היעד של הכרזות ה-AI מבית גוגל ו-OpenAI - אתם הנזק ההיקפי שלהן. בניסיון לא להפחיד את בעלי המניות (גוגל) ולגייס עוד השקעות (OpenAI) זנחו שתי ענקיות הטכנולוגיה את המחשבה על הערך לצרכן במוצריהן, והעדיפו למכור חלום טכנו-אוטופי רדוד שמאחוריו תסריטי שימוש הנעים בין מוזר למסוכן.
כדי לעמוד על טיב ההבטחות האלה, צריך להתאמץ לזכור דבר מה גם כשהמוח שלנו משדר התלהבות: ממשק שמרגיש כמו יצירת מדע בדיוני לאו דווקא מסתיר מאחוריו טכנולוגיה שיצאה מיצירות מד״ב. כשחברה מציגה הדגמה עם ממשק עוזר קולי שכאילו נלקח מהסרט ״היא״ (כפי שצייץ באגביות סם אלטמן יום לפני חשיפת GPT-4o, ה"ע), זה ניסיון אקטיבי לגרום לכם להאמין שמאחוריו יש בינה מלאכותית מהסוג שראינו בסרט הזה. המציאות, אפעס, מעט שונה. ולא רק כי לסקרלט ג׳והנסון היה הרבה מה להגיד על שימוש בקול דומה לשלה.
שום דבר לא השתנה מהותית בעולם ה-LLM-ים - מודלי השפה הגדולים שמאחורי הממשקים ההולכים-ומשתכללים שגוגל ו-OpenAI הציגו - בתקופה האחרונה. ואם לחדד: הטכנולוגיה הזו עדיין בנויה לייצר פלט תואם סטטיסטית לקלט אותו קיבלה, בלי שום יכולת ״הבנה״ או התעסקות ברובד האנושי של אמת או שקר. זה לא ״היא״ או ״הוא״, זה ״זה״, גם כשהעטיפה מסתירה את טבעה של הטכנולוגיה יותר טוב.
אז למה OpenAI מראה לנו סרטון נלהב של GPT-4o מתקשר עם GPT-4o אחר או מזהה פריטים בסרטון? כי החברה הזו, מהיום הראשון שלה, מנסה למכור לכם חלום עליו היא מפסידה הרבה כסף. זאת כדי שארגונים יקנו ממנה את הטכנולוגיה ויהפכו אותה לרווחית. ההימור הוא שאם כולם מדברים על AI, ארגונים לא יוכלו להרשות לעצמם להתעלם ממנו וככה אולי אפשר יהיה להרוויח.
לא בולעים את הפיתיון
כשמנכ״ל החברה אלטמן אומר שהוא רק רוצה לבנות AGI, בינה מלאכותית כללית או כוללת (הגרסה המד״בית, התבונית של הטכנולוגיה הזו) ולא אכפת לו כמה זה יעלה, התגובה הנכונה היא גלגול עיניים. ברור שכסף זו המטרה. ההיתכנות של AGI על בסיס הטכנולוגיה הקיימת זה סיפור נחמד אבל כרגע רק סיפור, ואילו החשבון החודשי ש-OpenAI מקבלת הוא לגמרי המציאות. והיא אמנם גייסה מעל 11 מיליארדי דולרים, אבל לא מדובר בכלי זול להפעלה ופיתוח (הערכות עלות התפעול החודשית של ChatGPT הן כ-700 אלף דולר ביום ב-2023, ה"ע).
רק שהארגונים לא בולעים את הפיתיון. מעבר לשימושים מגניבים אך מוגבלים בתחומים כמו כתיבת קוד/שאילתות וייצור תוכן פשוט, עוזר קולי שקרן פתולוגי זה לא דבר שקל למצוא לו שימוש הגיוני בארגון. תסריטי השימוש שיאפשרו ל-OpenAI להפוך לרווחית עדיין לא ברורים, ואילו החשיפה המשפטית בשימוש בכלים האלה הולכת והופכת לסכנה מוחשית ככל שהטכנולוגיה - שאומנה על חומר המוגן בזכויות יוצרים - עולה על הכוונת של הרגולטורים ברחבי העולם.
ומה עושים ב-OpenAI, חוץ מאשר לארגן לעולם דרמת סופ״ש עם חילופי מנכ״לים? מחפשים נואשות אחרי חומר עליו אפשר יהיה לאמן את המודלים שלהם. רק לפני זמן קצר הם חתמו עם רדיט, מאתרי התוכן הגדולים בעולם. תוכן של רדיט יגיע ל-ChatGPT, מה שיאפשר לאנשי שיווק לייצר תוכן כאילו-אנושי אמין יותר ולהציף את רדיט בו כדי לקדם את מוצריהם. יהיה מרהיב.
אבל כל זה לא עוזר להייפ, אז OpenAI חייבת גם להמשיך להלהיב. כי היי, אולי אפל תנגוס בפיתיון ותשלב את הטכנולוגיה שלה בסירי כדי לא להישאר מאחור בתחרות מול אנדרואיד. ואם השמועה הזו לא תתממש, ההייפ ההולך-ועולה לא יאפשר לחברות אחרות להיות אדישות. מישהו בסוף בטוח יקנה, ועדיף לפני שמיקרוסופט תפסיק לממן את ההרפתקה הזאת.
אבל בינתיים, אנשים רגילים קונים את החלום. הם חושבים שיוכלו לדבר עם בינה מלאכותית אינטליגנטית שתגיב לרגשות שלהם. אנחנו לא יותר קרובים למימוש החלום הזה בסוף השבוע הזה מאשר היינו בתחילתו. אנחנו כן יותר קרובים לרגע בו אנשים יוכלו להאניש בקלות רבה יותר צ'אטבוט. כבר עכשיו יש מקרים בהם אנשים משתמשים במערכות האלה כתחליף לטיפול מקצועי, ועם הפיכת הממשק הקולי לאמין יותר האשליה תהיה חזקה יותר. זה מסוכן.
הבינה המלאכותית הפכה את החיפוש של גוגל לטיפש
ומה עם גוגל? ההכרזות שלה, על פניו, נראות הגיוניות יותר. לחברה כבר היום יש הרבה ממשקים שימושיים, אז למה לא להוסיף להם יכולות כמו סיכום בשפה טבעית. קודם כל, דווקא כי הממשקים של גוגל כיום כל כך שימושיים. אנשים סומכים על גוגל, ועל LLM-ים אי אפשר לסמוך. מי שמבקשים מגוגל לסכם להם כתבה חדשותית מסתכנים בסיכום לא נכון. אנשים שיבקשו מגוגל להכניס לתוך מייל נתונים מקובץ מסתכנים בזה שהנתונים לא יהיו נכונים.
אבל גם אם אנחנו מגבילים את עצמנו רק לקלט ולא לפלט, גוגל לא הציגה ב-I/O ממשק שפה שנראה לי יותר נוח מלחיצה על מסך מגע או שימוש בעכבר. אני לא רוצה לדבר עם המחשב והטלפון - אני רוצה את הדרך הכי קלה לעבוד איתם. בינתיים, אבל, גוגל עומדת לעשות הרבה מאוד נזק. קודם כל למוניטין שלה עצמה, כפי שאפשר להתרשם מצילומי המסך המבדחים של ״סיכומי AI״ חסרי כל היגיון שמציפים את הרשת בימים האחרונים, לאחר שמשתמשים בארה״ב החלו לראות אותם צמוד לחלק מתוצאות החיפוש. אבל המוניטין של גוגל הוא לא הקורבן היחידי.
גופי מדיה, שמייצרים את התוכן עליו ה-AI של גוגל מתאמן וממנו הוא ״שואב״ את התוכן, סומכים על התוכן שמגיע מגוגל, ועכשיו החברה הולכת להציג את התוכן שלהם כתשובות לשאלות משתמשים בעמוד שלה - בלי להעביר את המשתמשים לאתר של גוף המדיה. עיתונות שמבוססת על חשיפת משתמשים לפרסומות הייתה במצב די נורא עוד לפני השינוי הזה, ועכשיו היא עומדת כנראה לאבד עשרות אחוזים מהתעבורה שלה לטובת תוצאות מסוכמות בדף החיפוש.
די ברור שגם בגוגל מבינים את כל זה. ובכל זאת, החברה נמצאת עכשיו עמוק בתוך מהלך תגובתי. השוק מספר לה בדיות על זה שה-AI תיכף יחליף מנועי חיפוש ואסור לה להישאר מאחור, אז היא מגיבה - לא כי זה נכון, אלא כי אין לה ברירה בתור חברה ששמה את ערך המניה שלה לפני כל שיקול אחר. כמה מהמוצרים האלה יקבלו שניים-שלושה עדכונים ואז ימותו כשהשוק יעבור הלאה לטרנד הבא? אסתכן בניחוש: רובם, אם לא כולם.
בכל מקרה, מיקרוסופט מרוויחה
אבל רגע! גם מיקרוסופט דיברה המון על AI בכנס המפתחים שלה שהתקיים השבוע - איפה הביקורת כלפיה? אל דאגה, ממש כאן!
ההבדל בינה לבין שתי החברות האחרות לעיל הוא שמיקרוסופט נוקטת בגישה יותר מבוססת מוצר כלפי חידושי ה-AI שלה. זו לא בהכרח מחמאה - השילוב של ChatGPT בבינג סובל מכל הבעיות של צ׳אטבוט שקרן שמנסה לסכם מידע - אלא פשוט מהלך שדורש התייחסות קצת שונה. קחו, למשל, את Recall, מנגנון שעוקב אחרי כל מה שאתם עושים עם המחשב, מקליט ומקטלג את זה, ונותן לכם לחפש בהיסטוריה שלכם. אם זה עובד כמו שמיקרוסופט אומרת שזה עובד, לא מדובר בגימיק מוזר או דמו חסר תכלית אלא במוצר אמיתי. דיסטופי? כן, אבל כזה שמאחוריו אפשר לראות חשיבה עסקית וניסיון להפוך את ״חלונות״ ליותר אטרקטיבית.
באופן כללי, נראה שבניגוד לחברות לעיל, מיקרוסופט לא מנסה להציג רעיונות ממש גרועים כחידוש הגדול הבא שממנו אתם צריכים להתלהב, אלא בעיקר רוצה שמפתחים יבואו ויבנו יישומי AI לחלונות. זה משהו שהיא יכולה להרשות לעצמה לעשות בגלל 10 מיליארדי הדולרים שהשקיעה ב-OpenAI, אז הלחץ על שאר החטיבות שלה לעשות שטויות מרגיש נמוך יותר. העתק/הדבק חכם שיכול להמיר טקסט ל-markdown או JSON? זה דווקא מגניב! דיבוב של וידאו בזמן אמת בתוך דפדפן Edge? אם זה עובד טוב, אנשים עשויים להתפתות להשתמש בו במקום בכרום.
חרף היותו של ״עידן ה-AI״ עוד בועה מוזרה של קפיטליזם פופוליסטי, חשוב גם להזכיר שיש למודלי השפה שימושים טובים ונחוצים. שאלו מפתחים, שאלו אנליסטים שכותבים שאילתות מסובכות, שאלו אנשים שצריכים לייצר המון תוכן לא מתוחכם. דברי ההבל על זה ש-AI ישאיר מאות מיליונים בלי עבודה אמנם מטופשים כתמיד, אבל כמה וכמה תעשיות מקבלות כיום כלים מעניינים שמקלים על אנשי מקצוע לעשות יותר בפחות זמן.
החשש שלי הוא שחוסר המוכנות של חברות הענק להתמקד באלה ולבנות את התחום בצורה אחראית יזיק לו בסופו של יום. רכבת ההייפ כבר יצאה מהתחנה, וכשהיא תתרסק בחומת המציאות גם התקצוב של הפרוייקטים השימושיים-באמת יתייבש. ההחלטה להתחיל מממשקי שיחה פסיאודו-אינטליגנטיים שנראים מגניבים אמנם העלתה את התחום לגבהים חדשים של פופולריות, אך היא גם הסכנה הגדולה ביותר עבורו. הציפיות הצרכניות מוגזמות שהיא יצרה לא יובילו לשום דבר טוב. אבל היי, לפחות את הודעת הסגירה של הפרוייקטים האלה נוכל לשמוע בקול טבעי - אם כי גם זה משהו שנוח יותר לקרוא בהודעת טקסט.