חברת OpenAI הציגה אמש (יום ב') את מודל הדגל החדש שלה: GPT-4o. בניגוד לגרסאות ChatGPT הקיימות, הצ'אטבוט החדש לא מסתפק בהתכתבות דמוית צ'אט. במקום זאת הוא מבין את המשתמש באמצעות קול או תמונה ויכול להגיב באמצעות דיבור. באירוע בשידור חי החברה הדגימה את עבודת המודל שמזכירה בחוויה שיחה עם סירי של אפל, אבל עם יכולות שעולות משמעותית על כל סייעת קולית קיימת. OpenAI הציגה הערב גם את גרסת הדסקטופ של ChatGPT, שמצטרפת לגרסאות האונליין והמובייל.
2 צפייה בגלריה
אירוע הכרזת GPT-4o של OpenAI
אירוע הכרזת GPT-4o של OpenAI
גרסת המחשב החדשה של ChatGPT
(צילום מסך: יוטיוב)
לפני האירוע נפוצו שמועות ש-OpenAI עומדת להציג מנוע חיפוש AI שיתחרה בגוגל, או לחילופין את מודל הבינה המלאכותית המצופה GPT-5. כל אלה לא קרו ומנכ"ל החברה סם אלטמן צייץ לפני כן: "זה לא GPT-5 ולא מנוע חיפוש, אבל עבדנו קשה על כמה דברים חדשים שאנחנו חושבים שאנשים יאהבו. מרגיש כמו קסם".
מודל GPT-4o (האות o מסמלת את המילה omni, כלומר ריבוי), הוא יישום משמעותי ראשון של גישת הבינה המלאכותית הרב-מודאלית, שרבים חוזים כי תתפוס את מקומה של הבינה המלאכותית המבוססת על הבנת טקסט (NLP) בלבד. בהדגמה הראו כמה מעובדי החברה יכולת של ChatGPT להגיב בדיבור בזמן אמת (ללא שיהוי) לתמונות ולצלילים, לזהות הבעות פנים ורגש בדיבור, לתרגם סימולטנית מאיטלקית לאנגלית, לזהות קוד תוכנה, והכל בדיבור שמביע רגשות ונשמע טבעי לגמרי. למעשה, הדיבור של ChatGPT הוא כה קולח, עד שיש חשש שיהפוך לנודניק בלתי נלאה, ואולי יגרום לנו להתגעגע לצ'אטבוט הישן והטוב.
2 צפייה בגלריה
אירוע הכרזת GPT-4o של OpenAI
אירוע הכרזת GPT-4o של OpenAI
אירוע הכרזת GPT-4o של OpenAI
(צילום מסך: יוטיוב)
מורי מוראטי, מנהלת הטכנולוגיה (CTO) של OpenAI, אמרה באירוע ש-GPT-4o מציג יכולת בינה מלאכותית ברמה של GPT-4 אבל מוסיף לכך יכולות חדשות בתחום האודיו והתמונה. "זה חשוב ביותר אם אנחנו חושבים על עתיד האינטראקציה בינינו לבין מכונות. אנחנו רוצים שחווית האינטראקציה תהפוך ליותר טבעית וקלה, ושלא תתמקדו בכלל בממשק המשתמש, אלא רק בשיתוף הפעולה עם GPT", אמרה מוראטי.
מודל GPT-4o זמין כבר מהיום בגרסה החינמית שלו, אך הזמינות לכלל ציבור המשתמשים תיקח עוד כמה שבועות או חודשים, ואילו מנויים משלמים ייהנו מיכולת שימוש בו ובכמות שאילתות גדולה פי חמישה לעומת הגרסה החינמית. מה יקרה כשתקרת השימוש במודל תגיע לסופה? הוא יעבור אוטומטית ל-GPT-3.5. עם זה היכולת הקולית של המודל לא תהיה זמינה עדיין והיא אמורה להיפתח לציבור בחודש הבא ולקבוצה קטנה של "שותפים מהימנים". זאת עד שהחברה תהיה בטוחה שהיא יכולה למנוע שימוש לרעה ביכולת יצירת הדיבור. החברה ציינה שבחנה את GPT-4o מול "צוות אדום" של יותר מ-70 מומחים חיצוניים שניסו כל שימוש לרעה שעולה על הדעת.
היום גם נחשפה העסקה של אפל עם OpenAI על שילוב ChatGPT במכשירי אייפון ב-iOS 18. היו דיווחים רבים על מו"מ בין החברה לאפל וכן בין אפל לגוגל, אך נראה שבינתיים ChatGPT ניצח. אחרי הדגמת GPT-4o ניתן להעריך כי אחד השימושים הראשונים שלו יהיה הטמעה לתוך סירי, כך שיכולות העוזרת הקולית ישתפרו משמעותית. אפל דשדשה עד כה מאחור בתחרות על תחום הבינה המלאכותית והעסקה הנוכחית עשויה להחזיר אותה למרכז הבמה בתחרות בין חברות המובייל. העסקה גם צפויה לחזק את מעמדה של OpenAI בתחום הבינה המלאכותית שכן העסקה עם אפל תספק לה תו איכות יוקרתי ביותר.