גוגל מדברת כבר חודשים על מודל הבינה המלאכותית ג'מיני ("מזל תאומים") שאמור להיות התשובה שלה ל-GPT-4 של OpenAI ולהציג "יכולות מולטי-מודאליות שלא נראו לפני כן במודלים קודמים", כאשר הכוונה היא שלמודל יהיו יכולות נוספות מעבר לעיבוד שפה בלבד.
עוד בנושא:
שבעה חודשים עברו מאז ההכרזה על ג'מיני במסגרת כנס המפתחים I/O, אך המודל טרם יצא לשוק. אמש (שבת) דיווח אתר The Information כי גוגל תכננה לחשוף אותו סוף-סוף השבוע, אך דחתה את ההשקה בחשאי לינואר. בגוגל בחרו שלא להגיב לפרסום.
לפי הדיווח, ענקית הטכנולוגיה תכננה להציג את ג'מיני בשורה של אירועים שיתקיימו בוושינגטון, קליפורניה וניו יורק בהשתתפות פוליטיקאים וקובעי מדיניות. אלא שהחברה גילתה שהמודל לא מתמודד באופן אמין עם שאילתות שאינן בשפה האנגלית. מדובר בעניין קריטי עבור גוגל, מכיוון שהמתחרה GPT-4 מפגין יכולות מרשימות בשפות אחרות, כולל עברית.
מאחורי ג'מיני עומדת מחלקת גוגל דיפמיינד - שהוקמה באפריל האחרון כאשר גוגל מיזגה בין מחלקת הבינה המלאכותית שלה, גוגל בריין, לבין סטארט-אפ הבינה המלאכותית הבריטי שרכשה בשנת 2014, דיפמיינד. המיזוג נתפס אז כניסיון של גוגל להאיץ את פיתוח יישומי ה-AI בעקבות ההשקה של GPT-4 ושיתוף הפעולה בין OpenAI למיקרוסופט.
GPT-4 של OpenAI נחשב היום למודל השפה המתקדם ביותר בעולם והוא יכול "להבין" טקסט, תמונות ואודיו. סביר להניח שגוגל מעוניינת להציג יכולות מתקדמות יותר, אולם עדיין לא ברור אילו תכונות בדיוק היא פיתחה עבור ג'מיני.
ג'ף דין, המדען הראשי של גוגל דיפמיינד, התייחס לעבודה על ג'מיני בריאיון שפורסם בשבוע שעבר ב-Economic Times ההודי. "אני הייתי חושב על ג'מיני כעל מודל שנמצא מתחת להרבה קבוצות של מוצרים, ולא בהכרח כעל מוצר חדש", אמר דין, "אנחנו כבר אמרנו שהוא יהיה מולטי-מודאלי ויוכל להבין הרבה סוגים של מודליות וכו'. אבל מעבר לכך, אין לנו על מה להכריז".