ענקית הטק גוגל הכריזה אתמול (ד') על ג'מיני 2.0, גרסה חדשה של מודל ה-AI שלה המסוגל ליצור לא רק טקסט, אלא גם תמונות ואודיו באיכות גבוהה, כך לפי הודעת החברה. לדבריה, המודל החדש מהווה קפיצת מדרגה משמעותית בתחום ה-AI הגנרטיבי, ומציב תחרות ישירה למה שניתן לקבל מ-ChatGPT של OpenAI ומקלוד (Claude) של אנת'רופיק.
3 צפייה בגלריה
ג'מיני 2.0 של גוגל
ג'מיני 2.0 של גוגל
מתוך אירוע ההכרזה של גוגל
(גוגל)
הגרסה החדשה של ג'מיני מצוידת ביכולת להתממשק עם שירותים חיצוניים כמו החיפוש בגוגל, לכתוב קוד ולנתח תמונות וסרטוני וידאו. גוגל טוענת כי המודל החדש מהיר משמעותית מקודמו, ומציע שיפורים ניכרים בתחומי קידוד, חישובים מתמטיים ודיוק עובדתי. יש לציין כי החלק האחרון הוא אולי החשוב ביותר, שכן האמינות של מודלי השפה הגדולים נתפסת עדיין כלא-מאוד-מרשימה ומדובר באחד מהחסמים העיקריים לשימוש בהם כיום.
אחד החידושים המרכזיים בג'מיני 2 הוא היכולת ליצור אודיו מותאם אישית, עם אפשרות לבחור מתוך מגוון קולות ולשלוט בקצב הדיבור. גוגל אף הטמיעה טכנולוגיה להוספת סימן (watermark) על התוכן שנוצר, במטרה למנוע שימוש לרעה וזיופים. יחד עם זאת, יכולות יצירת האודיו והתמונה זמינות כרגע למספר מצומצם של משתמשים - ככל הנראה מסיבות של בדיקת אמינות, והם צפויים להגיע לקהל הרחב בחודש ינואר הקרוב.
3 צפייה בגלריה
ג'מיני 2.0 של גוגל
ג'מיני 2.0 של גוגל
ג'מיני 2.0 של גוגל
(גוגל)

שטף של הכרזות והשקות

השקת המודל החדש של גוגל מגיעה במקביל לשלל הכרזות AI שהיינו עדים להן בשבועות האחרונים, כאשר נראה שכל חברת ביג טק שלה מודל שפה מנצלת את המומנטום כדי להראות את יכולותיה. אלו החלו עם אמזון לפני כשבועיים, והמשיכו עם OpenAI שהודיעה על שבועיים חגיגיים של הכרזות מיוחדות.
בהמשך, אמזון הודיעה על מחשב-על חדש ומודל שפה מתקדם בשם נובה (Nova) שצפוי לטענתה לאתגר את החברות המקבילות, לאחר מכן גוגל הודיעה על השקת מודל חדש ליצירת וידאו, מה שהביא את OpenAI להודיע על השקת מודל הווידאו שלה סורה (Sora) שעורר כל כך הרבה עניין, עד שגרם לקריסת האתר של החברה. לפני מספר ימים גם אילון מאסק הצטרף למסיבה והודיע על מודל השפה החדש של חברת הבינה המלאכותית שלו, xAI, הנקרא Grok-2.
3 צפייה בגלריה
אמזון מציגה את משפחת מודלי ה"נובה" שלה
אמזון מציגה את משפחת מודלי ה"נובה" שלה
משפחת מודלי ה"נובה" של אמזון. שטף של הכרזות
(אמזון)
כל זה מעלה תהיות עד כמה ההכרזות האלה באמת קשורות ביכולות טכנולוגיות חדשות, או שמדובר בעיקר ביצירת באז שיווקי. בינתיים, רוב המודלים האלה או היכולות החדשות שלהם ברובם לא זמינים עדיין לציבור הרחב או שצפויים להיות מושקים בהמשך, וגם אז לא ברור איך או באיזו תצורה.
לא מעט מהם כנראה יהיו זמינים בהתחלה לקהל משלם או נסיינים כדי להימנע מ"פאדיחות" שכבר התרגלנו לראות בכל פעם שטכנולוגיית AI מסוג זה מגיעה לשוק. הקורבן האחרון לכך היא xAI - חברת הבינה המלאכותית של מאסק שחשפה את מודל יצירת התמונות שלה אורורה בשבת שעברה, והסירה אותו אחרי מספר שעות לאחר שזה ג'ינרט תמונות של דונלד טראמפ מגואל בדם או של מיקי מאוס בקרב אגרוף מול לואיג'י (דמות ממשחקי המחשב של מריו).