גוגל מעלה הילוך בקרב מול OpenAI ומעבירה את הבינה המלאכותית שלה, ג'מיני, לשלב חדש: מעולם לא הכריזה ענקית הטכנולוגיה על אוסף כה משמעותי של חידושים כמו היום (ג'), בפתיחת הכנס השנתי "גוגל I/O", במאונטיין-ויו, קליפורניה, בנוכחות אלפי עובדים ומאות עיתונאים מכל רחבי העולם.
3 צפייה בגלריה
כנס המפתחים של גוגל
כנס המפתחים של גוגל
כנס המפתחים של גוגל
(צילום: גוגל)
רשימה חלקית בלבד: מנוע חיפוש שמציע סקירה מלאה של הנושא שחיפשתם בנוסף לקישורים; עוזרת אישית וירטואלית המנהלת שיחה קולית טבעית - דמיינו את אסיסטנט אבל עם יכולות שיחה של בן אדם; סיכום אינטליגנטי של כמות עצומה של מיילים בבת אחת; חיפוש באמצעות תמונה (ואפילו וידאו) במקום בעזרת טקסט (מולטימודאלי); ניהול צ'אטים עם AI באפליקציות כמו וואטסאפ; יצירת סרטוני וידאו ברזולוציה גבוהה בהנחיות טקסט בלבד (בדומה ל-Sora של OpenAI); כלים חדשים ליצירת מוזיקה - וגם שבב בינה מלאכותית מדור חדש בשם "טריליום".
מדובר במלחמה: אתמול מיהרה היריבה OpenAI, שעל מודל הבינה המלאכותית שלה מתבססת גם מיקרוסופט, להקדים את גוגל, ולהכריז על מודל מהיר חדש משלה בשם GPT-4o, וכן על עוזרת קולית שמתקשרת כמו בני-אדם, יכולה "להבין רגשות", לתרגם בזמן אמת ואפילו לשנות את טון קולה לפי ההקשר. לאחר האירוע, מנכ"ל OpenAI, סם אלטמן, פירסם ב-X מילה אחת בלבד: "היא" (Her) - סרטו של ספייק ג'ונז, המציג רומן בין גבר לסייעת וירטואלית בטלפון.
הסייעת האישית מבוססת ה-AI של גוגל דומה מאוד, והיא חלק ממה שהחברה מכנה "פרויקט אסטרה". גם גוגל מציגה מערכת עם יכולת שיחה שוטפת, טבעית, שיודעת להשמיע מגוון רחב של אינטונציות בקול, להבין הקשר, ולהגיב במהירות במהלך השיחה. כמו בכל שיחה רגילה, אתם יכולים לדבר איתה בקצב שלכם ואפילו להפריע לדבריה.
3 צפייה בגלריה
כנס המפתחים של גוגל
כנס המפתחים של גוגל
סונדאר פיצ'אי' מנכ"ל גוגל מציג את החידושים האחרונים של ג'מיני
(צילום: ישראל וולמן)
מעל לכל חידושי גוגל, שהציגו המנכ"ל סונדאר פיצ'אי ובכירי החברה, מרחפת גרסה חדשה ועוצמתית במיוחד, שפיתחה למודל הבינה המלאכותית שלה, "ג'מיני 1.5 פרו". זה כולל שיפורים דרמטיים, כגון: "הבנה" טובה יותר של תמונות, אודיו או וידאו. מעתה, לדוגמה, תוכלו לצלם תמונה של בעיה מתמטית ולקבל הוראות מפורטות לפתרונה, או לצלם סרטון שמתאר תקלה במכונה כלשהי - ולקבל הסבר לתיקון. באפליקציית "תמונות" אפשר יהיה לשאול פרט כמו "מה מספר לוחית הרישוי שלי" – ולקבל מיד תשובה וצילום של הלוחית מצילום היסטורי.
בצ'אטים רגילים, ניתן לצרף טקסט בהיקפים אנציקלופדיים, לשאול לגבי שאלות ספציפיות מאוד ולקבל תוך שניות תשובה מפורטת; או להעלות 100 מיילים שקיבלתם מהבוס – ו"ג'מיני" יידע בדיוק להוציא ממנו את המידע הרלוונטי שאתם מחפשים. בקרוב תוכלו גם להעלות אפילו קובץ וידאו של שעה ולשאול שאלה ספציפית לגבי סצנה מסויימת.
עד היום הגרסה (החינמית) הנפוצה בעולם ובישראל, למחשב ולסמארטפון, הייתה "ג'מיני 1.0 פרו". "ג'מיני 1.5 פרו" מתוכנן כשירות בתשלום, שיהיה זמין מעתה ב-35 שפות ב-150 מדינות, כולל בעברית. עוד הציגה גוגל את "ג'מיני 1.5 פלאש" החדש – מודל AI קל משקל יותר ומהיר מה"פרו", ומצטיין במיוחד במשימות כמו יישומי צ'אט, סיכום טקסטים, יצירה אוטומטית של כתוביות תמונה וידאו, חילוץ נתונים ממסמכים וטבלאות ארוכות ועוד.
3 צפייה בגלריה
כנס המפתחים של גוגל
כנס המפתחים של גוגל
כלי יצירת המוזיקה החדש
(צילום: גוגל)
גם את תחום הוידאו גוגל לא מותירה לאחרים: VEO הוא מודל AI ליצירת סרטי וידאו בעזרת הנחיות בלבד, ברזולוציה מרשימה של 1080 פיקסלים ובאורך של יותר מדקה. הוא יתחרה ב-Sora של OpenAI, ובשלב ראשון יהיה זמין להתנסות רק ליוצרי סרטים ויוצרים נבחרים. המודל מבין גם מונחים קולנועיים כמו "צילומי אוויר של נוף". גוגל משתפת בפרויקט את הבמאי והמפיק דונלד גלובר ("מר וגברת סמית") והאולפן שלו.
"אימג'ן 3" היא גרסה חדשה לכלי ליצירת תמונות באמצעות הוראות טקסט בלבד, רק שהפעם עם רזולוציה של 1080 פיקסלים, תמונות כמו-מציאותיות, וגם אפשרות לשילוב טקסט כמו הודעות יום הולדת מותאמות אישית, כותרת במצגות ועוד. גוגל הציגה גם כלים ליצירת מוזיקה - Music AI וגם Sandbox, המאפשרים ליוצרים ליצור קטעים אינסטרומנטליים חדשים מאפס, לשנות צלילים ועוד.
מנוע החיפוש המשודרג יהיה זמין בשלב ראשון רק בארה"ב, אבל גוגל מבטיחה שייפתח למדינות נוספות בקרוב. המשמעות היא שכבר השבוע תהיה למאות מיליוני משתמשים גישה אליו, ועד סוף השנה - ליותר ממיליארד בני-אדם.
הכותב היה אורח חברת גוגל