אנחנו גם כאן, עקבו אחרינו
בינה מלאכותית להמונים: גוגל מציגה את הדור הבא של החיפוש

מאת ישראל וולמן, קליפורניה|
תגיות
גוגל מעבירה את הבינה המלאכותית לשלב חדש: מעולם לא הכריזה ענקית הטכנולוגיה על אוסף כה משמעותי של חידושים כמו אמש, בפתיחת הכנס השנתי "גוגל I/O", במאונטיין-ויו, קליפורניה, בנוכחות אלפי עובדים ומאות עיתונאים מכל רחבי העולם. 
רשימה חלקית בלבד: מנוע חיפוש שמציע לא רק לינקים אלא גם סקירה מלאה של הנושא; עוזרת אישית וירטואלית המנהלת שיחה קולית טבעית; סיכום של כמות עצומה של הודעות דוא"ל בבת אחת; חיפוש באמצעות תמונה (ואפילו וידיאו) במקום בעזרת טקסט; ניהול צ'אטים עם AI בתוך אפליקציות כמו "תמונות" ו"ווטסאפ"; יצירת סרטוני וידיאו ברזולוציה גבוהה בהנחיות טקסט בלבד; כלים חדשים ליצירת מוזיקה - וגם שבב בינה מלאכותית מדור חדש בשם "טריליום".
מדובר במלחמה: שלשום מיהרה היריבה OpenAI, שעל מודל הבינה המלאכותית שלה מתבססת גם מיקרוסופט, להקדים את גוגל, ולהכריז על מודל מהיר חדש משלה בשם GPT-4o, וכן על עוזרת קולית בשיחה טבעית, שיכולה "להבין רגשות", לתרגם בזמן אמת ואפילו לשנות את טון קולה לפי ההקשר.
הסייעת האישית מבוססת ה-AI של גוגל דומה מאוד, והיא חלק ממה שהחברה מכנה "פרויקט אסטרה". גם גוגל מציגה מערכת עם יכולת שיחה שוטפת, שיודעת להבין הקשר ולהגיב במהירות במהלך השיחה. 
מעל לכל חידושי גוגל אתמול, מרחפת גרסה חדשה ועוצמתית במיוחד של מודל הבינה המלאכותית שלה, "ג'מיני 1.5 פרו". זה כולל שיפורים דרמטיים, כולל "הבנה" טובה יותר של תמונות, אודיו ו-וידיאו. מעתה, לדוגמה, תוכלו לצלם תמונה של בעיה מתמטית ולקבל הוראות מפורטות לפתרונה, או לצלם וידיאו שמתאר תקלה במכונה כלשהי - ולקבל הסבר לתיקון. כך, אפשר יהיה לצרף לשאלה בצ'אט טקסט בהיקפים אנציקלופדיים, לשאול שאלות ספיציפיות מאוד ולקבל תוך שניות תשובה מפורטת, או להעלות 100 מיילים שקיבלתם מהבוס – ו"ג'מיני" יידע בדיוק להוציא ממנו את המידע שאתם מחפשים. בקרוב תוכלו גם להעלות אפילו קובץ וידיאו באורך שעה, ולשאול שאלה ספציפית לגבי סצינה מסוימת.
"ג'מיני 1.5 פרו" מתוכנן כשירות בתשלום, שיהיה זמין מעתה ב-35 שפות ב-150 מדינות, כולל בעברית.
בתחום הווידיאו: VEO הוא מודל AI חדש ליצירת סרטי וידיאו בעזרת הנחיות בלבד, שבשלב ראשון יהיה זמין להתנסות רק ליוצרי סרטים נבחרים; ו"אימג'ן 3" ליצירת תמונות באמצעות הוראות טקסט ואפשרות לשילוב טקסט, מותאם אישית.