חברת הבינה המלאכותית הישראלית D-ID הודיעה היום (ד') על השקת כלי חדש שמאפשר לשנות את השפה בכל סרטון וידאו בתוך כמה שניות, וזאת תוך כדי התאמת תנועות השפתיים לשפה החדשה. כדי להמחיש את היכולת החדשה החברה הפיקה לבקשת ynet סרטון של דובר צה"ל תא"ל דניאל הגרי כמו שלא ראיתם אותו מעולם: מדבר סינית, צרפתית, אפילו פרסית. במקור הגרי דיבר כמובן באנגלית, בסרטון שהופץ לתקשורת על ידי דובר צה"ל.
1 צפייה בגלריה
מייסדי D-ID
מייסדי D-ID
מייסדי D-ID מימין: סלע בלונדהיים (סמנכ"ל תפעול), גיל פרי (מנכ"ל), ואלירן קוטה (סמנכ"ל טכנולוגיות)
(צילום: יח"צ)
חברת D-ID פועלת בתחום הרותח של בינה מלאכותית יוצרת (GenAI). הפלטפורמה שלה מאפשרת לחברות ויוצרי תוכן לייצר סרטוני וידאו עם דמויות וירטואליות (אווטארים) הנראות כמו בני אדם אמיתיים, שמקריינות כל טקסט מבוקש, בכל שפה ועם מבחר קולות של קריינים. אבל ההכרזה הנוכחית שונה: D-ID Video Translate הוא כלי שמאפשר לוותר על אותם אווטארים ולערוך באמצעות AI את הדמות האמיתית שמופיעה בסרטון. הכלי החדש משמר את הקול המקורי של הדובר גם בשפות האחרות, ומתאים את תנועות השפתיים לאותה שפה.
האתגר הטכנולוגי פה הוא לא פשוט. טכנולוגיות AI ודיפ פייק מצריכות בדרך כלל הרבה שעות של הקלטות קול וסרטוני וידאו כדי לייצר העתק של האדם באודיו ובווידאו. הטכנולוגיה החדשה מסתפקת בסרטון הווידאו הבודד, מאמנת את ה-AI על בסיס הקובץ הזה ואחר כך משכפלת אותו בשפה החדשה. בשלב זה מוצע מבחר של עשרות שפות, בהן ערבית, מנדרינית, יפנית, הינדית, ספרדית, צרפתית ועוד.
דיבוב אוטומטי של ווידאו היא תכונה מבוקשת מאוד על ידי המשתמשים, כך לפי החברה. הפלטפורמות לינקדין ואינסטגרם השיקו בחודשים האחרונים אפשרות לשנות את השפה של הסרטון על ידי שינוי ההגדרות תוך כדי צפייה בסרטון. האפשרות הזו מוצעת רק בחלק מהסרטונים ובינתיים התוצאה די מאכזבת: היא מזכירה דיבוב של סרטים בערוצי טלווויזיה, שבהם הקול אינו תואם לתנועות השפתיים ולכן יוצר הרגשה מלאכותית.
גיל פרי, מייסד שותף ומנכ״ל D-ID אומר: ״יוצרי התוכן יכולים לחסוך בעלויות ולהרחיב את קמפייני הווידאו שלהם לשפות חדשות. הוא (הכלי) מאפשר למנף השקעות קיימות בתוכן, בין אם מדובר בשיווק, חינוך, בידור או פעילות במדיה חברתית ומסייע למשתמשים להגיע לקהלים ושווקים חדשים עם תוכן בשפה המקומית״.
D-ID מתמודדת בשוק העולמי מול חברות כמו Synthesia ו-Colossyan שמציעות גם הן טכנולוגיות ליצירת אווטארים. באחרונה הציגה D-ID כלי בשם D-ID Video Campaigns, שמאפשר ליצור אווטארים בהתאמה אישית, במגוון שפות תוך שילוב תסריטים דינמיים ומותאמים למשתמש. לטענת החברה הכלי החדש משפר בעשרות אחוזים את מידת התגובתיות (Engagement) וההמרה לפעולה.
בתחילת השנה הציגה החברה טכנולוגיה נוספת, שהופכת את צ'אטבוט ה-AI המוכר, כמו ChatGPT, ג'מיני או Copilot, לאווטאר. במקום להתכתב עם הצ'אטבוט כמו בשיחת וואטסאפ, אפשר לדבר איתו במה שנראה כמו שיחת זום. כך יכולים יוצרי תוכן למשל, לנהל שיחות עם המשתמשים באמצעות האווטאר שלהם עצמם.
חברת D-ID הוקמה ב-2017, על ידי גיל פרי (CEO), סלע בלונדהיים (COO) ואלירן קוטה (CTO). בתחילה עסקה החברה בהתממה (אנונימיזציה) של פרטים אישיים בסרטוני ווידאו. בהמשך החברה עשתה פיבוט לטכנולוגיות וידאו סינתטי (דיפ-פייק). בין השאר היא פיתחה את טכנולוגיית Deep Nostalgia להנפשת תמונות של אנשים שנפטרו, אשר שולבה בפלטפורמה של חברת הגניאולוגיה הישראלית מייהריטייג' (MyHeritage). ב-2022, עם כניסת ה-GenAI לחיינו, החברה התמקדה בפיתוח טכנולוגיות מבוססות AI ליצירת אווטארים.