זה היה רק עניין של זמן, אבל מעכשיו כל אחד יכול ליצור אווטאר בינה מלאכותית בדמות אדם, כזה שמאזין לדיבור ומשיב בקול אנושי. תודו שזו התקדמות משמעותית, במקום משבצת הצ'אטבוט המוכרת (ChatGPT, ג'מיני ודומותיהן), שבה התקשורת היא באמצעות טקסט. מאחורי הטכנולוגיה החדשה ניצבת חברת D-ID הישראלית, שאחרי קרוב לשנה של פיתוח ובדיקה משיקה היום (ב') את מערכת ה-D-ID Agents לשימוש הקהל הרחב. ויש כבר משפיעני רשת ומפורסמים אחרים שמשתמשים בה לקשר עם המעריצים, אם כי החברה נמנעת מלחשוף את השמות שלהם.
מדובר בחוויה מסוג חדש לגמרי. אם עד כה הרגשנו שאנחנו מתכתבים בוואטסאפ עם אדם אמיתי - כששאלנו את ChatGPT שאלות קשות והוא ענה לנו בכתב - השיחה עם האווטאר של D-ID מרגישה ממש כמו שיחת וידאו בזום עם אדם אמיתי. החברה שילבה שורה של טכנולוגיות, כולל בינה מלאכותית יוצרת (GenAI), פיענוח דיבור, יצירת קול מטקסט ויצירת דמות תלת ממדית מצילום רגיל של אדם, והכל מתכנס לפלטפורמה ראשונה בעולם שמאפשרת ליצור אווטארים דמויי אדם.
למה זה טוב? באמצעות הפלטפורמה אתם יכולים לייצר לעצמכם אווטאר עימו תוכלו לשוחח במקום להתכתב בדרך הרגילה. אבל היעד העיקרי של D-ID הוא החברות העסקיות, שיוכלו ליצור באמצעות הטכנולוגיה סוכנים נציגי מכירות AI, אנשי תמיכת לקוחות AI, ואפילו להציב את האווטאר של מנכ"ל החברה או הפרזנטור שלה כדי שיענה על פניות הלקוחות. ניתן לשלב את הסוכנים באתרי אינטרנט, במצגות ובאפליקציות, וכך ליצור חוויית משתמש טבעית יותר ללקוחות. אפשר אפילו להתאים אישית את הסוכן ללקוח, כך שיענה על מגוון של אפשרויות מבחינת גיל, מגדר ומוצא אתני ומגוון שפות דיבור.
גיל פרי, מייסד שותף ומנכ״ל D-ID אומר: ״הבנו שההתפתחות הטבעית היא מעבר מאינטראקציות מבוססות טקסט לאינטראקציות מבוססות וידאו וקול. הפלטפורמה שלנו מסייעת לא רק בשיפור איכות האינטראקציות הדיגיטליות ורמת המעורבות של המשתמשים, אלא גם ביצירת הזדמנויות חדשות להגדלת ההכנסות ולצמצום הוצאות תפעוליות. כבר בשלב הבטא של D-ID Agents זיהינו את המוכנות והבשלות של עסקים וארגונים לשלב אווטארים מבוססי AI במערכי שירות הלקוחות והשיווק שלהם, כתחליף לצ׳אטבוט הסטנדרטי. האינטראקציות הדיגיטליות של ימינו חייבות להיות אינטואיטיביות, פרסונליות ומיידיות, והסוכנים החדשים של D-ID מאפשרים לעסקים וארגונים להשיג את המטרות הללו״.
המסע של חברת D-ID החל בשנת 2017, כשהחברה הוקמה על ידי גיל פרי (CEO), סלע בלונדהיים (COO) ואלירן קוטה (CTO) כדי לפתח טכנולוגיה להתממת נתונים פרטיים. מכאן גם שמה, שפירושו הסרת הזהות מצילומי בני אדם. הטכנולוגיה שפיתחה החברה הייתה מעין דיפ-פייק של יצירת פנים חלופיות לפנים האמיתיות, ומהר מאוד התברר שהשוק המלהיב יותר נמצא שם, בעולמות הדיפ-פייק והווידאו הסינתטי, בין השאר בטכנולוגיית ה-Deep Nostalgia ששולבה בפלטפורמה של חברת MyHeritage. בהמשך פיתחה החברה את טכנולוגיית האווטארים, שהם דמויות תלת מימדיות ריאליסטיות שמופקות מצילום דו מימדי רגיל, והשנה האחרונה הוקדשה לשילוב כל הטכנולוגיות כדי לפתח צ'אטבוט AI ויזואלי, בחזית הטכנולוגיה העולמית.
חברת D-ID מתחרה בשוק לא קל, שבו מתמודדות מולה חברות עם טכנולוגיות דומות של פלטפורמות ליצירת אוואטרים, בהן Synthesia, Colossyan ועוד. חברות אחרות מתמקדות ביצירת עוזרים אישיים וירטואליים, דמויות למשחקי VR, אוואטארים לשיחות ווידאו וגם כלים להנפשת אימוג'י וליצירת אוואטרים אומנותיים. עם זה, לחברה יש יתרון ביכולת לייצר אווטארים של בני אדם קיימים בדרך פשוטה.
הפלטפורמה משתמשת בטכנולוגיית (RAG (Retrieval Augmented Generation, המאפשרת ל-AI להתייחס לנתונים יותר רלוונטיים לחברה נותנת השירות וללקוח המסוים, כך שהסוכן מגיב בצורה אופטימלית ומהירה. הטכנולוגיה מציעה התייעלות רבה והפחתת עלויות לחברות, בכך שהיא מאפשרת יצירה של "אנשים דיגיטליים" על בסיס תמונה וטקסט בלבד, דבר המפחית משמעותית את הזמן והעלויות הכרוכים בהפקת תוכן וידאו, ומאפשר יצירת תוכן מותאם-אישית בהיקפים גדולים במיוחד. היכולת של D-ID ליצור סרטונים במהירות של 100 FPS ולהתממשק עם מודלי שפה (LLMs) מאפשרת למשתמשים ליצור חוויה אינטראקטיבית של שיחה פנים-אל-פנים עם דמות מבוססת AI.
מעל 150 מיליון סרטונים יוצרו עד כה בפלטפורמת של D-ID ולמעלה מ-250 אלף מפתחים השתמשו ב-API של החברה ליצירת פרויקטים בשילוב אנשים דיגיטליים. בין לקוחות החברה נמנות חברות פורצ'ן 500, חברות שיווק ופרסום, חברות מדיה והפקה, רשתות חברתיות ויוצרי תוכן, חברות קמעונאיות, חברות בתחום השירותים הפיננסים ועוד.