הגבול הבא של הבינה המלאכותית צפוי להיפרץ בקרוב: יצירה של תוכן כתוב ושל תמונות זה כבר חדשות ישנות בעולם ה-AI המסחרי. הגבול הבא שאותו מנסים לפרוץ? וידאו וסרטים. עם ChatGPT, DALLE-2 ו-Midjourney אנחנו יכולים ליצור טקסטים ותמונות, אבל עם הכלי החדש של חברת Runway, אפשר כבר לייצר סרטון של שלוש שניות ממשפט או שניים.
3 צפייה בגלריה
וידאו מבוסס AI הוא הגבול הבא של בינה מלאכותית
וידאו מבוסס AI הוא הגבול הבא של בינה מלאכותית
וידאו מבוסס AI הוא החזית הבאה של בינה מלאכותית
(צילום: Shutterstock)
הכלי החדש שהוצג ביום שני עדיין נמצא בניסוי סגור, כלומר לא ניתן להשתמש בו אלא אם נרשמתם מראש. כיום הוא מאגד כמה אלפי משתמשים רשומים והאישורים לבקשות חדשות ניתנים במשורה. עם הסרטונים שהוא מפיק ככל הנראה שלא ניתן יהיה לעשות הרבה כיום. בין היתר אין להם סאונד, אבל מנכ''ל החברה ומייסדה המשותף קריס ולנזואלה אומר שזה רק עניין של זמן עד שהנושא ייפתר.

עוד כתבות שיעניינו אתכם:

התוצרים עדיין בוסריים. הם לא נראים חדים מאוד והבינה המלאכותית לא מצליחה להציג איכות ויזואלית מספקת כדי שהסרטים יראו אמיתיים לחלוטין. בקשו ממנה למשל מכונית נוסעת על כביש ביער והיא אולי תחליק מדי פעם בתוך עץ או תעופף מעל הכביש. אבל אלה גליצ'ים נסלחים בשלב הזה וההישג עדיין מרשים גם אם יש שחקנים מתקדמים אפילו יותר. Runway לא לבד: חברת אידומו הישראלית, סטארט-אפ המתמחה ביצירה של תוכן ויזואלי לחברות וארגונים, הציגה היום כלי שמאפשר ליצור סרטונים על בסיס פקודות או תיאור טקסטואלי. את הוויזואליה שמשמשת כבסיס לסרטים הם אומנם לוקחים ממאגר תמונות קיים ששייך לסוכנות תמונות מסחרית. מנגד, ויותר טוב מהאמריקאים, הסרטונים שלהם כוללים גם צלילים והם יכולים להגיע לכמה דקות לעומת שלוש שניות אצל Runway.
היכולת, אם כך, קיימת. היא פשוט לא נפוצה וזה לא לחינם. מדובר בטכנולוגיה שניתן בקלות לנצל לצרכים לא חוקיים או אף זדוניים. יצירה של סרטוני וידאו על בסיס בינה מלאכותית קיימת כתחום מחקרי כבר שנים מספר. היישום הראשון והבעייתי שלה, בדמות דיפ פייק או עריכה של סרטוני וידאו קיימים לפורנו נקמה או הסתה פוליטית ברשתות החברתיות, הרים דגל אדום למפתחים.

הסכנות? פורנו נקמה, הפללות והסתה פוליטית

גם מטא וגם גוגל הציגו כבר בשנה שעברה טכנולוגיות ליצירת סרטונים באמצעות בינה מלאכותית. היום הציגה גם אנבידיה, ענקית השבבים שמספקת חלק ניכר מתשתיות המחשוב שמשמשות להפעלת מערכי ה-AI האלה, חידושים בתחום. במסגרת כנס GTC הציגה החברה את Picasso - שירות ענן לפיתוח והטמעה של יישומי AI גנרטיביים שהופכים טקסט לתמונות, קטעי וידאו או תוכן בתלת-ממד לעולמות הבידור, גיימינג והעיצוב.
3 צפייה בגלריה
GPT-2
GPT-2
יש גם צדדים אפלים לוידאו מבוסס AI
(עיבוד תמונה. צילום: shutterstock, Open AI)
את היישומים הראשונים תציג אדובי לתחום התמונות והסרטים דרך שירותי פוטושופ ופרימייר (תוכנה מקצועית לעריכת וידאו) מותאמים. אבל לא מדובר רק באדובי, גם מאגרי התמונות שאטרסטוק וגטי אימג'ס ישתמשו במודל של אנבידיה ליצירת סרטוני תלת-ממד יש מאין על בסיס תיאור כתוב פשוט.
מטא וגוגל, לעומת זאת, עדיין ממתינות. הבעיה העיקרית היא ככל הנראה לא טכנולוגית: כפי שראינו, יש מספיק חברות שכבר מציעות כלים מתקדמים למדי. הבעיה היא שסביר להניח שהכלים עדיין לא מספיק משויפים. אם במודל שפה מספיק לאמן אותו על טקסטים מרחבי הרשת או מתמונות סטטיות, אימון של כלי וידאו הוא הרבה יותר מסובך. כך שנדרש זמן רב יותר והשקעה גדולה יותר כדי לייצר מאגר מספיק גדול של סרטונים שיאפשר לבינה המלאכותית ללמוד את המלאכה. ד"ר טלי דקל, מומחית לראיית מחשב ממכון ויצמן וגוגל, הסבירה בשנה שעברה בריאיון ל-ynet כי ישנן בעיות רבות שעדיין לא נפתרו בכל הקשור ליצירת וידאו באמצעות בינה מלאכותית. "כמות הדאטה הרבה יותר גדולה וגם המרחב והזמן לא מתנהגים בסרטונים כמו בתמונות. בשביל שנראה פריצת דרך מאוד משמעותית בתחום תצטרך להיות כאן עבודה הרבה יותר עמוקה על איך לעבד מידע בזמן, לייצג תנועה ולהוריד את המידע העודף שיש בווידאו". למרות האתגרים, אמרה דקל, "אני בטוחה שזה יקרה".
בעיה שנייה ומדאיגה מאוד היא סכנת השימוש לרעה בסרטונים האלה. הם מהווים סכנה חמורה לשלטון החוק ולקיום של בחירות דמוקרטיות. מספיק לדמיין שמישהו מייצר סרטון מזוייף של יריב פוליטי אומר דברים שלא אמר כדי לשלהב את ההמונים. הדרך מכאן לחוסר אמון מערכתי קצרה למדי. תסריט מדאיג אחר הוא הפללה של אדם באמצעות יצירת סרטון מזויף שלו מבצע עבירה מסוימת. סרטון כזה יכול לשמש לסחיטה או לעדות שקר במהלך משפט. בקיצור, הסכנות מרובות.

איך מוכרים שירות יצירת סרטים מהדמיון?

גם המודלים העסקיים עדיין לא ברורים. בחלק מהמקרים היזמים מכוונים לתעשיית היוצרים ומתארים את הכלים האלה כאמצעי להקל על במאים, תסריטאים או יוצרי תוכן פרסומי. אבל מדובר בשווקים מצומצמים יחסית, והתפעול של מערכי בינה מלאכותית בהיקפים האלה דורש הרבה כסף ואנרגיה. כלומר החברות יצטרכו למצוא תסריטי שימוש מכניסים מספיק כדי לכסות על ההשקעות.
3 צפייה בגלריה
מארק צוקרברג וסונדר פיצ'אי
מארק צוקרברג וסונדר פיצ'אי
גם מטא וגם גוגל מהססות להיכנס לתחום
זה לא מפתיע, תוכן וידאו משמש לתיעוד החיים שלנו, כדי למכור לנו דברים, ככלי פדגוגי או לבידור. כל אלה שימושים מקצועיים מאוד ספציפיים. אם מתעלמים מהתיעוד העצמי, שכמובן לא דורש בינה מלאכותית, השימושים הנותרים לא מייצגים שווקים מאוד נרחבים. לכן, אין זה מפתיע שהראשונות למנף את הטכנולוגיה הן חברות מאגרי תמונות או כלי יצירת תוכן מקצועי.
ישנו תחום נוסף שעשוי ליהנות מהיכולות האלה: פורנו. תעשיית הבידור למבוגרים מייצרת הרבה מאוד תכנים וכלי בינה מלאכותית יוכלו לסייע לה להקטין מאוד את עלויות ההפקה ואולי אף להפיק סרטים מדמויות מזויפות. גם כאן ישנה סכנה שבינה מלאכותית תשמש ליצירת תכנים לא חוקיים למיניהם, אבל זה כנראה לא מה שיעצור את השימוש בטכנולוגיה הזאת בידי יוצרי פורנו. מדובר תעשייה שנחשבת למאמצת מוקדמת של חידושים טכנולוגיים, למשל וידאו ברשת, צ'אט וידאו, עולמות וירטואליים ושימוש במשקפי מציאות מדומה. לפי שעה, לא ידוע מתי תתברר ההיתכנות המסחרית בינה מלאכותית ליצירת סרטוני וידאו. בינתיים, כל השחקנים בתחום מציבים את הכלים שלהם על לוח המשחק כדי להיות מוכנים לשעה שאולי יימצא משהו מספיק מכניס.