אם בתעשיית הטכנולוגיה התרגלנו שחברות הביג טק לפעמים מהלכות בתחום האפור של החוק והמוסר כדי לעשות עסקים, מאנבידיה, המצטרפת האחרונה לעולם הזה עוד לא ראינו מהלך כזה. אבל לא לעולם חוסן. חביבת המשקיעים ככל הנראה נתפסה במהלך שהיינו מצפים שיבוצע על ידי אמזון של ג'ף בזוס, אובר של טראוויס קלאניק או X של אילון מאסק. על פי פרסום של אתר 404 Media אמש (ב') עובדים שלה השתמשו במאגרי סרטוני וסרטי וידאו שנקצרו מאתרים כגון יוטיוב, נטפליקס ומקורות נוספים ללא שקיבלה או ביקשה רשות מבעלי הזכויות.
1 צפייה בגלריה
לוגו חברת אנבידיה במטה החברה בסן חוזה קליפורניה
לוגו חברת אנבידיה במטה החברה בסן חוזה קליפורניה
לוגו חברת אנבידיה במטה החברה בסן חוזה קליפורניה
(צילום: רפאל קאהאן)
החברה הפעילה כ-20 עד 30 שרתים וירטואליים בענן של אמזון כדי להוריד סרטונים שהיה נדרש לאדם כ-80 שנה כדי לראות וזאת בכל יום. מאגר הסרטונים העצום הזה שימש אותה כדי לאמן מודלים בינה מלאכותית לווידאו ששימשו במוצרים כגון האומניברס (מוצר המציאות הווירטואלית של אנבידיה), מערכות נהיגה אוטונומיות למכוניות ומוצרי "תאום דיגיטלי". הפרויקט כונה "קוסמוס" כך על פי עובד לשעבר שהעביר את ההתכתבויות, צילומי המסך מקבוצות הסלאק הפנימיות שהפעילו את הפרויקט.
המטרה של הפרויקט היה לייצר מודל בינה מלאכותית לווידאו כמו Sora של OpenAI. אגב, גם האחרונה נתפסה קוצרת סרטוני יוטיוב לאותה מטרה. אבל המסמכים מראים שבאנבידיה לא הסתפקו רק ביוטיוב, אלא גם עשו שימוש בתכני וידאו של נטפליקס ושירותים נוספים. העובדים אגב היו סקפטיים מאוד לגבי החוקיות של הפרויקט וביקשו מהמנהלים שלהם לבדוק זאת - התשובה שהגיעה אישרה להם שמדובר בפרויקט שאושר בדרגים הבכירים ביותר של החברה.
התגובה של אנבידיה לסיפור הייתה שהשימוש בסרטונים לאימון המודל שלה חוסה תחת "שימוש הוגן". אבל בדוברות של גוגל הזכירו שהשימוש בנתונים שלה לאימון מודל וידאו מהווה "הפרה של תנאי השימוש שלה", בדיוק כמו שהיה במקרה של OpenAI. גם בנטפליקס אישרו שתנאי השימוש שלה לא מאפשרים "קצירה" של נתונים.
הסיפור הזה ממחיש עד כמה תעשיית הטכנולוגיה מרגישה לפעמים שיכורת כוח. האתוס שמקדש את התזוזה המהירה ולא לשאול רשות לא פעם שובר דברים שהיה אפשר בהתנהלות יותר אחראית לשמור שלמים. בנוסף, זה גם עדות להיקף הנתונים העצום שנדרש לאימון מודלים של בינה מלאכותית, מה שאומר שסיפורים כאלה ככל הנראה עוד יחזרו על עצמם פעמים רבות. אפשר להבין את הזעם של בעלי התכנים שהושקעו בהם מאמצים, כסף ומחשבה, ושנגנבים על ידי חברות הטכנולוגיה בשביל הקידום העסקי של המוצרים שלהן. אך כשזה נעשה על ידי חברה ששווי השוק שלה כבר עקף את זה של אפל, אפשר לתהות למה היא לא טרחה לשלם.