עוד יום, עוד מודל של בינה מלאכותית: חוקרים ב-Google Research, זרוע המחקר של ענקית הטכנולוגיה, הציגו אתמול (יום ב') את סינגסונג (SingSong), מודל בינה מלאכותית יוצרת (גנרטיבית) שיכול ליצור ליווי מוזיקלי בסגנונות שונים לקטעי שירה.
עוד כתבות שיעניינו אתכם:
לפי החוקרים, המטרה של המודל היא "לאפשר למוזיקאים וללא-מוזיקאים ליצור מוזיקה עם הקול שלהם בדרך אינטואיטיבית" - רעיון שצפוי להתקבל בזרועות פתוחות על ידי יוצרי תוכן בפלטפורמות כמו טיקטוק, אינסטגרם וכמובן יוטיוב שורטס. אחד החוקרים, כריס דונהיו, צייץ כי בחברה "עובדים על בניית חוויית משתמש מעולה לסינגסונג ואנחנו מקווים שהיא תהיה זמינה לציבור בחודשים הקרובים".
מאחורי סינגסונג עומדות שתי טכנולוגיות מרכזיות: אלגוריתמים מבוססי בינה מלאכותית שיודעים להפריד בין השירה לבין הליווי המוזיקלי בקטעי אודיו, ומודל בינה מלאכותית בשם AudioLM שפותח על ידי גוגל ויכול ליצור קטע מוזיקלי על בסיס האזנה לקטע מוזיקלי קיים.
החוקרים פרסמו שורה של קטעי מוזיקה קצרים שנוצרו באמצעות SingSong, והתוצאות בהחלט מרשימות. עם זאת, יש לו כמה מגבלות: בין היתר, ניתן ליצור באמצעותו קטעים קצרים יחסית, איכות הדגימה של הקבצים שהוא מייצר נמוכה למדי (16kHz) ולמשתמשים הפוטנציאליים אין אפשרות לבחור בסגנון הרצוי לליווי המוזיקלי. החוקרים מציינים כי מסיבה זו, "המערכת עלולה להיות מוטה כלפי קישורים בין זהויות תרבותיות של משתמשים לבין סגנונות מוזיקליים המזוהים עם זהויות תרבויות מסוימות".
גוגל הציגה את SingSong ימים ספורים בלבד אחרי ההכרזה על MusicLM, מודל בינה מלאכותית יוצרת נוסף מבית Google Research שמסוגל ליצור קטעים מוזיקליים על בסיס פקודה טקסטואלית. החברה הודיעה שהיא לא מתכוונת לשחרר את המודל לציבור.
לפי דיווח ב"ניו יורק טיימס", ההתלהבות סביב הצ'אטבוט המתקדם ChatGPT ושיתוף הפעולה המתהדק בין OpenAI שפיתחה אותו לבין מיקרוסופט, גרמו לגוגל לעצב מחדש את האסטרטגיה שלה בתחום הבינה המלאכותית. לפי הדיווח, ענקית הטכנולוגיה מתכוונת להשיק השנה כ-20 מוצרים בתחום הבינה המלאכותית, בהם גרסה חדשה של מנוע החיפוש שלה שתכלול פיצ'רים מבוססי צ'אטבוטים. לא מן הנמנע כי גם שתי ההכרזות האחרונות של Google Research נועדו להבהיר כי ענקית הטכנולוגיה היא עדיין שחקנית מובילה בתחום.