רון יבורסקי ירד במעלית בדרכו למכונית בזמן שקרא מאמר באחד מאתרי האינטרנט. "למה שלא אוכל ללחוץ פליי ולשמוע את המשך המאמר בזמן שאני נוהג?", הוא תהה לעצמו. כך נולד לפני כשנתיים הסטארט-אפ טריניטי אודיו שהופך כתבות ברשת לקבצים קוליים שאפשר לשמוע במכונית, במטבח, בחדר הכושר - כל מקום שתרצו.
אם אתם שואלים את יבורסקי, המהפכה הטכנולוגית הבאה לא תהיה מהפכת המציאות הרבודה (AR) וגם לא מהפכת הבינה המלאכותית (AI). מהפכת האודיו וההפעלה הקולית, הוא אומר בהתרגשות, תשנה את חיינו בדיוק כמו הסמארטפונים בעשור הקודם.
תראו למשל את עולם הרמקולים החכמים: השוק הזה צמח ב-44.9 אחוזים ברבעון השלישי של 2019, ולפי מכון המחקר Pew, לרבע מהאמריקנים כבר יש רמקול כזה בבית. בישראל המצב שונה, בעיקר בגלל היעדר תמיכה בעברית, אבל בעוד כמה שנים גם אנחנו נזמין הביתה בגדים בעזרתה של אלכסה ונבקש מגוגל אסיסטנט להדליק לנו את הדוד.
דוגמה אחרת היא עולם הפודקאסטים שצומח במהירות מדהימה. השוק שהכנסותיו מפרסום הוערכו בכ-479 מיליון דולר בשנת 2018, צפוי לחצות את רף מיליארד הדולר בשנת 2021. זה יקרה בין היתר בעזרתם של שחקני חיזוק כמו ברק ומישל אובמה שיפיקו ויקליטו פודקאסטים עבור ענקית הסטרימינג ספוטיפיי.
קלוני, אני רוצה נספרסו
יבורסקי מדבר בהתלהבות על עתיד שבו נאזין למאמרים, נשמע פרסומות בהתאם לתחומי העניין שלנו ואם נרצה נוכל באמצעות פקודה קולית לבצע רכישה. כרטיס האשראי שלנו הרי כבר מוזן בסמארטפון. חברה כמו נספרסו, למשל, תוכל להקליט את הפרזנטור שלה ג'ורג' קלוני וכל תהליך הרכישה יתנהל מול האוואטר הדיגיטלי שלו.
"זאת מהפכה מטורפת והיא תגיע גם לארץ", אומר יבורסקי, שהקים את טריניטי אודיו כחברה-בת של סומוטו שנסחרת בבורסה הישראלית. "בסופו של דבר כל הטכנולוגיה הזאת מתכנסת למשהו שהוא מאוד טבעי לנו - לדבר".
עד שהתרחיש שטריניטי אודיו מציגה יתממש יחלפו כמה שנים, והמשתמשים יצטרכו להתגבר על החששות ולאשר הפעלה אוטומטית של המיקרופון. חברות הטכנולוגיה, מהצד שלהן, יצטרכו להוכיח שהן פועלות כדי לשמור על הפרטיות של המשתמשים ולא מתמללות הקלטות שלהם, למשל, בלי לחשוף זאת מראש.
"גם מה-GPS חששו בהתחלה", מזכיר יבורסקי, "אבל עכשיו הוא פועל אצל כולם כל הזמן. אנחנו מחנכים את השוק, מלמדים את האנשים - בואו תקשיבו, היום אתם יכולים לנהוג בפקק באיילון ולשמוע כתבה בכיף". ויש גם זווית חברתית: יבורסקי מזכיר כי השירות יסייע מאוד ללקויי ראייה ולאוכלוסייה שאינה יודעת קרוא וכתוב, למשל במדינות מתפתחות כמו הודו.
כיום עובדת טריניטי אודיו עם כמה מוציאים לאור בעולם, למשל המו"ל האמריקאי מקלאצ'י, והופכת את התוכן שלהם לאודיו בעזרת אלגוריתם שמנתח את הטקסט ומסנן את מה שלא רלוונטי למאמר. הכלי העיקרי שבו הם משתמשים הוא אמזון פולי, שירות של AWS, חטיבת המיחשוב ושירותי הרשת של ענקית הטכנולוגיה, להפיכת טקסט לדיבור.
"היו תלונות על זה שמדובר בקול מכני בהתחלה", מודה יבורסקי, "אבל אנחנו מצמצמים מאוד את הפער. שני דברים קורים - פתרונות של הפיכת טקסט לדיבור משתפרים באופן היסטרי, כמו באמזון פולי, ואנחנו בתור בני אדם מתרגלים לקולות מכניים כי אנחנו מדברים יותר ויותר עם מכשירים".
טריניטי אודיו מתרגמת תכנים מאנגלית לשש שפות שונות בעזרת אמזון, ולדברי יבורסקי מו"לים בצרפת ובגרמניה הופתעו מאוד מאיכות התרגום. עברית עדיין אין, אבל בחברה מקווים שאמזון תספק את הפתרון כבר בשנה הבאה וגם אנחנו בישראל נוכל לשמוע מאמרים בכל מקום שנרצה. החלום של יבורסקי הוא כמובן להגיע הכי רחוק שאפשר, ולספק את השירות גם לקוראים של CNN, ניו יורק טיימס, וול סטריט ג'ורנל וכו'.
הפגישה עם יבורסקי מתקיימת בכנס Re:invent שעורכת AWS, חטיבת המיחשוב ושירותי הענן של אמזון, בלאס וגאס. "הגעתי לכאן כדי להעביר שתי הרצאות עם אנשי הצוות של אמזון פולי על הפיכת טקסט לדיבור", הוא מספר ומתגאה בשיתוף הפעולה ההדוק עם ענקית הטכנולוגיה. מכאן הוא ממשיך לכנס של תעשיית הפרסום בניו יורק, בניסיון להדביק עוד אנשים בחיידק האודיו. "אנחנו יכולים לדבר על התחום הזה שעות ובסוף השיחה יהיו לנו רעיונות לחמישה סטארט-אפים חדשים", הוא מבטיח.
הכותב הוא אורח AWS בלאס וגאס