הפיתוחים הישראליים של גוגל
תמלול סרטונים בסמארטפון בזמן אמת, פענוח דיבור של אנשים עם ליקויים בדיבור, חיזוי שיטפונות ועוד: חמישה פיתוחים של צוותים ישראליים הוצגו בכנס המפתחים של ענקית הטכנולוגיה בשבוע שעבר - רובם מיועדים לסייע לבעלי מוגבלויות. "חיפשנו דרך לעזור לאנשים האלה"
כנס המפתחים של גוגל בשבוע שעבר היה עמוס בהכרזות על חידושים מבית ענקית הטכנולוגיה. בין ההכרזה על מכשירי הפיקסל החדשים לעדכון על הפיצ'רים החדשים במערכת ההפעלה אנדרואיד, הודיעה החברה גם על חמישה מוצרים שמאחוריהם עומדים מפתחים ישראלים. רוב הפיתוחים האלה מיועדים לתמיכה באנשים בעלי צרכים מיוחדים, ועם זאת לכולם יש פוטנציאל לשמש בעתיד גם את הציבור הרחב.
אחד הפיתוחים הבולטים שהוכרזו בכנס I/O בהשתתפות מנכ"ל גוגל סונדר פיצ'אי הוא Live Caption, כלי שיוצר כתוביות לסרטוני וידיאו בסמארטפון תוך כדי הקרנתם. הפיתוח נועד לסייע לכבדי שמיעה, אבל סביר להניח שגם משתמשים אחרים ימצאו בו תועלת.
מיכל רמנוביץ', מהנדסת תוכנה בגוגל AI (בינה מלאכותית), סיפרה שהפרויקט נולד במהלך פיתוח טכנולוגיית ה-Call Screen, שמאפשרת לסנן מתקשרים על בסיס תמלול של דברים שהתבקשו לומר לפני קבלת השיחה. לדבריה, Live Caption מאפשר לקבל כתוביות לסרטוני וידיאו באתרים כמו יוטיוב, וגם לסרטונים שנשלחו באופן פרטי מחבר, בן משפחה או קולגה.
הכל התחיל בהתנדבות
עוד פיתוח המבוסס על בינה מלאכותית הוא Live Relay, המאפשר לאנשים עם ליקויי שמיעה לקבל תמלול מיידי של מה שאומר בן שיחם, ולענות לו באמצעות כתיבת הודעות שמיתרגמות לאודיו. ספיר כדורי, מהנדסת תוכנה בגוגל AI, יזמה את הפרויקט בעקבות התנדבות בארגון TOM שמסייע לבעלי מוגבלויות, ועומדת היום בראש צוות הפיתוח. "זה כבש אותי, אנחנו המפתחים נפגשנו עם בעלי הצרכים המיוחדים ופיתחנו את הפתרונות איתם", סיפרה כדורי, "היה אדם שביקש למצוא דרך שיוכל לצלם תמונות ולא מזמן הוא שלח לי תמונה של אשתו אחרי לידה. זה היה מדהים".
לדברי יוסי מטיאס, סגן נשיא גוגל ומנכ"ל מרכז המו"פ של החברה בישראל, Live Relay נמצא עדיין בשלב פיילוט והוא ישתלב בעתיד בתכונות שונות שישמשו גם את הציבור הרחב. הוא הזכיר טכנולוגיות נוספות שפיתחה גוגל לטובת שימושי טלפון מתקדמים, כמו למשל Google Go שהושקה לאחרונה בהודו - אפליקציה "רזה" שמיועדת לטלפונים חלשים ומאפשרת הקראת טקסטים, ו-Go Lens, שמאפשרת בין היתר לצלם טקסטים ולקבל תרגום שלהם - כלי שפותח בין היתר בישראל.
לדברי מטיאס, הפעולות הטכנולוגיות נעשות כולן במכשיר עצמו ואינן נשלחות לעיבוד בענן. זה לא רק יעיל יותר, אלא מונע אפשרות של זליגת המידע מהשרתים החיצוניים. הטקסט המתומלל אינו נשמר בקבצי טקסט ונמחק מיד לאחר הצגתו הראשונה. מתי הטכנולוגיה הזאת תפעל בעברית? בגוגל לא מתחייבים למועד, אבל מטיאס אומר: "חשוב לנו שהן יעבדו בסופו של דבר בכל השפות".
טכנולוגיה נוספת שפותחה בגוגל ישראל היא Euphonia, מערכת יוצאת דופן לפענוח ותמלול דיבור של אנשים בעלי קשיי דיבור או מבטא לא ברור, למשל חולי ALS או כבדי שמיעה. דותן עמנואל, ראש צוות המחקר בגוגל AI, סיפר: "חיפשנו דרך לעזור לאנשים האלה ובכלל לאנשים שהדיבור שלהם לא סטנדרטי. ראינו שבני המשפחה של האנשים האלה מבינים אותם ואמרנו שאם אנשים יכולים להתאים את עצמם להבנת הדיבור, אולי המודלים שלנו גם יכולים להתאים את עצמם". לדבריו, הצוות פיתח מודל שמותאם אישית לבעל המוגבלות ומאפשר לו גם להפעיל מכשירים בבית באמצעות התממשקות לרמקול החכם גוגל הום.
סלע נבו, ראש צוות מחקר בגוגל AI, הציג מערכת שנועדה להתריע על שיטפונות במדינות שסובלות מתופעת הטבע, ובראשן הודו. נבו הסביר כי גוגל מייצרת מפות טופוגרפיות של האזורים המועדים לסכנה באמצעות צילומים של פני השטח, מפות שמדוייקות פי 90 יותר מאלה הקיימות. על בסיס גובה השטח בכל נקודה לאורך תוואי הנהרות יכולים בגוגל לייצר סימולציה מקורבת למציאות של מיקום השיטפונות ועוצמתם, ולהתריע על כך בפני האוכלוסייה הנתונה בסכנה. לדבריו, בשלב זה המערכת אינה יכולה לעשות סימולציות של שיטפונות באזור נגב בישראל, שכן מדובר בשיטפונות מתפרצים ובלתי סדירים, בניגוד לשיטפונות בנהרות הגדולים בעולם.
"המידע הזה חיוני ומשפיע על חייהם של 250 מיליון אנשים בעולם וצריך לתת להם התרעות מתי השיטפונות צפויים להגיע, תחזית שתאפשר להגן טוב יותר על חייהם", אמר מטיאס. הוא הוסיף כי מדובר בפרויקט שהוצב גבוה בסדר העדיפויות של האו"ם והוא נמצא רק בתחילת דרכו: "יש עוד עבודה רבה לפנינו בעולם הזה".