בחלקים גדולים של העולם העוזרות הווירטואליות - בעיקר סירי, גוגל אסיסטנט ואמזון אלקסה - נמצאות כבר כמה שנים כמעט בכל מקום, מסמארטפון בכיס ועד לרמקול חכם במרכז הסלון. הן מאפשרות למיליונים להשתמש בקולם בלבד כדי להורות לסלולרי או לאוזניות לנגן שיר אהוב, לברר את אורך הגשר הגדול בעולם, לצוות על המזגן להוריד טמפרטורה, או לדלג ערוץ בטלוויזיה. במהלך הקורונה אנשים נעזרו בהן לביצוע תרגלי כושר בבית ולהקראת מתכוני אוכל.
עוד כתבות בנושא:
הפופולרית שבהן היא סירי, שמותקנת מראש על מיליארדי מכשירי אפל הפעילים בעולם, ועובדת עם מכשירים חכמים התואמים לשירות הבית החכם HomeKit. אבל מי ששולטות בשוק הרמקולים החכמים הן גוגל ואמזון. מביניהן, אלקסה מותאמת ליותר מכשירים אבל לא מותקנת כברירת מחדל בסמארטפונים. האסיסטנט, לעומת זאת, נחשבת מתקדמת ומהירה יותר. למשל, היא יכולה להבין ולבצע שתי פקודות בו זמנית - להעלות טמפרטורה במזגן וגם להפעיל את הטלוויזיה. שתי הטכנולוגיה מאפשרות להגדיר מראש מה שקרוי "שיגרות", כך שאמירת "בוקר טוב" למשל, תביא בבת אחת להדלקת האור, להכרזה על מזג האוויר וגם להשמעת שיר מסויים.
דפים בקול אנושי
למרות שעדיין מדובר במשימות פשוטות ומהירות, ההתקדמות בתחום בשנים האחרונות מרשימה, בעיקר בזכות ההתפתחות בטכנולוגיות למידת המכונה והבינה המלאכותית. יותר ויותר יצרניות מטמיעות את הטכנולוגיות במוצרים חדשים שלהן. הן מתוכנתות גם להישמע טבעיות יותר ולחקות תגובות אנושיות.
בעולם - אבל (כמעט) לא בישראל. מבין השלוש, סירי, היא היחידה עד כה המבינה עברית (כמו עוד 20 שפות נוספות), אם כי ברמה מוגבלת יחסית לאנגלית. רוב הישראלים, שהם בעלי סלולריים מבוססי אנדרואיד, אינם יכולים להנות מסייעת קולית. בתחומים אחרים, כמו טלוויזיות ומערכות שמע, חלק מהיצרניות וספקיות מציעות תמיכה לא רעה בזיהוי פקודות קוליות בעברית. לפני שנה נכנסה לתמונה גם רשות החדשנות, שהכריזה על הקמת "איגוד חברות לטכנולוגיות שפת אנוש" בעברית ובערבית במטרה לרתום למאמץ המשותף חברות מובילות במשק. כל זאת, בהשקעה ראשונית המסתכמת ב-7.5 מיליון שקל. בעוד עשרה ימים תקיים הרשות ובינר לקבלת מידע בנושא.
מאחורי הקלעים נרשמת כבר התקדמות איטית: דיווחים מלמדים, כי גוגל מתקדמת במאמץ להתאים למערכת גם את שפת הקודש. לפני כשנתיים הציגה החברה לראשונה תכונה שפותחה במרכז הפיתוח שלה בישראל, המאפשרת לגוגל אסיסטנט להקריא דפי אינטרנט בקול אנושי (בעקבות פקודה באנגלית, למשל Read this page), כשהיא מדלגת בהצלחה על תמונות, תפריטים ופרסומות. עד לאחרונה, דפים בעברית הוקראו רק באנגלית לאחר שתורגמו ברקע, אך עתה ההקראה מתבצעת בעברית מלאה, כמעט ללא שגיאות. אתר הטכנולוגיה הישראלי "גיקטיים" דיווח בשבוע שעבר, כי במכשירים שבדק, המערכת יודעת להקריא לא רק עמודים אלא גם הודעות וואטסאפ בעברית ואפילו מצליחה לענות על שאלות בעברית.
מדובר ככל הנראה בפיצ'ר ניסיוני: עברית לא נתמכת עדיין רשמית בגוגל אסיסטנט. בבדיקה שערכנו, הקראת עמודים לא מתאפשרת בכל אתר, ואת האופציה להקראת הודעות בסמארטפון לא הצלחנו לשחזר - ככל כנראה היא דורשת התערבות מיוחדת בהגדרות או שהופיעה בגרסה ספציפית. לעומת זאת, ממשק הטלוויזיה העברי של גוגל TV מזהה שאלות קוליות בעברית, אם כי חלקית בלבד.
כל אמריקאי שני
בשבוע הבא צפויה גוגל להכריז על הסמארטפונים החדשים שלה מסידרת פיקסל 6. על פי השמועות ברשת, לצדם יושקו כמה עידכונים ושיפורים לגוגל אסיסטנט. הראשון הוא הכתבה קולית משופרת, שמבטיחה זיהוי מהיר ומדויק יותר של מילים ומשפטים, ויכולות חדשות לשליטה במכשיר בפקודות עריכה כמו "מחק", "שלח", או "בטל". האם גוגל ערוכה כבר לשלב בעדכון גם שיפורים בתמיכה העברית? נראה שלא.
חידוש נוסף הוא זיהוי פקודות קוליות שהוגדרו מראש, בלי צורך לומר לפניהן "היי גוגל" כנדרש כיום. ניתן יהיה לענות לשיחה נכנסת באמירת המילה Answer בלבד, או להפסיק צלצול שעון מעורר ב-Turn off. בהמשך, בצורה דומה ניתן יהיה לשלוט מילולית במכשירי בית חכם בלי צורך להקדים ב"היי גוגל".
המגמות בשוק מצביעות על כך שטכנולוגיית העוזרת הקולית תמשיך לצבור פופולריות. כל אמריקאי שני כבר עושה שימוש לפחות במכשיר אחד הכולל אותה; רק לפני שלוש שנים החזיקו פחות מ-1% מהאוכלוסיה בארה"ב במכשיר כזה. השאלה היא לא האם, אלא מתי נוכל לשוחח באמת עם המכשירים שלנו בשפה חופשית וטבעית. וכן, גם בעברית.