"אני אוהב מפתחים שחושבים שהתוכנה שלהם מושלמת", צוחק רוג'ר ברגה, מנהל בכיר בתחום הבינה המלאכותית באמזון, כשאני שואל אותו על בלייק למוין, המהנדס שהושעה מחברת גוגל לאחר שהכריז כי מודל השפה החדש שלה, LaMDA, פיתח תודעה.
עוד כתבות שיעניינו אתכם:
מיד לאחר מכן פניו מרצינות והוא מסביר לי עד כמה למוין רחוק מהמציאות: "בלמידת מכונה (תת-תחום מרכזי בבינה מלאכותית - י.מ) אנחנו לוכדים את המאפיינים הסטטיסטיים שקיימים בדאטה על מנת להגיע למסקנות שמתכתבות עם מה שהוא כולל ומשתמשים בהן בתחזיות עתידיות. זה מאוד שונה מבינה כללית אמיתית, שכוללת יצירתיות, השראה ומוטיבציה. הדברים האלה שונים מאוד ממה שאנחנו עובדים עליו היום".
זה לא שזה לא יכול לקרות אף פעם. "יש תקווה", מודה ברגה ומזכיר את פרופסור מרווין מינסקי המנוח, מחלוצי הבינה המלאכותית שהלך לעולמו בשנת 2016. "בספר 'חברת הנפש' (The Society of Mind) הוא כתב על חברה של מוחות שבה האינטליגנציה בנויה ממאות אנשים חושבים. אז אולי היום אנחנו בונים את הלבנים שישתלבו בדבר הזה בסופו של דבר, אבל לדעתי הצנועה אנחנו עדיין במרחק של עידנים משם".
ברגה מציין שאומנם קיימים היום מודלים מתקדמים של בינה מלאכותית שיכולים לבצע משימות שהם לא בהכרח אומנו עליהן, "אבל כל המידע נמצא בדאטה. בינה אמיתית זה כאשר אתה מקבל החלטה בלי דאטה - אולי היה לך ניסיון, אולי תחושה, אולי השתמשת בשיקול הדעת שלך והבנת את הסיכונים".
השיחה עם ברגה, מנהל תחום ראיית המחשב בחטיבת שירותי הענן של אמזון (AWS), מתקיימת בכנס re:mars של ענקית הטכנולוגיה, שעוסק בבינה מלאכותית, אוטומציה, רובוטים וחלל. סביר להניח שהנוכחים היו שמחים מאוד להכריז שהבינה המלאכותית שלהם פיתחה תודעה, אבל האמת היא שההישגים שלה בינתיים צנועים הרבה יותר. אמזון הכריזה במהלך הכנס על רובוט חדש בשם פרוטאוס, שיכול לנוע באופן אוטונומי במחסנים שלה ולשאת על גבו עגלות מלאות בחבילות ממקום למקום. מדובר ברובוט נמוך ושטוח שנראה כמו גרסה מוגדלת של שואב אבק רובוטי, ובחברה אומרים כי הוא יכול לפעול באופן בטוח בסביבה שבה עובדים בני אדם בלי להתנגש בהם בטעות.
עוד הכרזה מסקרנת הייתה על פיצ'ר חדש של אלכסה, הסייעת הקולית של אמזון (שאינה זמינה בעברית), שיאפשר לשכפל קול של אדם בהתבסס על הקלטה קצרצה באורך של פחות מדקה. עד כה נדרשו לכך שעות של הקלטות. רוהיט פרסיד, סגן נשיא בכיר והמדען הראשי של אלכסה, הציג סרטון קצר שבו נראה ילד מבקש מאלכסה שסבתו, שהלכה לעולמו, תסיים להקריא לו את "הקוסם מארץ עוץ". מיד לאחר מכן מתחילה הסייעת הקולית לקרוא לילד מהספר בקולה של הסבתא המנוחה.
פרסיד הזכיר את מגפת הקורונה: "רבים מאיתנו איבדו מישהו שהם אוהבים. בינה מלאכותית לא יכולה להעלים את הכאב שכרוך באובדן, אבל היא יכולה לגרום לזיכרון שלהם להישאר איתנו". אמזון לא הודיעה מתי הפיצ'ר יושק או כיצד היא מתכוונת למנוע שימוש זדוני ביכולת לשכפל את קולם של בני אדם.
עידן הזהב של הבינה המלאכותית
"אנחנו חיים בעידן הזהב של הבינה המלאכותית, חלומות ומדע בדיוני הופכים למציאות", סיכם פרסיד את נאומו. ואכן, הכנס מתקיים שבועות ספורים אחרי שהמודלים Imagen של גוגל
ו-DALL-E2 של OpenAI, שמאפשרים ליצור תמונות ריאליסטיות באמצעות הקלדת תיאור טקסטואלי בלבד, עוררו השתאות ברחבי העולם.
ברגה סירב להשיב לשאלה אם אמזון עובדת על פיתוח דומה, אבל סיפר שגם הוא ראה והתרשם: "אנחנו בהחלט חושבים שזה מעניין. זה מבדר, אבל אני לא יודע מה הערך העסקי. אין לקוחות שבאים אליי ואומרים לי 'היי, תעשה את זה'. אנחנו חברה שהלקוחות הם חלק מרכזי במה שמניע אותה. כרגע אני לא מצליח לחבר את הנקודות".
במסגרת תפקידו אחראי ברגה בין היתר על מערכת זיהוי הפנים Rekognition. לפני שנתיים, בשיאה של מחאת Black Lives Matter, הודיעה אמזון שלא תאפשר למשטרות ברחבי העולם להשתמש בה עוד. באופן כללי, טכנולוגיות זיהוי פנים נחשבות לשנויות במחלוקת: הן הובילו בעבר למעצרים שגויים של שחורים והן מאפשרות לרשויות לבצע מעקב המוני אחר אזרחים.
"אנחנו מאמינים שצריך להשתמש בטכנולוגיה בצורה אחראית ושמדיניות וטכנולוגיה צריכות להתקדם זו לצד זו", מסביר ברגה את ההחלטה מ-2020, "לפעמים הטכנולוגיה מתקדמת מהר יותר מהמדיניות. כאשר ראינו שאין מדיניות עקבית, החלטנו להגביל את השימוש בטכנולוגיה".
מי הלקוחות של הטכנולוגיה הזאת, אם כך?
"יש לנו הרבה לקוחות בתחום המדיה והבידור, שיש להם קטלוגים גדולים של תמונות וסרטונים שהם רוצים לעבד ולסווג באופן דיגיטלי. נגיד שהייתה יום הולדת לשחקן מסוים, אתה רוצה לערוך חיפוש ולמצוא קליפים חמודים שלו לאורך השנים. מקרה שימוש נוסף הוא ניטור תוכן - לקוחות יכולים להשתמש במערכת כדי לבדוק כל קובץ שהמשתמשים שלהם מעלים ולהבין מה הוא כולל. הלקוחות אומרים לנו מה הם רוצים לסנן ואנחנו יכולים להתריע בפניהם כדי שיוכלו להגן על המשתמשים שלהם".
"מקרה השימוש השלישי הוא אימות זהות. בכלכלת החלטורה ובזירות מסחר ברשת אנשים רוצים להזדהות באמצעות תעודת זהות ועם הפנים שלהם כדי להוכיח שהם מי שהם טוענים שהם. תחשוב שאתה נכנס ל-Airbnb: אתה מראה למצלמה את תעודת הזהות שלך, נותן לה לבדוק את הפנים שלך, והיא מאפשרת לך להיכנס".
הכותב היה אורח חברת אמזון בלאס וגאס