כשהמחשב יראה במקומנו: הפתרון לכבדי ראייה
בסרטים רבים אנו רואים סצנות בהן המחשב משוחח עם הגיבור והוא בעל חשיבה אנושית לגמרי, עכשיו פיתוח חדש מאפשר לו גם לראות ולזהות את החפצים שהוא רואה. צפו בהרצאתו של פרופ' אמנון שעשוע על הטכנולוגיה שתהיה חלק מחיינו ממש בקרוב
מחשבים לסוגיהם הפכו בעשורים האחרונים לחלק בלתי נפרד מחיינו והשימוש בהם הולך ומתרחב ככל שהטכנולוגיה מתפתחת. אחד האתגרים איתם מתמודדים חוקרים וממציאים הוא הדרך בה ניתן להקנות למחשבים את היכולת ללמוד ולפתח חשיבה תבונית כשל האדם.
עוד סיפורים חמים - בפייסבוק שלנו
בלא מעט סרטי מדע בדיוני ניתן לראות את הגיבור משוחח עם המחשב וממש מנהל איתו דיון או ויכוח. אך מסתבר שהמציאות עולה על כל דימיון.
עוד מאירועי TEDMED live
הטכנולוגיה של מחר: מי ישלוט בגוף שלכם?
הבחירה בחיים: את מי מצילים ראשון בזמן אסון?
לחזות את העתיד: הניבוי שיציל את העולם
המחשב מזהה מי עומד מולו
בכנס TEDMED live הרשמי הראשון שהתקיים לאחרונה בירושלים, הציג פרופ' אמנון שעשוע, את הפיתוח של חברת 'אורקם' עליהם הוא שוקד בארבע השנים האחרונות - מתקן (מצלמה) שמונח על משקפיים של כבדי ראייה ומזהה מה עומד מול האדם באמצעות אלגוריתמים לראייה ממוחשבת.
פרופ' שעשוע הסביר כי האדם לא רואה פיקסלים, אלא המוח מזהה תמונות שלמות, חפצים, אנשים או נופים. התבונה האנושית מתרגמת את המראה למשמעות ולמושג אותו האדם מבין.
הטכנולוגיה היום מאפשרת להעניק למכונות את היכולת ללמוד, לעבד חזותית ולתרגם זאת לשפה טבעית. העיבוד החזותי הוא בעצם 'ראיית מחשב'.
האתגר הגדול הוא, כאמור, ללמד את המחשב לזהות את האובייקטים השונים בצורה מיטבית, שהרי תמונת אובייקט הוא דבר משתנה ומושפע מתאורה, זויות, יום ולילה, וזה נכון לגבי אובייקט חי, צומח ודומם.
כך למשל, כשאדם רואה כיסא הוא מיד מבין שמדובר בכיסא, אך את המחשב צריך ללמד לזהות באלפית שנייה סוגים שונים של כיסאות: כיסא נוח, כיסא מתקפל, כיסא מרופד, כיסא משרד, כיסא גן וכדומה.
המשקפיים שיעזרו לראות
ההתקן של חברת 'אורקם' נבחן בשנה האחרונה במחקרים קליניים, כאשר קבוצת היעד הראשונה שעשויה להפיק מהתקן שכזה תועלת עצומה הם אוכלוסיית כבדי הראייה, והשימוש בו הודגם על במת תיאטרון ירושלים במהלך כנס טד-מד.
מנחת האירוע הרכיבה משקפיים שעליהם הורכב המתקן, החזיקה מולה עיתון והצביע לעברה באצבעה. תוך שניות ספורות הוקראה כותרת העיתון בקול אנושי על-ידי המחשב לעיני הקהל הרב שישב באולם.
ולא רק טקסטים מזהה המתקן של 'אורקם' אלא כל דבר שאנו נתקלים בו ביום-יום: שילוט רחוב, תפריט במסעדה, מוצרים בסופרמרקט, שטרות כסף ואת צבע האור ברמזור. הזיהוי מועבר למשתמש במערכת קולית, כמעט ללא שהות מרגע בקשת המידע.
פרופ' אמנון שעשוע, ממייסדי מובילאיי (טכנולוגיית ראיה ממוחשבת) ומייסד OrCam, בעל דוקטורט במעבדה לבינה מלאכותית במכון הטכנולוגי של מסצ'וסטס. הוא מתמחה במודלים חישוביים בראייה ממוחשבת, יישומים אלגבריים לבעיות תנועה, ניתוח מבנה תלת ממדי מריבוי תמונות והסקה סטטיסטית בניתוח צורה וזיהוי עצמים.
מאמריו בתחום הראייה התלת ממדית זכו בפרס MARR ב-2001 ועבודתו היישומית זכתה בפרס KAYE מטעם האוניברסיטה העברית לשנת 2004. בשנת 2005 הוענק לו פרס לנדאו למדעים מדויקים.