לאורך אלפי שנים, חלמה האנושות על יצירה של דמויות מלאכותיות עם אינטליגנציה מהסוג שיש לנו. הרובוט טאלוס הגן על האי כרתים מפני פולשים בכוחות עצמו, אם להאמין למיתולוגיה היוונית. בימי הביניים, אנשים ניסו להבין באמצעות הקבלה איך בדיוק מייצרים גולם. ובמאה ה-19, המפלצת של פרנקנשטיין הפחידה את הקוראים ברחבי העולם.
לאורך רוב רובה של התקופה שבה רצינו יצורים מלאכותיים שיוכלו להחליף אותנו בעבודות הבית ולנקום באויבינו, לא הייתה לנו הטכנולוגיה לייצר אחד. במובנים רבים, גם היום אין לנו. אך החל משנות ה-50 של המאה הקודמת, עם עליית המחשוב, עלינו על מסלול שבסופו, אולי, אוצר שנקרא "בינה מלאכותית כללית" (AGI) - היכולת לדמות חשיבה אנושית.
שימו לב למילה "אולי" כאן. עוד בשנות ה-50 וה-60 חשבו מומחי הבינה המלאכותית של אותם הימים שתכף, ממש עוד מעט, נגיע לשם. השנה היא 2022, ו-DALL-E2 אולי יודע ליצור ציורים מרהיבים, אבל מדובר במוצר צר מאוד מבחינת היכולות שלו. אי אפשר להשתמש באלגוריתמים שעומדים בבסיסו בשביל להכין קפה או לנהל דיון פילוסופי.
בכלל, ב-2022 "בינה מלאכותית" זה מושג שיכול להתפרש בצורה שונה מאוד על ידי אנשים שונים. צרכתם הרבה מדע בדיוני? הדמיון שלכם עשוי אוטומטית ללכת ליצירות כמו "2001: אודיסאה בחלל" או סדרת הרובוטים של אייזק אסימוב, שבהן האינטליגנציה המלאכותית מתנהגת בצורה אנושית למדי. ביליתם את העשור האחרון בעולם הסטארטאפים? אינטליגנציה מלאכותית תהיה, הרבה פעמים, באזז-וורד ריק מתוכן שבו אנשי שיווק משתמשים כדי לתאר משהו שרחוק מאוד מאינטליגנציה. עוסקים במודלים של למידת מכונה? בטח נכנסתם לכתבה כדי לחפש שגיאות (ואנחנו בהחלט נשמח לשמוע מכם).
בהינתן אלפי שנות היסטוריה והרבה משמעויות שונות, מאיפה בכלל מתחילים לדבר על התחום של בינה מלאכותית? אם הולכים אחורה ממוצרי ה-AI הבולטים ביותר של היום ומנסים לשרטט נקודה משותפת לרבים מהם, מגיעים למדינת ניו-המפשייר. השנה היא 1955, ובאוניברסיטת דארטמות׳ קולג׳ פרופסור צעיר למתמטיקה, ג׳ון מקארתי, החליט שהגיע הזמן לפרויקט מחקר שיקדם את תחום המכונות החושבות. השם שנבחר לתחום, "אינטליגנציה מלאכותית", הוא השם בו אנחנו משתמשים עד היום.
אבל קיבלנו הרבה יותר מאשר את השם בסדנת דארטמות' שנערכה בקיץ 1956. הרעיונות שיצאו ממנה, והאנשים שהגו אותם, הם הבסיס שעליו תחום ה-AI המודרני בנוי. והכוונה אינה רק להצלחות שלהם, אלא גם לכשלונותיהם. כך, מהר מאוד הופיעו שני זרמים מרכזיים בחקר של בינה מלאכותית. הראשון, שתפס תאוצה בימים הראשונים של המחקר, הוא בינה מלאכותית סמלית (Symbolic artificial intelligence). ברמה הכי בסיסית, מדובר בבינה מלאכותית שמבוססת על חוקים שמבהירים לה איך "לחשוב", או במילים אחרות, איך לפתור בעיות שמציגים לה. המערכת מעבדת סמלים שמתארים יישויות או רעיונות, ומכילה עליהם חוקים כדי להגיע לתוצאה.
כשהבעיות שאיתן בינה מלאכותית כזו מתמודדת מוגבלות מספיק מבחינת החוקים והמטרות - משחק שחמט, למשל - אפשר להגיע איתה הרבה פעמים לרמת הצלחה גבוהה. לא לחינם בני אדם כבר לא יכולים לנצח מערכות AI מודרניות במשחקי שחמט. אבל קחו בעיה הרבה יותר אמורפית, כמו זיהוי של כלב. נתחיל מזה שאפשר לראות את הכלב מאינסוף זוויות שונות, נמשיך עם זה שיש הרבה מאוד סוגי כלבים ויש אינסוף וריאציות גם בתוך גזע אחד. מה אם לכלב יש רק שלוש רגליים, או אוזן אחת? המוח האנושי יאפשר לנו לזהות כלב כזה בשבריר שנייה, אבל בינה מלאכותית סמלית עשויה להתקשות מאוד עם זיהוי כזה.
קשיים בפיתוח בינה מלאכותית סמלית מתוחכמת מספיק הובילו בשנות ה-70 לאחד מ"חורפי ה-AI" הראשונים. הכוונה היא לתקופה שבה ההתלהבות מהתחום יורדת ממשמעותית, ועמה גם הכסף שמוקדש למחקר - עד לפריצת הדרך הבאה שמעוררת את העניין מחדש.
עלייתן של הרשתות העצביות
הגישה המשמעותית השנייה לבינה מלאכותית היא זו הקישורית. אתם מכירים אותה בשמות כמו רשתות עצביות (Neural Networks) ולמידה עמוקה (Deep Learning). בזמן שרשת סמלית צריך לתכנת, את הרשתות האלה צריך לחשוף למידע ולגרום להן לחפש דפוסים. תראו למערכת כזו מספיק תמונות של כלבים, והיא תוכל לזהות כלבים שמעולם לא ראתה ברמת דיוק גבוהה. מה שהיא לא תוכל, כנראה, זה להסביר לכם איך היא החליטה שמשהו הוא כלב.
אם זה נשמע יותר כמו מוח אנושי, אתם צודקים, אבל חשוב לסייג שגם המערכות האלה רחוקות מאוד מבינה מלאכותית כללית, או מבינה אנושית. DALL-E2, על כל התוצאות המדהימות שלו, לא באמת מבין אילו תמונות הוא מייצר. גם GPT-3, מודל השפה של חברת OpenAI, אולי יכול לדמות בן אדם בשיחה, אבל זה נעשה ללא שום סוג של תבונה. המערכות האלה משתמשות בסט המידע שעליו הן אומנו כדי לייצר נגזרות של המידע הזה, אבל הן לא מסוגלות לשבור את הפרמטרים של התכנות שלהן ו"לדמיין" משהו אחר לגמרי.
ההתלהבות מהמודלים האלה בימינו מקורה בפריצות דרך שנעשו בעשור האחרון ביכולות יצירת בסיסי נתונים גדולים מספיק שעליהם אפשר לאמן את הבינה המלאכותית. אתרים חברתיים כמו Reddit, שירותי אחסון תמונות, אתרי וידאו דוגמת יוטיוב - כולם יכולים לספק לחוקרים המעוניינים לאמן AI כזה את חומר הבסיס הנדרש. עדיין מדובר בתהליך מסובך ויקר מאוד, אבל יש חברות עם כיסים עמוקים מספיק כדי להשקיע את הזמן והמאמץ.
מה שהמערכות החדשות האלה יודעות לעשות בצורה טובה יותר ויותר - אם כי גם פה יש לא מעט ויכוחים - זה לעבור את מה שנקרא ״מבחן טיורינג״. מדובר בבדיקה שהציע המדען אלן טיורינג עוד ב-1950, שמטרתה המקורית הייתה לאמוד את היכולת של מכונה ״להציג התנהגות אינטליגנטית״, על ידי התבוננות של אדם בשיחה טקסטואלית בין אדם אחר למכונה, כאשר השלושה מופרדים והמתבונן לא יודע מי מהצדדים בשיחה אנושי. ברגע שהמתבונן, המשמש כשופט בבדיקה, לא מצליח לזהות את המכונה, היא עוברת את המבחן.
המגבלה המהותית של המבחן היא שהינו הרבה פחות רלוונטי מאז עליית האלגוריתמים שיודעים לחקות חומרים שעליהם אומנו בצורה סמנטית די מושלמת, בלי שום יכולת לשבור את התבניות האלה ולפתח תודעה. זו הסיבה לכך שבקרב האנשים העוסקים בתחום, תשמעו מושגים כמו "למידת מכונה" ו"רשת עצבית מלאכותית" הרבה יותר מאשר דברים שקשורים לבינה או תודעה.
תודעה, נכון לעכשיו, היא הגבול אותו המערכות האלה לא מצליחות לעבור - גם אם יש מהנדס בגוגל שחושב אחרת. הן מסוגלות לחקות אחת, אבל החזון מיצירות המדע הבדיוני עדיין נמצא רחוק מאוד, אם הוא בכלל אפשרי. מה שכן מתפתח בקצב מהיר זו יכולת החקיינות. בינה מלאכותית מייצרת כיום כתבות על פי דרישה, מציירת ציורים ומתחילה גם לייצר סרטוני וידאו. היא מאפשרת להעלות רזולוציה של סדרות ישנות באמצעות ניחוש מושכל של הפיקסלים שמעולם לא צולמו, ועוזרת למדענים לבצע קפיצות דרך בניתוח מחלות - הישגים שאסור לזלזל בהם.
ותודה לענן
פריצות הדרך האלה אפשריות בזכות העלייה הדרסטית ביכולות המחשוב שזמינה לאנשי מקצוע היום. עליית שירותי ענן שנותנים כוח של מחשב-על לכל מי שמעוניין (ומסוגל לשלם), יחד עם היכולת להתאמן על בסיסי נתונים עצומים מהאינטרנט הם חלק גדול מהעניין. חלק נוסף הוא יכולות המסחור של הטכנולוגיה: בטלפונים מודרניים מוטמעת חומרה שמטרתה להאיץ יישומי בינה מלאכותית, ואנחנו כבר רגילים לדברים כמו זיהוי פקודות קוליות והתאמת מצבי הצילום למה שרואים בתמונה.
בזמן שהכתבה הזו הייתה בהכנה, OpenAI שחררה את DALL-E2 לציבור הרחב. סתם ככה, ביום בהיר אחד, כל משתמשי רשת האינטרנט קיבלו את היכולת לייצר תמונות אמנותיות מטקסט. תחשבו מה זה יעשה לאיורים בבלוגים, ומצד שני כמה יושפעו האנשים שמכרו איורים למאגרי תמונות. בחודש שעבר מטא הציגה מנגנון שיכול ליצור סרטוני וידאו בהינתן שורת טקסט. ואלה הדברים הצרכניים - מאחורי הקלעים, שיפורים באלגוריתמים האלה משנים כמעט כל חלק מהחיים שלנו, החל מדייטינג ועד לגילוי תרופות חדשות. איפה גבול הפוטנציאל? לטוב ולרע, אנחנו לא יודעים. אבל היי, תראו איזה איור יפה DALL-E2 צייר כשביקשנו ממנו לצייר לנו אדם עומד בכיכר, תחת אורות ניאון של פרסום עתידני, ודואג מהעתיד של בינה מלאכותית.