האירוע המשמעותי ביותר בדברי הימים הקצרים של הבינה המלאכותית (AI) התרחש ככל הנראה ביום שישי האחרון. בסרטון צנוע שפרסמה OpenAI, החברה הציגה את המודל o3 - ככל הנראה מודל הבינה המלאכותית החזק ביותר שפותח עד כה.
המודל נמצא אמנם עדיין בבדיקות ואינו זמין בציבור, אבל הנתונים שפרסמה OpenAI גרמו לכמה פרשנים להכריז שהנה, אנחנו צופים סוף סוף בלידתה של הבינה המלאכותית הכוללת (AGI), ה"סופר אינטליגנציה" שחכמה יותר מבינה אנושית.

אקורד סיום מרשים

ההכרזה הזו הייתה אקורד הסיום המרשים של רצף הכרזות ה-AI של OpenAI, שנמשך 12 ימים ונועד להוכיח שהחברה היא המובילה הבלתי מעורערת של עולם הבינה המלאכותית, ואל לנו (או למשקיעים שלה), לשכוח את זה.
הייתה רק בעיה אחת שפגעה ברצף ההכרזות הזה של OpenAI – ענקיות הטק האחרות העוסקות בפיתוח AI, שממש לא מתכוונות לתת לחברה של סם אלטמן להוביל את התחום. התוצאה – שבועיים רצופים בהכרזות ושטף מודלים חדש מענקיות כמו אמזון וגוגל.
3 צפייה בגלריה
מנכ"ל OpenAI, סם אלטמן (ימין), מציג את o3
מנכ"ל OpenAI, סם אלטמן (ימין), מציג את o3
מנכ"ל OpenAI, סם אלטמן (ימין), מציג את o3
(OpenAI)
אך למרות שגוגל הוכיחה את כוחה עם השקת גרסת Gemini 2.0 Flash המרשימה של מודל הג'מיני שלה, זו החזיקה מעמד כמודל המתקדם ביותר בשוק רק למשך כשבוע – עד ש- OpenAI הציגה כאמור את o3 ושוב הטתה את הכף לטובתה.

הדור הבא של הבינה המלאכותית

מודל o3 הוא ממשיך הדרך של מודל o1 שהמשיך את דרכם של מודלי GPT לדורותיהם. אגב, הדילוג על o2 עורר סקרנות רבה, שמא מדובר במודל סודי שלא נחשף, אבל ההסבר של OpenAI היה פרוזאי: השם הזה כבר שייך לחברת סלולר בריטית מוכרת, ואף אחד לא רוצה להסתבך כאן.
כך או כך, לפי הנתונים o3 מדויק יותר מ-o1 ב-20% ומעלה בשורה של משימות תכנות. המודל אפילו ניצח את המדען הראשי של OpenAI , ג'יקוב פאצ'וקי, בתחרות תכנות. "המודל הזה מדהים ביכולות התכנות שלו", טען אלטמן בהצגת המערכת החדשה. המודל השיג תוצאות מעולות גם במבחני מתמטיקה, פיזיקה, כימיה וביולוגיה.
כמו קודמו, o3 הוא מודל הנמקה (reasoning model) - זה אומר שהוא בודק את עצמו היטב לפני שהוא נותן תשובה, מבצע מיליוני חישובים והשוואות ובוחן מספר עצום של חלופות. התוצאה היא תשובות טובות יותר ממודלי AI מהדור הקודם, אבל גם תוספת בזמן עד שמתקבלת תשובה. מודל o3 מאפשר לקבוע מראש מה עומק החשיבה שנדרש - נמוך, בינוני או גבוה.

אז האם זה ה-AGI שכולם דיברו עליו?

עד כה התרגלנו לחשוב על הבינה המלאכותית הכוללת כעל "בינת-על", בינה דמוית-אלוהים כמו שכינה אותה איאן הוגרת', שתשלוט באנושות ואולי גם תכחיד אותה. ל-OpenAI יש הגדרה יותר מצומצמת ל-AGI: "מערכות בעלות אוטונומיות גבוהה, שמשיגות ביצועים טובים יותר מבני אדם במרבית המשימות שיש להן ערך כלכלי". גם תחת ההגדרה הזו מדובר במשימה מאתגרת מאוד לבינה המלאכותית.
אבל על פי הנתונים שהציגה OpenAI, היא מתקרבת לשם. במבחן ההשוואתי ARC-AGI, המשקף עד כמה AI יכולה ללמוד לבצע פעולות שלא אומנה עליהן, o3 השיגה ציון 87.5. זה אמנם לא ציון 100, אבל זה ציון שגבוה פי שלוש מההישג של o1. הבעיה - מבחני ההשוואה (benchmarks) מתעדכנים תדיר ו-AI שפותח כך שיעמוד במבחן כזה, עלול להיכשל במבחן אחר מאותו הסוג.
3 צפייה בגלריה
AGI
AGI
AGI. יש עוד זמן עד שרובוטים חכמים יותר מבני אדם יגיעו לעולם
(התמונה נוצרה באמצעות מחולל התמונות DALL-E3)
בהתאם, מפתח מבחן ה-ARC-AGI , פרנסואה צ'ולט, פרסם תגובה לתוצאות של o3, והעריך שבגרסה הבאה של המבחן המודל יקבל ציון של 30, בעוד שאדם בעל יכולות ממוצעות יקבל 95, פשוט כי בני אדם טובים בלהתמודד עם משימות חדשות. אז כנראה שהדרך לבינה מלאכותית דמוית אלוהים עדיין ארוכה.
במקביל עולות כמה שאלות מעוררות דאגה לגבי o3. ראשית – הפעלתו בעומק חשיבה גבוה צורכת משאבי מחשב וחשמל כה גבוהים, שיש ספק אם מודל כלכלי כלשהו יכול להתאים לו. שנית – קודמו o1 כבר הראה נטייה גבוהה להוליך שולל בני אדם, יותר מאשר דורות קודמים של AI, ו-OpenAI צריכה להוכיח שהמגמה הזו לא נמשכת.
3 צפייה בגלריה
כנס המפתחים של OpenAI
כנס המפתחים של OpenAI
מנכ"ל מיקרוסופט, סאטיה נאדלה (ימין) וסם אלטמן
(צילום: JUSTIN SULLIVAN / GETTY IMAGES)
החברה טוענת כי פיתחה גישה חדשה שהיא מכנה "התאמה דיונית" (deliberative alignment) שנועדה לשמור שהמודל לא ירד מהפסים. זה עדיין דורש הוכחה, אם החברה רוצה לקבע את מעמדה כמובילת תחום ה-AI.
מעבר להישג הטכנולוגי ולצד המשמעות הכלכלית חסרת התקדים שלו, השגת היעד של פיתוח AGI היא אבן דרך משמעותית במובן נוסף: מאותה נקודה, OpenAI לא תהיה מחויבת לתת למיקרוסופט גישה לטכנולוגיות הנוספות שלה שיבואו בהמשך. כך או כך, מודל o3 יוצע בשתי גרסות, אחת מלאה והשנייה מכונה o3 mini. הגרסה המוקטנת אמורה להיות זמינה לציבור בסוף החודש הבא ובהמשך צפויה גם הגרסה המלאה להגיע לשוק.