התמודדות: האם מחשב ינצח גם את אלופי הפוקר?
בניגוד לשחמט, שש-בש ודמקה, משחק הפוקר כולל לא רק אפשרויות מרובות אלא גם מרכיב של אי-ודאות, לא רק ביחס לקלפים שמחזיק המתמודד בידו, אלא גם בהקשר לאופן בו הוא מתכוון להתשמש בהם
אלוף הפוקר, פיל לאק, יהנה מסיכויים לא רעים בכלל לנצח את המחשב במסגרת ההתמודדות ביניהם השבוע. אך המזל של לאק עלול להסתיים בקרוב. מחשבים שיפרו מאוד את יכולות הפוקר שלהם בשנים האחרונות. היום הם טובים מספיק כדי להתמודד מול מקצוענים כמו לאק, שזכה באליפות העולם בפוקר ב-2004.
מחשבים כבר נהנים ביתרון על האדם בשש-בש, דמקה ושחמט. זו שאלה של זמן בטרם יפתחו פער מול האדם גם בתחום הפוקר. על פי הצפי, מחשבים יגברו על שחקן הפוקר האנושי הטוב ביותר בעולם תוך עשור. היום הם יכולים לנתח כל חובבן במשחק.
"ההתמודדות הזו חשובה במיוחד, מאחר וזו הפעם הראשונה בו להתמודדות בין אדם למכונה יש משמעות
מדעית", אמר ג'ונתן שפר, פרופ' למדעי המחשב באוניברסיטת אלברטה בקנדה.
קבוצת מחקר המשחקים הקנדית, הנחשבת הטובה מסוגה בעולם, פיתחה תוכנת פוקר המשתפרת כל הזמן. לאק הביס את התוכנה לפני כמה שנים והתרשם מיכולותיה. הוא מעריך כי היה מפסיד אילולא המדענים איפשרו לו לבחון את קוד התכנות ולהתאמן מראש מול המחשב.
המנצח בתחרות הקרובה יזכה ב-50,000 דולרים. לאק ישחק נגד המחשב ביחד עם שותפו, עלי אסלמי, החל מיום ב', במסגרת הוועדה השנתית של האיגוד לבינה מלאכותית בוונקובר, קנדה. החוקרים גילו עניין גובר בפוקר בשנים האחרונות בשל מרכיב אי הוודאות והמידע הלא שלם הכרוך במשחק.
אין תמונה מדויקת
"בפוקר אין לשחקן תמונה מדויקת של מצב המשחק, במיוחד ביחס לקלפים שברשות המתחרה שלכם", אמר דיינה נאו, פרופ' למדעי המחשב באוניברסיטת מרילנד. "כאשר המתחרה מבצע פעולה, אתם לא תוכלו לדעת בוודאות מה המניעים שלו לביצועה. כתוצאה מכך, מתכנים מתקשים במיוחד ללמד מחשבים לשחק פוקר, יותר מכל משחק אחר".
"בשחמט, דמקה ושש-בש, כל תחרות נפתחת בצורה דומה, ולאחר מכן מתפתחת למספר גדול אך סופי של אפשרויות, על פי כללים קבועים. מחשב המצויד בכח מיחשוב מתאים, יכול פשוט לבנות עץ הכולל ענף לכל מהלך אפשרי במשחק, ולבחור את המהלך שיובל לניצחון בסבירות הגבוהה ביותר".
אסטרטגיה דומה שימשה את המחשב Deep Blue של IBM בניצחון על אלוף השחמט גארי קספרוב במסגרת ההתמודדות המפורסמת ביניהם ב-1997. אין מחשב שיכול לחשב כל מהלך אפשרי במשחק שחמט, אך תוכנות השחמט המצטיינות יכולות לחשב 18 מהלכים קדימה.
מרכיב של אי-ודאות
משחק הפוקר כולל לא רק אפשרויות מרובות אלא גם מרכיב של אי-ודאות, לא רק ביחס לקלפים שמחזיק
המתמודד בידו, אלא גם בהקשר לאופן בו הוא מתכוון להתשמש בהם. "השחקן חייב להבין את שיטת המשחק של היריב. זה מידע חיוני בפוקר, הייחודי למשחק הזה בניגוד לאחרים", אמר דרסה בילינגס, חוקר מאלברטה ושחקן פוקר שפיתח ב-15 השנים האחרונות את התוכנה למשחק פוקר.
גישת העץ וכל המהלכים האפשריים במשחק אינה רלוונטית בפוקר בגלל שבמצבים רבים אין מהלך אחד שהוא הטוב ביותר. אף אין אסטרטגיה טובה ביותר. שחקנים טובים משנים את האסטרטגיה מדי פעם, בהתאם להתנהגות המתחרה.
קשה מאוד למחשב ללמוד להתנהג כך. במשחק הפוקר אי אפשר להסתפק בלימוד מחשב לנהוג לפי מספר כללים בסיסיים, כי השחקן האנושי ידע מהר מאוד כיצד מתכוון המחשב לנהוג במצבים שונים.
"מה שהופך פוקר למקרה מבחן מעניין היא העובדה שאין מתכון קסם לניצחון", אמר שפר.
למה תוכנות פוקר נכשלות
למעשה, תוכנת הפוקר הפשוטות נכשלות בגלל שהן מתבססות על מתכון כזה, שורה של כללים המורים למחשב כיצד לנהוג על פי הקלפים שבידו. מתחרה מיומן ידע מהר מאוד אילו קלפים מחזיק המחשב בידו על פי הביטחון שהוא מפגין בהימור. שיטה זו אפשרה ללאק לנצח תוכנה בשם Poker Probot בתחרות ביניהן לפני שנתיים בלאס וגאס.
מתכנתים יכולים לגבור על כמה מחולשות המחשב בעזרת תורת המשחקים. מייסד תורת המשחקים, ג'ון פון נוימן, ראה במשחק הפוקר השראה לתורה זו, וחיפש בסיס מתמטי לאסטרטגיות ההטעיה, שיש להן תפקיד כה חשוב
במשחק זה. ג'ון נאש (על חייו מבוסס הסרט "נפלאות התבונה"), שזכה בפרס נובל על ניתוח אסטרטגיות של משחקים תחרותיים, תרם חידושים תיאורטיים גם עבור משחק הפוקר.
ההבדל בין אבן נייר ומספרים לפוקר
במשחק הרחוב "אבן, נייר ומספריים", למשל, האסטרטגיה הטובה ביותר היא לבחור באופן אקראי כל אחת מהאפשרויות ולהעניק להן משקל שווה במשחק. אם אחד השחקנים סוטה משיטת המשחק הזו ומעדיף אפשרות אחת כל פעם, השחקנים המתחרים יבחינו בכך במהרה ויתאימו את המשחק שלהם כדי להביסו.
השיטה של נאש מעט מורכבת יותר, אך בעזרתה, מחשבים יכולים לגוון את שיטת המשחק שלהם כדי להקשות מאוד על המתחרה האנושי שינסה לגלות אם הם "מבלפים" או מיישמים אסטרטגיית משחק מסוימת. אך גם לתורת המשחקים יש מגבלות. במונחים של נאש, הצלחה אינה ניצחון אלא אי-הפסד. יכולת זו מאפיינת את תוכנות הפוקר הטובות ביותר היום. על אף שהן טובות מספיק כדי להתמודד מול שחקנים אנושיים, הן אינן מצליחות לנצח באופן עקבי.
הדרך לשיפור הביצועים כרוכה בשילוב בין עקרונות תורת המשחקים לבין היכולת להבחין במשחק של המתחרה ולהתאים עצמה אליו. שחקני פוקר אגדתיים עשו זאת באמצעות הבנת טבע האדם. הם למדו את הטיקים, הבעות הפנים ותנועות גוף אצל המתחרים, שרמזו להם על המהלכים הבאים. מחשב אינו יכול לזהות מחוות אלה, אך הוא יכול לעקוב אחר המשחק של המתחרה, לחשב כמה פעמים הוא מנסה "לבלף" כאשר בעצם בידיו קלפים חלשים, ולהשתמש בחישובים אלה לצורך המשחק.