האם AI יוכל לנצח את ”המשחק הכי קשה בעולם”

מתברר ש-NetHack, משחק משנות ה-80 של המאה הקודמת, יכול לשמש כקרקע פורייה לאימון מודלי AI בלמידת חיזוק, ואפילו יש כבר אתגר חדש

הבינה המלאכותית לא זרה למשחקים מורכבים ואף התמחתה בכמה מהם. במקרה של גו היא אפילו גרמה לפרישה של אלוף העולם, לאחר שהודיע שלעולם לא יצליח לנצח אותה. אבל עכשיו רוצים חוקרים להשתמש ב-AI כדי לנסות לנצח משחק משנות ה-80 שנחשב לאחר המאתגרים בעולם.

קשה, אבל לא דורש כמעט משאבים

NetHack הוא אחד ממשחקי ה-Dungeon Crawlers הוותיקים בעולם – והוא איתנו משנות ה-80. אבל למרות שהוא מאוד “קל” מבחינת המשאבים שהוא מצריך כדי לשחק בו – הוא מורכב יותר מלא מעט משחקים, מה שזיכה אותו בתואר “אחד מהמשחקים הקשים בעולם”.

במסגרת המשחק אתם מגלמים מספר דמויות במיטב המסורת של מבוכים ודרקונים (D&D) כמו לוחם, קוסם, רופא, כשהמטרה שלכם להסתובב במבוכים, למצוא קמע ולנסות לשרוד בלי שהמפלצות יחסלו אתכם. בין הסכנות שמחכות לכם במהלך המשחק ניתן למנות רעב, קרבות, מלכודות, רעל, מחלות ועוד. “הגרפיקה” של המשחק מורכבת למעשה מאותיות וסימנים, כשאותיות שונות מסמנות יצורים שונים. המשחק מצריך מכם לתכנן המון (ואנחנו מתכוונים לזה כשאנחנו אומרים המון) מראש, אחרת גם אם תשקיעו שעות במשחק – מהלך שגוי בהתחלה יוביל אתכם למוות ולהפסד. אין נקודות שמירה ואין קיצורי דרך – זה הכל או כלום.

עכשיו מנסים חוקרי ה-AI של פייסבוק להשתמש ב-NetHack כדי להגיע להישגים חדשים בפיתוח בינה מלאכותית בעזרת למידת חיזוק (או Reinforcement Learning). החברה אף פרסמה אתגר למפתחים ומתכנתים העוסקים בבינה מלאכותית בשם המאוד הולם NetHack Challenge.

בפוסט שפרסמו בנושא, חוקרי ה-AI של פייסבוק מציינים כי השימוש ב-RL אמנם התקדם משמעותית בשנים האחרונות באמצעות הרצה של מודלים על משחקים מאוד מתקדמים כמו סטארקראפט 2, מיינקראפט ו-Dota 2. עם זאת, כדי להגיע להישגים שאליהם הגיעו נדרש כוח עיבוד רב מאוד – בגלל העובדה שהמשחקים הללו בבסיסם מבוססים על מנועים גרפיים מתקדמים (יחסית). וכאן נכנס לתמונה NetHack, משחק שכמעט ולא מצריך כוח עיבוד ברמת הגרפיקה – כך שאפשר להשקיע את כל המשאבים בפיתוח ה-AI, מבלי לבזבז עוד על גורמים חיצוניים.

בזמן שאימון המודלים על המשחקים שציינו למעלה דרש אלפי GPUs, בפייסבוק הצליחו לאמן את הבינה המלאכותית לבצע 1.2 מיליארד מהלכים ב-NetHack – עם שימוש בשני מעבדים גרפיים בלבד. כך מייצרת לאתגר שיצרה רף כניסה נמוך, כדי שכמה שיותר חוקרים – המעוניינים בכך לפחות – יוכלו להשתתף.

פנקו את הטלגרם שלכם עם ערוץ הטכנולוגיה הגדול בארץ פנקו את הטלגרם שלכם עם ערוץ הטכנולוגיה הגדול בארץ הצטרפו לערוץ גיקטיים בטלגרם

אבל איך זה יעזור בכלל?

האתגר של פייסבוק ירוץ על NetHack Learning Environment (או NLE) – ממשק למידת חיזוק המבוסס על המשחק כדי לספק לחוקרים שיתתפו בו סטנדרט שלפיו יעבדו. בפוסט של פייסבוק בנושא התחרות נכתב כי לאתגר כמה מטרות, בהן לאפשר השוואה בין השיטות שבהן עשו שימוש החוקרים כדי לקדם את תחום ה-RL ולספק אמות מידה (benchmarks) למחקרים עתידיים.

בנוסף, פייסבוק רוצה למצב את NLE בתור סביבת מחקר המתאימה לקידום תחום למידת החיזוק – גם בקרב חוקרים בחברות בשוק החופשי וגם בקרב חוקרים באקדמיה – כשהכוח החישובי הנמוך הדרוש לעבודה עם NLE לטובת מחקר הוא אחת מ”נקודות המכירה” שלה.

בחטיבת ה-AI של פייסבוק רוצים גם להשתמש בתחרות שיצרו כדי לבחון את היעילות של הרצת רשתות נוירונים על NLE בהשוואה להרצה של בוטים שפותחו כדי לנצח את המשחק מבלי להשתמש בבינה מלאכותית – ומזמינה את מפתחי הבוטים הללו להגיש את הבוטים שיצרו לתחרות.

על ידי השגת המטרות הללו, אנשי חטיבת ה-AI של פייסבוק חושבים כי ניתן יהיה להשתמש בשיטת האימון שבהם ישתמשו החוקרים כדי להתמודד עם הסביבה המאתגרת מאוד של המשחק עבור תחומים אחרים שגם בהם “הפסד” שווה התחלה מנקודת האפס.

לתחרות שלושה מסלולים, והמנצחים במסלולים השונים יוצגו בכנס NeurIPS שייערך בדצמבר. אם גם אתם רוצים לנסות ולנצח את NetHack ועל הדרך לקדם את תחום ה-RL – אתם יכולים לגשת ל-Starter Kit שיצרו פייסבוק ו-aicrowd, שעל הפלטפורמה שלה ירוץ האתגר.

 

 

אושרי אלקסלסי

Your Friendly Neighborhood Geek. יש לכם סיפור טכנולוגי? דברו איתי: Oshry@geektime.co.il

הגב

4 תגובות על "האם AI יוכל לנצח את ”המשחק הכי קשה בעולם”"

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 

* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.

סידור לפי:   חדש | ישן | הכי מדורגים
אלירו
Guest

חשבתם אולי לתת פסקה על המשחק עצמו גיקטיים?????

דובי
Guest

אתה מצפה ליותר מדי מגיקטיים. הגהה יש להם?

הבצל המקליק
Guest

נכנסת לכתבה?
הם עשו את שלהם והרויחו עליך כסף.

ASD
Guest

מה לגבי פסקה שלישית? (או שזה התווסף בהמשך?)

wpDiscuz

תגיות לכתבה: