ה-AI של גוגל יסייע להיסטוריונים לפענח ולתארך טקסטים עתיקים בעברית

חטיבת ה-AI של גוגל סייעה לפענח ולתארך טקסטים עתיקים ביוונית, ובהמשך – גם בעברית

מקור: DeepMind

אחרי שהשפילה רב-אמנים בשחמט, הובילה לפרישה של אלוף העולם ב'גו' מהמשחק והגיעה ל"גביש הקדוש" של עולם הביולוגיה, DeepMind – חברת ה-AI שגוגל רכשה ב-2014 – בדרך להשתמש בבינה מלאכותית כדי לעשות מהפכה גם בתחום הארכיאולוגיה, ולסייע גם להיסטוריונים ולארכיאולוגים ישראליים.

להשלים, לתארך ולמצוא את המיקום

DeepMind חשפה מודל למידת מכונה חדש שאותו פיתחה בשם Ithaca, שנועד לעזור לארכיאולוגים לשחזר טקסטים עתיקים, לתארך את אותם הטקסטים (בטווח של 30 שנה) ולהבין מה היה מקורם הגיאוגרפי של אותם טקסטים עתיקים. לצורך הפיתוח של המודל החדש, חברה דיפמיינד לארכאולוגים והיסטוריונים, לצד מומחים בתחומי למידת המכונה מאוניברסיטה באתונה. המודל שפיתחו מבוסס על רשת נוירונים שאומנה ספציפית על כתבים וטקסטים יוונים עתיקים – ומכאן גם מגיע שמו: אית'קה – האי שמוצג באודסיאה של הומרוס.

המודל נבנה על מודל נוסף שפיתחו בדיפמיינד עוד ב-2019, שנועד אך ורק לשחזור של טקסטים עתיקים — ולא כלל גם את יכולות התארוך ומציאת המיקום הגאוגרפי המקורי של הטקסט. המודל שיצרו, ושאומן על עשרות אלפי טקסטים יווניים עתיקים (כ-78 אלף טקסטים בסך הכל), סורק את הטקסטים העתיקים שברשות הארכואולוגים ומתחיל להשתמש במידע שממנו למד כדי לבצע השלמות בטקסט.

מקור: DeepMind

המודל מציג בפני החוקרים אופציות שונות להשלמות טקסטים, כשאת הרשימה יוביל החיזוי שלדעתו יתרום הכי הרבה להשלמת הטקסט שנבדק. כדי לזהות את המיקום הגאוגרפי שבו נכתב הטקסט, המודל מציג בפני החוקרים את כל המיקומים האפשריים לפי רמות של סבירות. כך מקבלים החוקרים 84 מיקומים שונים המדורגים בהתאם לסבירות – וכך הם יכולים לעבוד לצד המודל ולהגיע לתוצאה המדויקת ביותר.

מבחינת התיארוך, Ithaca מציג בפני החוקרים את התאריכים האפשריים של הטקסט שאותו הם בוחנים – עם מרווח סטייה של 30 שנה – בטווח השנים שנע בין 800 לפני הספירה ועד 800 אחרי הספירה. "כך יכולים ההיסטוריונים לראות את מידת הביטחון של המודל עבור טווח זמנים מסוים – מה שיכול לספק עבורו תובנות היסטוריות", נכתב בבלוג של החברה.

על פי דיפמיינד, המודל שפיתחו הציג 62% אחוזי הצלחה בהשלמת טקסטים עתיקים חסרים ו-71% בזיהוי המיקום הגאוגרפי שבו נכתבו. הנתון המעניין יותר הוא היכולת של המודל לסייע לחוקרים, שבלעדיו הצליחו להגיע ל-25% הצלחה בשחזור טקסטים עתיקים – אך יחד עם Ithaca המספר הזה מזנק ל-72%, אחוז הצלחה גבוה יותר (גם אם ממש במעט) לעומת זה של המודל הפועל בפני עצמו.

עוד סיפורים כאלו מחכים לכם עכשיו עוד סיפורים כאלו מחכים לכם עכשיו בערוץ העדכונים הרשמי של גיקטיים

העברית בדרך

חלק מעניין מאוד בחשיפת המודל החדש מבית DeepMind הסתתר דווקא בתחתית הפוסט של החברה בנושא. נכון להיום המודל של Ithaca עובד רק עם טקסטים יווניים עתיקים, אך בדיפמיינד כבר מתכננים להתרחב לאזורים נוספים מחוץ ליוון שבהם יסייעו לחוקרים עם השלמת טקסטים, תארוך שלהם ומציאת המיקום המקורי שבו נכתבו. בין היתר מציינים החוקרים כי אחת השפות הבאות תהיה עברית, "אנו עובדים כעת על גרסאות של אית'קה שאומנו על שפות עתיקות אחרות ושהיסטוריונים יכולים להשתמש בדאטה-סטים שלהם בארכיטקטורה הקיימת (של המודל) כדי ללמוד מערכות כתב עתיקות אחרות, מהשפה האכדית ועד הדמוטית (מצרית עתיקה) מעברית ועד שפת בני המאיה", נכתב בפוסט באתר החברה.

הפיתוח החדש מבית DeepMind פורסם בתור מאמר במגזין המדעי הנחשב Nature – ועבר ביקורת עמיתים – והוא זמין גם בתצורה אינטראקטיבית. מי שרוצה לחפור קצת בקוד, יוכל לעשות את זה בריפו בגיטהאב.

אושרי אלקסלסי

Your Friendly Neighborhood Geek. יש לכם סיפור טכנולוגי? דברו איתי: [email protected]

הגב

3 תגובות על "ה-AI של גוגל יסייע להיסטוריונים לפענח ולתארך טקסטים עתיקים בעברית"

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 

* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.

סידור לפי:   חדש | ישן | הכי מדורגים
KEY
Guest

החבר'ה בספריה הלאומית צריכים גם להיות מעורבים בזה, יחד עם "יד הנדיב" הרימו את התחרות להטמעת טכנולוגיה והנגשת טקסטים וספרים לציבור הרחב.

חןל
Guest

הדבר הכי מעצבן כאן זה החלון הקופץ מימין למטה. קופץ בכל כניסה למודעה ויוצר הכרח לסגור אותו מיידית כי הוא מפריע לקריאת הכתבה. מה שגורם לאי נוחות מודעת מראש לפני כל כניסה לכתבה.

יובל
Guest

בו נדייק.
אלפא זירו לא 'השפילה' רבי אמנים לראשונה. זה זמן רב שמחשבים טובים בהרבה בשח (הפרש של 200-300 נקודות מד כושר) מהשחמטאים הטובים בעולם. ההפתעה היתה בעיקר שהתוכנה הצליחה, ללא אלגוריתמיקה סופר מורכבת, להתברג כאחת התכנות הטובות בעולם (אם לא הכי טובה), תוך שהיא מסוגלת לבצע הקרבות עמדתיות ארוכות טווח, שנחשבו עד אז לנחלתו של האדם בלבד.

wpDiscuz

תגיות לכתבה: