חוקרים פיתחו מערכת AI שיכולה לשכתב מידע לא מעודכן וכוזב בוויקיפדיה

שני חוקרים מ-MIT יצרו מערכת היכולה לזהות מידע לא עדכני בוויקיפדיה, לשנות אותו עצמאית ולחסוך עבודה של אלפים. במקביל, פיתחו השניים מודלים לזיהוי ותיוג של פייק ניוז

 

צילום מסך

עורכי ויקיפדיה נאלצים לעמוד בפני לא מעט אתגרים: מעדכון כמות לא הגיונית של ערכים ועד הצורך להתמודד עם לא מעט שקרים שאנשים מנסים להפיץ בערכים שונים; בין שמדובר בקמפיינים שמטרתם הפצת פייק ניוז ובין שמדובר באנשים ששכחו שהשנה היא לא 2005 וזה כבר מזמן לא משעשע. כלי חדש יוכל להקל משמעותית על חייהם.

לחקות את אופן העריכה של בני אדם

צוות חוקרים ב-MIT הצליחו לפתח מערכת שיכול לעדכן באופן אוטומטי אי-דיוקים בטקסטים הקיימים באנציקלופדיה החינמית שבה כולנו משתמשים, ובכך לחסוך זמן לאלפי העורכים שמתנדבים כדי לבדוק, לתקן ולעדכן את המידע שהוזן למיליוני הערכים באופן ידני.

במאמר שפרסמו החוקרים שמאחורי המערכת, הם מפרטים כיצד המערכת עוברת על הטקסטים בוויקיפדיה, מוצאת משפטים הכוללים מידע לא עדכני או מידע שאותו היא יכולה לתייג כ”כוזב” או “נכון”, ובהתאם לבצע שינויים באותם משפטים תוך שמירה על יכולת כתיבה הדומה ברמתה לזו של בני אדם.

המערכת שאותה יצרו החוקרים סורקת את הערכים השונים בוויקיפדיה, וברגע שהיא מוצאת ערך הכולל מידע שאינו מעודכן, היא מזהה את המשפטים הבעייתיים ומשכתבת אותם ברמה הזהה לזו של כותבי תוכן אנושיים, כך טוענים החוקרים.

על פי החוקרים, למערכת שיצרו יש גם פוטנציאל לשימוש עתידי. אחד מהרעיונות שהציפו הוא הענקת היכולת למערכת לסקור את הרשת, למצוא מידע עדכני הרלוונטי לערכי ויקיפדיה ולאחר מכן לייצר תוכן שתוכל להוסיף או להחליף בערכים השונים מאותו מידע חדש.

דראש שאה, דוקטורנט במעבדת מדעי המחשב והבינה המלאכותית ב-MIT, אמר כי “הערכים בוויקיפדיה צריכים להתעדכן. היכולת לעדכן את החלקים הספציפיים הדורשים שינוי באופן אוטומטי עם סיוע אנושי מועט, אם בכלל, יכולה להיות מאוד מועילה מאוד”. הוא הוסיף כי “במקום מאות אנשים שיעבדו לעדכן כל ערך בוויקיפדיה, נצטרך רק כמה מהם – כי המערכת עושה זאת אוטומטית או עוזרת בעבודה הזו”.

החוקרים הם לא הראשונים שחשבו על הצורך בתיקון הערכים בוויקיפדיה. בעבר נוצרו כמה וכמה בוטים שעשו זאת, אך מדובר בבוטים עם יכולת מוגבלת שפעלו בעיקר לתיקון ערכים שהושחתו או הוספת מידע בערכים על פי חוקים מסוימים שהוגדרו מראש. צוות החוקרים אומר כי המערכת שפיתחו פותרת בעיה גדולה יותר בתחום הבינה המלאכותית – הפיכת מידע חדש, נטול תבניות, לטקסט שנראה כאילו נכתב על ידי עורך אנושי.

הצוות שפיתח את המערכת החדשה כלל גם את טל שוסטר, חוקר ב-MIT שהיה בעבר חלק מצוות שפיתח כלי AI שיודע לחזות סרטן 5 שנים מראש, ועל המאמר שפורסם עבדו שוסטר ושאה עם הפרופסורית הישראלית-אמריקאית רגינה ברזילי. שוסטר אמר לאתר של MIT כי מלבד השימוש במערכת לבדיקת מידע לא עדכני בוויקיפדיה, למערכת יכולים להיות שימושים נוספים – כמו שיפור מאגר מידע פופולרי לבדיקת עובדות באמצעות AI בשם FEVER על ידי סינתוז משפטים חדשים שיוכלו לשמש לבחינת מודלים של AI.

ה-AI שתשפר את מיגור תופעת הפייק ניוז?

המערכת שיצרו שוסטאר ושאה למדה, כאמור, ממאגר FEVER, המיועד ללמד אותה להבחין בין עובדות נכונות לעובדות כוזבות על ידי ניתוח צמדים של משפטים ותיוגם תחת ההגדרות “מסכים” ו”לא מסכים”. בצמדים הללו, לעובדה אחת היה מידע שיכול לאשש אותה ושנבדק מראש מוויקפדיה, וכפועל יוצא תויגה על ידי המערכת כ”מסכים”. מנגד, עובדה שעוותה על ידי מקור חיצוני ושלא נמצאו ראיות התומכות בה תתויג כ”לא מסכים”.

המערכת שפיתחו שוסטר ושאה מגדירה את המשפטים שלהם אין תימוכין כ”כוזבים” ובכך לנסות ולעזור למגר פייק ניוז. עם זאת, המודלים עדיין לא מושלמים ומצריכים עבודה נוספת לפני שיוכלו לעשות זאת באופן מלא. שאה מסביר כי המודלים מזהים חלקים בשפה כמגדירים אוטומטיים של משפט “כוזב”, מבלי להסתמך מספיק על משפטי הראייה – מה שמוריד את אחוז ההצלחה שלהם בזיהוי עובדות כוזבות.

כדי לשפר את אחוזי ההצלחה של המודלים שאיתם עבדו, החוקרים נעזרו במודל שיצרו לטובת העדכון של ערכי הוויקיפדיה – שכולל את מחיקת התוכן הלא-מעודכן והחלפתו בחדש – כדי לייצר “עובדות” למשפטים שתויגו אוטומטית על ידי המערכת כ”כוכזבים”. כך נוצר מצב שבו המערכת מזהה ביטויים המגדירים משפט כ”כוזב” בשתי הקטגוריות (“נכון” ו”כוזב”) – מה שאילץ אותה לבחון יותר אלמנטים ולשפר את יכולת ההבחנה בין משפטים נכונים לכוזבים. בעקבות יצירת מאגר המידע החדש שעליו הריצו את המודלים, שאה ושוסטר הצליחו לשפר את יכולת הזיהוי שלהם ב-13%.

היי-טק, סטארטאפים וטכנולוגיה - רוצים להקדים את כולם? היי-טק, סטארטאפים וטכנולוגיה - רוצים להקדים את כולם? להורדת אפליקציית גיקטיים לאייפון ולאנדרואיד לחצו כאן

אושרי אלקסלסי

Your Friendly Neighborhood Geek. יש לכם סיפור טכנולוגי? דברו איתי: Oshry@geektime.co.il

הגב

3 תגובות על "חוקרים פיתחו מערכת AI שיכולה לשכתב מידע לא מעודכן וכוזב בוויקיפדיה"

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 

* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.

סידור לפי:   חדש | ישן | הכי מדורגים
אופיס 2000
Guest

זה פשוט זועק “חרב פיפיות”…
וגם אם זה לא ינוצל לרעה במכוון, זה בהגדרה יקשה על שינוי הסטטוס קוו לגבי נושאים רבים גם כדרוש שינוי

הקרב על התודעה
Guest
הקרב על התודעה

בהרבה מיקרים בויקיפדיה העורכים מוחקים אינפומרציה לעיתים חשובה בהתאם לאג’נדה שלהם ובאמתלות שונות ומשונות בעיקר חוזרת הטענה של להפוך את הדף ליותר קריא

Hey
Guest

יש שתי אפשרויות לכתוב הסטוריה:
1. להחליט מה ההסטוריה ולכתוב אותה איך שבא לך
2. לתת לכולם לכתוב את כל האפשרויות ואז למחוק את כל מה שלא רצית שידעו

wpDiscuz

תגיות לכתבה: