אמנון שעשוע משיק מודל שפה וטוען שהוא טוב בהרבה מסירי, אלכסה וגוגל אסיסטנט

בזמן שמודלי שפה מתעדכנים אחת לכמה שנים, Jurassic-X של AI21 Labs מתחבר למאגרי מידע, ויודע לענות על שאלות שהיו גורמות לגוגל אסיסטנט לגמגם

תמונה: AI21 Labs

אם אתם משתמשים בעוזרות קוליות, או אפילו סתם בממשקי AI שונים, אתם ודאי מכירים את התסכול כשאתם מנסים לשאול שאלות באופן טבעי, וה-AI פשוט לא מבין אתכם או מחזיר תשובה פשוט לא נכונה. אז AI21 Labs, סטארטאפ ה-AI והשפה של אמנון שעשוע טוען שהוא יכול לשנות את זה, ולאפשר לכם לקבל מידע מדויק ובזמן אמת בשפה טבעית. וכן, הם כבר טוענים שהם יותר טובים מכל העוזרות הקוליות שאנחנו משתמשים בהן.

מודל שפה שתמיד מעודכן

לפי A21 Labs, המידע במודלי השפה השונים מתעדכן אחת לשלוש שנים בממוצע, וזה אומר ששאלות בסיסיות שאתם שואלים עשויות לקבל תשובות פשוט לא מעודכנות. בנוסף, מודלים קיימים אולי ידעו לפתור לכם בעיות חשבוניות כשתציגו אותן בצורה מאוד בסיסי ("כמה זה אחד ועוד אחד?") אבל לא כשתשאלו אותן בתור בעיה מילולית ("אם יש לי עוגיה אחת וקיבלתי עוד עוגיה, כמה עוגיות יש לי?"). אז בשביל לפתור את זה היא משיקה את Jurassic-X, המודל החדש שלה שמבוסס על המודל שהשיקה באוגוסט -אבל עם טוויסט.

Jurassic-X פועל לפי עקרונות MRKL (שהם בעצם Modular Reasoning, Knowledge and Language), וזה אומר שהוא לא רק מבוסס על 178 מיליארד הפרמטרים של Jurassic-1, אלא גם מתממשק אל מול מאגרי מידע כמו WikiData, מאגרי מזג אוויר ועוד. "הגישה שלנו לא באה להחליף את מודלי השפה הקיימים כמו GPT-3 או המודל החביב עלינו – Jurassic 1. היא באה לנצל את כל היכולות של המודלים האלה (סיכום טקסט, ייצור טקסט חדש, ניסוח מחדש, ועוד), ולבנות סט של יכולות נוספות מעל", כך מסביר בשיחה עם גיקטיים פרופסור יואב שוהם, מייסד שותף ב-AI21.

שוהם מסביר שלא כל הבעיות נפתרות באמצעות Deep Learning, אלא באמצעות שילוב של DL עם מודולים סימבוליים כמו מחשבונים, קריאה למאגרי מידע חיצוניים, קריאה למאגרי מידע מתחדשים ועוד. "השילוב הזה הוא לא טריוויאלי ויש בו קצת אלמנט ׳מגדל בבל׳, שדרש מאיתנו לגרום לפתרונות שונים לדבר באותה שפה". האתגר האמיתי הוא לקחת את השפה החופשית שבה אתם שואלים שאלות, ולתרגם אותה לשאילתת SQL. "השתמשנו באוגמנטציות (ניסוחים מחדש בצורה אוטומטית, ע.ב.), אימנו על מאגרי מידע שונים ומגוונים, כולל כאלה שייצרנו בעצמנו, ועוד – וכך הבאנו את המערכת למצב שבה היא מתמודדת בצורה גמישה", אומר שוהם.

כך למשל, הוא מדגים לי כיצד הוא מחבר בין מאגר המידע של נוסעי הטיטאניק (הדוגמה האהובה כנראה על חוקרי AI) לבין Jurassic-X, ולאחר מכן הוא שואל מה היה הגיל הממוצע של הנוסעים. השאלה הופכת לבדה לשאילתא תקינה:

SELECT avg(age) FROM placeholder

גם כשהוא שואל "מה היה המחיר היקר ביותר לכרטיס במחלקה 2?", השאלה מתורגמת ל:

SELECT fare FROM placeholder WHERE passenger_class - 2 ORDER BY fare DESC NULLS LAST LIMIT 1

במקרים אחרים, הוא מדגים כיצד GPT-3, המנוע המתחרה של OpenAI, משיב תשובה לא מדויקת, בזמן ש-J-X משיב תשובה נכונה.

"אפשר לחשוב על שאלה כמו – ״למנכ״ל היו 457,000 מניות שהוא חילק באופן שווה בין 122 עובדים״. מודל שפה רגיל יודע לחלץ מתוך זה את הבעיה החשבונית (457000:122) אבל לא יודע לפתור אותה. מחשבון לבדו יכול בקלות לענות על התרגיל החשבוני, אבל לא יבין שזאת השאלה שמתחבאת במשפט. השילוב ביניהם מאפשר לענות על השאלה הזו", כך לדברי שוהם.

המערכת שחושפת A21 Labs היא מודולרית, כך שאפשר להוסיף לה יכולות חדשות והתממשקויות חדשות, ויהיה מעניין מאוד לראות אילו עוד Use-Cases יהיו למערכת. ב-AI21 טוענים שכבר יש לקוחות ראשונים למודל החדש, שיעבור התאמה עבורם. הלקוח הראשון הוא סוכנות הפרסום והשיווק Publicis Groupe, והשני הוא מוציא לאור אמריקאי גדול ששמו טרם נחשף.

שימו לב ש-GPT-3 החזיר תשובה לא מדויקת

כשאני שואל את שוהם על המודל של AI21 לעומת אלו של אלכסה, סירי, גוגל אסיסטנט (הייתי שואל על ביקסבי אבל לא הייתי מצליח שלא לצחוק תוך כדי) – הוא מגיב בלי היסוס שמודל השפה של החברה "הוא אחד הגדולים והחזקים בעולם, לעומת מודלי השפה של העוזרות הקוליות שהם קטנים בהרבה ולכן מוגבלים ביכולות שלהם". כדוגמה נותן שוהם את היכולת לייצר טקסט בעזרת AI, מה שנחשב לאחד מההישגים המשמעותיים ביותר בתחום ונמצא מחוץ ליכולות של העוזרות הקוליות ואפשרי בהחלט על ידי ג׳וראסיק איקס. בזמן שמודלי שפה כמו Jurassic-1 וגם GPT-3 מסוגלים לסכם, לכתוב מחדש וליצור טקסט – העוזרות הקוליות לא מייצרות כלום, אלא רק עונות על שאלות. הפתרון של AI21 אמור לשלב את הטכנולוגיות האלו.

הסטארטאפ שהפך את ה-NLP לשירות

Jurassic-X מצטרף היום ל-AI21 Studio, פלטפורמת המפתחים של החברה, כך שאם אתם רשומים אליה, אתם יכולים להתחיל לשחק עם המודל החדש כבר היום (אם כי כרגע רק עם אפשרות חיבור למחשבון). להתנסות בדמו החדש לחצו כאן.

AI21 Labs מוכרת כנראה לקהל הרחב יותר בזכות Wordtune, התוסף המצוין שלה שמאפשר לכם לנסח מחדש, לקצר או להאריך משפטים ולהפוך מילים יומיומיות לפורמליות יותר. בעבר התנסתה החברה ואף העלתה לרשת גרסאות דמו למוצרים כמו חיים וחיימק’ה – מודלי שפה. חיים היה מודל שפה שמשלים טקסט בין שני משפטי וחיימק’ה לקח בולטים (רשימות תבליטים) והפך אותם לטקסט מסודר. ואנחנו יודעים את זה כי נתנו לחיים לכתוב לנו כתבה על AI.

AI21 Labs הוקמה ב-2017 על ידי אורי גושן, פרופסור יואב שוהם – המכהן כמנכ”ל שותף עם גושן – ואמנון שעשוע. משרדי החברה נמצאים בתל אביב, ולפי נתוני Pitchbook החברה גייסה עד היום 54.5 מיליון דולר ב-3 סבבים מהקרנות TPY Capital, 8VC, Walden Catalyst Ventures ו-Pitango Venture Capital.

העבודה הבאה שלכם מחכה לכם בגיקטיים אינסיידר העבודה הבאה שלכם מחכה לכם בגיקטיים אינסיידר כנסו לראות את כל המשרות השוות בהייטק

עידן בן טובים

נולד עם ג׳ויסטיק ביד. יש לו הרבה יותר מדי גאדג׳טים והרבה פחות מדי זמן פנוי כדי לשחק עם כולם. בעל פטיש לא מוסבר לביצוע קליברציות לסוללות של מכשירים. כשהוא לא עסוק בלכתוב על טכנולוגיה, הוא אוהב לדבר עליה, והרבה

הגב

11 תגובות על "אמנון שעשוע משיק מודל שפה וטוען שהוא טוב בהרבה מסירי, אלכסה וגוגל אסיסטנט"

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 

* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.

סידור לפי:   חדש | ישן | הכי מדורגים
בזיל
Guest

יש שם תשובות דיי מענינות.
תשאלו ״מה יקרה עם רוסיה?״
ו ״מה יקרה עם ארה״ב?|

סיימון
Guest

The war between Russia and Ukraine will be won by Russia.
זאת התשובה…

אילן
Guest

"ואנחנו יודעים את זה כי נתנו לחיים לכתוב לנו כתבה על AI"
אם נתתם לו גם להכין את הטקסט (הפרסוני למדי) לעיל הוא עשה עבודה טובה חוץ מהטעות בהאחדת שמו של פרופסור שוהם אם המילה "שהם" – צריך לעשות גם הגהה.
תודה

קיפי
Guest

"עם המילה", לא "אם".
טוב שאתה מודע לחשיבות ההגהה.

ערן
Guest

אנשים חכמים יוצרים דברים חכמים ושימושיים. ישר כח.

יוחאי כהן
Guest

מדהים! יש מאמר או בלוג טכני שמספר יותר על שיטת האימון והארכיטקטורה?

דניאל
Guest
איציק האדום
Guest

איש השעשועים מכה שנית

מצחיק
Guest

לכל 'שהם' שהיה כתוב בכתבה עשיתם החלף ל-'שוהם' וזה יצא מצחיק לאללה.
להבא, אל תעשו החלף הכל. תוודאו מה אתם משנים לפני פרסום

מישהו
Guest
משעשע, משווים תפוחים לתפוזים. טוב שלא השוותם בין זה למחשבון של מיקרוסופט. להשתמש בטכנולוגיה שגוגל המציאה לפני כחמש שנים (טרנספורמרים) וההדגמה של open ai של מיקרוסופט שעם הרבה פרמטרים אפשר לקבל בעזרת הטכנולוגיה הזאת מודל שפה מרשים עם gpt3. ואז לא רק שלא נותנים קרדיט, אלה גם משווים לדברים לא רלוונטים (ואני ארשה לעצמי להניח שהטכנולוגיה שלהם לא מסוגלת לשרת מליוני משתמשים) כאילו התעלו על החברות האלו. גוגל פרסמה לאחרונה מודל של 540b פרמטרים, אני משוכנע שהוא יותר טוב מ Jurassic. במקום להציג מצג מטעה, תתרכזו במה שחידשתם באמת (שזה לא הרבה, בסך הכל עוד אפליקציה של טרנספורמרים) ותנו קרדיט… Read more »
101
Guest

עכשיו תתנו למודל הזה לכתוב קוד ונראה אם הוא שווה משהו

wpDiscuz

תגיות לכתבה: