הסטארטאפ של אמנון שעשוע נותן לכם להשתמש בחינם במודל שפה עם 178 מיליארד פרמטרים

ראש בראש מול GPT-3: הסטארטאפ A21 Labs מאפשר לכל אחד להתנסות במודל השפה הגדול בעולם – בחינם. רק אל תעשו שטויות

תמונה: AI21 Labs

בשנים האחרונות עסקנו לא מעט בסטארטאפ OpenAI, אותו הקימו סאם אלטמן, נשיא Y Combinator לשעבר (ומנכ”ל רדיט לימים בודדים), ואילון מאסק (שעזב את החברה ב-2018 עקב חילוקי דעות) – ובעיקר במוצר הדגל שלה, ה-GPT-3 שהוא הדור החדש של מודל ה-AI המאוד מרשים שלה.

בשביל להשתמש במודל המתקדם הזה אתם תצטרכו לשלם, אפילו בשביל להתחיל ולנסות אותו. אז חברת AI21 Labs הישראלית עושה היום (ד’) את מה שכל אחד מאיתנו היה עושה, וקוראת תיגר על OpenAI כשהיא משחררת את מודל השפה הענק שלה בבטא פתוחה, כשכל אחד יכול להתנסות בו ולבנות את כל שעולה על רוחו.

ביקשנו מהמודל להמציא לנו שמות לסטארטאפים

מודל השפה החדש של החברה נקרא Jurassic-1, והוא מבוסס על 178 מיליארד פרמטרים חישוביים, מה שהופך אותו אגב לגדול יותר בפועל מ-GPT-3 של OpenAI שמבוסס על 175 מיליארד פרמטרים (אבל מי סופר). הפלטפורמה של AI21 Labs, שנקראת AI21 Studio תאפשר לכם להשתמש במודל הזה בין אם דרך אתר או דרך ה-API שלה, ובאמצעותו לבנות פחות או יותר מה שאתם רוצים שקשור לשפה: צ’טבוטים, כלים לסינון תוכן, להמיר טקסט לטבלה, להמיר קוד מפייתון ל-Javascript וגם סתם לכתוב קוד במקומכם.

המודל משוחרר כאמור במתכונת Open Beta, וממש לא מגביל את המשתתפים בבטא לחוקרי בינה מלאכותית או מתכנתי-על, וב-AI21 Labs טוענים שכל אחד יכול להכנס לפלטפורמה ופשוט להתחיל להשתמש בה וליצור לעצמם גירסה משלהם של המודל בהתאם לצורך שלהם.

אורי גושן, מייסד ומנכ”ל משותף ב-AI21 Labs, הדגים לי את המערכת בשידור חי, ומלבד ה-Presets שקיימים בה, ביקשתי ממנו ליצור אפליקציה שתמציא שמות קליטים לסטארטאפים, וכדי לעשות זאת הוא הזין למערכת 6 שמות אמיתיים של סטארטאפים, ובלחיצה על כפתור ה-Generate קיבלנו את השמות המגניבים החדשים: 4proof, Chronext, Apexigen, Overtime ועוד שמות משונים. לשימושכם החופשי.

גושן מסביר כי לכל מודל שפה יש מעין מילון שבעזרתו הוא מפרק מילים, אבל המודל של החברה שלו מתוחכם הרבה יותר: “מודלי השפה, לא רק GPT-3, כולם משתמשים במילון שהוא יחסית מצומצם (כ-50,000 טוקנים). אנחנו השתמשנו במילון גדול יותר של 250,000 טוקנים, בחרנו שהמילים שיופיעו במילון הזה יהיו בעלות משמעות, ואפשרנו לו להחיל צירופי מילים עם משמעות ברורה. זה משפר מאוד את היכולות של המיצוב והבנת הטקסט שלנו”.

אבל אתם מתחרים בענקית כמו OpenAI שיש לה הרבה יותר כסף ומשאבים משיש לכם. הם לא יכולים לעקוף אתכם ברגע?

גושן: “לאמן את המודלים האלה זה עלויות מאוד מאוד גבוהות. גם ל-OpenAI עם התקציבים שלהם. זה לא פשוט, ואתה לא רואה אף אחד ממהר לאמן רשתות בגודל הזה. זה מאוד מאוד קשה. עשינו פה עבודה משמעותית כדי לאפשר לנו לאמן את זה. זה ה-Secret Sauce שלנו, וזה עדיין מאוד יקר”.

פנקו את הטלגרם שלכם עם ערוץ הטכנולוגיה הגדול בארץ פנקו את הטלגרם שלכם עם ערוץ הטכנולוגיה הגדול בארץ הצטרפו לערוץ גיקטיים בטלגרם

ומה לגבי הבעיות שעלולות להיווצר?

תמונה: AI21 Labs

למרות הבשורה המרשימה, קשה להתעלם מהעובדה שמדובר בטכנולוגיה מתקדמת, וכשכל אחד יכול לעשות בה שימוש, יכולים להיווצר גם שימושים רעים. גושן טוען כי החברה מודעת לכך ש”סכנה שאנשים ישתמשו בכלי זה כדי להפיץ פייק ניוז, להרעיל את האינטרנט בביקורות מזויפות. אלה דברים שאנחנו רוצים להמנע מהם”, אבל מסביר שהדרך העיקרית שלהם להימנע מכך היא לשים מגבלות של כמות יומית, מה שלא יאפשר לבצע פעולות בקנה מידה רחב. “מי שירצה לקחת אותה לפרודאקשן סקייל יצטרך להירשם לתוכנית ואנחנו עושים Background Check לראות שהוא לג’יט”.

ובנוגע לסוגיות המוסריות של כלי שאפשר להיעזר בו גם למטרות רעות, הוא טוען כי “ברור שיש סוגיה שלמה של המודלים האלה, שבגלל שהם עברו על כל האינטרנט הם יכולים לייצר תוכן פוגעני או רעיל ומוטה. אנחנו כרגע לא מונעים באופן פרו-אקטיבי מהמודלים לייצר תוכן מהסוג הזה. אנחנו ערים לסוגיה, אבל בינתיים מה שמגביל את האימפקט של זה על העולם זה ה-Quota. גוגל בהיבט הזה, הוא הרבה יותר נגיש”.

גושן מסביר לנו שמפתחים שירצו לעבור משלב ההתנסות לשלב של פיתוח אפליקציות שישרתו קהל אמיתי (במילים אחרות, שימוש מסחרי, ע.ב.) יצטרכו כמובן לשלם על השימוש באופן דומה לדרך שבה אתם משלמים כיום לספקית הענן שלכם על שימוש בשרתים שלה (צרכת-שילמת). גם OpenAI מתמחרת את הגישה למודל שלה בצורה דומה, אך היא לא מאפשרת שימוש חופשי בדומה ל-AI21 Labs. “צריך לשים את זה על השולחן”, אומר גושן, “ה-Offering הנוכחי שלנו הוא בהחלט תחרותי לזה של OpenAI”.

שעות של אמנון שעשוע מובטחות

Jurassic-1 הוא לא המוצר הראשון ש-AI21 Labs משיקה, ולא מעט מכם בוודאי כבר מכירים את Wordtune, תוסף מבוסס מודל שפה שמאפשר לכם לנסח מחדש, לקצר או להאריך משפטים ולהפוך מילים יום-יומיות לפורמליות יותר. בעבר התנסתה החברה ואף העלתה לרשת גרסאות דמו למוצרים כמו חיים וחיימק’ה – מודלי שפה. חיים היה מודל שפה שמשלים טקסט בין שני משפטי וחיימק’ה לקח בולטים (רשימות תבליטים) והפך אותם לטקסט מסודר. ואנחנו יודעים את זה כי נתנו לחיים לכתוב לנו כתבה על AI.

“ראינו שהמנועים שאנחנו בונים לעצמנו הם כל כך חזקים ויכולים לשמש מגוון גדול של Use Cases וחשבנו שזה יהיה בזבוז לטייב אותם רק ל-WordTune, אז החלטנו לפתוח את זה לקהל הרחב”, אומר גושן.

AI21 Labs הוקמה ב-2017 על ידי גושן, פרופ’ יואב שוהם – המכהן כמנכ”ל שותף עם גושן – ואמנון שעשוע. משרדי החברה נמצאים בתל אביב, ולפי נתוני Pitchbook החברה גייסה עד היום 34.5 מיליון דולר ב-2 סבבים מהקרנות TPY Capital, 8VC ו-Pitango Venture Capital.

רוצים להתנסות במודל החדש של AI21 Labs? לחצו כאן

עידן בן טובים

נולד עם ג׳ויסטיק ביד. יש לו הרבה יותר מדי גאדג׳טים והרבה פחות מדי זמן פנוי כדי לשחק עם כולם. בעל פטיש לא מוסבר לביצוע קליברציות לסוללות של מכשירים. כשהוא לא עסוק בלכתוב על טכנולוגיה, הוא אוהב לדבר עליה, והרבה

הגב

8 תגובות על "הסטארטאפ של אמנון שעשוע נותן לכם להשתמש בחינם במודל שפה עם 178 מיליארד פרמטרים"

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 

* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.

סידור לפי:   חדש | ישן | הכי מדורגים
אבי
Guest

ישראל מבצעת פשעי מלחמה מכיוון שהציונים הם פסיכופתים
המשטר הציוני של ישראל ביצע פשע מלחמה נוסף נגד העם הפלסטיני, הפעם על ידי הטלת פצצות על בית ספר בעזה והרג לפחות 15 בני אדם, כולל ילדים.

כן.
יש לו הטיות, והרבה…

nope
Guest

הלו גיקטיים, כתבתם: “חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד. ”
נרדמתם בשמירה?

תיאובלד
Guest

מה לעשות שפסח מתקרב ומלאי הדם הצטמצם?

אוהד ברעם
Guest

נראה שזה הדבר הבא בתחום הבינה המלאכותית .
שאפו!

אני
Guest

איך אתם לא מוחקים פרצוף מעוות כמו אבי שנשמע כמו ערבי מיפו

אוהב יצורים, Not!
Guest
אוהב יצורים, Not!

“הפשע מלחמה” היחיד פה, זה יצורים כמוך. “תודה. אוהב דקל”.

KEY
Guest

התגובה של אבי נראית כמו חלק מניסוי התנהגותי שעורך דן אריאלי, אחרת אין סיכוי שהתגובה הזאת ממשיכה להישאר כדי להטריס את קהל הקוראים של גיקטיים

יותם
Guest

לא מתלהב מ שעשוע, בעיניי הכל אצלו ME2
גוגל עם WAYMO מקוריים
גוגל עם BERT מקוריים
אם שעשוע היה למשל מוכר ירקות בשוק
העולם היה מגיעה לרכב אוטונומי
ול NLP מושלם גם בלעדיו.

wpDiscuz

תגיות לכתבה: