לא מפחדים מ-GitHub Copilot: המערכת הישראלית שעוזרת לכתוב 4 מיליון שורות קוד ביום
יותר ממיליון מפתחות ומפתחים נעזרים ביכולות השלמת הקוד האוטומטיות של הסטארטאפ הישראלי Tabnine. המנכ"ל דרור וייס, לא חושש מהתחרות מצד מיקרוסופט ו-OpenAI: "יש מקום לשני מנצחים"
ב-2022 יכולות השלמה אוטומטית (Autocomplete) לקוד היא כבר פיצ'ר חובה ומתבקש בכל IDE, וכמעט אין מפתח או מפתחת שלא משתמשים בו. אבל אחת החלוצות בתחום היתה חברת הסטארטאפ הישראלית Tabnine (לשעבר Codota). היום (ד'), עם יותר ממיליון משתמשים בכלים שלה, מודיעה החברה על השלמת סבב גיוס בהיקף של 15.5 מיליון דולר. בין המשקיעים תמצאו את Qualcomm Ventures, Samsung Next Ventures, OurCrowd והמשקיעים הקיימים כמו Khosla, Headline, Hetz ו-TPY.
מפסיקים לחפש בסטאק ומתכנתים מהר יותר
אנחנו מכירים את מנגנוני ה-AutoComplete מלא מעט תחומים בעולם הטכנולוגיה: הם עוזרים לנו למלא טפסים בצורה מהירה יותר, לנסח מיילים בג'ימייל וגם בחיפושים בגוגל, אבל המערכת של טאבניין מתלבשת ישירות על ה-IDE האהוב עליכם, ובעצם עושה לכם AutoComplete לקוד שלכם. אתם כותבים כרגיל את הקוד, וכשהמערכת מזהה שהיא יכולה להשלים את הפעולה שלכם על בסיס עבודות שלכם ושל פרויקטים אחרים, היא מציעה לכם להשלים את הקוד בלחיצה.
בחברה טוענים כי מעל למיליון משתמשים נעזרים בטאבניין, וחוסכים בממוצע כ-30% מזמן כתיבת הקוד לצד צמצום של 38% בחיפושי קוד בגוגל או StackOverflow – מה שמוביל לכ-4 מיליון שורות קוד שמושלמות על ידי המערכת מדי יום בממוצע. אבל טאבניין לא עצרה רק באופן שבו מנגנון ההשלמה שלה עבד עד כה, ובדור החדש של המערכת ניתן לקבל גם השלמות לשורות ופונקציות שלמות, לייצר קוד אוטומטי לפי הגדרה בשפה טבעית וגם לאמן את המודל של החברה כך שיכיר את הקוד הספציפי של הארגון שלכם, ויתאים את עצמו אליכם.
בשיחה עם גיקטיים מספר דרור וייס, מנכ"ל טאבניין, על החידוש המשמעותי ביותר עבור החברה, והוא המעבר לתמיכה במודלי AI נוספים: "עברנו לעבוד במקום עם מודל אחד, עם הרבה מודלים שמתחלפים לפי סוג הפעילות של המשתמש. לדוגמא אם תתכנת עם טאבניין בפייתון ואז תעבור לטייפסקריפט – מאחורי הקלעים מודלים אחרים ישרתו אותך. זה חשוב כי זה מאפשר לנו להשתמש במודלים קטנים יחסית שמאומנים מהיסוד לשפה ספציפית, וכל המרחב הוקטורי שלהם והמשקולות הפנימיים מאופטמים במיוחד לשפה הזו ולדאטה הזה".
וייס מסביר שהשימוש במודלים קטנים מאפשר לחברה להריץ חיזוי קוד בתדירות גבוהה יותר למשתמשים, וגם מאפשר הרצה שלהם בשרתים הארגוניים. "כלומר, אפשר אבל לא חייבים להשתמש בענן שלנו בשביל לעבוד עם טאבניין. הרבה מהלקוחות שלנו מעדיפים לעבוד במנותק מהענן כשזה נוגע לקוד שלהם". בנוסף, החברה בונה סוג של קהילה סביבה שמאפשרת הפצה, אימון ושיתוף של מודלים שאומנו על ספריות ו-APIs שלהם.
ובכל זאת, אתם משחקים במגרש מול CoPilot של מיקרוסופט ו-OpenAI, כשנזכיר, מיקרוסופט שולטת גם בגיטהאב ובאינטגרציות. איך מתמודדים מולם?
וייס: "לא מדובר במשחק סכום אפס ויש מקום לשני מנצחים. גיטהאב קופיילוט בוודאי יצליחו להביא הרבה משתמשים, אך מדובר בגישה של גן סגור ומודל AI אחד גדול ששולט בכל. סביר להניח שרוב ממשקי התכנות – IDEs – לא יתמכו בתוסף שלהם. אנחנו כבר היום משתמשים בלמעלה מ-12 מודלים שונים, מותאמים כמעט לכל השפות וממשקי התכנות, וחברות אנטרפרייז גדולות ועד הקטנות ביותר שאינן רוצות להיות כבולות למיקרוסופט וחשופות להרבה ענייני סקיוריטי שכבר דובר עליהם רבות (זליגת קוד ושיתופו במאגרי קוד פתוח) – יעדיפו פתרון כמו שלנו. אצלנו גם אפשר להריץ את המודל לוקאלית על המחשב, ולא מחוייבים לשלוח את הקוד לענן, בעוד שבקופיילוט אין אפשרות כזו".
וייס מסביר שלדעתו מדובר בתחרות טובה ולא מדובר על מצב של המנצח לוקח הכל, "היות ותחום פיתוח התוכנה באופיו הינו מאד מבוזר, וכאן מדובר בשתי גישות שונות לחלוטין עם עשרות מיליוני מפתחים ועשרות אלפי חברות שמחפשות משאבים להאיץ תהליכי פיתוח וייעול פרודוקטיביות של מתכנתים" הוא אומר.
ולמה השם החדש?
מאז סבב הגיוס האחרון, מספר לנו וייס כי כמות המשתמשים במוצר של החברה גדלה פי 10, ומספר העובדים שולש לכ-30. עם זאת, החברה לא השתתפה בחגיגת הגיוסים בשנתיים האחרונות, "אין לנו אידיאולוגיה לגייס הררים של כסף. גייסנו לפי הצרכים שלנו, עם אקסטרה ליום סגריר" הוא מסביר. כך או כך, בחברה מתגאים ביותר ממיליון מפתחות ומפתחים שעושים שימוש במוצר הליבה של החברה, כלומר כלי השלמת הקוד; "לו היינו מכניסים לחישוב גם את אינדקס הקוד, היה מדובר בכ-4 מיליון משתמשים" מספר לנו וייס.
באופן מעניין, טאבניין בחרה לאמץ את השם של החברה הקנדית שרכשה ב-2019, ולא לשמור על השם המקורי שלה של לפני הנישואין. לטענת וייס, קודוטה לא התגלגלה טוב על הלשון של דובר אנגלית שהחליטות לקרוא לה קודאטה. "בנוסף, לאחר שרכשנו את טאבניין, השקענו מאד במוצר זה והוא צבר פופולאריות רבה בקרב קהילת המפתחים, ולאחר מחקר שוק קצר החלטנו שחייבים להמשיך עם שם אחד ושיותר נכון לשמור את טאבניין, ולהיפרד לשלום מקודוטה".
הגב
11 תגובות על "לא מפחדים מ-GitHub Copilot: המערכת הישראלית שעוזרת לכתוב 4 מיליון שורות קוד ביום"
* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.
ניסיתי את שלהם.
Copilot הרבה הרבה הרבה יותר טוב.
בהצלחה בתחרות.
איציק,
נראה שאתה ממש טוב בCopy-Paste
איציק חפרת
הלוואי שזה היה איציק. מערכת התגובות באתר הזה היא פשוט זוועתית. אין שום אינדיקציה שההודעה נשלחה לאחר לחיצה על 'הגב', מה שגורם לכך שלוחצים שוב ושוב והתגובה נשלחת בהתאם.
גיקטיים לטיפולכם. אתר טכנולוגי עלק
לא ברור גם למה לוקח כמות מכובדת מאוד של זמן (לפעמים 20 שניות ויותר בשביל לשלוח הודעה, אחרי לחיצה על הגב, צריך לחכות.. והרבה..
קוראים לי איציק
חושב שהעולם יפה
צחוק צחוק, אבל אחרי שיצא copilot ולא הייתה לו אינטגרציה לvim השתמשתי בtabnine הרבה זמן. אחרי כמה חודשים נפתר העניין ועברתי ל Copilot שהוא כרגע בפער משמעותי יותר מוצלח. מקווה שהם יצליחו לגשר על הפערים כי הבעיות שהזכירו בכתבה משמעותיות, אבל כל עוד האפקטיביות כל כך נמוכה אין סיכוי שמפתח ישמח לעבור מ copilot ל tabnine.
מישהו יודע להגיד אם Tabnine או Copilot יכולים לשמש גם ל HDL כמו Verilog?
חברה מדהימה, משתמש במוצר שלהם בעצמי ונהנה
לא בטוח שהייתי קופץ על זה. עדיין לא ברור אם האימון של גיטהאב על ספריות עם רשיונות מגוונים אומר שזה חוקי להשתמש בקוד שלך ללא התייחסות לרשיונות. הייתי נזהר עם זה.
nice