בכירים מ-NVIDIA, Kaggle וברקלי משקיעים ב-Datagen הישראלית
דאטהג'ן מפתחת מנוע דאטה ויזואלי שחוסך עבודת איסוף, תיוג ומיטוב, ועל הדרך גם דואג שהמאגר לא יהיה מוטה. עתה מודיעה החברה על השלמת גיוסי סיד ו-A בגובה 18.5 מיליון דולר
הסטארטאפ הישראלי Datagen הודיע היום (ג') על השלמת סבב גיוס Seed ו-A יחדיו. את סבב הסיד שעמד על 3.5 מיליון דולר הובילו TLV Partners, בעוד שאת סבב ה-A, בגובה 15.5 מיליון דולר, הובילה Viola Ventures. עוד השתתפו בסבב ה-A הקרנות Spider Capital, Operator Partners וכמה משקיעים פרטיים מעניינים: גל צ'צ'יק, דירקטור AI ב-Nvidia, אנת'וני גולדבלום מייסד ומנכ"ל Kaggle, מייקל ג'יי בלאק ממכון Max Planck וטריבור דארל, מייסד מעבדת ה-AI של אוניברסיטת ברקלי היוקרתית.
מנוע מידע ויזואלי לא מוטה
אין יותר מדי ספק שצמד המילים החם ביותר בהייטק הוא כרגע "בינה מלאכותית", אבל בשביל לבנות מוצר מבוסס בינה מלאכותית, צריך לאמן אותו על מאגר מידע גדול ומדויק ככל הניתן, ובשביל לעשות את זה אתם צריכים לאסוף אותו, לתייג אותו ולהנדס אותו, מה שלוקח חודשים ארוכים. וגם אז, אחרי כל העבודה הקשה הזאת, אם המאגר שלכם מבוסס על מידע שנאסף מהעולם האמיתי הוא יהיה מוטה. כאן נכנסים מנועי הדאטה.
"דאטה שנאסף מהעולם האמיתי הוא מוטה בהגדרה, מפני שהוא תלוי בפרמטרי שונות רבים שאין לנו שליטה עליהם כלל כמו עונתיות, אוכלוסיות, סביבות וכדומה", מסביר אופיר צ'קון, מייסד ומנכ"ל Datagen. בעוד יש מספר חברות כמו Datomize הישראלית אשר מפתחות אנונימיזציה של מאגרי מידע, דאטהג'ן מפתחת מנוע דאטה לאפליקציות Computer Vision. "המנוע הסימולטיבי שאנו מייצרים מעביר את השליטה בחזרה לידי החוקרים ומאפשר איזון מוחלט של צירי השונות בדאטה, כגון איזון של קבוצות גילאים, מגדרים, מוצאים, מקורות גאוגרפיים וכו'", כך לדברי צ'קון, אשר מסביר כי כך לא רק מתבטלת הטיית המידע, אלא שהחוקרים גם מסוגלים לקבל שקיפות מלאה למידע שהם מזינים למודלים.
המערכת של Datagen משלבת מידע תלת מימדי מהעולם האמיתי ומסוגלת לבצע סימולציה אשר תדמה את מצלמת הלקוח הנדרשת ברמת דיוק גבוהה, מה שמאפשר בעצם יצירת סימולציה מתקדמת של העולם האמיתי.
Datagen נוסדה ב-2018 על ידי אופיר צ'קון (CEO) וגיל אלבז (CTO). השניים הכירו במהלך לימודי התואר השני בטכניון. החברה מעסיקה 40 עובדים, רובם במרכז המחקר והפיתוח בתל אביב, והשאר עוסקים במכירות בניו יורק.
הגב
9 תגובות על "בכירים מ-NVIDIA, Kaggle וברקלי משקיעים ב-Datagen הישראלית"
* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.
אם התמונות האלה אמורות לייצג סימולציה של העולם האמיתי, המשקיעים בצרות
התמונות, כפי שזה נראה, נלקחו על ידי העיתונאים מהדגמה מלפני 3 שנים.
לפי הדוגמאות של 2021 הפרצופים נראים מאוד מציאותיים.
מי שהבין, מה זה עושה, ואיך זה מונע נטייה, שיסביר לי.
הי
אם לדוגמא רוצים לבנות מערכת שמזהה עבריינים.
בשביל לבנות את המערכת הזאת משתמשים באסירים בבתי הסוהר בארצות הברית.
הבעיה היא שיש הרבה יותר עבריינים שחורים מבחנים . כתוצאה מכך המערכת ai שתתקבל תזהה שחורים בסיכוי גבוה כעבריינים. וזו ההטייה מסוכנת ומפלה.
המערכת שלהם יוצרת אנשים בצורה מאוזנת.
לדוגמא המערכת תייצר ביחס שווה פנים של לבנים שחורים וכך תמנע העדפה למגזר מסוים
בדוגמה שנתת המערכת תתעלם מצבע העור של המועמד כשבפועל צבע עורו כן משפיע על ההסתברות שלו להיות עבריין.
כלומר בהגדרה היא תבטיח ללקוחות שלה תוצאות פחות טובות.
אף אחד לא ירצה להשתמש במערכת הזאת אם יש חלופות שמבטיחות תוצאות מדוייקות יותר (דיוק שווה כסף)
בעולם של פוליטקלי קורקט אתה לא רוצה להגיד ששחורים הם יותר עבריינים מלבנים.
האמת העצובה היא שיש יותר שחורים בבית סוהר כי אנחנו גזעניים.
האם אתה רוצה ai גזעני?
אסף
זה לא משנה מה אני רוצה
וזה לא משנה למה יש יותר שחורים עבריינים. למערכת הזו אין סיכוי. בעולם יש הטיות. מערכת שעובדת בלי ההטיות הללו (איך בדיוק? מישהו יצטרך לנרמל את הנתונים, לא? לפי מה? בדיוק ההיפך מאיך שמערכות למידה עושות, שפועלות על דאטה אמיתי), תתן תוצאות עסקיות פחות טובות.
עם כל הכבוד לפוליטיקלי קורקט, לכוחות השוק יש סדר עדיפות שונה (תשואה כלכלית)
למעשה בגלל הטיה כזאת ה ai של גוגל זיהה אישה שחורה בתור קוף.
עכשיו ה ai הוא לא גזעני אבל כנראה שהוא ראה הרבה יותר תמונות קופים מתמונות של אנשים שחורים.
העניין עם ai שלמרות שבאוכלוסיה סטטיסטית יש התפלגויות שונות, אתה רוצה שהמודל שלך ידע לזהות או לטפל בכולן בהתפלגות שווה, ולכן לא משנה מה גודל הקבוצה באוכלוסיה אתה רוצה ייצוג שווה שלה באימון של המודל.
שלום גם לך היטלר! <3