מלכוד 22: הבעיה של חברות מבוססות דאטה ו-Machine Learning

סטארטאפים רבים נתקעים בתחילת הדרך במלכוד של יצירת השירות מול צבירת הדאטה. אפשר לשלם ללקוחות עבור יצירת המידע, לתת שירות חינם כדי שהם יצברו אותו או לבחור באסטרטגיה שדורשת מעט סבלנות ולשלב ביניהם

צלם תמונה: guntsoophack yuktahnon/ Getty Images Israel

מאת אסף פלדמן, יזם ו-CTO של Riskified

חברת סטארטאפ שמטרתה לתת שירות מבוסס על דאטה ו-Machine Learning עלולה למצוא את עצמה במלכוד 22 כבר בתחילת הדרך. הבעיה העיקרית היא שכדי לייצר Machine Learning צריך דאטה, אבל דאטה מתקבל כשמציעים שירות וכדי לתת את השירות צריך Machine Learning. כך נוצר מעגל שדורש פתרון יצירתי.

ישנן שתי אסטרטגיות מרכזיות לפתור את הבעיה: ייצור עצמי של המידע או לגרום למקבלי השירות לייצר אותו עבורך. שתי דוגמאות טובות לענקיות טכנולוגיה שבחרו באסטרטגיה שונה הן גוגל ו-Waze. גוגל שילמה מאות מיליוני דולרים לאנשים שיסעו במכוניות על מנת למפות כבישים ודרכים, ואילו Waze הציעה לנהגים את שירות האפליקציה שלה והשתמשה בהם כדי שימפו עבורה את הדרכים והכבישים וכך צברה דאטה ללא צורך בתשלום.

לא מעט מהסטארטאפים בתחום ה-Big Data וה-Machine Learning נתקעים במלכוד של יצירת השירות מול צבירת הדאטה, וגוססים כבר בשלב ה-seed. יש מעט חברות שגייסו הון מספק כבר בהתחלה כדי לנסות לייצר את הדאטה בעצמן, אחת מהן היא Karhoo, שבחרה בייצור עצמי של דאטה ושרפה בדרך 250 מיליון דולר.

שילוב של שתי האסטרטגיות

אבל יש גם גישה שלישית, שמשלבת את שתי האסטרטגיות, ואותה נקטנו ב-Riskified. זה דרש מאיתנו לתת שירות קצת שונה במשך תקופה על מנת לבנות ולצבור את המידע. כדי שנצליח לעשות זאת, הצענו לסוחרים שאנחנו נבדוק רק את העסקאות המסוכנות שלהם – אלה שהם התכוונו לדחות – והם ישלמו רק על עסקאות שאנחנו נצליח "להציל" ולזהות שהן בעצם לגיטימיות. פנינו רק לסוחרים קטנים עם עסקאות אינטרנטיות בסכומים גדולים יחסית, וכך קיבלנו את המידע על כל העסקאות שלהם אבל היינו צריכים לנתח רק מספר עסקאות קטן יחסית, ואת זה יכולנו לעשות ידנית.

זו הייתה תקופה מתגמלת במיוחד. עבדנו עם עסקים קטנים והרגשנו שהעבודה שלנו באמת מסייעת לעסק שלהם לצמוח. לאחת מהן, חנות לאביזרי די.ג׳יי מברוקלין, סייענו להגדיל את היקף המכירות ב-30% והורדנו את זמן אישור העסקאות ב-84%. כמובן שתוך כדי בנינו את תשתיות איסוף והעשרת המידע שלנו, ודאגנו שכל התיוגים של הדאטה יתבצעו על ידי האנליסטים שלנו ויהיו מאוד מדויקים.

אחרי כשנה, כשנצברה כמות משמעותית של דאטה, בנינו את המודלים הראשונים של ה-Machine learning. זה אפשר לנו להתחיל להציע שירות לסוחרים גדולים יותר, ולהגדיל גם את היקף המכירות וגם את כמות הדאטה במערכת שלנו. באופן הזה המשכנו להגביר את האוטומציה, ובמקביל גם את גודל וכמות הסוחרים שלהם סיפקנו את השירות.

הסוחרים הקטנים שאיתם התחלנו עדיין איתנו, מקבלים שירות עם 100% אוטומציה, על אף שמבחינה שיווקית הם כבר לא קהל היעד שלנו. היום אנחנו עובדים עם קמעונאיות בינלאומיות כמו Macy's ו-FootLocker, אבל לפני שהיו לנו מודלים טובים לא יכולנו להתמודד עם היקף העסקאות של סוחרים כל כך גדולים, וגם הם מצידם אולי לא היו בוחרים לעבוד עם סטארטאפ קטן. כך שלמעשה הכל עבד בצורה אורגנית. כשהגענו לשלב בו היינו מספיק בשלים ומוכרים בשוק, האוטומציה במערכת שלנו הייתה כבר גבוהה מספיק בשביל לעבוד עם חברות ענק.

המעבר לאוטומציה מלאה

כשיש מאות עסקאות אינטרנטיות בשעה, כפי שיש בקרב לקוחות גדולים, אי אפשר להסתמך עוד על מערך ידני. בשביל להתמודד עם היקף כזה גבוה יש צורך באחוזי אוטומציה גבוהים מאוד – קרובים ל-100% – אבל דווקא אוטומציה מלאה לא מתאימה לכל עסק. הניתוח הידני של האנליסטים שלנו גם מאפשר לנו "לבנות" פיצ׳רים ומודלים מהר יותר מאשר לחכות שהמודלים יגיעו לתובנות בעצמם. לכן חשוב לזכור ש-Machine Learning זה המכשיר ולא המטרה; צריך להבין מה חשוב לעסק שמולו עובדים, מה האתגרים והתעדוף שלו, ולפי זה למצוא את השילוב הנכון של אוטומציה ומעבר ידני. ובמילים אחרות, אל תהססו לבחור אסטרטגיה שדורשת קצת סבלנות, זה ישתלם מאוד בהמשך הדרך.

הכתבה בחסות Extra Mind

הכתבה בחסות Extra Geek מתחם תוכן הסוקר את כל מה שחם בתעשייה. אם אתם לפני גיוס, מחפשים עובדים איכותיים או רוצים לייצר דיל פלואו איכותי, פה תוכלו למצוא בית שיספר את הסיפור שלכם ויבטיח חשיפה המכוונת ללב ליבה של התעשייה. המתחם הינו פרי שיתוף פעולה בין GeekTime ומשרד יחסי הציבור Extra Mind.

כתב אורח

אנחנו מארחים מפעם לפעם כותבים טכנולוגים אורחים, המפרסמים כתבות בתחומי התמחות שלהם. במידה ואתם מעוניינים לפרסם פוסט בשמכם, פנו אלינו באמצעות טופס יצירת קשר באתר.

הגב

3 Comments on "מלכוד 22: הבעיה של חברות מבוססות דאטה ו-Machine Learning"

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 
Sort by:   newest | oldest | most voted
עודד
Guest

יפה מאד. אכן נקודה חשובה לכל מי שרוצה להסתמך על תהליכי למידה.
רק שאלה אחת: האם אין הבדלים בין מאפייני הונאה מול עסקים קטנים לבין אלו שמול עסקים גדולים בהרבה? נראה כאילו נעשתה כאן בשלב הראשון למידה שאינה בהכרח רלוונטית לגמרי לשלב השני.

אלברט
Guest

זאת גישה אפשרית, אבל מסוכנת מאוד.
כשאוספים דאטא למטרה אחת בזמן שפותרים למטרה אחרת מקבלים תוצאות ממש מלוכלכות במיוחד במקרי קצה. דווקא בתחום ההונאות כשיש מטרה נעה ומתנגדת (הגנבים גם לומדים את המערכת) המטרה החדשה לא ממודלת כראוי.

גדשג
Guest

מפתח מוצר כמו של Riskified, רק לעולם הביטקוין – https://whitestream.io/

wpDiscuz

תגיות לכתבה: