הדרך לניתוח המידע עוברת בשיתוף שלו

הצמיחה המהירה של התעשיות הסובבות את תופעת הביג דאטה היא אחת המגמות המרגשות ביותר בשוק טכנולוגיית המידע בעת האחרונה. בהתאם לכך, עולה גם חשיבותו של שיתוף המידע, וגם שיטת השיתוף הנבחרת. בהיבט זה, למדיה חברתית יש פוטנציאל להביא לפריצת דרך במגזר זה.

הפוסט נכתב על ידי אופיר קרא-עוז, מנהל המו”פ של EMC בבאר שבע ומנהל בכיר לקו מוצרי Greenplum.

תמונה: flickr, cc-by, luckey_sun

הצמיחה המהירה של התעשיות הסובבות את תופעת הביג דאטה היא אחת המגמות המרגשות ביותר בשוק טכנולוגיית המידע בעת האחרונה, וחברות המחקר צופות שיעורי צמיחה יוצאי דופן במגזר זה. אם אמנם יתממשו התחזיות האופטימיות, צפוי גם חוסר משמעותי בעובדים שיידעו לנצל את כמויות המידע האדירות שהצטברו. בהתאם לכך, עולה גם חשיבותו של שיתוף המידע, וגם שיטת השיתוף הנבחרת. בהיבט זה, למדיה חברתית יש פוטנציאל להביא לפריצת דרך במגזר זה.

מחט בערימה של שחת

בעת הנוכחית, אין הגבלה עקרונית ליצירת אפליקציות ביג דאטה, מאחר וכמות המידע שאנו מייצרים נמדדת בזטה-בייטים, וניתן לעבד אותה באמצעות מאגרי נתונים המפעילים תהליכים מקבילים רבי עוצמה (Massively Parallel Processing), כלי ניתוח חדשים, וחומרה סטנדרטית השווה לכל כיס. עם זאת, ספקים ולקוחות הנעזרים בשירותי הביג דאטה ניצבים בפני בעיה לא פשוטה, דווקא בעידן שבו הטכנולוגיה מציעה את כל הפתרונות האפשריים – הם נזקקים לעזרתם של “מדעני נתונים”, מקצוע חדש הדורש שילוב נדיר של כישורים.

על מנת לאמוד את חשיבות המידע, מדען נתונים חייב להבין את הסביבה העסקית לעומק, כמו גם להחזיק בכישורים הטכנולוגיים הנחוצים. עליו לפעול בזמן אמת, למצוא את המידע המתאים וליישם סוגים שונים של נתונים. יתרה על כך, ממדען נתונים מצפים שיתנהל במידה מסויימת כמו אמן, המחפש חיבורים יצירתיים והמסוגל לשלב התמחויות בתחומים שונים.
חשוב לציין בשלב זה שמדען נתונים לא בהכרח חייב להיות אדם אחד, וניתן לשלב בין יכולות של מספר מומחים ליצירת מעין “מדען נתונים וירטואלי”. יחד עם זאת, האתגר האמיתי הוא השגת שיתוף פעולה בין מומחים מבלי לבזבז זמן יקר על ניסיונות לתאם בין הממצאים שנאספו. אחת הדרכים המומלצות לכך היא שימוש ברשת חברתית.

הרשת החברתית כפתרון

מדענים יכולים להשתמש ברשת חברתית על מנת לחלוק את המידע עם עמיתיהם, וגם לצורך קבלת דעה מלומדת על מסקנותיהם הראשוניות. מדובר בתהליך מתמשך, היוצר ניתוח מהיר יותר של מידע, ודומה במהותו למתודולוגיות ה”זריזות” (agile) בעולם פיתוח התוכנה, בהן תוכניתנים משתפים פעולה במקום לחלק את העבודה למשימות אישיות.

אם כך, כיצד צריכה להיראות הפלטפורמה החברתית של מדעני המידע? בעולם אידיאלי, פלטפורמה שכזו תהיה משולבת ישירות בסביבת הפיתוח שבה משתמשים החוקרים, ותכלול ארבעה אלמנטים עיקריים: הראשון הוא סקירה מקיפה של המידע – היכן הוא מצוי, כיצד ניתן להשתמש בו, באיזה אופן ערוך המטה-דאטה (מידע אודות גישה לנתונים) שלו, ההערות, שאילתות ה-SQL וכדומה. השני הוא קביעת סביבת העבודה – “ארגז החול” שניתן להקים במהירות, ושבו יוכלו מדעני הנתונים לנתח את המידע. המדענים יהיו מסוגלים להפעיל את “ארגז החול” באמצעות מספר לחיצות כפתור ולהתאימו לדרכי העבודה שלהם.

השלישי הוא ניתוח המידע עצמו, כך שהמשתמשים יוכלו לראות את הנתונים מול עינייהם ולשתף פעולה עם חוקרים אחרים. הצעד האחרון הוא פרסום מזורז של תוצאות המחקר, כך שהעמיתים יוכלו לצפות בו ולהעניק היזון חוזר. כך, סיעור מוחות ברשתות החברתית יאפשר למצוא הזדמנויות שלא זוהו, ויוביל את החוקרים לרעיונות חדשים. מחזור זה נמשך עד שתובנות חדשות נחשפות, והחוקר מגלה אלגוריתם אשר ישמש לניתוח מידע חדש באותה השיטה.

כמובן שלא כל אחד יוכל לקבל גישה לאותה רשת חברתית, מאחר וגישה חופשית אל מאגרי המידע של חברה עסקית עלול לסייע למתחרים. זאת בדיוק הסיבה מדוע נחוצה אבטחת מידע המשולבת בתקשורת באמצעות רשתות שכאלה – האבטחה חייבת למדר את הגישה, כך שמשתמשים יוכלו לראות רק את המידע שאליו הם מורשים לגשת, ויוכלו לבצע פעולות על הנתונים בהתאם להרשאות שקיבלו ממנהל המערכת.

פלטפורמת הרשת החברתית עשויה לשמש כמאגר של מסקנות מחקריות, כך שמי שירצה לאתר מסקנות ותובנות ולהשתמש בהן לא יצטרך לבצע חיפוש בהודעות דוא”ל ישנות, בשרתים או בפורטל הפנים-ארגוני. שיתוף המידע בזמן אמיתי היא שיטה המייעלת את הפעילות הארגונית בעת העבודה לקראת הפיתרון, אך גם מבטיחה שמידע חשוב לא ילך לאיבוד לאחר סיום התהליך.


הפוסט בחסות מרכז החדשנות של EMC בבאר-שבע


מרכז החדשנות של EMC בבאר-שבע הוא אחד מנותני החסות המרכזיים של אירוע Startup Weekend בבאר-שבע.

מרכז המחקר והפיתוח של EMC בבאר-שבע עוסק בפיתוח קווי מוצרים חדשים וקיימים, ביניהם: פיתוח קו מוצרי גרינפלאם (Greenplum) בתחום ניתוח נתוני ענק (Big Data), פעילות שנרכשה על ידי EMC בשנת 2010, פיתוח מוצרים עבור RSA, חטיבת אבטחת המידע של EMC, ופיתוח פתרונות בתחום מחשוב הענן.

 

 

כתב אורח

אנחנו מארחים מפעם לפעם כותבים טכנולוגים אורחים, המפרסמים כתבות בתחומי התמחות שלהם. במידה ואתם מעוניינים לפרסם פוסט בשמכם, פנו אלינו באמצעות טופס יצירת קשר באתר.

הגב

הגב ראשון!

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 

* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.

wpDiscuz

תגיות לכתבה: