התחלנו לחקות את פעילות המוח על ידי מכונות: איך זה עובד ולמה דווקא עכשיו?

תחום ה-Deep Learning תופס תאוצה בשנים האחרונות, וכבר היום משמש אותנו בתרגום טקסטים, זיהוי תמונות ובקשר עם שירות לקוחות. איך פועלת הטכנולוגיה שמאפשרת למכונות ללמוד ומדוע היא פורצת דווקא עכשיו?

 Donald Iain Smith/ Getty Images Israel

צלם/תמונה: Donald Iain Smith/ Getty Images Israel

מאת יובל מזור, ארכיטקט פתרונות ענן במיקרוסופט ישראל

המושג למידה עמוקה (Deep Learning או DL) עולה לאחרונה כמעט בכל מקום. מדובר בתחום הקשור לבינה מלאכותית ולכן שומעים עליו הרבה בהקשרים של מכונות שמסוגלות לחשוב בעצמן, ולעיתים אפילו בהקשרים מאיימים, כגון מכונות שמפתחות שפה שאינה מובנת לבני אדם או מכונות שמקבלות החלטות עצמאיות. למידה עמוקה היא אחד מהתחומים “החמים” של השנים הקרובות, כזה שישפיע על חיי היומיום של כולנו, ולכן וחשוב להבין אותו ואת החדשנות שהוא מביא איתו.

כמו תחומים רבים שקשורים בבינה מלאכותית ולמידת מכונה (Machine Learning), גם DL היא בעצם גלגול של תחום שמוכר כבר שנים רבות – שימוש ברשתות עצביות או ברשתות נוירונים (Neural Networks). רשת עצבית היא מודל חישובי ששואב את השראתו מהאופן שבו פועל המוח האנושי, המכיל מיליארדים של תאי עצב (נוירונים), ולכן כשמחברים כמות גדולה של יחידות חישוב פשוטות (נוירונים מלאכותיים) בתצורה הדומה לזו שבמוח, ניתן לבצע בקלות יחסית משימות שהן קשות למחשבים, כמו לזהות אובייקטים בתמונה. עם זאת, חשוב לציין שהדמיון בין רשתות נוירונים מלאכותיות למוח הוא, במקרה הטוב, שטחי – המוח הוא מנגנון מורכב מאין כמותו, והרבה פרטים שונים בתכלית בין רשת עצבית אמיתית למימוש שלה על גבי מחשב.

פריצות הדרך שגרמו ל-DL לתפוס תאוצה

רשתות נוירונים מוכרות כבר משנות ה-40 של המאה הקודמת, בשנות ה-80 וה-90 המוקדמות הן נתפסו כמודלים חישוביים מעניינים אבל חסרי תועלת מעשית, וחוקרים שעסקו בהן נחשבו כמי שמבזבזים את זמנם. מה קרה מאז ומדוע תחום הלמידה העמוקה תפס תאוצה דווקא עכשיו? השינוי נובע ממספר גורמים שהשתלבו יחד. ראשית, התיאוריה העומדת בבסיסן של הרשתות העצביות השתפרה באופן משמעותי, ומה שנראה כמגבלות מבניות במודל הוכח כמשהו פתיר; שנית, הגידול המשמעותי בכוח מחשוב אפשר ליצור רשתות בעלות יותר ויותר נוירונים, ויחד איתן הגיעו יכולות מרשימות של המודל לפתור בעיות “מהעולם האמיתי”; ושלישית, כחלק מעולמות ה-Big Data, כמות המידע הזמין שעליו ניתן לאמן את המודלים של הרשתות העצביות חווה גם הוא סוג של “פיצוץ אוכלוסין”.

אנו נמצאים היום במקום בו פריצות דרך תיאורטיות הן כמעט דבר שבשגרה ופלטפורמות ענן מאפשרות כוח כמעט בלתי מוגבל לאסוף ולעבד כמויות עצומות של נתונים. בתנאים הללו הלמידה העמוקה תופסת עוד ועוד תאוצה.

מה אפשר לעשות כיום ב-Deep Learning? הנה כמה בעיות קשות שהטכנולוגיה מצליחה לפתור:

זיהוי תמונות. בתחרות ImageNet המשתתפים מקבלים 1.2 מיליון צילומים. התוכן של כל צילום מתויג עם קטגוריה אחת מתוך אלף אפשריות (למשל, “כלב”, “חתול”, “מטוס”, “רכבת” וכו’).  המטרה היא לזהות את הקטגוריה (כלומר, את תוכן התמונה) ב-100 אלף צילומים נוספים שאינם מתויגים. מודלים מבוססי Deep Learning הגיעו לרמת דיוק של 73% (כלומר, כמעט שלושה רבעים מסך כל התמונות הלא-מתויגות).

תרגום שפה. מודלים של Deep Learning הם כיום השיטה המובילה לביצוע של תרגום מכונה (Machine translation) – תרגום אוטומטי של טקסט משפה אחת לאחרת. השימושים הנפוצים הם בתוכנות תקשורת ו-Instant Messaging וברשתות חברתיות.

העתקת סגנון. להעביר סגנון אמנותי של תמונה אחת לתוכן של תמונה אחרת. לדוגמה, להפוך את התמונה של החתול הביתי שלכם למשהו שנראה כמו ציור של ואן-גוך.

שירות לקוחות. בוטים הם הדבר החם כרגע בשוק שירות הלקוחות, ובוט טוב צריך לדעת להבין שפה טבעית (כולל טעויות ניסוח וכתיב) ולייצר תשובה משמעותית בעלת הקשר נכון. מודלי Deep Learning (הידועים בשם sequence-to-sequence) הם האמצעי הטוב ביותר כיום להשגת מטרה זו.

איך זה עובד באמת?

איך בעצם עובדים הנוירונים המלאכותיים ומדוע מספרם גדל ברשתות של השנים האחרונות? מדובר ביחידה חישובית פשוטה למדי, שמורכבת מהרכיבים הבאים:

– קלטים – בציור שלפנינו, היחידה מקבלת 3 קלטים:  x1, x2 ו-x3 (כולם ערכים מספריים)

– משקולות – בציור שלפנינו, היחידה כוללת 3 משקולות:  w1, w2 ו-w3 (כולם ערכים מספריים)

– פלט – בציור שלפנינו, היחידה מייצרת פלט אחד בשם y.  הפלט הוא סכום של מכפלת כל אחד מהקלטים במשקל המשוייך אליו, ואז “העברת” הסכום דרך פונקציה כלשהי (לדוגמה, פונקציה שמוודאת שהערכים של y נמצאים בין 0 ל-1 או בין 1- ל-1).

החוכמה של הנוירון היא היכולת שלו ללמוד. אלגוריתם יעיל בשם backpropagation מסוגל ללמוד את הקשר בין קלט לפלט המתאים לו, בהינתן רשימה של קלטים x ופלטים y, על ידי כך שהוא משנה את המשקולות w. המשמעות היא שאם יהיו מספיק צמדים (x,y) שכאלה, הנוירון יוכל ללמוד את החוקיות שבנתונים, ובהינתן x חדש (שלא כלול בנתונים המקוריים שלנו) הוא יוכל לייצר את ה-y המתאים. למשל:  קלטים הם מאפיינים של לקוחות, הפלט הוא 1 אם הלקוח נטש את השירות שלנו, או 0 אם הוא נשאר. הלימוד הוא הבנת הקשר בין המאפיינים לנטייה לנטישה.

מובן שנוירון בודד מוגבל במה שהוא יכול לחשב, וזה בדיוק מה שהוביל לאיבוד העניין במודלים הללו מלכתחילה. אך כיום כבר ניתן לחבר מספר נוירונים – למשל ה-y של נוירון אחד הוא ה-x של נוירון שני שבתורו מזין נוירון שלישי – אותם מארגנים בשכבות, כך שכל הנוירונים בשכבה i מחושבים לפני אלו שבשכבה i+1. באופן כזה אנו מקבלים את המבנה הרשתי, ועם כוח המחשוב הקיים כיום ניתן לעבוד עם רשתות של מאות מיליוני נוירונים ומיליארדים של קשרים. Deep Learning לרוב מתייחס למצב שבו לרשת יש עשרות או מאות שכבות של נוירונים.

הטכנולוגיה אמנם התפתחה מאוד והיכולות בתחום התעצמו, אך עדיין יש אתגרים רבים ב-Deep Learning, ובראשם השאלה כיצד לייצג את הקלט הרצוי. למשל, איך מייצגים טקסט חופשי או תמונה כאוסף של מספרים שרשת נוירונים מסוגלת להתמודד איתם.

תחום ה-DL ימשיך להציג יכולות מרשימות בשנים הבאות, וסביר כי המומחים בתחום יפתרו את הבעיות הקיימות וייתקלו בחדשות, אך בינתיים הפלטפורמות הענניות שקיימות כבר היום הפכו את התחום לנגיש ביותר יישומים כך שיותר ארגונים – קטנים או גדולים – יכולים ליהנות ממנו.

הכתבה בחסות Microsoft

מיקרוסופט רואה בתחומי ה-AI וה-Data Science חשיבות רבה. לפיכך, היא משקיעה מאמצים כדי לייצר מוצרים ויכולות לתמיכה ב-Data Scientists/Engineers ובעלי תפקידים אחרים בתחום ניתוח הנתונים. ב-Azure, הענן הציבורי מבית מיקרוסופט, תמצאו מגוון טכנולוגיות: משירותי Big Data מנוהלים (כולל Hadoop ו-Spark), דרך מכונות וירטואליות בעלות GPU ועד מודלים מאומנים בתחומי עיבוד השפה והתמונה הזמינים כשירות. אם תרצו להמתקצע בעולמות הענן בחינם - הכנסו עכשיו לאתר Cloud Society וצפו במגוון קורסים מקצועיים.

כתב אורח

אנחנו מארחים מפעם לפעם כותבים טכנולוגים אורחים, המפרסמים כתבות בתחומי התמחות שלהם. במידה ואתם מעוניינים לפרסם פוסט בשמכם, פנו אלינו באמצעות טופס יצירת קשר באתר.

הגב

3 תגובות על "התחלנו לחקות את פעילות המוח על ידי מכונות: איך זה עובד ולמה דווקא עכשיו?"

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 

* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.

סידור לפי:   חדש | ישן | הכי מדורגים
תומר
Guest

תודה רבה
כתוב בצורה ברורה ומעניינת

(הלוואי וגם כתבים אורחים אחרים היו כותבים ברמה כזו)

נועם
Guest

כתבה לעניין

עודד
Guest

כתבה עניינית שהחכימה אותי. תודה!

wpDiscuz

תגיות לכתבה: