מיקרוסופט חושפת תרגום קולי ומהפכני, הממיר את קול המשתמש לשפה זרה

במסגרת אירוע Microsoft Research Asia’s 21st Century, הציג ריק ראשיד, מנהל המחקר הראשי במיקרוסופט את מערכת ה-Text-To-Speech עליה עבדה החברה במהלך השנים האחרונות

מקור: יח”צ

מיקרוסופט מציגה את הטכנולוגיה האחרונה שפיתחה: שירות תרגום Text-To-Speech. בניגוד לחברות האחרות הקיימות בשוק ומציעות שירותים דומים, הייחוד העיקרי של מיקרוסופט הוא בהשמעת הטקסט – גם בשפה הזרה – בקולו של המשתמש המקורי.

שוק בצמיחה

עבור משתמשים רבים ברחבי העולם, מחסום השפה הוא אחד מהקירות החזקים ביותר המונעים מהם להתפתח, להכיר אנשים חדשים או אפילו לטייל במדינות חדשות. בעוד שבתי הספר מנסים להכין את תלמידיהם על ידי לימוד אנגלית, צרפתית, ערבית, ספרדית או כל שפה פופולארית הנמצאת באיזור המחייה של התלמידים, רבים מהם נוטים לשכוח כל מה שלמדו ברגע שרגלם דורכת מחוץ לכותלי בית הספר

כתוצאה מכך, אחד השווקים הפופולאריים ביותר כיום הוא שוק התרגום, המציע עשרות ואף מאות תוכנות שונות ומגוונות הכוללות תרגום מילים משפה אחת לאחרת, תרגום משפטים שלמים ואף הצעת המרת טקסט אל דיבור, המציע למשתמש פלט בשפה אחרת מזאת שדיבר אליה בצורה קלה ופשוטה – דרך הסמארטפון שלו.

כעת, נראה כי חברה ענקית נוספת מעוניינת להכנס אל שוק ה-Text-To-Speech על ידי הצגת טכנולוגיה חדשה עליה עבדה במהלך השנים האחרונות, והצעת חידושים ושיפורים שלא נראו בעבר – מיקרוסופט.

לדבר כמו מקומי

במסגרת אירוע Microsoft Research Asia’s 21st Century שנערך בסוף השבוע בטיינג’ין, סין, עלה לבמה ריק ראשיד, מנהל המחקר הראשי ב-Microsoft Research והצליח להדהים את הקהל בזכות הצגת יכולות הטכנולוגיה שפיתחו. במסגרת האירוע, ראשיד הסביר באנגלית כיצד המערכת עובדת, כאשר בסיומו של המשפט, נשמע קולו בשנית – רק הפעם בשפה הסינית.

כלומר, ההבדל העיקרי והמשמעותי מצד מיקרוסופט הוא העובדה שגם פלט הקול שמוצע בשפה החדשה אינו נשמע בשפת מכונה, אלא המערכת יודעת לקחת את קולו של הדובר, להמיר את התנועות וההגיות שלו, ולהשמיע גם את השפה הזרה באותו קול, כמעט כאילו ידע לדבר מאז ומתמיד.

אופן הפעולה של המערכת שפיתחה מיקרוסופט עובד כך: הצעד הראשון לוקח את המילים שאמר המשתמש ומוצא את השוות להן בשפה הסינית. לאחר מכן, המערכת מסדרת מחדש את מיקומן של המילים, על מנת שיהיו בעל משמעות והגיון בשפה החדשה. בנקודה זאת הודה ראשיד כי עדיין יכולות להופיע טעויות, גם בשפה הסינית וגם בשפה האנגלית, עם תוצאות משעשעות במיוחד. אך למרות זאת, אין ספק שמדובר בפיתוח טכנולוגי שימושי.

הצעד האחרון הוא המרת הטקסט לקובץ קול. במסגרת ההדגמה הסביר ראשיד כי פלט הקול אינו מובן מאליו, והיה על החברה להקליט במשך מספר שעות את קולו של דובר סיני, ועוד כשעה את קולו של ראשיד עצמו. נכון לעכשיו מדובר על פיתוח מקומי של החברה, ועדיין לא ברור מתי ואיך יגיע לשיווק מסחרי, אך מטרתה של מיקרוסופט היא לנסות ולשבור את מחסום השפה כבר במהלך השנים הבאות – ולאפשר לכל המשתמשים לדבר אחד עם השני, ללא התייחסות למדינה ממנה מגיעים, או לשפות אותן דוברים.

התחרות מתחילה

מיקרוסופט נכנסת לשוק רווי המתחרים, הכוללים לצד חברות כמו Nuance המציעה את Dragon Dictation או בבילון גם ענקיות תוכנה, כמו גוגל המציעה את שירותי התרגום באמצעות Google Translate ו-Google Now, וסירי של אפל, המסוגלת לזהות שפות ולהמיר טקסט לדיבור.

עם זאת מבהיר ראשיד כי בניגוד לחברות הללו, היתרון וההבדל המשמעותי שמציעה מיקרוסופט היא בכך שמצליחה להמעיט את טעויות התרגום ב-30 אחוזים. כלומר, בעוד שסירי וגוגל יציגו מילה אחת שאינה נכונה בכל ארבע או חמש מילים, למיקרוסופט יש טווח טעות של מילה אחת בכל שבע-שמונה מילים. בנוסף, ראשיד מודה כי המוצר שפיתחו עדיין אינו מושלם, אבל לאור העובדה שכבר עכשיו מציע טווח טעויות קטן משמעותית ממתחריו, והחברה מתכננת להמשיך להגדיל את הפער ככל שימשיכו לפתח את המוצר, מאמין כי מיקרוסופט תהיה החברה שתציע את הפתרון האולטימטיבי בתחום זה, או לפחות כך מקווה.

בבלוג הרשמי של ראשיד סיכם את האירוע ואת הצגתו בכך שייתכן כי המשתמשים לא יאלצו להמתין עד המאה ה-22 על מנת להשתמש במתרגם האוטומטי, כפי שנראה לראשונה בסטאר טרק ואנו מקווים כי הוא אכן צודק, וכבר בקרוב נוכל לראות את המוצרים הללו בפעולה בעוד כמה שפות מלבד אנגלית וסינית.

וידאו: Speech Recognition Breakthrough for the Spoken, Translated Word

חן אידן

אוהבת גאדג’טים, אפליקציות ואת עולם הטכנולוגיה בכלל. שלל עיסוקיה כוללים הריסת מכשירים סלולריים לצרכי בדיקה, התעסקות בלתי פוסקת ברשתות חברתיות, סקירת אפליקציות חדשות, סטארטאפים מבטיחים והתנסות עם (כמעט) כל מוצר חדש שיוצא לשוק.

הגב

Be the First to Comment!

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 
wpDiscuz

תגיות לכתבה: