פיתוח חדש של גוגל מתרגם אתכם – בקול שלכם

רק במעבדה אבל אנחנו כבר מחכים: Translatotron של גוגל יספק תרגום מדויק יותר, מהיר יותר וגם יאפשר לכם לשמוע את המשפט המתורגם בקול שלכם

תמונה: גוגל

אם כבר אתם לוקחים כמובן מאליו את העובדה שאתה יכולים לשאול את העוזרת הקולית שלכם איך אומרים משפט מסוים בשפה אחת, והיא מתרגמת אותו עבורכם, חכו שתראו את זה: גוגל חשפה פרויקט חדש תוצרת בית בשם Translatotron. השם הלא-קליט-במיוחד הזה מחביא מאחוריו את אחת הטכנולוגיות המרשימות ביותר של החברה בשנים האחרונות שבסופו של דבר עשויות לאפשר לכם לדבר בשפה אחת, והמודל החדש יקח את המשפט שלכם, יתרגם אותו, וישמיע אותו מחדש בשפה המבוקשת, אבל בקול שלכם.

תרגום מהיר יותר, מדויק יותר וטבעי יותר

עד כה מערכות תרגום פועלות בשלושה מישורים עיקריים: זיהוי קולי והפיכתו לטקסט, תרגום של טקסט כתוב לשפה המבוקשת, ומנגנוני הקראת טקסט (TTS) שמאפשרים לכם לשמוע את הטקסט הכתוב מוקרא על ידי מחשב. את כל הפתרונות הללו אנחנו כבר מכירים ממערכות כמו Google Translate, אבל ה-Translatotron נראה יותר כאילו הוא נשלף מסרט מדע בדיוני שמתרחש בעתיד מאשר עוד פונקציה Google Translate.

תמונה: גוגל

ה-Translatotron בעצם מדלג על שלב ייצוג ויזואלי של הנאמר באמצעות טקסט והמרה שלו, שלעיתים גורם לתקלות תרגום, איבוד מידע בדרך וחוסר הבנה של פרטים שלא צריכים תרגום כמו שמות. במקום התהליך המקורי, הוא לוקח את הקלט הקולי (כלומר, המשתמש אומר משפט בשפת האם שלו), ממיר אותו לכדי ספקטוגרמה (ייצוג ויזואלי של התדרים המופקים מקובץ הקול) ומייצר ספקטוגרמה חדשה בשפה המבוקשת. בגוגל טוענים כי התהליך מהיר, מדויק ויעיל יותר מתהליכי תרגום קיימים, ומאפשר את קיומו של פיצ׳ר ההקראה החדש.

מעכשיו גיקטיים גם בטלגרם מעכשיו גיקטיים גם בטלגרם להצטרפות לערוץ הטלגרם שלנו לחץ כאן

גוגל שילבה ב-Translatotron את מה שהיא מכנה speaker encoder network, מערכת אשר מקודדת את קולו של המשתמש ומאפשרת הקראה של המשפט בשפה האחרת בצורה יותר טבעית ופחות צורמנית. מלבד האפשרות שההקראה תישמע בקולכם, המודל החדש אמור גם לשמור על הטונים בהם השתמשתם במהלך המשפט, כך שהמשפט שיוקרא ישמע הרבה יותר קרוב להקשר המקורי שלו ולדרך בה אתם אמרתם אותו. במקום קול רובוטי שמקריא באופן שטחי את המשפט פשוטו כמשמעו, הקול שלכם יקריא אותו עם כל הטונים הנובעים מהרגשות המעורבים בתהליך של התבטאות טבעית.

רק נקודת הפתיחה לפיתוחים הבאים

מאחר והפרויקט עדיין מוגדר כניסוי, גוגל מסתייגת ומסבירה שיכולות הדיוק של התרגום עדיין לא חדות כמו מערכות מקובלות אחרות שקיימות בשוק כבר שנים על גבי שנים, והשתפרו עם הזמן, אך התוצאות הקיימות הן טובות. צוות החוקרים חותם את הפוסט בנושא בהסבר כי הם מקווים שזוהי נקודת הפתיחה לאפשרויות שיפתחו כעת, ואם יש מישהי שיכולה לקחת את הניסוי הזה ולפתח אותו לפיצ׳רים מדהימים ושימושיים באמת, זו כנראה גוגל.

לא קשה לדמיין כיצד פרויקט ה-Translatotron יכול להשתלב בהמשך במוצרים אחרים של החברה כמו גוגל דופלקס, כדי שהעוזרת הקולית שמתקשרת בשמכם למסעדה תוכל לדבר בצורה שדומה הרבה יותר לקולכם הטבעי. גוגל גם השיקה השנה את העוזרת הקולית שלה במהדורה מיוחדת בקולו של הזמר והיוצר ג׳ון לג׳נד בניסוי מעניין עם מודל סינתוז הקול שלה, WaveNet. כך ששילוב מעניין בין שני הניסויים יאפשר לכם אולי לקבל עוזרת קולית בקולכם. וכמובן, אולי השימוש המתבקש מכל: שיחות טלפון שבהן אתם מדברים עם אדם שמדבר בשפה אחרת לגמרי, אך כל אחד מהצדדים שומע שיחה טבעית למדי בשפת האם שלו.

גוגל שיתפה את קובצי הקול שהופקו במסגרת הניסוי בגיט. שימו לב שהם פחות שמים דגש על רמת הדמיון בין קול המשתמש לקול המסונתז בסוף, אלא יותר על הטונים ששומשו בהקראה המקורית.

עידן בן טובים

נולד עם ג׳ויסטיק ביד. יש לו הרבה יותר מדי גאדג׳טים והרבה פחות מדי זמן פנוי כדי לשחק עם כולם. בעל פטיש לא מוסבר לביצוע קליברציות לסוללות של מכשירים. כשהוא לא עסוק בלכתוב על טכנולוגיה, הוא אוהב לדבר עליה, והרבה

הגב

5 תגובות על "פיתוח חדש של גוגל מתרגם אתכם – בקול שלכם"

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 

* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.

סידור לפי:   חדש | ישן | הכי מדורגים
גם אני
Guest

לא רוצה לשמוע את הקול שלי. מעדיף לשמוע קול של סירי

מישהו
Guest

הרעיון גדול, הביצוע רחוק

עוד מישהו
Guest

ואתה אומר את זה בתור מהנדס בכיר עם שנים של נסיון בעיבוד שפות טבעיות … כאילו אלפיהמהנדסים של גוגל סתם יושבים שם ץץץ

wolfie
Guest

גיא
Guest

כמה שנים עברו ועדיין אין תמיכה של גוגל בTTS בעברית. באסה בגלל שיש מרכזי פיתוח של גוגל בארץ..

wpDiscuz

תגיות לכתבה: