מהנדסים ישראליים בגוגל: זאת הסיבה שהגוגל אסיסטנט לא יודעת עדיין עברית

גם אתם מחכים שהעוזרת הקולית של גוגל תתחיל לדבר ולהבין עברית? המהנדסים הישראליים של גוגל, שאחראיים על הפיתוח, מסבירים לנו למה זה לא קורה עדיין

Photo by John Tekeridis from Pexels

באירוע ההכרזה של גוגל בתערוכת CES 2020 בלאס וגאס, הציגה החברה לא מעט חידושים בתחום העוזרת הקולית הפופולרית והמוצלחת שלה. אחד החידושים הבולטים ביותר היה יכולת הקראת עמודי האינטרנט החדשה של האסיסטנט. מי שעומדים מאחורי הפיתוח המרשים הזה הם צוות מהנדסים ממרכז הפיתוח של גוגל בתל אביב, שחלקם אף הוזמן לקחת חלק באירוע לאחר פיתוח קדחתני של שנתיים. ישבנו עם שלומי בן שמעון, מהנדס תוכנה בגוגל, ודוד קדוש, מנהל מוצר בגוגל, כדי להבין איך הפיצ’ר פותח וגם כדי לענות על שאלת השאלות: למה עדיין אין אסיסטנט בעברית?

האתגר של הפיצ’ר החדש: להתעלם מהמסיחים

 


הפיצ’ר החדש של האסיסטנט בעצם מאפשר למשתמשים לגלוש לאתרים עם טקסט, ופשוט לבקש מהעוזרת להקריא להם את הכתוב. לכאורה, יישום לא מורכב מדי של Text-To-Speech. אבל זהו, שלא. בן שמעון מסביר לנו שאחד האתגרים הקשים ביותר היה בנייה של מנגנון חכם שיודע להתעלם מגורמים טקסטואליים בעייתיים בדפי אינטרנט כמו תיאורי תמונות, תפריטים, תאריכי פרסום של כתבות, פרסומות ושאר טקסטים שאם העוזרת הייתה מקריאה, היו מבלבלים אתכם וגורמים לכם להפסיק להשתמש בפיצ’ר.

בהדגמה שנערכה לנו באירוע של גוגל, הפיצ’ר עבד בצורה מרשימה ואכן הקריא את הטקסט בצורה רציפה בקול המסונתז אך המוכר והנוח של האסיסטנט, והתעלם לגמרי מאלמנטים מסיחים בתוך גוף הכתבה כמו פרסומות, כפתורים ואלמנטים שונים של ניווט בדף. עם זאת, למרות שגוגל הכריזה שהפיצ’ר תומך בהקראה ב-42 שפות, לצערנו – גם הפעם – עברית לא ברשימה של גוגל, על אף שהפיתוח של הפיצ’ר התבצע במרכז הישראלי.

מעכשיו גיקטיים גם בטלגרם מעכשיו גיקטיים גם בטלגרם להצטרפות לערוץ הטלגרם שלנו לחץ כאן

למרות שהוא לא תומך רשמית בעברית, פיצ’ר ההקראה החדש כן מאפשר להכנס לדפים בשפות זרות, ולהקריא את הטקסט באנגלית אחרי תרגום. ניסינו את הפיצ’ר עם כתבה של גיקטיים והוא פשוט הצליח בתוך רגע לתרגם את הכתבה בצורה מרשימה, ולא בנוסח שאנחנו מכנים בזלזול “Google Translate”, כלומר תרגום מכונה לא חכם. למרות ההדגמה המוצלחת, לא מדובר ב-100 אחוזי הצלחה, וחלק מההקשרים והמשמעויות אבדו בתרגום.

מי חשב שניקוד יהפוך לכזו בעיה?

שלומי בן שמעון, מהנדס תוכנה (משמאל), ודוד קדוש, מנהל מוצר (מימין). צילום: גיקטיים

מהשיחה עם בן שמעון וקדוש עולה כי חוסר התמיכה של פיצ’ר בהקראה בעברית הוא בעצם אותה הסיבה שבגינה האסיסטנט של גוגל עדיין לא תומכת בעברית: “להבין מישהו שמדבר בעברית זו ממש לא בעיה. לקחת את הסאונד של בנאדם מדבר ולפענח את זה למילים – זה אפשרי – גם בעברית וגם בשפות אחרות” מסבירים השניים. לדבריהם, יש פיצ’רים שעובדים לא רע כמו החיפוש הקולי בווייז למשל, אבל הבעיה מתחילה כשצריך לענות בחזרה למשתמש עם קול מסונתז בעברית.

קדוש מסביר כיצד עברית מאתגרת את הצוות של גוגל בצורה משמעותית, בעיקר לאור העובדה שהיא שפה “חסכונית” באותיות: “ברגע שאין את הניקוד, קשה לדעת איך להקריא את המילים בצורה נכונה. התוכן בעברית הוא לא מנוקד. כשבני אדם קוראים בלי ניקוד, הם מפענחים בראש שלהם את המילה הנכונה בעזרת ההקשר של הטקסט. הם יודעים להבדיל בין המילה ‘רכבת’ (כלי התחבורה, ע.ב) ו’רכבת’ (כלומר, רכבת בעבר. ע.ב). למחשב זה הרבה יותר מסובך”.

קדוש ובן שמעון מסבירים שאיכות מנגנון הקראת הטקסט פשוט לא מספיק טובה כרגע כדי שגוגל תדגים אותה. אבל כן חושפים כיצד החברה מתמודדת עם הבעיה הזו: “יש לנו אנשי מחקר ששוקדים על הבעיה הזאת ומשתמשים ב-Machine Learning כדי לבנות אלגוריתמים מתאימים. מילים מסוימות קשורות לעיתים למילים אחרות ולהקשרים שונים. הכללים של השפה לא מספיקים, וצריך להבין גם את המילים האחרות שגם הן לא מנוקדות. זו בעיה מאוד מסובכת שלא מאפשרת לכתוב חוקים פשוטים”.

קדוש, שמגדיר את נושא העברית כ”אתגר אישי”, מסביר כי אותם אלגוריתמים זקוקים לכתבות אינטרנטיות מנוקדות, ומאחר שאין הרבה כאלו, הן דורשות כוח אדם רב וספציפי מאוד כדי לייצר דאטה איכותי. גם אחרי שהאסיסטנט תדע לדבר עברית באופן מלא, יחכו לצוות עוד כמה אתגרים של פענוח פקודות והוראות שונות שיאפשרו את השקת האסיסטנט בעברית. “אני מאמין שזה יקרה”, מסכם קדוש בצורה חצי אופטימית.

ומה בנוגע לאפל? כבר כמה שנים שיש לה עוזרת קולית דוברת עברית

“בפעם האחרונה שבדקתי את סירי באנגלית, היא לא מגיעה ליכולות של האסיסטנט. גם מבחנים מוכיחים את זה. הם החליטו שעבור סירי מה שהם עשו מספיק טוב וזה הרף שלהם. כל אחד עושה את השיקול שלו”.

אתם מרגישים שהשוק הישראלי ודובר העברית מספיק חשוב לגוגל?

“המדיניות של גוגל היא להשיק בכמה שיותר שפות. אבל יש לה תעדופים. לעברית יש שתי בעיות: היא גם שפה קשה וגם היא לא השוק הכי גדול. ביחד, בתחום של האסיסטנט, מקצים לזה משאבים, אבל יכול להיות שיש שווקים אחרים שעוקפים אותנו בדרך. אלה החיים”.

בן שמעון מסביר שאתגרים נוספים שעמדו בפני הצוות, שלא קשורים בהכרח לעברית, הם בעיקר בתחום מהירות התגובה של המנגנון מהרגע שהמשתמש מבקש להקריא את התוכן, עד שזה מתבצע: “יש לנו Pipeline שמתחיל מהרגע שהמשתמש נותן את הפקודה. יש מודלי ML שמייעלים את חילוץ המידע ושיפור שלו מהדפים, ומנגנוני קאשינג חכמים והזרמה מהירה של האודיו למשתמש תוך כדי אופטימיזציה שלו”.

השניים מספרים כי הפיצ’ר היה בפיתוח במשך הרבה זמן, והצוות בראשות יוסי מטיאס, VP R&D ישראל, הרגיש שהוא בשל כעת להצגה לציבור. השילוב של ההתקדמות בפיתוח המוצר והמועד המתקרב של CES היוו הזדמנות עבור הצוות וגוגל להדגים את הפיצ’ר. “הצוות שלנו משתמש בפיצ’ר באופן קבוע. הרגשנו בטוחים מספיק להגיע לכאן ולהדגים את זה. זה עדיין Preview ויש לנו עדיין עבודה על זה, אבל הפיצ’ר יגיע למשתמשים בהמשך”.

אז הבנו את הבעייתיות, אבל מתי בפועל נוכל לראות תמיכה מלאה בעברית? לצערנו, המהנדסים מילאו את פיהם מים, ולא הצלחנו לקבל מהם תשובה. לצערנו, לפחות עכשיו, לא נראה שזה יקרה בעתיד הקרוב.

 

עידן בן טובים

נולד עם ג׳ויסטיק ביד. יש לו הרבה יותר מדי גאדג׳טים והרבה פחות מדי זמן פנוי כדי לשחק עם כולם. בעל פטיש לא מוסבר לביצוע קליברציות לסוללות של מכשירים. כשהוא לא עסוק בלכתוב על טכנולוגיה, הוא אוהב לדבר עליה, והרבה

הגב

31 תגובות על "מהנדסים ישראליים בגוגל: זאת הסיבה שהגוגל אסיסטנט לא יודעת עדיין עברית"

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 

* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.

סידור לפי:   חדש | ישן | הכי מדורגים
דולב
Guest

מה הסיבה שמונעת מהם לשחרר תמיכה ברמה “נמוכה” יותר כמו של סירי כרגע, ולבנות עליה ולשפר אותה בהמשך? אפילו אם גוגל יכלה להבין עברית משמע ולא לענות בעברית או לקרוא עברית בצורה טובה, היעילות שלה הייתה עולה פי כמה ביחס לשוק הישראלי..

אבושי
Guest

מה הם יעשו עם אידיש חחחח
העוזרת תגיד זול זי גיין קאקן

אבושי
Guest

יש להם אוזניות תרגום סימולטני אז שיתחילו משם או כמו בניווטים הגעת ליעד לא ברור חוזרים לנקודה האחרונה !!! אבישי ימצא תשובה בטוח !!!

תומר
Guest

גם גוגל אסיסטנט סבירה /גרועה זה עדיף מכלום .

אבושי
Guest

ולנו לנו את המוח עם העוזרת שתבוא אליי בבקשה לעשות כלים וספונזה ונציגי שתדבר תאילנדי יכולה להפעיל וייז

מוטי
Guest

ממש חבל שלא מקדמים את זה. אם אסיסטנט מבינה טוב כשמדברים אליה בעברית, אז לפחות שיהיו פקודות קוליות כמו “תתקשר ל…”. יש המון מכוניות שמגיעות עם תמיכה ב android auto ואם פקודות קוליות יעבדו בעברית זה ישדרג משמעותית את חווית השימוש. תמיכה חלקית בעברית יותר טובה מכלום.

מישהו
Guest

אם להבין הוראות בעברית זה אפשרי אז זה מספיק בשביל שהאסיסטנט תבצע פקודות. שתענה לי באנגלית מצדי. לכל הפחות שלא יעשו שאם המכשיר בעברית האסיסטנט לא עובד זה כל כך נכה

שלמה
Guest

אנחנו שוק קטן מדי!!!

אחד שיודע
Guest

לא בשביל אפל

אני רק שאלה
Guest

מה עם android auto, לאפשר הוריד בחנות הרשמית זה לא אתגר גדול מה התירוץ שם ?

משה
Guest

קשקוש ואפילו קשר. יש מספיק תוכנות שמקריאות עברית כבר כיום. זה קיים כבר ושלא יבלבלו לנו את המוח בגוגל. כמו הרבה דברים אחרים, גוגל לא רוצה להשקיע בישראל אולי כי אנחנו שוק קטן ואולי כי הם אנטישמים – לכו תדעו. בכל מקרה, גוגל לא תומכת בישראל לא רק בנושא העברית אלא במגוון מוצרים שאינם אמורים לפעול בישראל. למשל, גוגל הום היא מערכת עם אפליקציה שלא ניתן להוריד בישראל. למה? לאלוהים הפתרונים. כמעט בכל המדינות זה פתוח ואצלנו נישט. יש סיפור של תדרים אבל לא נראה לי שזה הסיבה. הסיבה היא שהם לא שמים עלינו. זו הסיבה!

ASD
Guest

איבדת את האמינות ברגע שאמרת ״אנטישמים״.

אילנה בניש
Guest

התירוץ המוכר … גוגל צריכים להבין בדיוק כמו שאפל הבינו כי לעולם לא יהיה מנוע דיבור מושלם בשפה העברית וצריך להשלים עם זה … את זה שלא יהיה לעולם מנוע דיבור מושלם הסבירו לי כבר לפני 12 שנים. אני ועוד אלפי אנשים הזקוקים להקראה בעברית השלימו עם זה אז כדאי שגם גוגל ישלימו עם זה ושסוף סוף יכניסו לשימוש את מנוע הדיבור Vocalizer bTTS בדיוק כמו שעשתה אפל. נו גוגל, יש לכם כמה שקלים להשקיע בזה נכון?

גוגל
Guest

לעבור עכשיו לסירי באייפון מהפיקסל?

Assaf Harari
Member

מציע שייצרו כלי לכותבי המאמרים לשמוע ולתקן מילים. כשמישהו יעלה תוכן לאתר הוא יעתיק וידביק את התוכן לתוך מקום, או תג, שממנו תוכנות מקריאות יוכלו לקרוא. והכותב או מעלה התוכן בעברית יחליט עבור כל מילה שלא נשמעת טוב איך היא צריכה להיאמר.

רוברט
Guest

איזה בולשיט!
גוגל טרנסלייט כן יודע לקרוא להבין עברית לא מנוקדת. אז האלגוריתם להתמודדות עם עברית לא מנוקדת כן זמין בגוגל

דוד
Guest

לא מבין למה לא לשחרר בינתיים שיהיה כמו סירי בעברית

yw1971 .
Member

כדאי שיפתו את המפתח הרלבנטי של אפל… לא סביר שיש בעיה עם הקול.

yw1971 .
Member

כדאי שידברו עם IBM ישראל. עובדים על משהו כזה כבר עשרים שנה…

itamar
Guest

התירוצים שלו קלושים מכמה סיבות,
1. יש מנועי TTS קיימים שעובדים בצורה טובה ולחלוטין מספקת בעברית.
2. יש תוכנת ניקוד בשם נקדן שעובדת מעולה. אם “נקדן” שהיא דיי אנונימית יכולה לנקד מעולה, גוגל יכולים לעשות את זה מושלם.
3. WearOs עד היום לא תומכת אפילו במקלדת עברית רשמית שלא לומר תפריטים בעברית, מה התירוץ לזה?

המסקנה היא שלגוגל לא אכפת מהמשתמשים בישראל כי אנחנו שוק קטן, כל זאת למרות שמרכז הפיתוח שלהם בישראל הוא משמעותי עבור החברה.

כמו שכבר אמרו, אם הבעיה באמת הייתה ניקוד הם היו יכולים לתת את על הפונקציות של האסיסטנט רק ללא דיבור.

שי אוזן
Guest
לא יודע עד כמה ההסבר שלהם נכון ואם כן מה כיוון הפיתרון שלהם. בסוף יש הרבה שפות נוספות שיש בהן בעיות דומות שעובדות על אותה מערכת (צרפתית, שפה נפוצה בעוזרות קוליות, היא שפה שיש בה עודף אותיות, מה שלפי הטענה שלהם אמור להיות בעיה בקלט, אבל לא נראה שיש בעיה עם זה, כי אם מה שהם היו אומרים נכון ברגע שאתה מדבר לתוכנה היא לא הייתה יודעת להוסיף עוד אותיות שלא הוגים אותם בשום צורה) אם לכל מילה בצרפתית יש ערך של, איך הוגים אותה, איך היא נכתבת ואיזה סוג היא (מכאן איפה היא צריכה להיות במשפט והמשמעות שלה), אז… Read more »
אבג
Guest

אין בעיה עם עודף אותיות אלא עם העובדה שמילה אחת יכולה להיקרא בשני אופנים או אפילו יותר, למשל סֵפֶר וסַפָּר או סָפַר – יש בעברית המוון מילים כאלה, שאנחנו יודעים לקרוא נכון רק על סמך ההקשר, והמחשב שלא מבין הקשר מתקשה מאוד. זה דבר שלא קיים בצרפתית, לא באנגלית, לא בגרמנית, לא ברוסית. זה קיים בפרסית, ערבית ולכן גם בהן תקועים בדיוק כמו שתקועים בעברית.

משה
Guest

מוזר שבאפל זה עובד…
יכול להיות שאפל עשו משהו נכון יותר כבר מההתחלה ויוצא מזה שאפל (מחשבים + טלפונים) יודעת להקשיב לעברית ולדבר.
הדברים נכונים גם לערבית (שכנראה, מבחינה טכנית אנחנו מאוד דומים).
——–
בתכלס, זה לא עובד חלק, לדוגמא: אם תבקש להתקש לגִלעד, סירי (או המחשב) יחזיר לך תשובה: מתקשר לגלעד… בכתב זה נראה סבבה, אבל המחשב לא יגיד לך גיל-עד, במקום זה הוא יגיד גל-עד (GAL AD).
מאחר ואני כבר לא עומד בפשלות האלו – ההחלטה נפלה ואני חדל מלדבר עברית ותחתה אשתמש בגרמנית, וזה יקרה כבר בחודש מרץ.
אני לא יודע גרמנית – אבל לא נראה לי שזה מורכב מידי…

אליהו
Guest

כי במדינת סתימת הפיות הציונית אסור שבעולם יתורגמו דוברי העברית ,וזה למה התרגום מעברית לשפות אחרות לא שווה

מישהו
Guest

ההסבר שלהם נשמע כמו תירוץ כי הרי גם באנגלית יש את הבעיה של כפל משמעויות למילים שנראות אותו דבר למשל i am reading a book ו i will book a flight המילה book נראת פה בדיוק אותו הדבר אבל המשמעות שונה. מודלי nlp פותרים את זה בעזרת הקונטקסט של המשפט You shall know a word by the company it keeps

אחד
Guest

המשמעות שונה, ההגייה זהה

שאול
Guest

ובכן, קשה לפענח טקסטים לא מנוקדים, אלא שקיימים חצי תריסר נקדנים אוטומטיים, החל מ-https://nakdan.dicta.org.il/, וגם שניים-שלושה שאתרים כגון AlmaReader שמקריאים טקסטים בעברית לגמרי לא רע, עם מינימום של טעויות. אז למה לא לשתף פעולה עם אחד מהמיזמים הללו?

Ben Ishay
Guest

“הם החליטו שעבור סירי מה שהם עשו מספיק טוב וזה הרף שלהם.” אני חייב לומר שזה נשמע שלגוגל אין תירוץ טוב לעובדה שהשוק הישראלי לא מעניין אותה…
כשבגוגל התחילו להטמיע את העוזרת הקולית שלהם היא לא ידע לעשות הכל אבל היא התחילה ממשהו.
אני משתמש בעוזרת של גוגל באופן יום יומי בנתיים, אבל זה סיוט ואני בטוח שאני יעבור לסירי של אפל ברגע שאוכל.

אליהו
Guest

תירוצים תירוצים. סירי עושה זאת נהדר!
אחת הסיבות המרכזיות שעברתי לאייפון.

אדיר
Guest

חזרתי לאחרונה וביצעתי מעבר ממוצרי אפל למוצרי אנדרואיד..
חייב לציין שמאוד קשה וכואב הויתור על סירי..
הכלי הזה ממש מציל חיים כשאתה בנהיגה ועובד לרוב ללא טעויות בצורה נוחה ומהירה!
מכל שאר הםיצרים של אפל קל להיפרד…

ברמה השיווקית גוגל עושה טעות!
כשגוגל מוותרת על מדינה שצורכת המון טכנולוגיה ומעצבת את העתיד ואפל ולא גוגל שולטת בתחום הכי מבוקש-עוזרת קולית..הילדים שלי מדברים עם סירי וגדלים על ממשק אפל ולא גוגל.
מקווה שמישו יתעשט שם בגוגל

ערן
Guest

עצוב מאוד שמהנדסים בכירים בגוגל ישראל לא דוחפים קידום של עברית במוצרי גוגל וכל שאר הדברים שנאמרו בכתבה הם תרוצים בלבד כי אפל עושים עבודה למופת במוצרים שלה וזה שסירי נותנת מענה בעברית כבר למעלה משנתיים בעוד גוגל עדיין לא בדרך פשוט עושה חשק לשחרר מהאנדרויד לטובת אפל עידן הטכנולוגיה מתקדם מהר מאוד ואין מצב שחברה כמו גוגל נשארת מאחורה בדברים בסיסיים כמו חיוג קולי או ביצוע פקודות קוליות בתמיכה בעברית !!!!!!

wpDiscuz

תגיות לכתבה:

נותרו עוד
00
ימים
:
00
שעות
:
00
דקות
:
00
שניות
לכנס המפתחים הגדול בישראל