גוגל משיקה בישראל פיצ’ר חדש שיקריא לכם כתבות – ופותח בישראל

במקום לקרוא טקסטים ארוכים, גוגל רוצה שתתחילו להקשיב להם, ועל הפיתוח הזה אחראי צוות ישראלי

צילום: גיקטיים

יכול להיות שאתם עומדים לקרוא עכשיו את הכתבה הזאת, אבל אתם עוד רגע עולים לאוטובוס, או מתיישבים במשרד, או פשוט עסוקים מכדי לקרוא אותה והייתם שמחים שמישהו פשוט יקריא אותה בשבילכם. ממש היום (ד’) משיקה גוגל פיצ’ר חדש ומגניב לעוזרת הקולית שלה שיאפשר לה להקריא כל דף אינטרנט, בכמעט כל שפה, וכפי שנחשף לראשונה בגיקטיים עוד בחודש ינואר, על הפיתוח המעניין היה אמון צוות ישראלי.

האתגר: לא להתיש אתכם במהלך ההקראה

הפיצ’ר החדש של גוגל נקרא “Read It”‘, והוא פועל בצורה מאוד פשוטה. הגעתם לעמוד אינטרנט ואתם רוצים לשמוע אותו במקום לקרוא אותו? פשוט אימרו לעוזרת הקולית “Read This Page”, והיא תתחיל להקריא את הכתוב. אם אי פעם העוזרת הקולית שלכם התחילה להקריא טקסט ארוך, וודאי הרגשתם שמדובר בקול רובוטי שלא ניתן להקשיב לו ליותר ממשפט-שניים מבלי להתייאש. על כן הצוות הישראלי גייס צוותים נוספים מגוגל כדי לפתח קולות מיוחדים למה שהם מכנים Long Form Text-To-Speech. אלו הם אלגוריתמים שמבינים את ההקשרים של המשפטים ואת החיבורים בינהם כדי ליצור רצף הקראה יותר טבעי ופחות סינתטי.


למה העוזרת הקולית של גוגל לא תומכת בעברית? מהנדסים בגוגל חושפים


בהדגמה שבוצעה לנו ב-CES וגם במפגש עיתונאים מיוחד שהתקיים היום, נראה כי אכן מדובר בקולות שונים מאלו של האסיסטנט, והם אכן הרבה יותר נעימים. אם ציפיתם שהם ישמעו לחלוטין טבעיים כאילו מדובר בקריין מקצועי, אתם עלולים להתאכזב מעט. הקולות עדיין מרגישים די סינתטיים ואני עדיין לא בטוח שהייתי מסוגל להקשיב לטקסט באורך 10 דקות בתצורה הנוכחית של הפיצ’ר.

העיבוד מתבצע בזמן אמת, ותומך כמעט בכל שפה. בערך.

מימין לשמאל: רוני אמירה, יוסי מטיאס ודויד קדוש. תמונה: באדיבות גוגל

החלק המרשים ביותר ב-Read it טמון במהירות שלו. גוגל לא מאחסנת או מעבדת מראש את המידע שבעמודים הללו, אלא מבצעת את ההמרה של הטקסט לדיבור בזמן אמת. מהרגע שבו המשתמש מבקש את ההקראה ועד הרגע שבו הטקסט מתחיל להיות מוקרא עוברות רק שניות אחדות במהלכן מודלי ML מייעלים את חילוץ המידע, ומנגנוני קאשינג חכמים מזרימים את האודיו למשתמש תוך כדי אופטימיזציה שלו.

חוץ מהנוחות של משתמשים שפשוט מעדיפים כרגע להקשיב לתוכן במקום לקרוא אותו, יוסי מטיאס, VP R&D ומנהל מרכז הפיתוח של גוגל בישראל, מסביר כי ישנם אנשים שבשבילם מדובר בפונקציה חשובה במיוחד: עיוורים, כבדי ראייה, אנשים שהעיניים שלהם מתעייפות מקריאה ממושכת ועוד. כל אלו יכולים להכנס לכל דף באינטרנט ופשוט לשמוע אותו.

היי-טק, סטארטאפים וטכנולוגיה - רוצים להקדים את כולם? היי-טק, סטארטאפים וטכנולוגיה - רוצים להקדים את כולם? להורדת אפליקציית גיקטיים לאייפון ולאנדרואיד לחצו כאן

לצערנו, כפי שחשפנו בראיון עם צוות הפיתוח הישראלי ב-CES 2020, הפיצ’ר לא תומך בהקראה בעברית. דוד קדוש, מנהל מוצר בגוגל שהיה אחראי על פיתוח Read It, הסביר כי עברית לא מנוקדת היא מהשפות היחידות בעולם שכדי לדעת איך להגות מילה, צריך לדעת את ההקשר שלה. כך למשל המילה “רכבת” יכולה להשתמע ככלי התחבורה, או כהטיית עבר של שורש “רכב”.

על אף שהפיצ’ר לא תומך בהקראה בעברית, הוא כן תומך בהקראה של תוכן בעברית, אבל באנגלית. מבולבלים? צפו בהדגמה שערכנו עם צוות הפיתוח בחודש ינואר:


גוגל בעצם משלבת ב-Read It גם את יכולות התרגום שלה, ומאפשרת הקראה לאחר תרגום של פחות או יותר כל דף ברשת, ולא משנה באיזה שפה הוא נכתב. מטיאס הסביר כי הפיצ’ר הזה מכיל את ה”חזון” (הדי קלישאתי) של גוגל של הנגשת כל המידע שברשת לכל המשתמשים, לא משנה היכן הם ובאיזו שפה הוא נכתב. עם זאת, כדאי לשים לב שהפיצ’ר החדש של גוגל מיועד לשימוש בדפים טקסטואליים המורכבים מכותרת וטקסט חופשי. האלגוריתם של Read It בעצם יודע להתעלם מאלמנטים “מסיחים” בגוף הכתבה כמו לינקים, תמונות, טבלאות, פרסומות ועוד, ולהקריא לכם רק את גוף הכתבה.

רוני אמירה, מנהל קבוצת הפיתוח, חשף כי גוגל משחררת היום גם API למפתחים, שיוכלו לשלב את Read It גם באפליקציות התוכן שלהם, כך שלא תצטרכו לבקש מהעוזרת הקולית להקריא לכם רק דפים בכרום, אלא גם באפליקציות אחרות. בהמשך, הצוות מתכנן להרחיב את פקודת ההקראה גם לשפות אחרות, כדי שמשתמשים באסיסטנט לא יצטרכו לשנות את שפת העוזרת לאנגלית כדי להשתמש בפיצ’ר. נכון לעכשיו, Read It תומכת בהקראה ב-44 שפות, בהן אנגלית, ערבית, שפות הודיות, אסייתיות, אירופאיות ועוד, אך כאמור, עברית עדיין לא נמצאת ברשימה. עם זאת, בצוות לא אומרים נואש, וטוענים כי הם ממשיכים להתקדם גם בגיזרה הזאת, אך לא מוכנים לנקוב בשום תאריך יעד שהוא.

הפיצ’ר Read It מובנה כבר בעוזרת הקולית של גוגל, וזמין לשימוש בכל מכשירי אנדרואיד אשר תומכים בעוזרת.

עידן בן טובים

נולד עם ג׳ויסטיק ביד. יש לו הרבה יותר מדי גאדג׳טים והרבה פחות מדי זמן פנוי כדי לשחק עם כולם. בעל פטיש לא מוסבר לביצוע קליברציות לסוללות של מכשירים. כשהוא לא עסוק בלכתוב על טכנולוגיה, הוא אוהב לדבר עליה, והרבה

הגב

20 תגובות על "גוגל משיקה בישראל פיצ’ר חדש שיקריא לכם כתבות – ופותח בישראל"

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 

* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.

סידור לפי:   חדש | ישן | הכי מדורגים
אלון
Guest

ניסיתי וגוגל ביקשה גישה קבועה לקריאת התוכן במסך שלי. פה חשדתי. כל הכבוד על הפיתוח, חשוב לזכור שאין מתנות חינם

גוגל
Guest

יש לך אנדרואיד? גוגל גם ככה עוקבים אחריך ללא אישור הרשאות באפליקציות

פיני גורן
Guest

אפשר להשתמש למטרת לימודים לאלה שיש להם בעיה של קשב וריכוז

Asaf
Guest

חשבתי שגם ערבית דורשת ניקוד, אז איך ערבית נתמכת ?

אנון
Guest

נראה לי שהניקוד בערבית פחות משמעותי מאשר הניקוד בעברית, בערבית לכל תנועה יש גם כתיב מלא לעומת עברית שרק לחלק מהתנועות יש. אבל אני קצת מנחש פה.

שאול
Guest

זה לא נכון. בערבית אמנם יש פחות סוגי ניקוד (a, u, i), אבל יש בה יחסות, אלא שבגוגל ידעו להתמודד עם הקראת טקסטים בערבית מהרגע שפותח היישום Google Go. למה? ככל הנראה, אינטרסים כלכליים, שוק ענק של דוברי ערבית מול שוק פצפוני של מדינת ישראל.

מישהו
Guest

ערבית היא שפה הרבה יותר נפוצה יותר כדאי להם להשקיע בערבית מאשר בעברית

big o
Guest

יש אפשרות גם לקרוא pdf?

שאול
Guest

אין, כי ברוב המקרים לא ניתן לחלץ טקסט מקובץ PDF

יאיר
Guest

זו טעות, ברוב המקרים בקובץ פידיאף הטקסט הוא חי, כלומר שניתן לזהות אותו ולקרוא אותו (כמו שכבר עושות תוכנות נגישות). רק במיעוט המקרים מדובר בקובץ פידיאף שהטקסט עבר המרה לוקטור או לפיקסלים ואז לא ניתן לקרוא אותו ללא ocr

itamar
Guest

וואו.
ניסיתי את זה ישר אחרי שקראתי את הכתבה.
שאפו ענק לצוות הישראלי. חוויה מאד שונה (לטובה כמובן) מהTTS המסורתי. בנוסף העניין שהתוכן מתורגם סימולטנית לאנגלית. פשוט וואו.

לא נראה את זה בקרוב בעברית אבל כשכן’ זה יהיה Game changer.

א.פ.
Guest

ציטוט: “מודלי ML מייעלים את חילוץ המידע, ומנגנוני קאשינג חכמים מזרימים את האודיו למשתמש תוך כדי אופטימיזציה שלו”
– אוקי.

הבן של יהודה
Guest

הסבר: בכל שפה יש הרבה מילים שלא נשמעות כמו שנקראות בשביל זה משתמשים במודלים סטטיסטים שנבנו בעזרת Machine-Learning
ומנגנוני קאשינג חכמים בלה בלה בלה זה גוגל שמשוויצים ביכולות הענן שלהם

דהz
Guest

אי אפשר להאזין לזה יותר מ30 שניות.
לא רלוונטי ב5 שנים הקרובות

ASD
Guest

5? אני דווקא שמעתי 4.5

שלומי
Guest

בIOS זה כבר קיים בעברית

שלימי
Guest

‏גם ב-MacBook אין מה לעשות תמיד אפל לפני כולם

שלימי
Guest

‏זה לא ‏‏פיצ׳ר חדש זה מאוד ישן יש את זה באפל ‏כבר שנים
‏וזה יודע להגיד רכבת מצוין
‏אין מה לעשות ‏תמיד אפל לפני כולם

88768
Guest

אם אפשר לתרגם אז יודעים מה משמעות המילה

נאור
Guest

עוד עשור אנשים לא ידעו לקרוא ולכתוב

wpDiscuz

תגיות לכתבה: