מסתבר שגוגל כן מצנזרת

אחרי המהומה הגדולה שגוגל עשתה בעקבות הצנזורה שמבקשת הממשלה הסינית להפעיל על מנוע החיפוש, מסתבר שהיא בעצמה יודעת לצנזר יפה מאוד בכל הנוגע למוצרים שלה. הקורבן הנוכחי הוא מכשיר הטלפון החדש של החברה, הנקסוס וואן.

nexusonegeektime

אחת התכונות המובנות במכשיר הנקסוס וואן החדש של גוגל היא תכונה זיהוי הדיבור והמרה לטקסט, או Speech-To-Text. כאשר כתב Reuters בחן את המכשיר לעומק, גילה אחד הכתבים כי המכשיר מצנזר באופן עצמאי מילים גסות בעת תרגום הדיבור לטקסט על גבי המכשיר. בעבר נתקלנו במערכות שביצעו פעולה דומה, אך אלו השאירו את האות הראשונה של המילה על-מנת להבין את השיוך של המילה למשפט ולהקל על המשתמש להבין מה בדיוק קרה במהלך זיהוי הדיבור. לדוגמה: המילה fuck הפכה ל-f*** או f—. גוגל לעומת זאת, לקחה את נושא הצנזורה צעד אחד קדימה ובכל פעם שניסה הכתב להגיד מילה גסה אל מערכת זיהוי הדיבור של המכשיר, הטקסט המייצג את המילה הופיע על-גבי המסך בתור סולמיות (####) המחליפות את כל התווים של המילה. בכתבה צויין שהמערכת הצליחה לצנזר אפילו חלקי מילים דוגמת bullshit והפכה אותם ל-bull####.

אבל אל נא תטעו לרגע ותחשבו שגוגל רוצה להפוך את העולם למקום יפה יותר. מאחר שהטכנולוגיה אינה מושלמת, גוגל החליטה להימנע מסיכון של תרגום טקסטואלי שגוי בכל מחיר ולפיכך בחרה לצנזר את מילים גסות בעת השימוש בפונקציית ה-Speech-To-Text. לפי תשובת איש התמיכה של גוגל לסוגיה, החברה בחרה לצנזר מילים גסות או פוגעות מתוך הרצון להימנע ממצב שבו המערכת תזהה לא נכון מילה לגיטימית של המשתמש ותציג במקום מילה גסה שעלולה “להעליב” את המשתמש.

בבחינה שערכנו לנושא עם מכשיר הנקסוס וואן שקיבלנו מ-GoMobile לבדיקה (סקירה בקרוב), צנזורת המילים הגסות אכן עובדת כפי המתואר בשפה האנגלית, אך מאחר שהמכשיר אינו תומך בזיהוי דיבור בעברית, אז רוב הקללות בעברית “עוברות” את תהליך הצנזורה, אבל לא את תהליך התרגום, מה שגורם לכך שרוב הקללות יוצאות כמילים דומות באנגלית ולא בתור ביטוי באנגלית של המילה המקורית. לדוגמה, המילה קקי הפכה למילה לעיתים ל-Chucki, לעיתים ל-Jackie ולעיתים לסתם Aki. המילה חרא, תורגמה ל-Hola או Haha. חשוב לציין כי המכשיר יודע לזהות את הקונטקסט של מילה מסוימת במשפט ולדעת אם לצנזר אותה או לא. לדוגמה, כאשר ניסינו את המשפט “You are a Bitch” הוא צנזר את המילה Bitch והפך אותה ל-####. לעומת זאת, כשניסינו את המשפט “I am going to the beach”, המכשיר ידע לזהות את הקונטקסט, לתרגם את המילה ולא לצנזר אותה.

נקודה מעניינת למחשבה היא מה יקרה אם וכאשר גוגל תחליט לצנזר גם ביטויי סלנג או ביטויים שעלולים להתפרש כביטויים גסים. מה יקרה במכשיר הבא של גוגל (בהנחה התיאורטית לחלוטין שזה יתמוך בזיהוי דיבור בעברית), כשנשלח הודעת טקסט עם המילה “ערה?”

Avatar

יניב פלדמן

לשעבר העורך הראשי של גיקטיים ומייסד שותף של האתר. יזם, טכנולוג, כלכלן בהשכלה והיסטוריון חובב. התחביב האהוב עליו הוא מציאת פתרונות מסובכים לבעיות פשוטות במיוחד.

הגב

3 תגובות על "מסתבר שגוגל כן מצנזרת"

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 

* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.

סידור לפי:   חדש | ישן | הכי מדורגים
ירון שהרבני
Guest

חביבי, אני כבר עוקב אחרי ניוזגיק מזה כמה זמן
אמנם יש לי הרבה תיקונים להעביר לכתבים במגזין הזה אבל נתחיל מהבסיסית ביותר: “מאחר ו…” אינה תקנית בעברית ובמקום יש לכתוב “מאחר ש…” וגם לאמר לצורך העניין…

אז בבקשה ככתב מקצועי תעשה מאמצים לסגל לעצמך את החוקים הבסיסיים של העברית
בברכה,
ירון

אבישי
Guest

ולמרות כל זה נקסוס 1 מכשיר מעולה.
אני מת כבר שיגיע לארץ בשביל לתת לו השוואה של ראש בראש מול האייפון שלי :)

wpDiscuz

תגיות לכתבה: