גוגל יוצאת למלחמה בתוכן מועתק, ואז נתפסת בעצמה

לפני שבועיים יצאה גוגל במהלך שנועד למנוע מצבים בהם תוכן מועתק יזכה לחשיפה גדולה יותר מזה של המקור. אלא שאז הופיע ציוץ שחשף שזה בדיוק מה שהיא עצמה עושה.

google scraper

הפוסט נכתב על ידי אורי ברייטמן.

בסוף החודש הקודם הקודם הודיעה גוגל על דו”ח חדש לבעלי אתרים בשם “סקרייפר ריפורט” (Scraper Report), שנועד לדווח על מעתיקני-תכנים שמקבלים תוצאות טובות יותר מבעלי התוכן המקורי שהועתק. ואז קרה הבלתי-צפוי: גוגל נתפסה עם המכנסיים למטה, כשהיא מבצעת “סקרייפינג” על ויקיפדיה.

מאט קאטס, ראש צוות המאבק ב’ווב-ספאם’ של גוגל, יצא עם יוזמה יפה – לעזור לבעלי אתרים ומו”לים להילחם במעתיקנים מקצוענים: “סקרייפרים” (מלשון ‘גירוד’), באמצעות דו”ח חדש. המטרה היתה פשוטה: להודיע לגוגל על מצב שבו המעתיקן זוכה לדירוג גבוה יותר בתוצאות החיפוש, על חשבון המפרסם המקורי שלמעשה נפגע פעמיים:

א) התוכן שלו נשדד.

ב) השודד זוכה בתנועה על חשבונו.

אלא שמר דן ברקר, מקדם אתרים בריטי, הצליח להביך את גוגל בעזרת צילום-מסך מבריק:

dan barker tweet 27-feb-2014 scraper site

הטוויט של ברקר אמר כך: “מאט קאטס, אני חושב שזיהיתי סקרייפר אחד. שים לב לדמיון בין הטקסט בתוכן”.

ברקר הוכיח בצורה פשוטה שגוגל עצמה היא למעשה מעתיקנית (“סקרייפר”) שצריך לדווח עליה לרשויות, בגלל שהיא פשוט מפרה זכויות יוצרים ועוברת על החוק. איך? כאשר אדם מחפש בגוגל “מהו אתר סקרייפר” באנגלית, התוצאה הראשונה שייכת למעשה לגוגל – שהעתיקה תוכן של ויקיפדיה, האנציקלופדיה החופשית שכולנו אוהבים.

המבוכה של גוגל היתה משולשת: ראשית, תוצאות החיפוש שמציגה למעשה יוצרות שיכפול מיותר, שאינו תורם דבר למשתמשים. שנית, ברור לחלוטין שגוגל מעתיקה תכנים מ’ויקיפדיה’ כדי להקדים את עצמה בתוצאות. ושלישית – גוגל עושה בדיוק את הדבר שהיא עצמה מגנה ונלחמת נגדו: סקרייפינג.

מלחמת גוגל-ויקיפדיה, שגרמה לאנציקלופדיה ירידה של כ-20% בתנועה במהלך 2013, כפי שניתן לראות מן הדו”חות של ויקיפדיה עצמה, היא חלק ממהלך רחב של גוגל, שמטרתו להפוך את מנוע החיפוש לספק-תכנים בפני עצמו. לגוגל נמאס לספק תוצאות חיפוש לבעלי אתרים, והיא מפעילה את כוחה האדיר כדי “לגרד” תכנים מהרשת, לסדר אותם ולהציג אותם כ”תשובות”. גוגל קוראת לזה “גרף ידע” (Knowledge Graph), כשחלק מן הגרף הוא “חיפוש ישויות” (Entity Search).

גוזרת קופון על חשבון ויקפדיה

ההסכם המקורי בין גוגל והאינטרנט היה אמור להיות פשוט: גוגל סורקת ומעתיקה את האינטרנט בשביל לשרת את קהילת האתרים ברשת, ולא בשביל לשרת את עצמה. בשנים האחרונות, כך מתברר, גוגל עסוקה בעיקר בהגדלת כוחה ורווחיה, לעתים על חשבון יצרני התוכן ברשת. ויקיפדיה, בהיותה אחד השחקנים הגדולים והחשובים בתחום זה, היא רק ארגון ללא מטרות רווח; לעומתה, גוגל “גירדה” את המאגר שלה אך ורק כדי להרוויח.

מהנדסי גוגל יטענו ש”גירוד” תכנים הוא למעשה “שירות” (זה לא באג, זה פיצ’ר). כאשר התכנים של ויקיפדיה מוצגים מיד בתוצאות, ובצורה תמציתית, אנחנו חוסכים למשתמשים שלנו הרבה זמן, יגידו האורקלים של גוגל באמונה שלמה. הבעיה היא, שלא בטוח שהעניין עובר את המבחן המשפטי הפשוט – העתקה היא העתקה היא העתקה, לא משנה מי עושה אותה.

ויקיפדיה יודעת שגוגל שואבת ממנה תכנים בלי להתבייש. היא יודעת שכל “שאיבה” כזו פוגעת בהכנסות של ויקיפדיה מתרומות גולשים. ויקיפדיה הבינה שגוגל לא מעוניינת לחסל אותה, אלא רק להחליש אותה. אבל ויקיפדיה גם יודעת שגוגל מזרימה אליה כמויות עצומות של תנועה, והיחסים בין הענקיות הללו הפכו מזמן לסימביוטיים. זו בדיוק ההתלבטות של שאר בעלי האתרים ברשת כיום, לפני שהם לוחצים על ההדק ויורים באבא-גוגל.

הציוץ של דן ברקר הוא לגמרי כמו הילד שצעק “המלך עירום” ב-2014: כאשר גוגל עושה “סקרייפינג” זה למעשה “שיפור השירות לגולשינו היקרים”, אך כאשר אחרים ברשת עושים זאת, זו “פגיעה באיכות החיפוש”. האם רק בתי המשפט ירסנו את גוגל מלהמשיך לעשות ‘הלבנת סקרייפינג’, או שגוגל פשוט תמשיך לנגוס יותר ויותר בתכנים שהיא סורקת, עד שתבלע את כל הרשת לתוכה?

הפוסט פורסם לראשונה בבלוג ״חופש החיפוש״.

כתב אורח

אנחנו מארחים מפעם לפעם כותבים טכנולוגים אורחים, המפרסמים כתבות בתחומי התמחות שלהם. במידה ואתם מעוניינים לפרסם פוסט בשמכם, פנו אלינו באמצעות טופס יצירת קשר באתר.

הגב

12 Comments on "גוגל יוצאת למלחמה בתוכן מועתק, ואז נתפסת בעצמה"

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 
Sort by:   newest | oldest | most voted
שי
Guest

ויקיפדיה היא אפליקציה חופשית.

עזרא
Guest

בוקר טוב, כבר שנים זה ככה תכתבו כל ערך של ויקיפדיה בגוגל ותראו שהיא מביאה את תחילת הערך עם קישור לויקיפדיה.

רפי
Guest

ראו הוזהרתם! גוגל לאט לאט משתלטת על העולם.
זה נראה הזוי אבל זה כבר קורה. החברה פשוט גודלת מהר מידי.

אדם
Guest
כמות כזאת של שטויות לא קראתי הרבה זמן. גוגל לא מבצעת scraping לויקיפדיה. להיפך! היא נותנת לה קדימות (אפשר לראות בבירור בסוף הטקסט את הקישור לדף בויקיפדיה) וזאת כי לרוב כשאנחנו מחפשים ביטוי שקיים כערך בויקיפדיה – אותו טקסט שיופיע למעלה יהיה הכי רלוונטי כלפינו. במצב בו התוצאה הראשונה היא לא באמת דף של ויקיפדיה אנחנו בכל זאת נקבל את המידע הרלוונטי בזכות גרף הידע יחד עם הקישור לויקיפדיה.. הדבר הכי מוזר הוא “שגוגל מעתיקה תכנים מ’ויקיפדיה’ כדי להקדים את עצמה בתוצאות” – זאת בדיחה? באיזה תוצאות חיפוש גוגל מופיע? של עצמה? אנחנו כבר נמצאים שם גם ככה. תפסיקו לחפש… Read more »
ניר
Guest

צודק מאוד, זה בדיוק מה שעלה לי בראש כשקראתי את הכתבה.

משהו
Guest

היא לא העתיקה, יש reference למקור.

ממש לא
Guest

דבר ראשון,כתוב שזה מויקיפדיה הם מביאים קרדיט! דבר שני,זו ממש לא העתקה, מה שגוגל מביא זה תשובה קצרה לדבר אותו חיפשתה,אך אם אתה רוצה לדעת יותר, אתה פשוט יכול ללחוץ על הקישור שנמצא שם המפנה אותך לאתר המקור.
ודבר שלישי, גוגל נלחמת מול מעתיקנים בכללי ובמיוחד במעתיקנים אשר אינם מביאים קרדיט למקור!
ודבר אחרון, ויקיפדיה זה אתר חופשי בעל קוד חופשי!

יוש
Guest

לא מדויק. ויקיפדיה גם חיה מכך שיש תנועה לתוך האתר שלה.
האינטרס של ויקיפדיה הוא להופיע ראשונה בתוצאות חיפוש (ולרוב, עבור החיפושים הרלוונטיים, מגיע לה) – אבל שההופעה הזו תגרום לכניסה לאתר עצמו.
כאשר התוכן המתומצת מופיע בתוצאות של גוגל, רוב הגולשים יקראו שם ולא יכנסו לאתר, גם אם הקרדיט והלינק מופיעים. וזו פגיעה מהותית באתר עצמו.

אלון
Guest

web definition הוא אלמנט של גוגל לא של ויקיפדיה. גוגל רוצים להשתמש בתוכן של ויקיפדיה לצורך “שיפור השירות” של לקוחותיהם? בבקשה, רק תשלמו עבור זה לויקיפדיה.
רוב האנשים שמחפשים הגדרה למשהו מסתפקים בפסקה או שתיים הראשונות בויקיפדיה, ברגע שפסקאות אלו מופיעות כבר בגוגל רבים כבר לא טורחים להכנס. כל מי שעובד באינטרנט יודע שאם לא נכנסים אליך לאתר אז כסף מאותם אלו שעדיין נהנים מהתוכן שלך בטוח לא יכניסו לך כסף.

יוש
Guest

הפתרון פשוט: כל אתר שגוגל מגרדת מתוכו מידע, צריך לקבל ממנה תשלום על כל פעולה כזו.
היא רוצה לתת שירות לגולש? אבל גם הכיסים שלה עמוקים. ככה גם אוכלים את העוגה וגם משאירים אותה שלמה.

אחד
Guest

רמת שפל חדשה של רדידות הכותבים בגיקטיים הגיעה לשיא

הרי הכותב כאן העתיק בעצמו תוכן של מישהו כל כך דביל שבושה להזכיר את שמו.

גוגל בדיוק כמו בתוצאות חיפוש מציגה חלקים מהתוכן וקישור לתוכן עצמו, מבליטה תכנים מסויימים שלדעתה הם המידע המדוייק ביותר אותו המשתמש מחפש.

זה מה שגוגל עושה – לספק תוצאות לערכי חיפוש. איפה כאן בדיוק היא העתיקה?

מוטק'ה
Guest

רק מה שכולם כמעט שוכחים, שללא גוגל, ויקיפדיה היתה שקופה כמעט ובלתי נראית.
בשביל להגיע לויקיפדיה, על המחפש לדעת בודאות שהמידע הנחוץ לו רשום בה ואת זה אינו ידוע בודאות.
אם גוגל לא היה עושה את השרות שהוא עושה ספק רב אם בויקיפדיה היו זוכים להכרה נרחבת כל כך על ידי כלל הציבור.

גילוי נאות: אני היכרתי את ויקיפדיה הודות למנוע החיפוש של גוגל, אז שויקיפדיה יבנו לעצמם מנוע חיפוש בכדי שיגיעו אליהם באופן עצמאי.

wpDiscuz

תגיות לכתבה: