גיק-על-אחד: ג’ים דרייפר, סמנכ”ל Gale

לקחנו את סמנכ”ל ההוצאה לאור הגדולה בעולם לשיחה אחד על אחד ושאלנו מה הוא חושב על המעבר לפורמט דיגיטלי וכיצד עושים את זה כשמדובר בכתבים בני מאות שנים

מקור: יח”צ, עיבוד תמונה

הצורך להמיר תכנים רבים לפורמט דיגיטלי מלווה עסקים רבים. עבור רובם, הצורך אינו מוגבל רק להמרה דיגיטלית, אלא גם בשמירה של ארכיב מודרני וזמין, בו הארגון יכול להשתמש על בסיס קבוע, בכל פעם שעולה סוגיה המצריכה בדיקה של מידע מן העבר. סוגיות הארכוב בעידן הדיגיטלי הן רבות וסבוכות. כל מי שהיה שותף לפרויקט דיגיטציה ברמה כלשהי, נחשף להתלבטויות הקשות סביב סוגיות של בחירת הפורמט הדיגיטלי המתאים ביותר להמרה, כיצד לשמור על המידע הדיגיטלי, וכיצד להבטיח שניתן יהיה לשלוף אותו ברגע האמת.

את הסוגיה הזאת, ורבות אחרות, ביקשנו לברר עם ג’ים דייפר (Jim Draper), סמנכ”ל חברת Gale והמו”ל הראשי שלה.

מהי חברת גייל, ומה עיסוקה העיקרי?

חברת Gale נוסדה בדטרויט, מישיגן, בשנת 1954. מאז, המשימה שלנו היא לאסוף, לארגן ולסדר מידע עבור מאגרי מידע וספריות מכל הסוגים; פרטיות, ממשלתיות, סגורות וציבוריות. החברה פרשה כנף ופועלת היום בכל קצוות תבל, ובעשורים האחרונים העבודה שלנו נעשית אפילו קלה עוד יותר עם המעבר למידע דיגיטלי. זאת, משום שקל יותר לרכוש רישיונות ולמכור רישיונות לתכנים בפורמטים דיגיטליים.

השווקים העיקריים שלנו הם בעיקר השווקים דוברי האנגלית, אבל בשנים האחרונות התקדמנו משמעותית ופיתחנו פורמטים דיגיטליים התומכים בשפות נוספות, כמו מנדרינית. הטכנולוגיה החדשה שפיתחנו מאפשרת לדוברי אותן שפות לבצע חיפושים מתוחכמים ולשלוף את המידע הרלוונטי עבורם מתוך הררי המידע. בין השפות הנוספות עליהן אנחנו עובדים היום ניתן למנות גם ערבית, עברית, הינדי ושפות נוספות מתת-היבשת ההודית.

Mr. Jim Draper, מקור: יח”צ, עיבוד תמונה

מה אתה חושב על המעבר של הצרכנים היום, בעיקר בארצות הברית, לצריכה של תוכן באמצעות מדיות דיגיטליות, כמו קוראים אלקטרוניים?

אני אוהב את המגמה הזאת. צרכני ידע מצליחים להציע ליותר מידע מאי פעם בעבר. בנוסף, גם מי שמחפש בין הררי המידע פריט מידע ספציפי יכול לעשות את זה בקלות רבה היום, כך שאני מאושר מהמגמה.

למשל, כאשר אנחנו ניגשים למלאכת המרת ספר לפורמט דיגיטלי אנחנו שומרים על המבנה של עותק הנייר של הספר. בעותק הדיגיטלי יהיה את אותו האינדקס שיש בעותק מנייר. אם מוסיפים מעל שכבת המידע את שכבת החיפוש והשחזור החכם, המשתמש יוכל לעשות שימוש מוגבר במידע. האינדקסים שלנו דומים לאלו של מנוע חיפוש, מלבד העובדה שאת שלנו מקלידים אנשים ידנית. הם גם אלה שמוסיפים את ה-METADATA סביב המסמכים השונים, שמאפשר למצוא בקלות מידע והקשרים רלוונטיים.

במהלך השנים האחרונות אנחנו משקיעים מאמצים רבים בהמרה לפורמט דיגיטלי של תכנים רבים מהמאות ה-17, ה-18 וה-19. מדובר במסמכים היסטוריים ותרבותיים חשובים.

מבחינת העתיד, היום אפשרויות החיפוש הן טובות ויכולת מציאת המידע שאתם מחפשים עובד טוב, אבל זוהי רק ההתחלה. בשלב הבא של התפתחות הטכנולוגיה נוכל להציע כלי עבודה שיאפשרו לחוקרים לשתף חוקרים אחרים בעבודה שלהם, הרבה יותר ממה שאפשר לעשות היום.

כיצד אתם בוחרים איזה מידע להמיר?

יש לנו קשר מקצועי עם חוקרים ברחבי העולם. הם אלה שאומרים לנו איזה מידע חשוב להם שתהיה להם נגישות אליו, ועל בסיס הבקשות שלהם אנחנו מקצים משאבים. למשל, בשנים האחרונות התבקשנו להמיר לפורמט דיגיטלי תכנים רבים דווקא מהמאה ה-19. תכנים אלה, שבחלקם צריכים לעבור תהליכי שימור עוד בטרם ניתן לסרוק או לצלם אותם, עוברים את כל התהליכים הנדרשים במטרה להכין אותם לתהליך.

לאחר מכן, כאשר החומרים המקוריים מוכנים לעבודה, ניתן להמיר אותם לפורמט דיגיטלי. יש לנו צוות מקצועי שעובר על המידע הדיגיטלי ויודע לזהות, ידנית, בעיות בהמרה. בנוסף, מידע הקשור לשכבת ה-METADATA מוכנס אף הוא ידנית על-ידי אנשים הבאים מהתחום שהטקסט קשור אליו, כך שהקישורים יהיו הרלוונטיים ביותר.

יש לנו הסכמים עם מאות ספריות מרחבי העולם, אשר מחזיקות היום באוספים עתיקים. דרך שיתופי פעולה והסכמי רישיון אנחנו פועלים להמיר את הררי המידע לפורמט דיגיטלי. במסגרת העבודה השוטפת שלנו, יוצא לנו להמיר מסמכים עתיקים שנשתמרו, ולצידם גם כאלה שעצם הטיפול והשימוש בהם עשוי לפגוע בהם. אנחנו נעזרים כמובן באנשי מקצוע מיומנים, ויש לנו ביטוחים לכל צרה שלא תהיה.

מקור: תמונת מסך מאתר החברה, עיבוד תמונה

איך אתם עושים OCR לטקסטים שנכתבו בכתב יד לפני מאות שנים?

למעשה, אנחנו לא עושים OCR. במקרים של טקסטים עתיקים שנכתבו בכתב יד, אנחנו שוכרים שירותים של אנשים שיקראו את הטקסט הכתוב כך שניתן יהיה להשתמש בו בפורמט דיגיטלי. למשל, יש לנו בהודו צוות של כ-300 איש העובד על קריאה והמרה דיגיטלית של תכנים מתת-היבשת ויצירת שכבת ה-METADATA הרלוונטיים.

למשל, בשכבת ה-METADATA אנחנו שמים את שמות הדמויות הרלוונטיות, תאריכים, מידע טכני על אורך המסמך, נושאים קשורים ומידע נוסף שיאפשר לחוקרים עתידיים להפיק את המקסימום מחיפוש בין הטקסטים הללו. למיטב ידיעתי, אנחנו החברה היחידה היום בעולם שנוקטת בשיטה זו ומוסיפה את שכבת ה-METADATA לשימושם של החוקרים העתידיים.

האם אנשים עם צרכים מיוחדים יוכלו לגשת לטקסטים הללו?

בעוד שלטקסטים המקוריים יהיה קשה מאוד לגשת אם סוג ההנגשה שאתה צריכה הוא תוכנת הקראה, הרי שבפורמט החדש הכנסנו אפשרות שתוכל לבקש להוריד את שכבת ה-OCR של הטקסט. כך, גם אנשים עיוורים וכבדי ראייה הנעזרים בעזרי הקראה שונים יוכלו בכל זאת לגשת אל הטקסטים העתיקים. אפשרות זו קיימת באוסף החדש שלנו, הכולל מידע מהמאה ה-19.

מקור: תמונת מסך מאתר החברה, עיבוד תמונה

תוכל לפרט מעט על כמויות המידע שאתם מתמודדים איתם?

בגייל, רק באוספים ההיסטוריים שלנו יש לנו כ-140 מיליארד דפים שונים של מידע. כל דף כזה נבדק בעין אנושית, כולל אדם שבדק שכל המידע שהוקלד לשכבת ה-METADATA רלוונטי, נכון ועדכני. כדי לשפר את העבודה הזאת יצרנו כלים ייעודיים שעוזרים לאנשים העמלים בתחום.

יש לנו כמה מאות עורכים במשרה מלאה. אלה יושבים בדטרויט ועוברים על כמויות המידע האדירות שלנו. בכל שנה נתונה אנחנו מפיקים ומוציאים לאור כ-70 כותרים ראשיים (לחברה זכויות על מגזינים כמו ה-National Geographic ואחרים – נ.ד.ג.), לצד כמה מאות כותרים נישתיים יותר. אלה יכולים להיות כותרים באורך של אנציקלופדיה של פעם, כמו אנציקלופדית יודאיקה, שיוצאת לאור ביותר מ-20 כרכים.

מה אתה חושב על ההכרזה של אנציקלופדית בריטניקה להפסיק להוציא מהדורות מודפסות?

ההתמודדות של בריטניקה עם הסוגיה היתה פשוטה, לאור העובדה שהמהדורה המודפסת הפכה להיות חלק שולי בהכנסות החברה. מכאן, עלה הצורך לבחון את היעילות של המשך הדפסתה, וההחלטה שבריטניקה קיבלה היתה להפסיק אותה. גייל מתמודדת עם סוגיות דומות, ומה שמכריע את הכף היא השאלה של ‘מה יהיה הטוב ביותר לצרכן’. בהתאם לשאלה הזאת, אנחנו עושים את המעבר לדיגיטלי.

אם יזם צעיר יפנה להתייעץ איתך וישאל מה כדאי יותר: תואר אקדמאי או עבודה על רעיון היזמי, מה תמליץ לו?

השאלה הגדולה היא עד כמה הרעיון שלך טוב. אם הרעיון שלך מעולה, פשוט לך על זה. ישנם אנשים רבים, כפי שאתם יודעים, שתרמו רבות לכלכלה, לתרבות ולחברה מבלי שסיימו תואר אקדמאי. אבל, מצד שני, חשוב לזכור שאנשים אלה נדירים ורקע אקדמאי הוא חשוב וטוב. לפחות בארצות הברית, עלויות התארים האקדמאיים הולכת וגוברת ומביאה אנשים רבים להתלבט האם שווה להשקיע כספים רבים כדי לקבל תואר אקדמאי.

מבחינת השקעה כלכלית, בארצות הברית התשובה כעת היא שתואר אקדמאי הוא השקעה לכל דבר. אם בוחרים בדרך היזמית, צריך להביא את כל ההשפעות שלה בחשבון, וכדאי שהרעיון יהיה ממש טוב. זאת, משום שעדיין צריך לשלם חשבונות ולקנות במכולת, ואת זה אי אפשר לעשות בלי כסף.

וידאו: סרטון הסבר על גייל

דרייפר הגיע לישראל כאורח חברת טלדן מערכות מידע, והשתתף בכנס השנתי של החברה: Teldan Info2012. טלדן מערכות מידע מייצגת את גייל בישראל מזה עשור.

נדב דופמן-גור

עו”ד העוסק בתחומי דיני הטכנולוגיה, דיני פרטיות וקניין רוחני. מרצה ומנטור לסטארטאפים, ובעל ניסיון רב-שנים בפיתוח ווב (http://about.me/nadavdg).

הגב

Be the First to Comment!

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 
wpDiscuz

תגיות לכתבה: