הכל אודות Siri: העוזר האישי של האייפון 4S

אחד החידושים המשמעותים שהביא עימו האייפון החדש הוא סירי. מה עומד מאחורי המסייע הוירטואלי החדש של אפל וכיצד הוא פועל?

תמונה: יח"צ

כשאפל הציגה לראשונה את סירי באירוע חשיפת האייפון 4S, נראה היה שמדובר בפיצ’ר עתידני מידי שבדומה לשאר יכולות הזיהוי הקולי הקיימות כיום ולמעשה החלו כבר בשנות ה-90 המאוחרות, נידון לכישלון ושלא מדובר ביותר מאשר גימיק. אבל הסקירות של המכשיר שפקדו את הרשת בימים שקדמו להשקת האייפון 4S טוענות אחרת, כאשר כולם משבחים את סירי והיכולות שלה. אם החומרה של האייפון 4S מבחינת המצלמה ומעבד ה- A5 הן הצעד שלה קדימה, שהרי סירי היא שלושת הצעדים הצידה, כאשר מדובר בפיצ’ר מדהים שעדיין אין לו אף מתחרה שיכול לבצע את כל הפעולות שסירי, שעדיין נמצאת בבטא, מסוגלת לעשות.

איך היא פועלת?

אפל הציגה את סירי בתור פיצ’ר הזיהוי הקולי הטוב ביותר שיש, שמחליף לחלוטין את פונקציונליות Voice Control שהוצגה לראשונה עם מכשיר ה- 3Gs ב- 2009. סירי מבצעת את הזיהוי הקולי באופן מוצלח למדי, גם לפי הצגת התכלית של אפל וגם לפי סקירות המשתמשים והמבקרים. הזיהוי הקולי מתבצע עם טכנולוגיית הזיהוי הקולי של חברת Nuance, חברה מוכרת וותיקה בתחום שהמתחרה העקרית שלה בנושא הזיהוי הקולי היא לא אחרת מאשר גוגל. יש לציין שהזיהוי הקולי של סירי התבצע על ידי Nuance גם כאשר סירי הייתה אפליקציה עצמאית, אם כי לא אפל ולא Nuance אישרו כי אכן מדובר בטכנולוגיית הזיהוי הקולי של Nuance.

אבל סירי עושה הרבה מעבר לרק זיהוי קולי, ובניגוד לפיצ’ר אותו הוא יורשת (Voice Control), המשתמש מסוגל לתקשר עם סירי ממש כמו עם בנאדם כאשר סירי מקשרת לשיחות קודמות שניהלה עם המשתמש ולעיתים היא גם מבקשת מידע נוסף בכדי לבצע את הפעולות טוב יותר. סירי גם “זוכרת” את ההקשר של התשובה/פקודה השניה. אבל אפל לקחה את היכולות הראשוניות של סירי לחיפוש מסעדות ומקומות בילוי והרחיבה אותן ללא הכרה. סירי מסוגלת לשלוח מיילים, הודעות טקסט, להפעיל אפליקציות, שירים, למצוא מפת הגעה, מידע כללי מתוך האינטרנט, להתקשר לאנשי קשר, ליצור תזכורות, פגישות ועוד. סקוט פורסטל, תיאר את סירי לא כעוד תוכנה לזיהוי קולי שרבות כאלה קיימות בשוק, אלא בתור כלי שמסוגל לא רק להבין את דברי המשתמש אלא גם להבין את ההקשר.

אחד הדברים שאפל אפשרה לעשות עם סירי הוא לבצע תיקון ידני לשאילתות. כך שאם רציתם למצוא את השורש הריבועי של 346 אבל החלטתם להתחרט ובסופו של דבר זהו השורש של 246, ניתן יהיה לתקן ידנית את השאילתה ולמצוא את התשובה לשאלה החדשה והרצויה.

המתחרים נותרו הרחק מאחור

כפי שציינתי קודם, סירי היא לא הכלי היחיד בשוק לזיהוי קולי. גם פלטפורמת האנדרואיד מכילה את טכנולוגיית הזיהוי הקולי של גוגל – זיהוי קולי מתקדם מאוד שמאפשר לבצע בעיקר חיפוש בפלטפורמה הניידת של גוגל וכן ניווט קולי מודרך כהמשך לחיפוש נתיב במפות גוגל, שליחת הודעות או חיוג קולי, מיילים והשמעת מוזיקה. בנוסף קיימת אפליקציה בשם Vlingo באנדרואיד מרקט שמבצעת חלק מהפעולות של סירי במכשירי האנדרואיד. אולם אין שום כלי אחד או אפליקציה אחת, שלא לדבר על כזאת המובנית במערכת ההפעלה שמאפשרת לבצע את הפעולות שסירי עושה. כך שאין ספק שהמתחרים נמצאים הרחק מאחור, וזאת הסיבה שרבים סוברים שסירי היא 3 הצעדים לצד של אפל.

מה בהמשך?

תמונה: יח"צ

האתר 9to5mac גילה רישום פטנט של אפל המראה כי אפל חוקרת בעצמה את נושא הזיהוי הקולי ויתכן שבעתיד הלא רחוק אפל תחליט לנטוש את חברת Nuance. לפי השמועות היא שותפה קשוחה לא פחות מאפל, ותטמיע את טכנולוגיית הזיהוי הקולי שלה במכשירי iOS ובמחשבי המק. כמובן שיתכן שאפל תעבוד בשיתוף עם Nuance ופשוט תשתמש בטכנולוגיה שלה כבסיס אותו היא תשפר עם טכנולוגיה עצמאית. Norman Winarsky, אחד ממייסדי חברת סירי אמר לראיון ל- 9to5mac שהטכנולוגיה המודולרית של סירי מאפשרת לאפל להחליף את טכנולוגיית הזיהוי הקולי בכל זמן ולבחירתה.

סביר להניח כי בשלב מסוים אפל תוביל את סירי למוצרים נוספים. בין אם מכשירי האייפד, האייפוד טאצ’ ואולי אפילו האפל TV והמק. יהיה מאוד מעניין לראות את הטכנולוגיה הזו מגיעה גם למוצרים הללו, ויהיה מעניין לגלות איזה עוד פיצ’רים ויכולות אפל תוסיף לסירי.

מה שכן, נכון לעכשיו היכולות של סירי מוגבלות בעיקר לשימוש בארה”ב. כאשר משתמשי 4S ברחבי העולם ציינו כי ניסיון להשתמש בסירי לחיפוש מקומי של מסעדות/מקומות בילוי או ניווט במדינות אחרות אל מחוץ לארה”ב לא היה מוצלח וסירי אף אומרת זאת בפירוש. אולם אפל ציינה בעת הצגת הפיצ’ר כי סירי נמצאת עדיין בבטא, והרחבה של היכולות שלה אל מעבר לגבולות ארה”ב תגיע במהלך 2012. יתר האפשרויות של סירי כמו למשל חיפוש ברשת, יצירה של פגישה, שליחת הודעה וכו’ יעבדו בלי קשר למיקום המשתמש אולם רק בשפות האנגלית, צרפתית וגרמנית כאשר עברית היא לא שפה שנראית באופק, מה שקצת מקטין את רמת השימושיות של סירי למשתמש הישראלי הממוצע.

תגיע למכשירים ישנים יותר?

תמונה: יח"צ

מאז שסירי הוצגה רבים שואלים, האם סירי תגיע גם למכשירים ישנים יותר כמו האייפון 4 או האייפד 2? אולם טענתה של אפל שהבינה המלאכותית דורשת את כוח העיבוד של ה- A5 מגלה כי לחברה אין כוונה לצרף את סירי למכשירי האייפון 4, אולם לגבי מכשיר האייפד 2 לא ברור, כאשר נתיחת האייפון 4S האחרונה מגלה כי החומרה של האייפון 4S דומה לזו של האייפד 2, ואף אפילו קצת חלשה יותר כאשר אפל מגבילה את מהירות השעון של מעבדי האייפון 4S כדי לחסוך בסוללה.

בימים האחרונים הודיע MuscleNerd, דובר ה- Dev Team כי הקבוצה תחפש דרך חוקית להביא את הפיצ’ר למכשירי האייפון 4, אם כי דרך זו תהיה קשה מאוד, מאחר והיא תצריך מציאת פריצה במעבד ה- A5 שתאפשר את הטמעת הפיצ’ר במכשירים נוספים. לעומת זאת ה- Dev Team לא יבצעו מעבר פשוט של קבצי הקוד של סירי מתוך מערכת ההפעלה של האייפון 4S למכשירי האייפון 4, מאחר ויהיה מדובר בפעולה לא חוקית אליה מתנגדים חברי הקבוצה, כפי שהם מתנגדים לפרסום קבצים מקוסטמים המפירים את זכויות היוצרים של אפל.

אולם מנגד המפתח Steven Troughton-Smith שעובד בימים האחרונים באופן קרוב עם האתר 9to5mac הצליח להטמיע את סירי במכשיר אייפון 4 והאתר אף פרסם סרטון קצר המדגים את הממשק של סירי כשהוא רץ על מכשיר אייפון 4, אם כי לא רואים את סירי בפעולה של ממש.

קצת על סירי

סירי החלה את דרכה בתור אפליקציה חינמית שהושקה באפסטור והייתה מיועדת למשתמשי האייפון בעיקר (מאחר ודאז לטאצ’ לא היה מיקרופון). האפליקציה שהושקה תחת הכינוי “personal assistant” אפשרה למשתמשים לדבר בשפה טבעית בכדי לבצע פעולות כמו מציאת כרטיסים לסרט קרוב ורכישתם. מלבד לפונקציונליות “נטולת ידיים”, האפליקציה הוצגה כחוסכת זמן, כאשר פעולתה חסכה זמן בחיפוש באתרים ושירותים כמו Yelp, כדי לבצע פעולות או לקבל מידע דרוש. סירי ידעה לבצע חיפוש במספר מאגרי מידע במקביל ולתת למשתמש את כל המידע האפשרי שמצאה. כך למשל משתמש שחיפש מסעדה איטלקית בסביבתו היה מקבל את המידע על כל המסעדות שקיבלו ביקורות טובות לצד מפות/מידע הגעה.

הטכנולוגיה הרשימה את אפל כל כך, עד שהחברה החליטה לרכוש את החברה ואת האפליקציה שלה, באפריל 2010. מאז אפל שקדה על הטמעת הטכנולוגיה בתוך מערכת ההפעלה iOS. אבל אם אתם חושבים שמדובר בקונספט חדש עבור לאפל – אתם טועים, מדובר בסך הכל בטכנולוגיה שמאפשרת לאפל לבצע תכנון ישן. אפל חשבה על קונספט של עוזר אישי וירטואלי שכזה עוד בשנת 1987 (!), כאשר ג’ובס לא היה חלק מאפל והחברה נוהלה על ידו של ג’ון סקאלי. בסרטון קונספט שהחברה פרסמה ניתן לראות כיצד המשתמש (מרצה) משתמש בעוזר הוירטואלי שלו הממוקם בתוך מכשיר דמוי טבלט כדי לבצע פעולות ולתקשר עם אנשים. את הטבלט הציגה אפל רק בשנת 2010 ואת העוזר הוירטואלי – שקיבל את השם סירי רק השנה.

וידאו: אפל מציגה את סירי

פורסם לראשונה באתר iPhones.co.il

iPhones.co.il

הגב

1 תגובה על "הכל אודות Siri: העוזר האישי של האייפון 4S"

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 

* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.

סידור לפי:   חדש | ישן | הכי מדורגים
SGS
Guest

לפי מה שהבנתי יש לסירי בעיה לזהות מה אתה אומר אלא אם יש לך מבטא אמריקאי. עוד מישהו נתקל בתופעה הזו?

wpDiscuz

תגיות לכתבה: