הגורם האנושי בענן של VMware

ביום שאחרי תקלה רצינית בשירותי הענן של החברה, אחד המהנדסים גרם בטעות לתקלה חמורה עוד יותר – שניתקה את הלקוחות מהשירות.

מקור: תמונת מסך מערוץ הטוויטר של Cloud Foundry

בזמן האחרון נראה שמיחשוב הענן זוכה לטבילת אש לא פשוטה בכלל. אחרי הקריסה המתוקשרת של חלקים נרחבים בשירותי הענן של אמאזון, שהשפיעו וניטרלו אתרים רבים וגדולים ברשת, מגיעה הידיעה על בעיות בענן של VMware.

תקלה ועוד תקלה

הסיפור ב-VMware היה יכול להיות די פשוט, אם היה מדובר בתקלה אחת. לאחרונה השיקה החברה שירות מיחשוב ענן תחת המותג Cloud Foundry. השירות כיום נמצא רשמית עדיין בשלב ה-Beta, ומציע ללקוחות שירותי PaaS (Platform as a service).

במהלך שבוע שעבר, בימים 25-26 באפריל, חוו משתמשי שירות מיחשוב הענן של VMware תקלה אשר הפריעה לאספקה סדירה ותקינה של השירות. בעקבות התקלה, שתוקנה תוך שעות מעטות, החליטו ב-VMware שהם צריכים להכין לעצמם סט נהלים חדש כדי למנוע ולהתמודד עם תקלות מאותו סוג שארע ב-25 באפריל.

במסגרת החשיבה על הנהלים החדשים, ישבו מהנדסי החברה ותכננו את כל הצעדים הנדרשים כדי למנוע את הבעיה וכדי לטפל בה אם היא מתחילה להתפתח, ולפני שהיא הופכת לתקלה רצינית.

הגורם האנושי מכה שנית

במסגרת הפקת הלקחים ופיתוח סט הנהלים החדש, ניגשו המהנדסים לבדוק כיצד צפוי סט הנהלים שפיתחו להשפיע על שירות הענן שהחברה מציעה ללקוחותיה. אבל, למרות שהבדיקה היתה אמורה להיות תיאורטית בלבד, כלומר, המהנדסים לא היו אמורים ללחוץ על שום כפתור, אחד המהנדסים, בטעות, לחץ על אחד הכפתורים שהוביל לניתוק שני של שירותי הענן, ב-26 באפריל. כך יצא שמהנדס אחד שרצה לבדוק ולוודא שהנהלים והלקחים שהופקו בעקבות התקלה של יום קודם לכן, גרם להפרעת שירות קשה עוד יותר ביום העוקב. במסגרת התקלה, נותקו כל הלקוחות משירות ה-Cloud Foundry.

סדרת התקלות ב-Cloud Foundry מדגישה כמה לקחים שלא תמיד מרבים לדבר עליהם. הראשון הוא שבעלי עסקים, לקוחות של שירותי ענן, צריכים להתכונן ליום שבו המערכת תקרוס, להכין תוכנית עבודה בלי הענן, ולדאוג שתהיה כל הזמן מעודכנת. שכן כל מערכת יכולה לקרוס, תהא הסיבה אשר תהיה. הקריסה השניה, החמורה יותר, של Cloud Foundry מדגישה את העובדה שהגורם האנושי יכול להיות גורם דומיננטי ומשפיע מאוד על אספקת השירות ללקוחות. במקרה הזה, טעות של מהנדס אחד גרמה לניתוק כל הלקוחות של השירות מה-Front-End שלהם, במשך זמן ארוך.

תקלות הענן של VMware מצטרפות לתקלות באמאזון, וביחד עשויות להוות תמריץ לאנשים מסוימים להתרחק מהענן. ספק אם התרחקות מהענן רק בגלל תקלות אלו מוצדק. מתקלות שכאלו ילמדו מרבית, אם לא כל השחקנים בתחום אספקת שירותי מיחשוב ענן, ויש לקוות שאת הלקחים הם הפיקו ויישמו מהר. ברמת העסק, ישנם צעדים רבים שניתן לנקוט על מנת למזער את ההשפעה של תקלות כאלה על ביצועי עסק שבחר להשתמש בשירותי מיחשוב ענן.

נדב דופמן-גור

עו"ד העוסק בתחומי דיני הטכנולוגיה, דיני פרטיות וקניין רוחני. מרצה ומנטור לסטארטאפים, ובעל ניסיון רב-שנים בפיתוח ווב (http://about.me/nadavdg).

הגב

2 תגובות על "הגורם האנושי בענן של VMware"

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 

* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.

סידור לפי:   חדש | ישן | הכי מדורגים
ירדן
Guest

מה יהיה עם העננים הללו? העולם יעלם בענן..
הכל כבר שם..
http://www.seeit.co.il

פילוני
Guest
“שבעלי עסקים, לקוחות של שירותי ענן, צריכים להתכונן ליום שבו המערכת תקרוס, להכין תוכנית עבודה בלי הענן, ולדאוג שתהיה כל הזמן מעודכנת. שכן כל מערכת יכולה לקרוס, תהא הסיבה אשר תהיה.” זה רק ממחיש כמה שירותי ענן לא אמינים מעבר לסוגיית אבטחת המידע ועצם קיומו של מידע עיסקי קריטי בידי ארגון אחר שאתה תמיד תהיה מוטרד מלחשוב על מי מציץ ומחטט במידע שלך. אז אם סוגיית האבטחה הבריחה אנשי IT ומנהלים בכירים עד כה, אזי שסוגיית הזמינות תבריח אותם עוד יותר. האמת בצדק, אני מעולם לא הייתי חושב ששירותי ענן יהיו זמינים 24/7, זו תמימות לחשוב כך. אבל סוגיית האבטחה… Read more »
wpDiscuz

תגיות לכתבה: