התאוששות מאסון באופן לא תיאורטי

תוכנית התאוששות מאסון הינה נושא המעסיק רבות כל ארגון ועסק בין אם הוא קטן או גדול. בשנים האחרונות הכנת תוכנית התאוששות מאסון הפכה רלוונטית יותר ויותר, בייחוד באזורינו רווי המלחמות. רונן נדלר מסביר לנו כיצד יש לנהוג בעת תכנון ההתמודדות של העסק עם אסון הפוגע בפעולותיו השוטפות.

disaster_recovery_1_1_0202תוכנית התאוששות מאסון (Disaster Recovery Plan או DRP) הינה נושא המעסיק רבות כל ארגון ועסק בין אם הוא קטן או גדול. בשנים האחרונות הכנת תוכנית התאוששות מאסון הפכה רלוונטית יותר ויותר, בייחוד באזורינו רווי המלחמות. מלחמת לבנון השנייה המחישה את הנושא והטילים שהגיעו למקומות רבים ברחבי הצפון הראו לכולנו את החשיבות המעשית בהכנת תוכנית התאוששות מאסון ויישומה המעשי (הריסת מבנה אינו חלום אלא מציאות). יש לשים דגש  על הכנת תוכנית התאוששות מאסון אמיתית ולא הכנת ספר עב כרס אשר ישב אחר כבוד במגירה ויענה על דרישות הרגולטור ומערך הביקורת של הארגון.

לכן, כאשר אנו רוצים להכין תוכנית התאוששות מאסון אמיתית ומעשית לארגון בו אנו עובדים יש מספר רבדים אליהם צריך להתייחס, חלקם מנהליים וחלקם מחשוביים, אשר בהם עלינו לטפל. בהמשך נסקור את הרבדים השונים לבניית תוכנית DRP מעשית לארגון  בנושא המחשוב וכן נסקור היבטים של גודל הארגון, העסק , הצדדים הכלכליים, הטיפול במידע כוח אדם ועוד.

תוכנית התאוששות מאסון הינה צורך של הנהלת העסק או הארגון ובאופן אידיאלי, התנעת תהליך צריכה להגיע מההנהלה הגבוהה אשר תפנה לגורמים הטכניים ותבקש להכין תוכנית התאוששות מאסון. לעיתים קיים הצורך לרתום את הנהלת הארגון לתהליך, להסביר את החשיבות הרבה ולקבל את מחויבותם ותרומתם בהיבטים השונים.

קיימים מספר רב של תרחישים לאסון בסדר גודל קטן. אנחנו נבדוק ונטפל ב- 2 תרחישים עיקריים ומהותיים והשפעתם על המחשוב:
תרחיש ראשון – תקלות מקומיות המתרחשות ביום יום דוגמת בעיות חשמל, הצפת ביוב, בעיות מיזוג וכדומה.
תרחיש השני – הרס של המבנה בו הארגון פועל. בתרחיש זה יש להתייחס למצב בו קיימת הפסקת פעילות מלאה של העסק לזמן ארוך ואף יכול להתפתח להרס של אזור גיאוגרפי שלם אשר התאוששות ממנו כרוכה בזמני תגובה ארוכים ולפעמים בלתי ידועים.
השלב הראשון בהכנת התוכנית להתאוששות מאסון הוא מיפוי הארגון על כל רכיביו. חשוב להתמקד בתהליכים עסקיים אותם אנו רוצים להפעיל באופן מיידי לאחר האסון או לחילופין הגדרת הצרכים לפעילות רציפה של המערכות השונות על מנת שנוכל לשמור על זמינות התהליכים העסקיים. במסגרת המיפוי כדאי לבנות סדרי עדיפויות להפעלה מחדש של התהליכים העסקיים בארגון כאשר מערכות המידע בדרך כלל משמשות גורם מרכזי בהפעלת הארגון על כל תהליכיו. לאחר סיום תהליך המיפוי, יש להגדיר יחד עם הנהלת הארגון את התהליכים העסקיים להתאוששות מאסון והגדרת הזמנים להפעלת התהליכים העסקיים ניתן לבנות את התוכנית להתאוששות מאסון .

המיקום הפיזי
קרדיט תמונה: Howstuffworks

לאור הרצון להענות לתרחישים כגון התקפת טילים, לא הגיוני למקם את הבניין המכיל את המערכות האמורות לשמש להתאוששות מאסון במרחק גיאוגראפי קרוב ולכן נרחיק את המבנה לפחות לעיר אחרת ובמקרים כקיצוניים גם למדינה אחרת. התקנים המרכזיים בתחום, קובעים שיש לשמור על מרחק של בין 30 ל-50 קילומטר בין האתר המרכזי לאתר ה-DRP. בנוסף, נשאף לקבל מבנה מאובטח בחלקו או בשלמותו ואת חדר המחשב נבחר למקם במקום מוגן כגון מרתף או מקלט. לתוך חדר המחשב נכניס את ציוד המחשוב לפי סדר התלות בדרישת הארגון לזמינות התהליכים העסקיים. במידה ואנו רוצים זמינות מלאה אז יש לדאוג למערך מחשוב מלא פעיל ומסונכרן, כך שהמעבר יהיה מהיר. אם אין צורך בזמינות גבוהה אזי ניתן על-ידי חוזים עם ספקים לרכוש ציוד בעת הצורך ולהתקינו בחדר המחשב המרוחק. כמובן שזמן שחזור מערך המחשוב מלא נמדד לעיתים בחודשים ולא רק בדקות או שעות.

מערך התשתיות הטכנולוגיות
מערך התשתיות יבנה על פי  הדרישה לזמינות המידע כאשר יש לקחת בחשבון את כלל המערכות אשר אתם רוצים להפעיל. במקרים אלו נשתמש ביכולות האשכול (Cluster) של מערכות ההפעלה השונות וננצל את הרפליקציה של מערכי האחסון. בנוסף, יש להוסיף תוכנות שונות המטפלות בסנכרון המידע בצורה שוטפת ומטפלות בבעיות ה-Corruption של בסיסי הנתונים בכדי שמידע בעייתי לא יעבור דרך מערך הסנכרון מהמערך המבצעי למערך ההתאוששות מאסון בצורה אוטומטית. ישנן מערכות תשתית אשר יודעות לבצע מעבר אוטומטי לעבודה באתר הגיבוי, אך מעבר של מערך אחסון בעל נפח אחסון של מאות טרה-בייטים הינו בעל דרגת סיכון גבוהה ולכן יש לבצעו באופן ידני. לעיתים נדרש רק רובוט קלטות כתשתית גיבוי מלאה, אשר יאכסן את המידע ובאמצעותו יבנה מערך שיחזור המידע באתר ה-DRP. קיים הבדל עקרוני בזמינות מערך המחשוב בין חדר מחשב אשר בו מותקן מערך תשתיות טכנולוגיות פעיל ומסונכרן לבין חדר מחשב שאין בו את החומרה המתאימה וצריך לבנות ולהקים את מערך המחשוב מהתחנה הראשונה ועד לשרת ה-Mainframe האחרון.

האפליקציות
זמינות היישומים נקבעת בעיקר על סמך מערך התשתיות הטכנולוגיות. הכלים הקיימים כיום במערך התשתיות  מאפשרים את הזמינות הנדרשת בכל תצורה שנבחר להגדיר. מערך היישומים יכול וצריך מנגנונים עבור התממשקות למערך התשתיות הטכנולוגיות ולפעמים יש צורך במנגנונים עצמאיים לשמירה על המידע. קיים הבדל עקרוני בין חזרה לטרנזקציה אחרונה תקינה לפני הקריסה לבין שיחזור המערך מהסנכרון האחרון, זאת מאחר שניתן שבמידה וקיים Corruption בנתונים, אנו עלולים לסנכרן גם אותו בטעות.

כוח אדם
בתוכנית יש לערב את כל אנשי המחשוב בארגון ולכן יש לדאוג להכשרת האנשים באופן מעשי לתפקידם בעת קרות אסון. יש לתרגל את כלל כוח האדם באופן מלא כולל זמני תגובה להזעקות מהבית. יש לקחת בחשבון בעת התכנון שבמקרה אסון, הגעה פיזית לאתר הראשי תהיה קשה ולעיתים בלתי אפשרית כך שהכנות ועבודה מרחוק כולל הכשרת כוח אדם השוהה בארגון דרך קבע תספק את הפתרון הנדרש עד להגעת שאר עובדי המחשוב לבדיקת הבעיות ותפעול מערך המחשוב.

נהלים ונושאים מנהלתיים
כל התוכנית צריכה להיות מופרטת על-גבי מסמך הכולל את כל הפרטים (מספרי טלפון, כתובות האנשים הרלוונטיים, אמצעי תקשורת שונים, דרכי הגעה לאתרים, אנשי קשר שונים ועוד). התוכנית צריכה להיות מתורגלת באופן מלא על-ידי הארגון על מנת שב"יום הדין" הכול יבוצע ללא תקלות מפתיעות ובצורה טובה ככל הניתן. יש לשיב לב בעת ההתחייבות בפני ההנהלות השונות על זמן העלייה לאוויר, כי יש לבדוק את כל הגורמים השונים: כוח אדם, הגעה לאתר, מעבר המערכות לאתר הגיבוי וחישוב מדויק של זמן החזרה לשגרה.

עלויות
עלות חדר מחשב חלופי יכולה לנוע מאלפי שקלים בחודש לחדר ריק לבין הקמה של חדר מחשב מלא הכולל מבנה ומערך תשתיות טכנולוגיות היכול להגיע למיליוני שקלים. לפיכך, יש לבדוק את העלות מול התועלת ולהביא את המידע בפני הנהלת הארגון על-מנת להחליט "מה נותנים ועל מה משלמים".

לסיכום, תוכנית התאוששות מאסון היא ברת ביצוע וחובת ביצוע. על-מנת לבצע אותה בצורה הטובה ביותר, יש להגדיר באופן מדויק את הצרכים, את הזמינות הנדרשת של התהליכים העסקיים בארגון ורק מול אלו תוכל להיבנות תוכנית DRP המתאימה לארגון ולמשאבים שהוא יכול להקצות לנושא.

רונן נדלר הוא מנהל תשתיות טכנולוגיות של רשות שדות התעופה בישראל והוא בעל ניסיון של מעל ל-20 שנה בתחום מערכות המידע, שליטה ובקרה ועולם ה-IT.

.

פוסט נוסף מאת רונן נדלר:
שליטה ובקרה בעולם הארגוני

רונן נדלר

הגב

Be the First to Comment!

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 
wpDiscuz

תגיות לכתבה: