אבולוציית האחסון: הדיסק און קי שלכם שקול ל-3,200 מערכות על של יבמ משנות ה-50

הצצה לאבולוציית האחסון ועד לעידן שאנחנו חיים בו שמתאפיין בביג דאטה. אלו השינויים, וזו תמונת המצב הנוכחית

shutterstock big data

הפוסט נכתב על ידי עמי צביאלי, Storage Architect, מ-IBM.

בצרור המפתחות שלי ניתן למצוא 2 כונני דיסק-און-קי (Disk-on-Key) ובכל אחד 8 גיגה-בייט. כמות המידע שהם מכילים שקולה ל-3,200 מערכות RAMAC של IBM משנות ה-50, מערכות אשר הכילו 5 מגה-בייט כל אחת ומחירן ,כמו גם גודלן העצום, אפשר רק לחוג לקוחות מצומצם בעולם כולו ליהנות מהם וגם זאת בתעריף של אלפי דולרים לשעת שימוש.

עידן ה-Big Data

כמות המידע שהעולם מייצר היום באמצעות מחשבים, סמאטרפונים, מצלמות, חיישני מזג אוויר ותעבורה, רשתות חברתיות וכד’ מכפיל את עצמו מדי שנתיים. אולם לא רק היקף המידע המיוצר גדל, אלא גם היקף המידע שנצרך. ישנם שימושים רבים ומלהיבים למידע האינסופי שהאנושות מייצרת וקיימים אלגוריתמים אשר מסוגלים למפות ולנתח כמויות מידע גדולות ולהביא תועלת רבה:

  • משטרת ניו-יורק, NYPD, משתמשת באלגוריתמים מתקדמים על גבי בסיסי נתונים עצומים כדי לבדוק ולהצליב נתונים בדבר מעצרים, מועדי תשלום חשבונות שכירות ומזונות, אירועי ספורט המוניים, מזג אוויר ותחבורה וכל זאת בכדי לחזות מראש את הסבירות לאירועי פשיעה ברחובות מועדים ובהתאם לתחזית זאת להקצות כוח אדם למשימות מניעה באזורים אלו.
  • רשתות הסחר הגדולות, כמו Walmart ואחרות, קובעות את תאריכי הורדת מחירי המוצרים בהסתמך על אנליזה של מיליארדי נתונים: דמוגרפיה, קניות, מזג אוויר, נתונים מסחריים, תחזיות כלכליות וכד’.
  • דוקטורנט ב-MIT כתב מחקר על אנליזה של בלוגים, פוסטים וציוצים ברשת כאמצעי להבנת דעת הקהל בנוגע למדיניות ציבורית ופוליטיקה.

השימושים, אם כן, הינם מרובים ומגוונים. יש אומרים כי אנו רק בתחילתה של מהפכה חדשה בה ה”זהב” הינו המידע וכרייתו (כמו גם היכולת להפיק ממנו מידע שמסייע למסחר, לביטחון, לכלכלה ולצריכה) תביא לשגשוג וליצירת ערך רב בעתיד. בתעשיית ה-IT מכנים תחום זה בשם – “Big Data”.

כמויות מידע עצומות אלה דורשות שיטות אחסון מתקדמות. לא עוד תוספת דיסקים אינסופית, אשר צורכת עוד ועוד שטח רצפה לבקרים, לדיסקים ולרשת, ואשר דורשת חשמל רב וקירור אמין, ומתיישנת כעבור מספר שנים.

האבולוציה של מערכי האחסון

בטרם נדון באותן שיטות מתקדמות ובכדי להבין את התהליך שעובר על תעשיית האחסון, נביט אל אבני הדרך שהתעשייה עברה, עד כה, ומתוך כך ננסה להבין לאן פניה מועדות:

עולם ה- DAS – Direct Attached Storage אפשר לשרת מסוים לגשת אל מחסן הנתונים השייך לו. כל התקן ניהל את המידע הרלוונטי עבורו, באמצעות חיבורים ספציפיים, עם יכולות גיבוי מקומיות שהותאמו לשרת/אפליקציה ספציפיים, וחוסר גמישות בשימוש חוזר בהתקן אחסון שהתפנה.

התחנה הבאה הייתה מעבר למערך אחסון מרכזי SAN – Storage Area Network (למעט עבור שירותים מסוימים שדרשו הקצאה ישירה “פרטית” של אחסון). בתצורה מרכזית זאת, יכולת ההקצאה והשחרור של מקטעי אחסון השתפרה פלאים שכן הדיסקים כבר לא היו ספציפיים לשירות מסוים אלא יכלו לשמש מספר רב של משתמשים/שרתים.

שיטות ההגנה על נתונים הלכו ונהיו פורמאליות ואחידות הן ברמת הדיסק / RAID והן בשיטות הרפליקציה וההבהקים (Snapshot). לא צריך היה לנהל מדיניות הגנה פרטית עם שפה שונה עבור כל משתמש. ריבוי הדיסקים אף פרץ את מחסומי הביצועים ואפשר פרישה (Stripe) שהגבירה קצבי הקריאה והכתיבה.

התחנה הבאה במסע הינה התפתחות “טבעית” של מארזי האחסון הראשוניים: GRID. המעבר אל טכנולוגיות GRID אפשר למעשה, ניצולת גבוהה הרבה יותר של ה-SAN: לא עוד hot-spot בזמן שדיסקים אחרים אינם מנוצלים, לא עוד חוסר גמישות בהקצאת השטחים ובשחרורם בתוך המארז. מעתה, המידע נפרש על הדיסקים בצורה שנותנת IO גבוה, כולל יתירות ו-caching מתקדם. כעת, גדילה פירושה גם הוספת יחידות חישוב ו-cache ולא רק עוד דיסקים (וזאת בניגוד למערכי האחסון הקודמים בהם הגדילה בשטח לא הייתה לינארית גם בהיבט הביצועים, ואותם הבקרים נאלצו לשרת יותר משתמשים באמצעות יותר דיסקים). ב-GRID המודולאריות אפשרה גמישות רבה בחיבוריות, זיכרון ויכולות עיבוד.

כפי שתיארנו לעיל, כמויות המידע העצומות הכתיבו את המעבר לשלב הבא, אל סביבות אחסון וירטואליות בהן ההתייחסות של רכיבי החומרה היא כאל משאבים פיזיים, בדומה לאופן שבו וירטואליזציה מנוסחת וממומשת בעולם השרתים. את היכולות המתקדמות מימשו באמצעות תוכנה – אם באמצעות תוכנות מתוחכמות המתמחות בחישוב ניצולת ואופטימיזציה (כגון: Thin Provision, Compression, EasyTier) ואם באמצעות שימוש בבקרים מתקדמים שמשמשים ב-Gateway חכם המשרת את כל סביבת האחסון ובכך הוא מאפשר לשמר את השקעות העבר בתשתיות הארגון, מייתר את הצורך להכיר כל מארז/ספק, מנטרל ריבוי מתודולוגיות הגנה ורפליקציה שונות, ואת הצורך לערוך כיוונון (Tuning) וניטור של כל מערך בנפרד.

לתפישה זו של ניהול משאבים ע”י תוכנה אחת שנותנת ערך מוסף לכל רכיבי התשתית החומרתית יש שם: Software Defined Storage. לא עוד מקבצים של תכונות שקשורים ל-Appliance או מוגדרים ע”י Vendor מסויים. בשלב זה, אין עוד הכרח לרכוש את רכיבי הבסיס (דיסקים , בקרים, מבואות) מספק מסויים. מעטפת התוכנה מאפשרת ניצול מיטבי של התשתיות הפיזיות של הארגון, אלו הקיימות כמו גם אלו שירכשו בהמשך הדרך.

קרדיט תמונה: big data via shutterstock

 

הכתבה בחסות Triple c

IBM ו-Triple c מציעות כיום את פתרון האחסון המתקדם לסביבות בינוניות וקטנות V3700 . מארז אחסון זה בעל יתירות מלאה, ללא נקודת כשל יחידה, ממשקי FC ,SAS , iScsi ותכונות מתקדמות אשר מאפשרות לארגונים קטנים ליהנות מפתרונות הנמצאים בחזית הטכנולוגיה ואשר עד לא מכבר היו נחלתם של תאגידים ולקוחות Enterprise . ל-V3700 לקוחות רבים בארץ ובעולם, וביצועים מעולים בסביבות DB ו VM. ניהול פשוט ואינטואיטיבי מאפשר למידה מהירה ביותר ויכולת ניטור קלה של תקלות. לחצו כאן לפרטים נוספים.

Avatar

כתב אורח

אנחנו מארחים מפעם לפעם כותבים טכנולוגים אורחים, המפרסמים כתבות בתחומי התמחות שלהם. במידה ואתם מעוניינים לפרסם פוסט בשמכם, פנו אלינו באמצעות טופס יצירת קשר באתר.

הגב

1 תגובה על "אבולוציית האחסון: הדיסק און קי שלכם שקול ל-3,200 מערכות על של יבמ משנות ה-50"

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 

* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.

סידור לפי:   חדש | ישן | הכי מדורגים
משה
Guest

Ahh.. Hadoop? Other commodity hardware based distributed in-memory deployments?

Nice irrelevant commercial for IBM

wpDiscuz

תגיות לכתבה: