כל מה שרציתם לדעת על InfiniBand

מה מייחד את InfiniBand על פני פרוטוקולי תקשורת רשת אחרים ומהם היתרונות שלו?

shutterstock network

הפוסט נכתב על ידי בריאן קלף, כתב בכיר של טכנולוגיה במלאנוקס

InfiniBand הוא פרוטוקול לתקשורת רשת מבוססת מיתוג של קישורים דו-כיווניים מנקודה לנקודה (point to point) בין צמתי מעבדים, כמו כן בין צמתי מעבדים לבין צמתי קלט / פלט, כגון כוננים או אחסון. לכל קישור מחובר התקן אחד בדיוק בכל אחד משני קצותיו, כך שהמאפיינים השולטים בתעבורה (שידור וקליטה) בכל קצה מוגדרים היטב ומבוקרים.

אינפיניבנד יוצר ערוץ פרטי, מוגן וישיר בין הצמתים באמצעות מתגים, ומאפשר תנועת נתנונים והודעות מבלי למערב את המעבד בעזרת גישה ישירה מרוחקת לזיכרון (Remote Direct Memory Access או RDMA) והעתקת עומסים (offloads) של שידור / קליטה המנוהלים ומבוצעים על ידי מתאמי רשת אינפיניבנד. המתאמים מחוברים בקצה אחד למעבדים דרך ממשק PCI Express ובקצה השני לתת-רשת אינפיניבנד דרך פורטים של המתאמים לרשת אינפיניבנד. זה מספק יתרונות ברורים על פני פרוטוקולי תקשורת רשת אחרים, הכוללים רוחב פס גבוה יותר, השהיה (זמן תגובה) נמוכה יותר, ויכולת סקלאביליות משופרת.

איור 1: הארכיטקטורה הבסיסית של אינפיניבנד

איור 1: הארכיטקטורה הבסיסית של אינפיניבנד

איגוד האינפיניבנד (IBTA), אשר הוקם בשנת 1999, הגדיר, משמר, ומקדם את מפרט האינפיניבנד (InfiniBand® specification), והוא אחראי על בדיקות תאימות ויכולת פעולה הדדית של מוצרי אינפיניבנד מסחריים. באמצעות מפת הדרכים שלו, IBTA דחף וממשיך לדחוף את הפיתוח של ביצועים גבוהים יותר בצורה אגרסיבית יותר מאשר כל פתרון קישוריות אחר, ומבטיח בכך ארכיטקטורה שנועדה למאה ה-21.

אינפיניבנד מעוצב כדי לאפשר את יישום מרכז הנתונים היעיל ביותר. אינפיניבנד תומך באופן מקורי בוירטואליזציה של שרתים, ברשתות OVERLAY, וברשת מוגדרת תוכנה (SDN) ונוקט גישה ממוקדת ביישום להעברת הודעות, תוך מציאת הדרך עם הכי פחות התנגדות כדי לספק נתונים מנקודה אחת לאחרת. זאת בשונה מפרוטוקולי רשת מסורתיים (כגון TCP / IP ו-Fibre Channel), המשתמשים בשיטה יותר ממוקדת-רשת לתקשורת.

גישה ישירה משמעותה שהיישום לא מסתמך על מערכת ההפעלה כדי להעביר הודעה. בפרוטוקולי קישוריות מסורתיים, מערכת ההפעלה היא הבעלים היחיד של מקורות רשת משותפים; משתמע מכך שיישומים לא יכולים לקבל גישה ישירה לרשת. במקום זאת, היישומים צריכים להסתמך על מערכת ההפעלה כדי להעביר נתונים מהחוצץ (buffer) הוירטואלי של היישום למחסנית הרשת ומשם על גבי התיל המתחבר לרשת, ומערכת ההפעלה בצד המקבל צריכה להיות מעורבת באופן דומה, אבל בסדר הפוך.

בניגוד לאלה, פרוטוקול האינפיניבנד נמנע ממעורבות מערכת ההפעלה על ידי עקיפת מחסנית הרשת כדי ליצור ערוץ ישיר לתקשורת בין היישומים בכל קצה. המטרה הפשוטה של אינפיניבנד היא לספק שירות הודעות המאפשר ליישום לתקשר ישירות עם יישום אחר או עם מערכת אחסון. ברגע שזה קיים, שאר הארכיטקטורה של האינפיניבנד פועלת כדי להבטיח שערוצים אלה מסוגלים להעביר הודעות בגדלים שונים, למרחבי כתובות וירטואליות החוצים מרחקים פיזיים עצומים, יחד עם בידוד ואבטחה.

מחשבה ליישום בחומרה

ארכיטקטורת האינפיניבנד מעוצבת תוך מחשבה ליישום בחומרה, בניגוד ל-TCP שנבנה תוך כדי מחשבה על יישום בתוכנה. אינפיניבנד הוא לכן שירות העברה בעל משקל קל יותר מאשר TCP בכך שהוא לא צריך לסדר מחדש חבילות, כי שכבת הקישור ברמה התחתונה מספקת שידור חבילות לפי הסדר בהן התקבלו. שכבת התעבורה (Transport Layer) נדרשת רק לבדוק את סדרת החבילות ולספקן בסדר המתקבל. בנוסף, היות ואינפיניבנד מספק בקרת זרימה מבוססת קרדיט (שבה צומת שידור לא שולח נתונים מעבר לכמות “הקרידט” שפורסמה על ידי חוצץ (buffer) הקליטה בצדו השני של הקישור), שכבת התעבורה אינה מחייבת קיום מנגנון השמטת חבילות כמו אלגוריתם “חלונות ההזזה” (windowing / sliding windows) של TCP הנדרש על מנת לקבוע את המספר האופטימלי של חבילות להעברה בחלון אחד. זה מאפשר למוצרים העברת נתונים יעילה עבור יישומים, בקצב של 56 ובקרוב 100 גיגהביט בשנייה עם זמן תגובה נמוך מאוד ושימוש זניח בזמן המעבד.

אינפיניבנד משתמש בטכנולוגיית גישה ישירה לזיכרון (RDMA) כשיטה להעברת הנתונים מקצה אחד של הערוץ למשנהו. טכנולוגיית ה-RDMA מספקת את היכולת להעביר נתונים ישירות בין יישומים מעבר לרשת בלי מעורבות של מערכת ההפעלה ותוך כדי ניצול משאבי CPU זניחים משני צדדי הקישור (zero-copy transfers). היישום בצד השני פשוט קורא את ההודעה ישירות מהזיכרון, ובכך הועברה ההודעה בהצלחה.

תקורת מעבד (overhead) מופחתת זו מגדילה את יכולת הרשת להעביר נתונים במהירות ומאפשרת ליישומים לקבל נתונים מהר יותר. פרק הזמן שלוקח לכמות נתונה של נתונים לעבור מהמקור ליעד ידוע כזמן תגובה או השהייה (latency), וככל שהוא נמוך יותר, השלמת עבודת היישום תהיה מהירה יותר.

איור 2: קישוריות מסורתית

איור 2: קישוריות מסורתית

איור 2: קישוריות מסורתית

איור 3 – קישוריות RDMA (Zero Copy)

איור 3 – קישוריות RDMA (Zero Copy)

אינפיניבנד FDR משיג זמן תגובה נמוך עד כדי 0.7 מיקרו-שניות, שהוא משמעותית זמן התגובה הנמוך יותר הזמין להעברת נתונים.

היתרונות העיקריים של אינפיניבנד על טכנולוגיות קישוריות אחרות כוללים:

• תפוקה גבוה יותר – אינפיניבנד תומך באופן מתמיד בתפוקה הגבוהה ביותר מקצה לקצה לעבר חיבור השרת והאחסון.

בשנת 2008, אינפיניבנד הציג 40 גיגהביט לשנייה (QDR) בשוק, בזמן שאית’רנט תמך ב- 10 גיגהביט ופייבר צ’אנל רק ב- 8 גיגהביט.
בשנת 2011, אינפיניבנד הציג 56 גיגהביט לשנייה (FDR) בשוק, בזמן שאית’רנט תמך ב- 40 גיגהביט ופייבר צ’אנל רק ב- 16 גיגהביט.
מוצרי אינפיניבנד של 100 גיגהביט לשנייה (EDR) הושקו בשנת 2014, ובשנים הקרובות יושקו גם מוצרי 200 גיגהביט לשנייה (HDR), תוך כדי שמירה על הפער בשוק עם הפרוטוקולים המתחרים.

• זמן תגובה נמוך יותר – קישוריות מבוססת RDMA zero-copy מפחיתה את התקורה (overhead) של מערכת ההפעלה כך שהנתונים יכולים לנוע במהירות דרך הרשת.

• סקלאביליות משופרת – אינפיניבנד יכול להכיל רשתות שטוחות של כ-40,000 צמתים בתת-רשת בודדה, ועד 2^128 (2 בחזקת 128) צמתים (מספר בעצם בלתי מוגבל) ברשת גלובלית, המבוססת על אותם רכיבי מיתוג – וזאת, בסך הכל, על ידי הוספת מתגים נוספים.

• נצילות מעבד גבוהה יותר – עם העתקת עומסי תנועת נתונים יכול המעבד להשקיע יותר מחזורי מחשוב על היישומים שלו, דבר שיקטין את זמן הריצה ויגדיל את מספר העבודות ליום.

• תקורת ניהול מופחתת – המתגים של אינפיניבנד יכולים לרוץ בתצורת רשת מוגדרת-תוכנה (SDN), המאפשרת להם לרוץ כחלק ממארג הרשת ללא ניהול של המעבד.

• פשטות – אינפיניבנד הוא קל מאוד להתקנה כאשר בונים אשכול fat-tree פשוט, לעומת אית’רנט שדורש ידע על פקוטורולים מתקדמים שונים כדי לבנות אשכול IT.

מעבר לכל, אינפיניבנד מציע החזר טוב יותר להשקעה, עם תפוקה ונצילות מעבד גבוהות יותר במחיר תחרותי, השקול לפרודקטיביות גבוה יותר יחד עם עלות נמוכה יותר לכל נקודת קצה.

קרדיט תמונה: network cables via shutterstock.

הכתבה בחסות מלאנוקס

מלאנוקס מציעה פורטפוליו מלא של אינפיניבנד בקצב 56Gb/s (FDR) מקצה לקצה עבור מרכזי נתונים ומערכות מחשוב עתירות ביצועים, הכולל מתאמים, מתגים וכבלים. כרטיסי המתאם Connect-IB® של מלאנוקס מספקים ביצועים מובילים עם רוחב פס מרבי, זמן תגובה נמוך, ויעילות מחשוב עבור יישומי שרתים ואחסון מכוונים לביצועים גבוהים. משפחת מתגי SwitchX של מלאנוקס של אינפיניבנד בקצב FDR ותוכנת הניהולUnified Fabric Management (UFM®) משלבים כלים מתקדמים שמפשטים את ניהול הרשת וההתקנה, ומספקים יכולות הנדרשות לסקלאביליות הגבוהה ביותר וצמיחה עתידית. כבלי הנחושת והסיבים האופטיים של מלאנוקס מבטיחים את ביצועי הקישוריות הגבוהים ביותר. עם מוצרי אינפיניבנד של מלאנוקס מקצה לקצה, מנהלי IT יכולים להיות סמוכים ובטוחים שיקבלו את הביצועים הגבוהים ביותר ומארג הרשת היעיל ביותר. לקבלת מידע נוסף על מוצרי אינפיניבנד של מלאנוקס הקליקו כאן

Avatar

כתב אורח

אנחנו מארחים מפעם לפעם כותבים טכנולוגים אורחים, המפרסמים כתבות בתחומי התמחות שלהם. במידה ואתם מעוניינים לפרסם פוסט בשמכם, פנו אלינו באמצעות טופס יצירת קשר באתר.

הגב

הגב ראשון!

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 

* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.

wpDiscuz

תגיות לכתבה: