עוד איום על אינטל: NVIDIA חשפה מעבד לשרתים

הענקית האמריקאית הכריזה בכנס GTC על החידושים שלה, בהם Grace, מעבד מבוסס ARM לשרתים, פיתוח ישראלי חדש וד”ש מטוני סטארק

הדור החדש של הפיתוח מבית מלאנוקס | מקור: NVIDIA

מבצעי החיסונים ברחבי העולם אמנם מתרחבים, והחזרה לחיים כבר הפסיקה להיות חלום רטוב ויותר מציאות מתגבשת – אבל הכנסים של ענקיות הטכנולוגיה עדיין מתקיימים מרחוק. בכנס GTC הדיגיטלי של NVIDIA, הציגה אמש (ב’) הענקית האמריקאית כמה מהחידושים המעניינים שלה לשנים הקרובות.

כאב ראש חדש לאינטל

NVIDIA מוכרת ללא מעט אנשים בעיקר מתחום הגרפיקה וה-GPU, אך עם התוספת של מלאנוקס הוסיפה החברה האמריקאית גם את ה-DPU כחלק מההיצע שלה עבור דאטה סנטרים. כעת, הכריזה אנבידיה על CPU חדש שפיתחה – כדי להשלים את ההיצע – CPU, GPU ו-DPU שהיא יכולה לספק עבור חוות שרתים. בכך היא תנסה לעשות לאינטל בתחום השרתים את מה שאפל עושה לה בתחום המחשוב האישי ולהציע אלטרנטיבה מבוססת ARM למעבדים של אינטל.

השבב החדש, NVIDIA Grace, הוא הראשון שפיתחה החברה עבור התחום והוא מיועד לחישובי הבינה המלאכותית המורכבים ביותר ולטובת מחשוב על (High Performance Computing). המעבד מבוסס על מערך ליבות בעל צריכת אנרגיה נמוכה מבית ARM (שנרכשה על ידי NVIDIA בשנה שעברה תמורת 40 מיליארד דולר). שמו של השבב החדש הוא מחווה למדענית המחשב האמריקאית הנודעת גרייס הופר.

NVIDIA Grace אמור לספק, לפי החברה, שיפור של פי 10 בביצועים במשימות של אימון מודלי בינה מלאכותית (AI) גדולים, מטרתו לספק פתרון ליישומים התובעניים ביותר, כולל עיבוד שפה טבעית, מערכות המלצה ומחשוב-על מבוסס בינה מלאכותית (AI Supercomputing).

באנבידיה אומרים כי מודלי הבינה המלאכותית גדלים אקספוננציאלית, כשהגדולים בהם – לדוגמה GPT-3 של OpenAI, מבוססים על מיליארדי פרמטרים. על פי החברה האמריקאית, עד 2023 מודלי AI יתבססו על טריליוני פרמטרים – מה שיצריך יכולות עיבוד אדירות. כאן נכנס לתמונה Grace – שעם אופטימזציה לצד ה-GPUs של החברה ישפר משמעותית את זמני האימון של מודלים מסוג זה.

באנבידיה אומרים כי עם כניסתו לשוק של ה-CPU החדש שפיתחה ב-2023, מערכת המבוססת עליו תוכל לאמן מודל NLP עם טריליון פרמטרים במהירות הגבוהה פי 10 בהשוואה לפלטפורמת NVIDIA DGX המתקדמת ביותר כיום, ומבוססת על מעבדים בארכיטקטורת x86 – לעומת גרייס המבוסס ארכיטקטורת ARM. המעבד החדש כבר נמכר ל-2 לקוחות נחשבים בתחום – מרכז מחשוב העל השוויצרי והמעבדה הלאומית לוס אלמוס.

המעבד הראשון של NVIDIA לדאטה סנטר – הגרייס | מקור: NVIDIA

 

פנקו את הטלגרם שלכם עם ערוץ הטכנולוגיה הגדול בארץ פנקו את הטלגרם שלכם עם ערוץ הטכנולוגיה הגדול בארץ הצטרפו לערוץ גיקטיים בטלגרם

דור חדש לפיתוח מבית מלאנוקס

במסגרת הכנס הכריזו ב-NVIDIA על דור חדש ל-Bluefield, הפיתוח מבית מלאנוקס הישראלית – שנרכשה לפני כשנתיים ע”י אנבידיה ב-6.9 מיליארד דולר. Bluefield הוא DPU (קיצור של Data (Processing Unit, שהוא SoC שבעצם בא להוריד מהמעבד הקלאסי (ה-CPU) את העומס של איחסון, אבטחה וניתוב של מידע.

באנבידיה הכריזו הערב על BlueField 3. הדור החדש של ה-DPU שלה, שיציע קצב העברת נתונים של 400Gbp/s. בלופילד 3 הוא ה-DPU הראשון של החברה שפותח באופן ייעודי לעיבוד בינה מלאכותית (תתכוננו, המושג הזה חוזר לא מעט הערב), כשבאנבידיה טוענים כי יחידה אחת שלו יכולה לספק לארגונים ביצועים השווים בערכם לאלו של 300 ליבות CPU.

הדגם החדש של הפיתוח מבית מלאנוקס מבוסס על 16 ליבות עיבוד מסוג ARM Cortex-A78 והכפיל את הביצועים שלו פי 10 לעומת הדור הקודם כשזה מגיע למחשוב מואץ (Accelerated Computing)

ביצועים משופרים פי 10 עבור מחשוב מואץ בהשוואה לדור הקודם, והאצה של עד פי 4 בביצועי הקריפטוגרפיה שיספק ה-DPU החדש. BlueField 3 יהיה זמין לבדיקות החל מהרבעון הראשון של 2022.

ליצור צ’אטבוט שיחתי עם JARVIS | מקור: NVIDIA

מה-MCU לחיים האמיתיים

ב-NVIDIA אמנם חשפה כבר בשנה שעברה את JARVIS, הפריימוורק שלה לבינה מלאכותית שיחתית (Conversational AI), והיום היא רשמית משחררת ללקוחותיה את הגישה לפלטפורמה. מפתחים שישתמשו ב-JARVIS יקבלו גישה למודלים מאומנים של למידה עמוקה וכלים נוספים שיאפשרו להם ליצור שירותי שיחה אינטראקטיביים מבוססי בינה מלאכותית.

המודלים שיאומנו על ידי JARVIS יציעו יכולות זיהוי דיבור אוטומטי ברמת דיוק גבוהה והבנת חמש שפות שונות (אנגלית, גרמנית, יפנית, צרפתית ורוסית) – ויכולת תרגום בזמן אמת בין חמש השפות הללו. בנוסף המפתחים יוכלו להשתמש במודלים הללו כדי להמיר טקסטים לשיחה ולייצר צ’אטבוט קולי מבוסס בינה מלאכותית.

הפלטפורמה החדשה מואצת – איך לא – בעזרת ה-GPUs של אנבידיה, והחברה מתחייבת לזמן תגובה של 100 מילי-שניות לטובת האזנה, הבנה ויצירת תגובה באמצעות הפלטפורמה ששואלת את שמה מהבינה המלאכותית שיצר טוני סטארק/איירון מן בקומיקס ובסרטי ה-MCU. את JARVIS יוכל המשתמשים להטמיע בענן, בדאטה סנטרים או בציוד הקצה שלהם.

ויש עוד כמה הכרזות

ב-NVIDIA מנסים למצב את עצמם גם כמי שיכולים להיות הבית של חברות הסייבר עם פלטפורמת NVIDIA Morpheus, המונעת על ידי ה-GPUs של החברה וה-DPUs שלה (Bluefield) כדי לאפשר לספקי שירות בתעשיית הסייבר לפתח מערכת אבטחה מבוססות בינה מלאכותית.

באנבידיה אומרים כי הפלטפורמה מסוגלת לזהות ולמנוע איומי אבטחה בשעה שהם מתרחשים באמצעות השימוש בטכנולוגיית למידת מכונה המאפשרת זיהוי, תפיסה ונקיטת פעולה מיידית נגד איומי אבטחה ופעילויות חריגות המתרחשות בסביבת מרכז הנתונים. עוד אומרים באנבידיה כי הפלטפורמה החדשה שלהם מסוגלת לזהות גם דליפות של מידע רגיש בלתי מוצפן, מתקפות פישינג ונוזקות.

לצד הכניסה לתחום הסייבר, באנבידיה מנסים למצב את עצמם כספקים בכירים של שבבים עבור מכוניות עם השבב החדש NVIDIA DRIVE Atlan. מדובר ב-SoC המיועד לרכבים ואמור לספק להם יכולות עיבוד משמעותיות – כשהמטרה הסופית מבחינת החברה היא להניע את הרכבים האוטונומיים של העתיד. השבב החדש כולל תמיכה בביצועים של עד ל-1,000 טריליון פעולות בשנייה (TOPS) והוא מורכב מ”השילוש הקדוש” – CPU מבוסס ארכיטקטורת Arm, מעבד נתונים (או DPU) בלופילד וכמובן GPU של החברה.

באנבידיה רוצים לתת ליצרניות הרכבים את היכולת להניע את הרכבים האוטונומיים עם מה שהם מכנים “ביצועים של דאטה סנטר על גלגלים” שיכול להשתפר כל הזמן באמצעות עדכוני גרסה OTA. השבב החדש מבית NVIDIA, שיחליף את שבב Orin (שייצא לשוק רק בשנה הבאה), יהיה זמין החל מ-2025.

אושרי אלקסלסי

Your Friendly Neighborhood Geek. יש לכם סיפור טכנולוגי? דברו איתי: Oshry@geektime.co.il

הגב

רוצה להיות הראשון להגיב?

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 

* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.

wpDiscuz

תגיות לכתבה: