SQL Server מול Big Data: על טרנדים ופרופורציות

חברות רבות רוצות לבדוק מה הן יכולות לעשות עם Hadoop, מנסות להבין מה זה Big Data ואיך הוא יכול להזרים להן עוד מזומנים. מומחי Big Data צצים בלינקדאין, בעיתונים הכלכליים מתפרסמות כתבות על מהפיכת ה-Big Data, וכל מיני כותבים מכריזים על מותו של ה-Database הרלציוני. האם הבאזז מוצדק?

הפוסט נכתב על ידי מתן יונגמן, SQL Server DBA. כיום עובד דרך חברת לוג-און במרכז הפיתוח של Microsoft בהרצליה ומתמחה בעיקר ב-Database Design, High Availability ובשיפור ביצועים של מערכות בצד ה-Database והאפליקציה.

sqlsאם הייתם על כדור הארץ בזמן האחרון, כנראה ששמעתם כמה וכמה פעמים את המילים NoSQL, Hadoop, Big Data וכו’.

חברות רבות רוצות לבדוק מה הן יכולות לעשות עם Hadoop, מנסות להבין מה זה Big Data ואיך הוא יכול להזרים להן עוד מזומנים. מומחי Big Data צצים בלינקדאין, בעיתונים הכלכליים מתפרסמות כתבות על מהפיכת ה-Big Data, וכל מיני כותבים מכריזים על מותו של ה-Database הרלציוני.

כמובן שגם במקומות העבודה שומעים את זה יותר ויותר, ואין ספק שלא תמיד נעים לשמוע את זה בתור DBA. האם זה הזמן להחליף קריירה?

החלטתי ללכת ל – Google Trends כדי לראות קצת מספרים.

בתור התחלה, רציתי לראות גרף עבור “SQL Server”. ככה הוא נראה:

sql

 

לעומת זאת, ככה נראה הגרף עבור “Big Data”:

BigDataTrend_thumb

זה לא נראה טוב. SQL Server בירידה ו-Big Data בעלייה משמעותית.

אבל בואו נשים את שני החיפושים על אותו גרף (SQL Server בכחול, Big Data באדום):

SQLServerVsBigData_thumb

 

ניתן לראות שלמרות כל ההייפ, מספר החיפושים אחרי Big Data הוא פחות מעשירית ממספר החיפושים אחרי SQL Server. גם הגרפים מול Hadoop, NoSQL ו-MongoDB נראים כך.

מה זה אומר? קשה להגיע למסקנות חותכות. אנחנו לא יודעים למשל מה עומק הכיסים של מי שמחפש Big Data, או מה הדרג בארגון של מי שמחפש SQL Server. לכן אני לא רוצה להסתבך בכל מיני אמירות שיוציאו אותי אידיוט עכשיו או בעוד כמה שנים. מה שבטוח אפשר להגיד זה שאפשר קצת להירגע. למרות שכבר יש הטמעות מאוד רציניות של Big Data ו-NoSQL, התחומים הללו עדיין יחסית בחיתולים, וה – Relational Database לא הולך לשום מקום.

בנוסף, SQL Server (וה-Relational Database באופן כללי) הוא מוצר בשל, עם יתרונות וחסרונות ידועים ועם קהילת משתמשים גדולה ופעילה. BigData ו-NoSQL הן טכנולוגיות שעדיין לא נמצאות באותו איזור. עדיין יש באיזור שלהן המון בלאגן, בין השאר כי יש המון סוגים של NoSQL Databases (למרות שיש כאלה שמנסים לעשות סדר – אתם תחליטו אם בהצלחה או לא).

חברות עדיין מגששות באפלה כדי להבין מה הן יכולות לעשות עם זה, ולדעתי זה טרנד שיווקי לא פחות משזה טרנד טכני.

כל זה לא אומר שהטכנולוגיות הללו לא יצמחו. הן טכנולוגיות חשובות, והחוכמה היא לדעת במה להשתמש מתי. פייסבוק היא דוגמא מעולה – הטיימליין יושב על MySQL (רלציוני), וה-NewsFeed יושב על NoSQL (נכון לסוף 2011). ולכן כדאי להכיר אותן – כבר קראתי את הפוסט המעולה של מריה זקורדייב (“Love your enemies.. it pisses them off”), אני מחכה להרצאה של ליאור קינג על NoSQL Databases, ומתכוון להתחיל לשחק עם HDInsight.

בנוסף, כדאי להבין מתי בכלל צריך פתרון Big Data. לפני כמה שנים היה מונח מאוד נפוץ בעולם שלנו: VLDB – Very Large Database. ההגדרה הכי טובה ששמעתי בזמנו ל-VLDB היא “Database שצריך לעבוד איתו ולתחזק אותו בדרכים לא סטנדרטיות”.

הדרכים הלא סטנדרטיות של אז הפכו ליותר סטנדרטיות היום, אבל ההגדרה הזו מאוד מזכירה לי את מה שמדברים עליו היום: מקובל לדבר על מערכת שצריכה פתרון Big Data כמערכת שצריכה לטפל בכמויות עצומות של מידע, שמגיע בקצב רצחני במגוון גדול של סוגי מידע, שיכול להיות Structured ו-Unstructured (ציוצים בטוויטר, וידאו, מיילים וכו’). לכן לא כל שטוען שהוא צריך פתרון Big Data באמת צריך פתרון כזה – רוב המערכות הן די סטנדרטיות.

אני מעריך שבעוד כמה שנים יהיה פחות בלאגן, יהיה הרבה יותר ברור מתי נכון להשתמש באיזה סוג Database, ובאופן כללי SQL Server יישב ליד NoSQL Databases, כשכל אחד עושה את מה שהוא טוב בו.

אשמח לשמוע את דעתכם על הנושא בתגובות. לדעתי יכול להתפתח דיון מאוד מעניין.

הפוסט פורסם לראשונה בבלוג SQL Server.

 

כתב אורח

אנחנו מארחים מפעם לפעם כותבים טכנולוגים אורחים, המפרסמים כתבות בתחומי התמחות שלהם. במידה ואתם מעוניינים לפרסם פוסט בשמכם, פנו אלינו באמצעות טופס יצירת קשר באתר.

תגיות לכתבה:

להגיב

4 תגובות

  1. מאת בני ש:

    השוק ל-SQL "רגיל" גדול בהרבה מהשוק של big data, מאחר ואין שום טעם להפעיל אתרים, מערכות ניהול תוכן, ניהול חשבונות בחברות קטנות-בינוניות והזמנות על מערכות "כבדות" יותר.
    לכל סוג של דטה בייס יש את התחום המתאים שלו וככה זה ישאר בשנים הקרובות, וזה לא אומר שאחד יבוא על חשבון האחר.

  2. מאת Anton:

    אני כרגע מתחיל בחברה חדשה ועובד על לפתח את כל הכלים המערכות הדרושות באופן אישי ולא להסתמך על מערכות קיימות והסיבה היא שאני מנסה ללמוד מערכות שכבר קיימות היום בסטנדרט של שימוש יומיומי כדי למצוא תאוריות מעניינות שיכולות ליעל את המערכות הנ״ל..

    בחרתי בתחום זה כי לדעתי כל המערכות האלה פותחו כדי לענות לבעיות פשוטות כגון טפסי רישום משתמשים ודפי log in פותחו בפזיזות כדי לפנות מקום לדברים המשמעותיים ולכן עם הזמן מערכות פשוטות אלה נשארו מאחור ופתאום התחילו ללצוץ להן שיטות חדשות כאלה שהוצגו בכתבה ולדעתי הן יכולות לענות לבעיות הפשוטות הנ״ל בצורה משמעותים ובכך לעשות redesign לעולם הסטנדרטי והמשעמם שלהן!

    בנוסף רציתי להודות לצוות האתר! אני מאוד אוהב את הכתבות שלכם תמשיכו כך ;)

  3. מאת רן נ.:

    שני הסנט שלי.
    אני לא רואה בכלל קשר בין סוגי הדטה בייסים האלו – מאד מאד מאד ברור מתי צריך בסיס נתונים רלציוני לעומת Document DB.

    אם אתה רק שולף ומאחסן מידע – Document DB הוא פתרון טוב.
    אם אתה רוצה לעושת חישובים על המידע, הצלבות, דוח"ות ואנליזות לא תוכל לעשות כלום עם Document DB ואתה צריך בסיס נתונים רלציוני. (אפשר להזכיר גם דטהבייסים של עמודות לחישובים יותר מהירים).

    רן.

  4. תודה רבה לכולם על התגובות

הרשם לאתר

רק גיקים יכולים ליצור דיון חדש! כדי להפוך לגיק מדופלם, הרשם לאתר.