אחסון חדש: תמונה, טקסט וקובץ אודיו על גבי DNA

לאחר נסיונות קודמים בקידוד מידע על DNA, הצליחו חוקרים לקודד תמונה צבעונית, קבצי טקסט וקובץ אודיו אל DNA ואף לחלץ את המידע לאחר מכן, בצורה טובה יותר מבעבר

מקור: Flickr, cc-by JohnGoode

מקור: Flickr, cc-by JohnGoode

עד היום, הסתפקנו בהתקני USB, כוננים חיצוניים וטכנולוגיית ענן על מנת לשמור את המידע שלנו ולגשת אליו בכל רגע שרצינו. אך לצד הפיתוחים הטכנולוגיים הללו, קיים אמצעי האחסון הגדול והעתיק ביותר – מולקולת ה-DNA. מדובר במולקולה המכילה בתוכה את כל המידע התורשתי הקיים בכל האורגניזמים החיים על גבי כדור הארץ הכוללים לא רק את בני האדם והחיות, אלא גם חיידקים, נגיפים וכדומה.

כיום, מחקרים רבים בודקים את גבולות המולקולה המדוברת במטרה להפוך אותה לאמצעי אחסון קטן מבחינה פיזית, אך ענק מבחינת כמות החומר שיכולה להכיל. כעת, מחקר חדש שהתפרסם באתר Nature מציג חוקרים שהצליחו לקודד 5.2 מיליון ביטים של מידע אל מחרוזות DNA שכללו תמונה צבעונית, קובץ MP3 וקבצי טקסט.

משנים את הרצף

ה-DNA מורכב מארבע אבני בניין בסיסיות המחולקות לשני זוגות קבועים, כאשר כל אחד מהם מורכב מפורין ופירימידין, היוצרים ביניהם קשרי מימן. אדנין (A) וגואנין (G) הם פורינים, ואילו תימין (T) וציטוזין (C) הם פירימידינים. אלפים עד מיליארדים של זוגות בסיסיים כאלה מרכיבים את ה-DNA ויוצרים סליל כפול, כאשר סליל זה ארוז בצורה קומפקטית ודחוסה ביותר, במבנה של מארזים המכונים כרומוזומים.

עד היום, במאמצים להפיכת DNA לאמצעי לאחסון מידע השתמשו מרבית החוקרים באבן בניין אחת (TTTT), והיה מדובר במקור הגדול ביותר לשגיאות. במסגרת המחקר הנוכחי, החליטו החוקרים לשנות את אופן הקידוד ולהשתמש באחת מאבני הבניין הנוספות על מנת לשבור את הרצף הארוך, ובכך למעשה להמנע מהשגיאות הנפוצות. לשם המחשה, A,T ו-C משמשים להצפנת מידע בעוד ש-G מיועד לייצוג של “עוד מאותו הדבר”, כלומר עוד מאותה האבן שהשתמשנו בה עד עכשיו.

כך, במקום הרצף TTTT, יכולים החוקרים ליישם את הרצף החדש TTGT, שלמעשה מהווה ארבע פעמים את האות T אך בקידוד שונה. האלמנט היחיד שחשוב בצורת הקידוד החדשה, הוא שאסור להשתמש ביותר משתי אבני בניין בסיסיות בשורה אחת – כלומר, הרצף TTGT הוא אפשרי, בעוד שרצף כגון TTGA הוא אינו בר יישום.

בעוד שהמידע הנמצא על גבי מחשבים הוא בינארי, החוקרים המירו את המידע לדיאגרמות תלת מימדיות אליהן הצליחו לקודד מידע רב, שכלל את 154 הסונטות של שייקספיר, קובץ PDF שהכיל מחקר מדעי, תמונה של המעבדה בה חלקם עובדים וקובץ MP3, שהכיל חלק מנאומו המפורסם של מרטין לותר קינג, I Have a Dream. החוקרים הוסיפו למידע גם את האלגוריתם בו השתמשו על מנת להפוך את המידע הבינארי לדיאגרמה תלת מימדית.

לאחר ששלפו את המידע בחזרה מה-DNA, קודדו את התוצאות לטכניקות הקידוד החדשות אותן הציגו וחילקו לחתיכות, על מנת שיהיה קל יותר להרכיב אותן מחדש. כל חתיכה הגיעה עם מידע זוגיות (כלומר, לאיזה חלק היא מתחברת על מנת למשוך את המידע בצורה הנכונה), ID אישי ונתונים אודות הרצף המדובר, כגון כמה אותיות או מילים הוא מכיל.

התוצאות היו משמחות, והחוקרים גילו כי יכולים לחבר את הקבצים בדרכים שונות ולהגיע לתוצאות טובות ונכונות בחלק נרחב מן הפעמים, עם אחוזי שגיאה נמוכים במיוחד. כעת, החוקרים עובדים על מנת להבין מהיכן הגיעו השגיאות המדוברות – וברגע שיצליחו לפצח את התשובה, למעשה יגיעו לפתרון הצפנה ישים וטוב משמעותית מאלה שהיו קיימים עד היום בשוק.

מקור: Nature

מקור: Nature

גמיש ומוכן לפעולה

את הקידודים הללו ביצעו החוקרים בגרמניה, לאחר שהעבירו את ה-DNA תהליך ייבוש ואחסנו אותו בטמפרטורות נמוכות ובסביבה יבשה, על מנת לשמור עליו לאורך זמן. להערכתם, נפח האחסון שמציע ה-DNA עומד על כ-2.2 פטאבייטס לגרם (ולשם השוואה, 1 פטאבייט שווה ל-1 מיליון ג’יגהבייט), כך שמדובר על אמצעי אחסון שלא רק יכול לשמור על נתחי מידע גדולים במיוחד, אלא גם לאורך זמן ממושך, העומד על למעלה מ-500 שנים.

אך גם במידה ומדובר על תהליך שיתבצע בצורה אוטומטית ובעלות מינימלית, השאלה המתבקשת היא האם אכן מדובר על דרך חסכונית או הגיונית לשמירת מידע? כרגע, החוקרים מסבירים כי התשובה היא עדיין לא, אך במידה והטכנולוגיה תמשיך להתפתח בקצב הנוכחי, יקחו רק מספר עשורים עד שנוכל להגיע לאחסון מבוסס DNA שיהיה הגיוני ונפוץ לכל מי שמעוניין לשמור מידע לכ-50 שנים.

החוקרים מוסיפים כי גם במידה ובסופו של דבר ניישם שיטות אחרות לקרוא או להרכיב את המידע הנמצא על גבי ה-DNA, הוא תמיד יהיה זמין. במילים אחרות, אם לא נהיה מסוגלים לקרוא את המידע הנמצא על גבי ה-DNA, כלומר, במידה והוא ישתנה בצורה כה קיצונית שנצטרך להתחיל מחדש את כל המחקרים והבדיקות על מנת לחלץ ממנו את המידע, כנראה שאנחנו עומדים בפני בעיות הרבה יותר גדולות מאיבוד כמה תמונות, קבצי טקסט או שירים.

חן אידן

אוהבת גאדג'טים, אפליקציות ואת עולם הטכנולוגיה בכלל. שלל עיסוקיה כוללים הריסת מכשירים סלולריים לצרכי בדיקה, התעסקות בלתי פוסקת ברשתות חברתיות, סקירת אפליקציות חדשות, סטארטאפים מבטיחים והתנסות עם (כמעט) כל מוצר חדש שיוצא לשוק.

הגב

1 תגובה על "אחסון חדש: תמונה, טקסט וקובץ אודיו על גבי DNA"

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 

* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.

סידור לפי:   חדש | ישן | הכי מדורגים
גבי גפן
Guest

עוד עשרות שנים יכניסו בגרגר מלח 100 פטאבייט..

wpDiscuz

תגיות לכתבה: