DNA雙鍊片段(圖片來源:Vcpmartin/Wikimedia/CC BY-SA4.0)
你能想象在一條DNA鍊上演奏巴赫的《第一大提琴組曲》嗎?此情此景并非天方夜譚,DNA雖因過于小巧而無法承受節奏分明的撥弦與絲滑的運弓,但它是儲存音頻文件與其它媒體的強大工具。
貝克曼先進科學技術研究所(Beckman Institute for Advanced Science and Technology)的研究員、此項研究的共同作者Kasra Tabatabaei說道:“DNA是天然的原始數據存儲系統,我們能利用它儲存如圖片、視頻與音樂等各式各樣的數據。”
該機構團隊擴充了DNA的分子構成,并研發出了精确的新測序方法,使得其能夠将雙螺旋轉化為一個具有魯棒性與可持續性的數據存儲平台。該團隊的論文于2022年2月發表在《納米通訊》(Nano Letters)上。
在數字信息化時代,任何浏覽每日新聞的人都會深感世界檔案的與日俱增。紙質文件更多地被數字化存檔,以便節省空間并保護信息免受自然災害之虞。從科學家到網紅,任何需要存儲信息的人都希望從安全可持續的數據保險箱中獲益,而雙螺旋結構符合要求。
伊利諾大學香槟分校(University of Illinois Urbana-Champaign, UIUC)的研究生兼本文共同作者Chao Pan說道:“尤其是在檔案數據的存儲方面,DNA是首選之一。”
DNA的使用年限取決于其耐用性。DNA為抵禦地球最極端的條件而生,在經曆數萬年後,它們仍是可信的數據來源。科學家們能對化石中的DNA進行測序,揭示遺傳史,并為闊别已久的景象注入生機。
盡管DNA的尺寸很小,但它正如神秘博士(Dr.Who)中臭名昭著的警察亭一樣内有乾坤。五年級博士生Tabatabaei說道:“每天,互聯網都會産生數PB(注:1PB=106GB)的數據,但隻需要1克DNA就足夠儲存它們了。這就是DNA作為存儲介質的密度。”
(圖片來源:Pixabay)
DNA的另一個優點體現在其自然豐度與近乎無限的可再生性,這是當今市場上最先進的數據存儲系統都不具備的特性。如矽微芯片在成為電子垃圾報廢之前,通常僅循環數十年。
電機及計算機工程學系Franklin W.Woeltge教授兼該課題主要負責人Olgica Milenkovic說道:“我們正面臨前所未有的氣候挑戰,可持續存儲技術的重要性不容小觑。新的綠色DNA錄制技術正在萌芽,這将使分子儲存在未來變得更加重要。”展望數據存儲的未來,該跨學科團隊研究了DNA的悠久曆史,随後對雙螺旋結構注入了他們當下獨樹一幟的新元素。
(圖片來源:Pixabay)
自然情況下,每條DNA鍊中都包含四種化學物質,即腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)。它們沿雙螺旋結構排列與重排列進而産生意義,使科學家們能夠解碼或測序。研究人員在現有的四堿基序列中增添了七個合成核堿基,從而擴增了DNA既有的廣泛信息存儲容量。
Tabatabaei說道:“在英文字母表中,如果你隻有四個字母可供使用,那隻能創造這麼多單詞。而如果你有完整的字母表,你就能創造無限的單詞組合,DNA亦是如此。與将二進制轉化為A、T、C、G不同,我們将二進制轉換為A、T、C、G和七個新堿基。”
該團隊是首個采用化學修飾的核苷酸進行DNA信息存儲的團隊,成員們圍繞一個獨特挑戰進行了創新:并非所有當前的技術都能解讀化學修飾的DNA鍊。為了化解該問題,他們将機器學習與人工智能相結合,首創了一套DNA序列解讀處理方法。他們的解決方案能将化學修飾的堿基與天然堿基相區别,并将七種新堿基中的每一種都區分開來。
“我們嘗試了11種氨基酸的77種不同組合,我們的方法能完美地區分每一種。”Pan說道,“作為識别不同核苷酸方法的一部分,深度學習的框架是放之四海而皆準的,這使得我們的方法能推廣至許多其它的應用。”
這種完美的核苷酸識别來源于納米孔,它們是中間開口的蛋白質,DNA鍊能輕易地通過。值得注意的是,該團隊發現納米孔能檢測并區分DNA鍊上的每個單體單元,無論它們是天然的或是經化學修飾的。
材料科學與工程系James Economy教授兼該課題主要負責人Charles Schroeder說道:“這項工作為大分子數據存儲擴展到非天然化學物質提供了令人興奮的原理論證,這或将大幅提高非傳統存儲介質中的存儲密度。”DNA通過儲存遺傳信息創造了曆史,從本項研究來看,它也是數據存儲的未來。
作者:Jenna Kurtzweil
翻譯:哥本哈根的量子
審校:趙冰瑩
引進來源:貝克曼先進科學技術研究所
本文來自:中國數字科技館
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!