天天看點

微軟拟用DNA存儲資料:一段就能頂一個資料中心

5月24日消息,據technologyreview報道,微軟公司旗下研究院的研究人員表示,在早期利用nda存儲電影和文檔的研究基礎上,該公司正在研發利用生物學取代錄音帶驅動器的存儲裝置。

微軟研究院的計算機架構師表示,該公司已經正式制定了一個目标,即在2020年之前,在資料中心内建立一個以dna為基礎的操作存儲系統。微軟研究院架構師道格·卡米(doug carmean)說:“我們希望3年内實作這樣的願景,即在原始商業系統中的dna上存儲相當于1個資料中心的資料量。”卡米還描述了最終裝置的大小,它與20世紀70年代的施樂影印機差不多。在内部,微軟懷有更宏偉的目标,即利用生物學取代錄音帶驅動器,這是一種用于歸檔資訊的通用格式。卡米說:“我們希望把它命名為‘dna存儲'。”

這些計劃表明,許多科技公司正嚴肅地對待這個看似奇怪的想法,希望将視訊、照片或有價值的文檔儲存在基因構成的分子中。semiconductor research corporation首席科學家維克多·日爾諾夫(victor zhirnov)表示,努力增加計算機記憶體依然存在實體極限,而dna卻擁有令人難以置信的密度,可用其存儲資料。

在dna中,每部電影都被壓縮到比方糖更小的體積。日爾諾夫說:“dna是宇宙中已知最密度最高的存儲媒體,這就是為什麼人們會看重這種研究潛力的原因,我們正在解決存儲資訊呈現指數增長的問題。”去年七月份,微軟公開宣稱它在dna鍊中儲存了200兆位元組的資料,其中包括一段音樂視訊,創下了新的記錄。卡米與微軟研究院專家卡琳·斯特勞斯(karin strauss)、華盛頓大學計算機實驗室科學家路易斯·塞澤(luis ceze)在預印伺服器biorxiv上發表論文,介紹了他們取得的進展。

利用dna存儲資料的主要障礙仍然存在,将數字位轉換成dna編碼(由a、g、c和t組成的核苷酸鍊)仍然費力而昂貴,因為制造dna鍊需要漫長的化學過程。在其示範項目中,微軟使用了13448372個獨特的dna片段。專家表示,在公開市場上購買這些材料要花80萬美元。哥倫比亞大學研究dna存儲方法的教授雅尼弗·埃裡奇(yaniv erlich)說:“用dna存儲資料的主要問題是成本高昂,是以微軟方案最重要的地方是其是否能解決這個問題”。在閱讀卡米等人的論文後,埃裡奇說:“我沒有看到幫助實作這個目标的任何進展,但也許他們還有更多新東西。”

微軟表示,dna存儲成本需要下降10000倍後才可能被廣泛采用。雖然許多專家認為這是不可能的,但微軟堅信這種進步可能會發生,前提是計算機行業需要它。将數字資料寫入dna的過程自動化也是至關重要的。根據數周的實驗顯示,卡米估計向dna中轉存資料的速率是每秒400位元組。微軟表示,這個速度需要增加到每秒100兆位元組。

讀取資料變得越來越容易,通過使用高速測序機就可實作,包括召回檔案的特定部分,類似于計算機上的随機存取存儲器。微軟認為,如果dna閱讀獲得兩倍改進,就能促使該系統的效率滿足商業用途。由于寫入和檢索資料到dna中非常緩慢,任何早期使用的技術将僅限于特殊情況。這可能是因為需要存檔的資料存在法律或監管原因,如警察機構的cam視訊或醫療記錄。

微軟目前正與位于舊金山的dna制造商twist bioscience合作,後者是新成立的公司,緻力于提高dna産量。除twist bioscience之外,其他類似公司還包括dnascript、nuclera nucleics、evonetix、molecular assemblies、catalog dna、helixworks以及從oxford nanopore剝離出來的genome foundry。

有些初創公司正追求令人興奮的願景,即用一種使用酶的dna代替40年的化學反應過程,就像我們自己的身體那樣。technicolor research的科學主管讓·伯洛特(jean bolot)說:“我相信今年會看到結果。”他的公司始終在與電影公司讨論如何用dna存儲。他說,1951年之前的半數電影因為存儲在電影膠片上而丢失。現在有了新的格式,如高清視訊和虛拟現實,正在擴大工作室儲存這些作品的能力。

日爾諾夫表示,計算機晶片制造商非常看重dna存儲技術,因為傳統媒介(如錄音帶或硬碟)存儲資料總是存在實體限制。日爾諾夫所在的機構由微軟、英特爾以及其他機構資助,他們正進行應用研究,并從2013開始開始瞄準dna。他說,認為dna太“軟”的半導體專家們驚訝地發現,它比矽器件長100到1000倍。這種分子非常穩定,經常可以從猛犸象骨頭和遠古人類遺骸中提取到。

但其最重要的特征是高密度性。dna可以在1立方毫米的片段上容納100億億位元組資訊。日爾諾夫說“密度才是最重要的”。微軟研究院發言人表示,該公司目前無法确認“産品計劃的具體細節”。在公司内部,dna存儲的想法顯然得到許多人支援,但尚未被普遍接受。卡米說:“我們内部的人相信我們,但支援錄音帶存儲的人還存在懷疑。”

除了質密耐用外,dna存儲還有其他不被經常提到優勢,即與人類物種的極端相關性。想想那些你已經無法讀取的舊軟碟或難以辨認出象形文字的粘土片。與這些媒介不同的是,dna永遠不會過時。卡米表示:“隻要我們依然是人類,我們永遠都能讀取dna。”

本文轉自d1net(轉載)