龜甲、宣紙、磁帶、硬盤……
數(shù)據(jù)怎么存、存在哪
始終是人們孜孜以求的問題
時(shí)代變遷,社會(huì)發(fā)展
我們的生活每天都在產(chǎn)生海量數(shù)據(jù)
傳統(tǒng)硅基材料
難以滿足日益增長(zhǎng)的數(shù)據(jù)存儲(chǔ)需求
北京大學(xué)張成、錢瓏團(tuán)隊(duì)
與合作者另辟蹊徑
以表觀修飾作為存儲(chǔ)介質(zhì)
通過分子信息并行寫入實(shí)現(xiàn)信息存儲(chǔ)
為這道難題提出新的解法
10月23日
團(tuán)隊(duì)研究成果已發(fā)表于Nature
△研究成果已正式發(fā)表于Nature
1公斤便可“裝下”全世界
2024年10月23日,北京大學(xué)計(jì)算機(jī)學(xué)院張成與定量生物學(xué)中心錢瓏聯(lián)合研究團(tuán)隊(duì)與合作者,在國際學(xué)術(shù)期刊Nature上發(fā)表題為“Parallel molecular data storage by printing epigenetic bits on DNA”的研究論文,首次提出了一種基于并行寫入策略的DNA存儲(chǔ)策略,成功將信息打印在DNA分子之上,猶如“活字印刷”,在白紙上批量印刷信息。團(tuán)隊(duì)在實(shí)驗(yàn)中,成功將中國漢代“白虎”瓦當(dāng)和大熊貓的高清圖片(數(shù)據(jù)量超過27.5萬比特)寫入DNA分子中,并無損還原了原始數(shù)據(jù),解析出高清圖片。
DNA具有超高存儲(chǔ)密度,僅1克DNA就足以存儲(chǔ)1000萬小時(shí)高清視頻數(shù)據(jù);1公斤DNA,便可以裝下全世界數(shù)據(jù)。此外,如果避免潮濕和紫外線照射,DNA可以保存數(shù)十萬年之久,擁有超長(zhǎng)壽命。相比之下,硬盤往往需要每隔幾年更換一次以防止數(shù)據(jù)損壞。因此,DNA顯示出作為顛覆性存儲(chǔ)介質(zhì)的巨大潛力。
然而,傳統(tǒng)DNA存儲(chǔ)依賴“從頭合成”的信息寫入路線,在成本和速度上面臨著“速度慢”“易出錯(cuò)”“價(jià)格貴”的多重巨大挑戰(zhàn)。不同于傳統(tǒng)技術(shù)路線,張成-錢瓏聯(lián)合團(tuán)隊(duì)開發(fā)的“表觀比特(epi-bit)”DNA存儲(chǔ)技術(shù),利用預(yù)制的DNA模板和“分子活字塊”,通過DNA自組裝介導(dǎo)的分子信息排版,經(jīng)選擇性酶促甲基修飾轉(zhuǎn)移,實(shí)現(xiàn)了“活字印刷”,達(dá)到分子級(jí)“信息打印”的目的。
該技術(shù)不依賴于主流的“從頭合成”寫入路線原理,通過DNA自組裝與選擇性酶促甲基化(DNA分子的一種表觀遺傳修飾)的組合原理,無需合成,就像在紙上印刷文字。首先,研究團(tuán)隊(duì)設(shè)計(jì)并預(yù)制通用的單鏈DNA載體和互補(bǔ)短單鏈DNA“文字庫”。然后,通過將“文字庫”裝到DNA載體的相同加載序列上,任意表觀比特信息就得以被排版。接下來,堿基修飾(5-甲基胞嘧啶)通過酶的選擇性甲基化以并行的方式穩(wěn)定地“打印”在DNA載體上,一場(chǎng)精密、高效的“分子印刷術(shù)”就大功告成了。
這種被稱為“表觀比特”類似于傳統(tǒng)的比特,以兩個(gè)二進(jìn)制數(shù)值中的一個(gè)(0或1)來存儲(chǔ)信息,對(duì)應(yīng)堿基是否甲基化。研究團(tuán)隊(duì)通過使用有限的700種DNA活字和5個(gè)模板進(jìn)行編程,在自動(dòng)平臺(tái)上實(shí)現(xiàn)了約27.5萬個(gè)比特的免合成寫入,每個(gè)反應(yīng)的寫入輸出為350比特,遠(yuǎn)超過去依賴DNA從頭合成的數(shù)據(jù)存儲(chǔ)系統(tǒng)每個(gè)反應(yīng)約僅1比特的輸出量,實(shí)現(xiàn)了重大突破。
同時(shí),這一研究還成功實(shí)現(xiàn)了個(gè)人定制DNA存儲(chǔ)示例,證明了便捷的分布式DNA存儲(chǔ)應(yīng)用潛力。該方法的建立,不僅為實(shí)現(xiàn)了快速、低成本的大規(guī)模分子數(shù)據(jù)存儲(chǔ)奠定了技術(shù)基礎(chǔ),還為未來DNA存儲(chǔ)的發(fā)展提供了全新思路。
基于表觀比特條碼的高位并行大規(guī)模存儲(chǔ)示意
“這項(xiàng)技術(shù)的核心突破在于,我們能夠通過預(yù)制的DNA模板和活字塊,在分子底層以排版的方式打印epi-bit信息,實(shí)現(xiàn)分子數(shù)據(jù)的精確并行寫入,進(jìn)而完成大規(guī)模并行DNA存儲(chǔ)?!闭撐耐ㄓ嵶髡?、北京大學(xué)研究員張成介紹說,“與傳統(tǒng)DNA數(shù)據(jù)存儲(chǔ)方法相比,這種活字印刷并行寫入方式僅需有限數(shù)量的預(yù)制DNA分子,從而避免了復(fù)雜繁瑣DNA序列編碼過程,不僅大幅降低分子信息寫入復(fù)雜度,還能降低成本,提高操控靈活性?!?/p>
把照片“存在”DNA里
團(tuán)隊(duì)在實(shí)驗(yàn)中,將中國漢代“白虎”瓦當(dāng)和國寶大熊貓“飛云”的高清圖片成功寫入DNA分子中,數(shù)據(jù)量超過27.5萬比特,相比此前發(fā)表的其他非傳統(tǒng)DNA存儲(chǔ)技術(shù),數(shù)據(jù)規(guī)模提升超過300倍。這些信息讀取使用便攜式納米孔測(cè)序儀,實(shí)現(xiàn)了對(duì)DNA模板上復(fù)雜表觀比特信息的高通量讀取,并通過單次超240種不同修飾模式的并行解析,無損還原了原始數(shù)據(jù),解析出高清圖片,真正有望實(shí)現(xiàn)“經(jīng)典永流傳”。實(shí)驗(yàn)結(jié)果驗(yàn)證了該創(chuàng)新型分子存儲(chǔ)技術(shù)的可行性和準(zhǔn)確性,還展示了表觀比特的穩(wěn)定性。
值得關(guān)注的是,團(tuán)隊(duì)還展示了這項(xiàng)技術(shù)的分布式存儲(chǔ)應(yīng)用潛力。在個(gè)人定制DNA存儲(chǔ)實(shí)驗(yàn)中,邀請(qǐng)了北京大學(xué)、華北電力大學(xué)等單位60名背景廣泛的青年志愿者,由他們?cè)谌粘-h(huán)境下,將私人數(shù)據(jù)親手寫入DNA并由個(gè)人保存。這些數(shù)據(jù)直到使用時(shí)才被讀取,可有效保障個(gè)人數(shù)據(jù)的隱私與安全。這種分布式DNA存儲(chǔ)方式,不僅能極大降低DNA存儲(chǔ)的使用門檻,且保障了數(shù)據(jù)隱私,有望推動(dòng)DNA存儲(chǔ)的個(gè)人應(yīng)用。
表觀比特DNA存儲(chǔ)原理流程和實(shí)驗(yàn)結(jié)果
從二進(jìn)制數(shù)據(jù)到DNA數(shù)據(jù),從從頭合成到并行寫入,從DNA存儲(chǔ)池到細(xì)胞存儲(chǔ),從二代測(cè)序到納米孔測(cè)序……在多維技術(shù)的突破性革命與融會(huì)貫通下,誕生了如今的表觀比特DNA存儲(chǔ)框架,這一框架為大規(guī)模數(shù)據(jù)存儲(chǔ)提供了全新的解決方案,有望突破DNA存儲(chǔ)的成本和速度壁壘。此項(xiàng)技術(shù)的開發(fā),還展現(xiàn)了非傳統(tǒng)分子比特在數(shù)據(jù)存儲(chǔ)中的獨(dú)特優(yōu)勢(shì),為未來新型分子信息處理系統(tǒng)的研發(fā)奠定了堅(jiān)實(shí)的基礎(chǔ)。
“在DNA這張白紙上批量打印信息,代表著DNA存儲(chǔ)技術(shù)的重要突破與革新。”論文通訊作者、北京大學(xué)研究員錢瓏表示,“可預(yù)見的是,在未來,無論身處何時(shí)何地,我們都將無需依賴大型實(shí)驗(yàn)儀器,就能實(shí)現(xiàn)簡(jiǎn)單、準(zhǔn)確、高效的DNA數(shù)據(jù)存儲(chǔ)?!?/p>
① 凡本站注明“稿件來源:中國教育在線”的所有文字、圖片和音視頻稿件,版權(quán)均屬本網(wǎng)所有,任何媒體、網(wǎng)站或個(gè)人未經(jīng)本網(wǎng)協(xié)議授權(quán)不得轉(zhuǎn)載、鏈接、轉(zhuǎn)貼或以其他方式復(fù)制發(fā)表。已經(jīng)本站協(xié)議授權(quán)的媒體、網(wǎng)站,在下載使用時(shí)必須注明“稿件來源:中國教育在線”,違者本站將依法追究責(zé)任。
② 本站注明稿件來源為其他媒體的文/圖等稿件均為轉(zhuǎn)載稿,本站轉(zhuǎn)載出于非商業(yè)性的教育和科研之目的,并不意味著贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。如轉(zhuǎn)載稿涉及版權(quán)等問題,請(qǐng)作者在兩周內(nèi)速來電或來函聯(lián)系。