樊春海:DNA大數(shù)據(jù)存儲,讓IT-BT交融迸發(fā)出無限潛力 | 我的遠(yuǎn)見(1)


樊春海:DNA大數(shù)據(jù)存儲,讓IT-BT交融迸發(fā)出無限潛力 | 我的遠(yuǎn)見(1)
我的遠(yuǎn)見
在當(dāng)下眺望未來,你看見了什么?
樊春海:現(xiàn)在的證據(jù)越來越多證明,21世紀(jì)可能是生物技術(shù)和信息技術(shù)交叉融合的世紀(jì)——這就是我的遠(yuǎn)見。
交大安泰EMBA20 周年之際,正式聯(lián)合每日經(jīng)濟(jì)新聞共同推出“我的商學(xué)之路·我的遠(yuǎn)見”系列策劃。邀請海內(nèi)外知名的學(xué)者、專家以自己專業(yè)的視角共同為中國未來的社會經(jīng)濟(jì)發(fā)展、行業(yè)動態(tài)把脈。唯有遠(yuǎn)見未來才能更好的立足當(dāng)下。
在2022年9月23日的交大安泰EMBA20周年暨安泰視界年度峰會上,中國科學(xué)院院士、上海交通大學(xué)化學(xué)化工學(xué)院院長樊春海給我們講述了一個關(guān)于用DNA存儲海量數(shù)據(jù)的神奇故事,描繪了一個生物技術(shù)與信息技術(shù)交融發(fā)展的美好未來。
樊春海
中國科學(xué)院院士
上海交通大學(xué)化學(xué)化工學(xué)院院長
人物簡介
你還記得嗎?1994年,比爾蓋茨坐在33萬紙上,對全世界發(fā)布,我們現(xiàn)在有了“光盤”。一張光盤能夠記錄的內(nèi)容,也就33萬張紙,這在當(dāng)時來講應(yīng)該是非常具有震撼性的廣告效應(yīng),也就是我們電子存儲是具有如此強(qiáng)大的能力。你發(fā)現(xiàn)了嗎?身處在信息爆炸的時代,人類每時每刻都在產(chǎn)生著海量數(shù)據(jù)信息。為了存儲它們,我們現(xiàn)在到處都在建設(shè)數(shù)據(jù)中心。這些數(shù)據(jù)中心要在靠近山邊、水邊的地方,占用了大量的土地和能源。你會相信嗎?未來有一天,我們有可能拿著一管DNA說:“看,我們這里面存儲著全世界的所有數(shù)據(jù)!”
數(shù)據(jù)存儲需要一場“綠色革命”
從原始人的結(jié)繩記事,到造紙術(shù),再到電子信息時代的數(shù)據(jù)存儲,信息存儲方式的變革,從一個角度反映了人類社會的文明發(fā)展史。
信息時代來臨時,我們曾相信:電子信息來存儲,似乎解決了所有存儲問題。然而,當(dāng)我們真正進(jìn)入一個數(shù)據(jù)爆炸的時代,我們逐漸發(fā)現(xiàn):僅憑電子信息來存儲數(shù)據(jù),滿足不了我們的需求了。
樊春海院士告訴了我們一組數(shù)據(jù):2020年全世界的數(shù)據(jù)是44個ZB(440萬億億字節(jié))?!鞍堰@些數(shù)據(jù)存下來,光耗的電就是一個三峽大壩所產(chǎn)生的電。這個數(shù)據(jù)還在不斷增長,到2025年預(yù)計是175ZB,而且里面80%-90%是很少被調(diào)用的冷數(shù)據(jù)?!?/p>
這些所謂冷數(shù)據(jù),就是像圖書館的圖書一樣,我們需要把它存在那兒,不能讓它毀滅??墒?,日常工作生活中我們又很少去用它,一年可能都用不上一次。存儲它們不僅需要耗能、占地,而且由于數(shù)據(jù)電子存儲的壽命只有十年到幾十年,時間到了就需要重新更新迭代一次。
所以,在這種情境下,信息存儲越來越成為一個重大的國家戰(zhàn)略級的需求。不僅存儲消耗能源巨大,傳輸也越來越成為一個問題。
“1969年阿波羅登月計劃的時候,當(dāng)時存儲介質(zhì)是紙,也就是1人高這么多的數(shù)據(jù),”樊春海院士舉例對比:“到2019年,我們可能都知道人類第一次觀察到了黑洞,把黑洞的圖片傳回來,存儲這些數(shù)據(jù)的硬盤加起來有半噸重,沒有辦法通過網(wǎng)絡(luò)來傳輸,只能通過飛機(jī)來運輸?!?/p>
也正因如此,現(xiàn)有基于硅的存儲方式,不僅存在高成本、高能耗、壽命短的問題,相對來說遷移起來也很麻煩。現(xiàn)有的數(shù)據(jù)存儲架構(gòu),越來越難以滿足數(shù)據(jù)日益爆發(fā)性增長的趨勢。這時候,迫切需要一場“綠色革命”。
基因測序從理想變?yōu)楝F(xiàn)實
在人類不斷生產(chǎn)出海量信息的同時,我們對于生命的理解也更加深刻。在過往幾十年里,人類探索生命奧秘最重要突破之一,就是對DNA的更深入理解。
“DNA就是我們生命的密碼。我們知道DNA由4種堿基組成,遵循非常簡單的配對規(guī)則,我們有時候會稱為叫華生-克里克配對原則。就是4個堿基分成兩組,A一定是跟T配對,G一定是跟C配對?!?/p>
樊春海院士這樣科普到:“在我們細(xì)胞里,每時每刻都有這樣一個的過程:DNA雙列進(jìn)入到聚合酶的蛋白質(zhì)的孔洞里,就像一個復(fù)印機(jī)一樣,可以說是一個最精確的自然界產(chǎn)生的納米復(fù)印機(jī)。當(dāng)DNA復(fù)制達(dá)到一定量后,細(xì)胞開始分裂,一個細(xì)胞分成兩個細(xì)胞,兩個細(xì)胞分成四個細(xì)胞,逐漸變成組織、器官,到植物、動物、人……這就是我們所說的生物學(xué)遺傳分子機(jī)制?!贝蠹覍ι鲜兰o(jì)末的人類基因組計劃耳熟能詳。人類基因組計劃的目的,是把我們的遺傳物質(zhì)DNA序列測定下來。什么叫測定序列?就是把ATGC4個字母排列組合給確定下來。經(jīng)過幾代全世界科學(xué)家的努力,這終于變成了一個現(xiàn)實。更重要的是,當(dāng)時測一個人的基因,要花幾十億美元。而現(xiàn)在對于全世界最強(qiáng)的測序公司來說,只要一天時間,花費一兩千塊錢的成本,就可以把一個人的基因檢測出來?,F(xiàn)在,全世界基因測序的市場規(guī)模已經(jīng)達(dá)到100多億美元。不僅如此,我們還可以把古人類、古生物的基因組序列測出來。比如我們通過檢測70萬年前野馬化石的基因組信息,了解70萬年前的野馬有哪些生物學(xué)特性。
DNA如何存儲數(shù)據(jù)信息?
虛擬世界、計算世界或者說現(xiàn)在的元宇宙,它的背后是兩個數(shù)字——1和0在跳動。而在我們生物學(xué)生命的世界里,實際上背后是ATGC這4個字母在跳動。人類基因組計劃所測出來的一本“天書”,實際上就是4個字母的排列。
從這個意義上講,或者說我們從信息論的角度來看,實際上生命世界跟虛擬世界,可以說是等價的,無非一個是二進(jìn)制,一個是四進(jìn)制。也就是說,DNA分子就是這樣一些由ATGC4個字母組成的,可以編碼的分子信息材料。
既然DNA里面的ATGC是四進(jìn)制,計算機(jī)里面就是二進(jìn)制1和0,兩者在信息上等價的。那么,是不是可以用DNA來存儲計算機(jī)的信息呢?
樊春海院士介紹到,DNA存儲無非就是把數(shù)據(jù)1和0的二進(jìn)制變成ATGC四進(jìn)制的編碼過程。通過一系列的生化反應(yīng),把數(shù)據(jù)給存下來、讀出來,再通過數(shù)據(jù)解碼,變成1和0,跟計算機(jī)系統(tǒng)對接起來?!?988年,有科學(xué)家證明DNA可以用來存儲信息,但是在當(dāng)時并沒有引起很多人的關(guān)注,后面有一系列的進(jìn)展,包括哈佛大學(xué)的研究表明DNA可以用來存儲一本書,在科學(xué)界都有一定的影響,但是沒有引起社會上的震動?!?/p>
樊春海院士談到,因為在當(dāng)時,電子存儲是足夠用的,大家并不需要這樣一個聽起來很突破性、很怪異的方法來存儲。但隨著信息爆炸時代的來臨,電子存儲的瓶頸越來越明顯?!坝谑牵肈NA來存儲,這件聽起來比較怪的事情,實際上已經(jīng)受到了國內(nèi)外的普遍重視?!?/p>
據(jù)樊春海院士介紹,在科學(xué)雜志《Science》提到的未來人類的125個科學(xué)問題中,關(guān)于信息科學(xué)里面4個問題其中之一,就是DNA能否用作信息存儲的介質(zhì)。而在我們國家的“十四五”科技規(guī)劃,就已經(jīng)把它列入需要加快布局的幾個前沿技術(shù)之一。
IT與BT交融的世紀(jì)來臨
那么,用DNA來存儲數(shù)據(jù),將生物材料用到信息技術(shù)里,究竟會帶來怎樣的變革?
“推算一下可以知道,通過50克DNA,可以存下1千萬盤硬盤的信息??梢酝ㄟ^DNA存儲,把數(shù)據(jù)存儲的容量極限提升7個數(shù)量級,”樊春海院士列了一組數(shù)據(jù):“這樣推算下來,全世界440萬億的字節(jié),只要200公斤DNA就可以存下來,這就解決了大問題?!?/p>
也就是說,DNA存儲帶來了一種密度高、能耗非常低、壽命非常長的存儲模式。壽命能夠長到什么程度?“類似于剛才所說的70萬年前的野馬化石DNA信息,不僅可以存百年、萬年,甚至有可能存到幾十萬年、百萬年。相對于硅基電子存儲只能存幾十年來說,有著巨大的進(jìn)步。”他說。
“2019年我們國家信息存儲的市值將近5000億元,預(yù)計到2025年,我們國家將成為全世界最大的數(shù)據(jù)城?!痹诜汉T菏靠磥?,來自醫(yī)療、金融、互聯(lián)網(wǎng)等等各行各業(yè)大量的數(shù)據(jù),都有可能成為供DNA來存儲的一些需求。
“DNA信息存儲應(yīng)該說目前還在起步階段?!睋?jù)他預(yù)測,預(yù)期到2024年,將有30%的數(shù)字業(yè)務(wù)有可能是用DNA存儲來實現(xiàn),從而解決現(xiàn)在指數(shù)級增長的數(shù)據(jù)存儲問題?!拔覀兩虾=煌ù髮W(xué)成立了DNA存儲研究中心,希望在這個過程當(dāng)中,能夠發(fā)揮獨特的作用?!?/p>
據(jù)樊春海院士介紹,DNA數(shù)據(jù)存儲是典型的信息技術(shù)和生物技術(shù)交融的產(chǎn)業(yè),其中不僅包含有信息、大數(shù)據(jù)和人工智能技術(shù),也包括合成生物學(xué)、基因測序等生物學(xué)技術(shù)。只有技術(shù)的交融,才有可能產(chǎn)生這樣一個偉大的事情。
“在上個世紀(jì),我們經(jīng)常會聽到這樣的爭論——21世紀(jì)到底是IT(信息技術(shù))的世紀(jì)還是BT(生物技術(shù))的世紀(jì)?現(xiàn)在的證據(jù)越來越多證明,21世紀(jì)可能是生物技術(shù)和信息技術(shù)交叉融合的世紀(jì)?!狈汉T菏空f。
來源:每日經(jīng)濟(jì)新聞
責(zé)任編輯:葉睿雋
審核:徐靜
(本文轉(zhuǎn)載自上海交通大學(xué)安泰經(jīng)濟(jì)與管理學(xué)院 ,如有侵權(quán)請電話聯(lián)系13810995524)
* 文章為作者獨立觀點,不代表MBAChina立場。采編部郵箱:news@mbachina.com,歡迎交流與合作。
備考交流

掃碼關(guān)注我們
- 獲取報考資訊
- 了解院校活動
- 學(xué)習(xí)備考干貨
- 研究上岸攻略
最新動態(tài)
推薦項目
活動日歷
- 01月
- 02月
- 03月
- 04月
- 05月
- 06月
- 07月
- 08月
- 09月
- 10月
- 11月
- 12月
- 07/03 預(yù)約席位 | 7月3日交大安泰EMBA招生說明會
- 07/05 最高可獲得2萬元獎學(xué)金| 上理管院專業(yè)學(xué)位項目2026聯(lián)合招生發(fā)布會&MBA/MPA/MEM職業(yè)賦能工坊第三期開放申請中!
- 07/05 財務(wù)人必修的戰(zhàn)略思維課|復(fù)旦MPAcc公開課報名
- 07/05 財務(wù)人必修的戰(zhàn)略思維課|復(fù)旦MPAcc公開課報名!
- 07/05 【預(yù)告| 7.5北大國發(fā)院EMBA體驗日】“導(dǎo)師·同學(xué)共話會” 邀您走進(jìn)北大承澤園
- 07/05 上海場 | 清華-康奈爾雙學(xué)位金融MBA項目上海場公開課暨招生說明會誠邀您參與!
- 07/05 上海交大MTT招生開放日
- 07/05 鄭州活動預(yù)告 | 7月5日交大安泰MBA全國巡展即將來到中原大地,招生政策、考生激勵、項目生態(tài)一場活動全掌握!
- 07/05 海π智鏈 商道新生 | 2026東華大學(xué)MBA/EMBA/MPAcc/MEM/MF/MIB培養(yǎng)體系煥新發(fā)布會即將啟幕!
- 07/05 活動報名 | 7月5日深圳招生直通車,15年零售餐飲O2O行業(yè)學(xué)長以夢為馬,為何選擇交大安泰MBA?