要說信息存儲,沒有一樣比得過DNA。人們很早就覬覦我們自身的基因代碼存儲數據的潛力,但如何將信息編碼進DNA遺傳物質再如何解讀出來,一直是個難題
近日,哈佛大學維斯生物工程研究所的一群研究人員嘗試將一本大約有5.34萬個單詞的書籍編碼到不到一沙克(億萬分之一克)的DNA微芯片中,連同文字一起的還有11張圖片和一段Java程序。這是迄今為止人類使用DNA遺傳物質儲存數據量最大的一次實驗。“今后,拇指大小的設備就能存下整個互聯網的信息。”該項目首席研究員、哈佛大學遺傳學家喬治·丘奇(George Church)說,被編碼進DNA的書正是他的大作《再生:合成生物學將如何改變未來的自然和自己》。
這項實驗被刊登在《科學》期刊上。但因編碼存儲和讀取過程太過昂貴,DNA存儲離商業化還有一段距離。“隨著DNA合成、測序價格的不斷下降,這或許將成為長期存儲數據的一種選擇。”哈佛大學生物學教授可蘇里(Sriram Kosuri)說。這一實驗,或許為解決未來社會爆炸性的大數據存儲指明了方向。
從二進制到堿基對編碼
DNA是生物數據庫,它的主要功能就是存儲包含各種指令的生物信息。DNA有G(鳥嘌呤)、T(胸腺嘧啶)、A(腺嘌呤)、C(胞嘧啶)四種堿基,共同構成了相互纏繞的雙鏈階梯狀的螺旋結構。通過這四種堿基不同順序的編碼,存儲了生物所有的遺傳信息。
現代計算機技術奠基者之一馮·諾依曼曾在1948年提出“自動復制機器”的設想:一個能夠自我繁殖的系統,不僅能夠構建某個組成元素,結構和自己一致的下一代,也能夠把對自身的描述傳遞給下一代,如此往復。……