当前位置:94677奇闻网 > 未解之谜 > 手机访问:m.94677.net

一克DNA储存信息相当千亿张DVD光盘(2)

来源:www.94677.net时间:2012-09-07 17:17:54奇闻指数:编辑: 手机版

  从二进制到碱基对编码

  DNA是生物数据库,它的主要功能就是存储包含各种指令的生物信息。DNA有G(鸟嘌呤)、T(胸腺嘧啶)、A(腺嘌呤)、C(胞嘧啶)四种碱基,共同构成了相互缠绕的双链阶梯状的螺旋结构。通过这四种碱基不同顺序的编码,存储了生物所有的遗传信息。

  现代计算机技术奠基者之一冯·诺依曼曾在 1948 年提出“自动复制机器”的设想:一个能够自我繁殖的系统,不仅能够构建某个组成元素,结构和自己一致的下一代,也能够把对自身的描述传递给下一代,如此往复。后来随着生物遗传的奥妙被发现,人们意识到,DNA 双螺旋结构正是冯·诺依曼描述的自动复制机器。

  DNA里的四种碱基,两两互补成对。一个最短的DNA分子也有 4000个碱基对,可能的排列方式就有44000种。碱基对排列顺序千变万化,从而能够存储大量的遗传信息。

  向活体DNA里写入数据,有诸多困难,细胞会死亡、分裂、变异,数据内容就会发生改变。

  在本文开头提到的那项实验中,科学家们没有采用活细胞的基因组,而是采用了人工合成的DNA片段。他们用很多短的DNA序列而非长DNA序列来编码数据,这类似于硬盘写入的原理,在硬盘中,数据是被写入称为扇区的小硬盘块,这样能够降低写入和读取数据的困难和成本。科学家们将这种片段用喷墨打印机嵌入到微阵列芯片表面。接着,他们把计划写入 DNA的书里包含的信息:图片、文字、程序转化为HTML格式的文件,并将这些文件编译为由 0和1组成的电脑能够读懂的2进制数据。然后,他们将2进制数据转为四种碱基,把0转为A或 C,把1转成G或者T,并建立DNA链来维系这些编码的顺序和位置。每一个DNA片段还包含一个数字“条码”,记录它在原始文件中的位置,每个片段被合成多个拷贝以便有助于校正错误。编码完成后,这些芯片会在4摄氏度下保持三个月。

  测序就是读取数据的过程:启用DNA测序装置,将所有DNA片断中的编码按照标记顺序排列,再还原成 2 进制格式的数据。每个 DNA 片断的每一个拷贝被测序高达3000次以便校对。利用这种方式,他们将5.27兆数据中的错误降低到只有12个。这种尺寸微小的存储设备,存储密度远远高于DVD、硬盘等介质,效果也毫不逊色。
推荐文章:北纬30 中国未解之谜 海洋动物 广西柳州食人鱼

奇人奇事未解之谜世界之最奇异生物宇宙探索

本月排行

    未解之谜排行