发布时间:2021-01-27 10:21 原文链接: 将数据存到DNA里!全世界的信息只有1公斤重

  将数据存到DNA里!全世界的信息只有1公斤重

  大数据时代,我们在网络上每一个动作,比如网上冲浪、观看视频,甚至跑步、走路等日常行为,每分每秒都在产生大量数据。它们如一条条河流,汇聚成数据的汪洋大海。

  如此大量的信息如何存储?珍贵的数字记忆要如何长久可靠地保存?科学家们想到了一种方法,将数据写入活细菌的DNA中!

  最近,美国哥伦比亚大学的研究人员通过改变环境电压,引导“基因魔剪” CRISPR-Cas系统,将“hello world”翻译成碱基语言,录入大肠杆菌的DNA中。在繁衍80代以后,这些大肠杆菌体内储存的数据仍然基本完好无损。

  相关研究发表在1月11日的《自然·化学生物学》杂志。

  数据时代,存储的革新

  在地球生命系统中,DNA 可谓无处不在。自然将生命的遗传信息存储在 DNA 中,人类也可以将数据信息存储其中。

  计算机的二进制语言只需要0和1两个符号,即可编码所有信息。生命的本质也是一种语言,那就是由 A、T、C、G 四种碱基串联而成的 DNA ,四种碱基的顺序蕴藏着生命的信息。

  早在上世纪80年代末,就有人提出,或许可以将计算机的二进制数字语言转换成DNA的四种碱基语言,从而将数据信息存储在DNA上。读取时只要反向进行DNA测序即可。相比于人类津津乐道的硅,DNA 简直是数据存储的理想载体。首先,DNA 的存储密度非常大。如果我们能够像大肠杆菌那样包装DNA,那么全世界的数据信息都可以储存在1公斤重、只占粉笔盒大小空间的一堆 DNA 中。

  其次,一般物理存储设备使用寿命往往不到10年,DNA 则可将遗传信息完整保存100年以上;如果是在零下18℃以下的低温环境中,甚至可保存上万年、数十万年。

  第三,DNA 存储过程耗能极少。要存储同样大小的信息,DNA 的耗能量只相当于闪盘的亿分之一。

  人工合成 DNA 带来希望

  在实际操作中,二进制数字语言要如何转换成DNA的四种碱基语言呢?2012年,哈佛大学遗传学家乔治·丘奇团队确立的规则是,用碱基A、C编码二进制的0,G、T编码二进制的1。

  经过简单翻译,一本包含大约5.34万个单词的书籍、11张JPG图片、一段简短的计算机程序,全部被编码进不到亿万分之一克的DNA微芯片中。这些文件大小相当于659千字节。之后,研究人员利用 DNA 测序技术成功阅读了这本书,虽然略有瑕疵地发现了22个错误。

  几个月后,欧洲生物信息研究所采用另一种策略,同样将大小为739千字节的文件写入人工合成DNA中,读取正确率接近100%。

  这两项研究让人们看到了DNA存储技术的希望,也开启了研发热潮。之后,存储数据的大小不断突破上限,从22兆字节,到200兆字节,再到维基百科所有16GB 的数据。

  不过,人工合成DNA数据存储技术要实现商业化应用,还有一些重大问题要解决。

  一是成本过高,目前人工合成存储1兆字节数据的DNA,需要3500美元,解码过程还需要额外的1000美元。二是无论存储还是读取过程都需要专业设备,个人使用极不方便。三是DNA保存需要低温环境,否则长时间容易发生 DNA 降解,导致数据失真或丢失。

  活细菌蕴藏着新可能

  既然人工合成 DNA 有缺陷,那能不能借用活细菌的 DNA 呢?比如大肠杆菌,在实验室只需要少量的营养物质就能茁壮成长,成本应该也会低很多。

  事实上,早在2017年,丘奇团队就开创性地利用“基因魔剪” CRISPR–Cas 技术,将编码信息的DNA片段送入细菌体内。CRISPR–Cas 系统可以对任何DNA序列进行精准修改,如将碱基A替换成碱基G,或者删除、插入、替换一段特异的DNA序列,就像我们使用 Word 软件编辑文字一样。

  实验中,丘奇团队将一些黑白图像和一张飞驰骏马动图编码为DNA序列,插入大肠杆菌的基因组中。在大肠杆菌经过多代繁殖后,研究人员仍然能够还原动图信息,正确率达90%以上。

  这一次,哥伦比亚大学的研究人员则进一步发展了该方法。他们用电化学方法调控 CRISPR 系统看是否行使功能。需要存储的二进制信息先被转换为DNA序列,并插入环状质粒(一种稳定的DNA环),然后随质粒转入大肠杆菌体内。

  通过改变化学试剂的浓度,就可以改变细菌周围的电压,这时一些特定的环状质粒拷贝数会显著增加。CRISPR 系统感知到这种变化,并将质粒中的插入片段(目标DNA序列)写入细菌基因组,在生物体内实现数据信息的自动存储——这就像为存储动作设置了一个开关。


相关文章

DNA打印机升级迭代PCR检测相关标准再更新

PCR检测——ISO标准发布近日,由上海海关主导制定的2项ISO标准正式获得国际标准化组织(ISO)通过并发布。这两项ISO标准是:《ISO/TS20224-10:2024分子生物标记分析——食品和饲......

NatureMaterials|南京邮电大学汪联辉/高宇/晁洁智能DNA纳米器件,精确溶栓!

南京邮电大学汪联辉、高宇及晁洁共同通讯在NatureMaterials在线发表题为“AnintelligentDNAnanodeviceforprecisionthrombolysis”的研究论文,该......

Cell:揭示蛋白PARP1形成的超级胶水对DNA损伤的修复至关重要

我们的DNA会不断受到损伤和修复。最严重的损伤发生在DNA断裂成两段时,即DNA双链断裂。它会产生两个松散的DNA末端,如果不加以修复,就会导致细胞死亡。在一项新的研究中,来自德国德累斯顿工业大学生物......

2023年美国质粒DNA制造市场规模达到18968万美元

2023年美国质粒DNA制造市场规模达到18968万美元,预计到2033年将达到115044万美元左右,2024年至2033年复合年增长率为19.57%。访问我们的医疗保健数据智能工具,其中包含100......

超过100个与DNA损伤相关的基因被发现

威康桑格研究所的研究人员及其剑桥大学英国痴呆症研究所的合作者进行了一项新研究,旨在确定细胞健康的生物学原理并确定维持基因组稳定性的关键基因。研究人员通过对近1,000个转基因小鼠品系的系统筛选,发现了......

Nature最新文章:基因测序游戏规则正在被改写,速度翻倍,仅需数小时

超高速测序推动基因组诊断快速发展简化的DNA和RNA测序工作流正在帮助临床医生在几天甚至几小时内提供迅速的有针对性的护理    约十年前,澳大利亚墨尔本的默多克......

Nature发布2024年值得关注的七大技术,首位中国科学家成果入选

2024年1月22日,《自然》发布了2024年值得关注的七大技术——大片段DNA插入、人工智能设计蛋白质、脑机接口、细胞图谱、超高分辨率显微成像、3D打印纳米材料和DeepFake检测。七大技术中,生......

古DNA研究对东亚豹母系遗传历史提出新见解

1月15日,中国科学院古脊椎动物与古人类研究所、西北大学和湖南省文物考古研究院共同主导完成的题为《古DNA准确鉴定湖南老司城遗址残缺头骨以及东亚豹母系遗传历史新见解》(AncientDNAunrave......

癌症“照妖镜”——游离DNA助力肿瘤早期探查

“人体细胞也有生命周期。细胞衰老凋亡后,细胞内的物质会渗透出来。其中,DNA会随之‘崩裂降解’,进入血液,成为游离DNA。”中国医学科学院肿瘤医院防癌科副主任张凯教授告诉科技日报记者,“肿瘤细胞的游离......

研究揭示双加氧酶的低复杂度结构域调控DNA氧化去甲基化

《自然-结构与分子生物学》(NatureStructural&MolecularBiology)在线发表了中国科学院分子细胞科学卓越创新中心杜雅蕊/徐国良团队完成的题为Auto-suppres......