发布时间:2013-01-28 16:04 原文链接: 用DNA存储信息能达数万年之久

  据物理学家组织网近日报道,欧洲分子生物学实验室-欧洲生物信息学研究所(EMBL-EBI)的研究人员创建了一种可将数字化信息存储数万年之久的新技术。其采用DNA作为介质,储存规模远远超出全球所有的信息量。该技术可以在大约一杯DNA里存储至少1亿小时的高清视频文件。相关研究结果发表在1月23日《自然》杂志在线版上。

  世界上的数字信息将近3泽字节,即30万亿亿个字节。新的数字内容不断汇集对档案工作者构成了挑战。而硬盘价格昂贵且需要不断的电力供应,即使是最好的“无动力”归档材料如磁带,也会在10年之内“失忆”老化。这在生命科学领域更是一个日益凸显的问题,包括记录大量DNA序列的科学数据卷宗。

  EMBL-EBI的尼克·高曼说:“DNA是一种可靠的存储信息方法,因为我们可以从猛犸象的骨头中提取到它,其上的数据可以追溯到几万年之前。而令人难以置信的是它小而密集,不需要任何电源存储,因此传输、保存信息很容易。”

  研究人员说,读取DNA是相当简单的,但将它写入是DNA存储成为现实的一个主要障碍。挑战主要来自两方面:首先,目前的方法唯有可能用短字符串加工DNA;其次,写入和读出DNA都很容易出错,尤其是当重复相同的DNA字母时。高曼和该研究的联合作者、 EMBL-EBI副主任伊万着手创建了一种代码,以克服存在的问题。

  伊万说:“我们知道需要使用唯一的DNA短字符串制作代码,而用这样一个方式创建运行相同的字母是不可能的。所以我们设想,把代码解散成两个方向上的很多重叠的片段,其携带的索引信息可以显示每个片段属于整体哪一部分的代码,然后做一个不允许重复的编码方案。这样一来,在不同的片段就不会出现同样的错误,即便有也非常罕见。”

  这种新方法需要合成DNA的编码信息,总部位于加州的安捷伦科技公司自愿提供此服务。伊万和高曼发送其编码的版本包括:马丁·路德·金演讲“我有一个梦想”的MP3,一张EMBL-EBI的JPG照片;沃森和克里克开创性论文“分子结构核酸”的PDF版本;所有莎士比亚十四行诗TXT文本以及描述编码的文件。研究人员说:“我们从网络上下载文件,并用其来合成成千上万的DNA片段,结果看起来像一小块尘埃。安捷伦把合成后的样品邮寄给了EMBL-EBI。”研究人员能够毫无差错地排序DNA和解码文件,准确率可达100%。

  高曼说:“我们用分子形式创建了一个容错代码,可以保存数万年,在适当的条件下或可能持续更长时间。只要有人知道代码是什么,并有一台机器可以读出DNA,就能够将原信息读回。”

  理论分析表明,以DNA为基础的存储方案在规模上远远超出了目前的全球信息量,并为大规模、长期和不经常访问的数字典藏提供了一个理想的技术。事实上,目前技术进步的趋势是减少DNA合成在速度上的成本,计划在10年内实现50年归档的成本效益。虽然还有很多实际中有待解决的问题,但是DNA固有的密度和“长寿”优势,使之成为一个具有吸引力的存储介质。研究人员的下一步是完善编码方案,并探究其实用性,为商业上可行的DNA存储模型铺平道路。

相关文章

天大学者提出全新DNA存储系统

随着信息技术的飞速发展,传统存储方式已经逐渐无法满足大数据时代的需求。在此背景下,DNA信息存储技术应运而生,通过利用DNA分子存储数据,已经被视为未来大规模数据存储的潜力介质。每克DNA能够存储数百......

DNA信息存储编解码新方案解决脑部核磁海量数据存储难题

记者9月29日从天津大学获悉,该校合成生物学研究团队与天津市环湖医院合作提出了一种创新的DNA信息存储编解码方案——“DNAPalette”。通过体外存储实验,该方案成功将患者疾病全周期的脑部核磁共振......

深圳先进院实现医学数据在生物DNA分子中存储

5月29日,中国科学院深圳先进技术研究院研究员姜青山、高级工程师黄小罗、中国农业科学院深圳农业基因组研究所戴俊彪研究员等联合在SmallMethods发表最新研究成果。研究人员设计了一种名为"......

非洲猪瘟病毒DNA拓扑异构酶催化机制研究获新进展

中国科学院生物物理研究所饶子和院士研究组首次阐明非洲猪瘟病毒编码的全长II型DNA拓扑异构酶的基本机制,为减轻非洲猪瘟病毒的影响提供了潜在的干预策略。相关论文于5月30日发表在《自然-通讯》。非洲猪瘟......

我国科学家首次发现线粒体基因编码第14个蛋白质

热热闹闹的线粒体大厂中,线粒体基因细胞色素b(CYTB)兄弟的一项全新能力,已被我国科学家解锁出来。5月3日,国际期刊《细胞-代谢》刊发了中国科学院广州生物医药与健康研究院刘兴国课题组的该项研究成果。......

大脑里有位GPS“指挥官”

无论是太阳的东升西落,还是城市的东西南北,人们在日常生活中,寻找方向、定位目标或是记忆场景,都需要用大脑对空间信息进行处理和记忆。那么,这个过程是如何在大脑中发生的?中国科学院深圳先进技术研究院(以下......

新研究揭示自我中心编码的细胞和亚细胞机制

确定空间信息的表征机制是探讨空间信息处理的核心任务之一,为学习记忆中空间场景处理原则提供了重要启发。12月14日,中国科学院深圳先进技术研究院脑认知与脑疾病研究所研究员王成团队,联合南方科技大学生命科......

中国科大等展示复杂系统随机建模的信息存储量子优势

近日,中国科学技术大学郭光灿院士团队与英国曼彻斯特大学、新加坡南洋理工大学合作,利用量子技术在复杂系统随机建模中的信息存储方面取得重要进展。该团队教授李传锋、项国勇与合作者,使用单个量子比特的内存实现......

新型物质相可使信息存储时间更长

美国物理学家受斐波纳契数列的启发,将这种序列的激光脉冲照射到量子计算机内的原子上,创造出一种前所未见的时间物质相。研究人员在20日的《自然》杂志上发表论文指出,尽管只有一种单一的时间流,但该时段具有两......

新技术可构建细胞发育指导基因

原文地址:http://news.sciencenet.cn/htmlnews/2022/7/481918.shtm科技日报北京6月30日电(记者张梦然)美国纽约大学研究人员利用新的合成DNA技术和干......