发布时间:2019-02-19 13:49 原文链接: 用DNA藏匿电脑病毒:一次基因测序就劫取机密

  DNA作为储存生物信息的结构,从演化产生以来一直保持着稳定、安全的性能。利用4个碱基的组合,它传递着一代又一代的遗传密码。这种密码组合的优越性如今也被科学家看在眼里,类似计算机中的1和0,他们利用ATCG同样创造了信息储存代码。但是黑客能不能会入侵DNA代码呢?目前来看,答案同样是肯定的。

  DNA是一种存储信息的方式,利用ATCG四个碱基,组成了生物体的遗传信息,引导生物的发育与生命机能的运转。科学家们曾经利用DNA的信息存储功能,将书籍、录音、动图,甚至是亚马逊的礼品卡存于其中,跨越了生物与计算机之间的鸿沟。

  后来,华盛顿大学信息安全研究人员有了这样一个想法:如果能将恶意代码存入DNA,会带来怎样的风险?于是,他们进行了一次试验,他们设计了一段用ATCG编码的恶意代码,并成功的在互联网上买到了由此代码合成的DNA,当测序仪对此段DNA进行测序并利用电脑软件进行数据分析时,恶意代码被启动并入侵了电脑。

  研究人员认为,考虑到现在基因测序的应用领域越来越广,虽然现在还没有证据表明基因测序或者基因数据面临此类安全问题,但是未来,一旦有黑客发起类似攻击,将可能窃取大型实验室的知识产权,污染用于犯罪调查的DNA分析数据。也有可能,企业可以利用这项应用保护其转基因产品的商业机密。

  从数字信息到生物信息

  从理论上看,将信息存储在DNA中并不困难。在电脑中,每一个字符都由0、1进行编码,任何数字化的内容,不管是视频还是图片亦或是一段程序,本质上都是一串串的0和1。而在生物体中,遗传信息存储在DNA中,代码变成了碱基:A、C、G、T。简单地说,用DNA存储数字信息相当于用A、C、G、T取代了0和1。

  2012年,哈佛大学教授、美国基因工程学家乔治·丘奇(George Church)及其团队在科学期刊Science上发文,介绍了他们将DNA用作信息存储媒介,使用DNA微芯片编写了一本5万余字的书,制作了54898个DNA序列,利用测序仪就可以阅读了这本书。在论文中,作者写道:“DNA是已知最稳定和密集的信息媒介之一,随着DNA合成和测序技术的发展,DNA将成为越来越可行的存储媒介。”

  2016年,纽约基因组研究中心的研究人员开发了一套新的编码系统,可以极大地增加DNA分子的数据存储容量,他们将一部电影、一个电脑操作系统、一篇论文、一个电脑病毒以及一张50美元的亚马逊礼品卡进行“碱基编码”,产生了一份包含7.2万个DNA片段的文库,一家DNA合成公司帮助他们合成了实体DNA。为了再次重现DNA中储存的数据,他们对DNA进行了测序,并利用软件将遗传信息转化为二进制代码,几乎无误差的,能够重现所有文件。

  2017年,乔治·丘奇等人又在Nature上刊文阐述了他们如何利用基因编辑技术CRISPR将图片和短片编码到了一群活细菌的基因组中。他们所制作的短片有5帧,每一帧,研究人员用104个DNA片段进行编码。接着,研究人员以每天一帧的速度,将短片的DNA片段植入到大肠杆菌中,5天的时候,将整部短片植入到了大肠杆菌中。之后,研究人员再对大肠杆菌进行测序,即可读取并还原短片。作者认为,这项研究表明,在活细胞的基因组中可以稳定的存储真实的数据。

  生物学家们的研究证明,将数字信息存储于DNA中,甚至是活细胞的基因组中是可行的,且这些信息可以以较高的精准度还原。而且DNA存储有一种先天的优势,不需要很苛刻的条件,其中的信息可以保存上百年,如果将其保存在阴凉、干燥的地方,其中的信息甚至可以保存成千上万年。

  大多数生物学家和计算机科学家看到了DNA存储无以复加的优势和广阔的应用前景,但华盛顿大学的计算机安全研究专家却注意到了其中潜在的风险。

  将电脑病毒藏在DNA中

  华盛顿大学计算机科学教授Tadayoshi Kohno等人注意到,基因检测越来越常见。部分原因来自于DNA测序价格持续的下降,2000年左右,对一个人进行全基因组测序需要1亿美金,到现在,这一价格已经下降为约1000美金,研究人员们的未来目标是希望将这一价格降低到100美金。价格的下降、操作的便捷让DNA测序应用范围越来越广泛,不仅仅是基础生物学,还包括考古学、犯罪调查、产前诊断等等。在美国,个人基因检测已经成为一种潮流,为家中宠物进行基因检测也越来越流行。

  这就不得不考虑一种风险:DNA样本来自外部来源,这可能难以适当地审查,那么其中是否会包含一个或几个存储恶意代码的DNA片段?当这些DNA片段被测序并利用电脑软件进行处理分析时,将对计算机安全造成怎样的影响?

  华盛顿大学的研究人员开始了他们的试验。为了简化整个试验,首先,他们在一个用于DNA测序数据处理的开源软件中人为的引入一个程序缺陷。实际上,研究人员分析了很多用于DNA数据处理与分析的开源生物信息学工具,他们发现很多工具都没有遵循最佳的计算机安全保障方法,这给攻击者留下了潜在的漏洞。

  接着研究人员设计了一个恶意计算机代码,希望利用“缓冲区溢出”攻击计算机,缓冲区溢出是针对程序设计缺陷,向程序输入缓冲区写入使之溢出的内容,从而破坏程序运行,趁程序中断之际夺取程序乃至计算机系统的控制权。

  不过将恶意计算机代码转化为DNA分子的过程并没有研究人员原本想的那么简单,当他们将精心设计的恶意代码以A、T、G、C的形式输入DNA分子合成网站时,出现了满屏的错误。

  他们了解到,为了使DNA样本保持稳定,A、T、G、C必须保持合适的比例。研究人员不得不反复编写恶意代码,以找到合适的形式。按下订购按钮的一周后,一小瓶样本就寄到了研究人员的手中。

  通过测序,DNA样本中的恶意程序被“释放”了出来,攻击软件漏洞,入侵了电脑。“我们从理论上证明了,利用DNA存储恶意代码能够攻击计算机,但是我们现在并没有证据表明DNA测序或者DNA数据的安全性目前正受到攻击,我们希望在技术成熟之前,最好在新兴技术的早期就考虑安全威胁。”负责该项目的华盛顿大学计算机科学教授Tadayoshi Kohno认为。“因为在真正的攻击出现之前,安全问题更容易解决。”

  研究人员认为,如果黑客真的采用这项攻击方式,那么他们就可能获得有价值的知识产权,或者可能污染与犯罪有关的基因分析结果。当然,企业也可能在转基因产品中植入恶意代码,以保护其商业机密。“未来这可能转变成一些有趣,或者带来威胁的应用。”研究人员表示。


相关文章

婴儿猝死因素研究进展,基因检测帮大忙

研究者发现,以往被用于诊断儿童疾病的一种基因测试(被称为染色体微阵列芯片测试)可以帮助更好地理解婴幼儿猝死背后的原因。美国波士顿儿童医院的研究员CatherineBrownstein最近在Advanc......

单例成本降至100美元!华大智造发布全球通量最高测序仪

导语:华大智造发布全球通量最高测序仪,单次通量为常规超高通量测序仪的4.5至7倍。每年可完成高达5万例人全基因组测序,单例成本100美元以内。20年将人全基因组测序测序成本从30多亿美元降至100美元......

RedoxBiology:糖尿病内皮细胞的糖酵解依赖DNA修复缺陷

糖尿病心血管疾病和微血管并发症,如糖尿病视网膜病变(DR),是糖尿病患者发病和死亡的主要原因,糖尿病血管并发症的患病率正在迅速增加。糖尿病血管并发症的一个关键事件是血管通透性增加,内皮细胞(ECs)丢......

辉瑞说漏嘴了:自研病毒!美激进组织卧底偷拍辉瑞高管

 截止至2023年1月29日,辉瑞自行研发新冠病毒新变种的消息并没有被证实。(现在唯一不能确认的就是视频里的男子到底是不是辉瑞的研发主管,他的话内里意思很明确,就是辉瑞曾经尝试过制作变种病毒......

宠物克隆:“复活”一只宠物的代价,是无数只动物被虐杀

宠物克隆原理看上去很简单,取一块原本宠物的皮肤,在皮肤细胞里提取细胞核;从其它动物体内取一个卵细胞,去掉它的细胞核;再把新卵细胞植入到另一动物体内,直到孕育出一个新生命。取卵的过程是无比痛苦的,他们会......

独特人类基因进化是平衡行为

人类和黑猩猩的DNA仅百分之一不同。人类加速区域(HAR)是基因组的一部分,美国研究人员分析了数以千计的人类和黑猩猩HAR,发现人类进化过程中积累的许多变化具有相反的影响。研究结果近日发表在《神经元》......

“泛转录组”首次用于RNA测序分析

近日发表在《自然·方法》杂志上的一篇新论文中,美国加利福尼亚大学圣克鲁斯分校(UCSC)的研究人员介绍了有史以来第一种使用“泛转录组”分析全基因组RNA测序数据的方法。分析一个人的基因表达需要将他的R......

特定基因突变促进心血管疾病发展

据发表在《自然·心血管研究》上的一项新研究,西班牙卡洛斯三世国家心血管研究中心(CNIC)的一个研究小组与美国研究机构合作,已经证明编码蛋白p53基因的获得性突变,将促进动脉粥样硬化性心血管疾病的发展......

研究发现新型抗流感病毒药物的靶点及作用机制

近日,华南农业大学材料与能源学院制药工程系宋高鹏副教授联合南方医科大学教授刘叔文团队发现了一类基于苄基四氢异喹啉为结构骨架的三位点结合型流感病毒PAN抑制剂。相关研究在线发表于JournalofMed......

基因揭示这些西伯利亚人具有高流动性

复旦大学生命科学学院青年研究员王轲和德国图宾根大学古生物学教授CosimoPosth等合作,报告了7500年前10个古人类的基因组数据,填补了早期从北亚穿越白令海峡迁徙到北美的人类古基因组数据的空白,......