发布时间:2024-08-09 17:51 原文链接: 人工智能新模型可解码DNA隐藏“语言”

DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将人类DNA视为文本,通过学习其规则和上下文来提取DNA序列的功能信息。这一新工具有望彻底改变基因组学并加速个性化医疗的发展。相关研究论文发表在新一期《自然·机器智能》杂志上。

大型语言模型通过文本训练,发展出了在多种语境下使用语言的能力。研究人员设想将生命代码DNA当作一种语言,训练了一个大型语言模型——GROVER。

在语言方面,人们谈论的是语法、句法和语义。而对于DNA来说,这意味着学习核苷酸的序列等。就像GPT模型学习人类语言一样,GROVER基本上学会了DNA“语言”。

研究表明,GROVER不仅能准确地预测接下来的DNA序列,还可用来提取具有生物学意义的上下文信息,例如识别DNA上的基因启动子或蛋白质结合位点。此外,GROVER还学习了“表观遗传”过程,即在DNA序列不发生改变的情况下,基因表达的可遗传变化。

GROVER有望解锁DNA中蕴含着关于人类本质、疾病易感性以及对治疗反应的关键信息。研究人员相信,通过语言模型理解DNA的规则,将有助于揭示隐藏在DNA中的生物意义,从而推动基因组学和个性化医学发展。


相关文章

人工突触成功模仿人类彩色视觉

日本东京理科大学团队成功开发出一种具有极高颜色分辨能力的自供电人工突触,其颜色识别能力已经非常接近人眼,标志着人们在计算机之“眼”研究领域迈出重要一步。相关成果已发表在最新一期《科学报告》上。人工智能......

人工智能在催化剂合成领域有了新进展

近日,中国科学院大连化学物理研究所研究员邓德会团队与新加坡南洋理工大学李昊博博士团队合作,受邀撰写了人工智能在催化剂设计与合成领域的Perspective评述文章,系统梳理了人工智能技术在多相催化剂设......

清华新设四大书院推动人工智能与传统工程学科融合

5月30日,清华大学无穹书院、紫荆书院、自强书院、水木书院成立仪式暨书院院长聘任仪式在主楼接待厅举行。这是清华大学坚持以进一步全面深化改革激发内在活力,面向国家重大战略需求和经济社会发展需要,把传统工......

我国科学家提出高效推理策略可避免大模型“过度思考”

随着人工智能大模型的不断发展,如何让其在“难”的问题上深入思考,而不是对所有问题“想个不停”?记者5月29日从中国科学院自动化研究所获悉,该所联合鹏城实验室提出了一种高效推理策略AutoThink,可......

南开大学启动“数学与人工智能实验班”项目

5月27日,南开大学数学科学学院与多点数智有限公司、智现未来科技有限公司、淡水泉投资管理有限公司正式签署合作共建备忘录,联合启动数学与人工智能实验班项目。根据共建备忘录,数学与人工智能实验班将于202......

这一分子工具有望成基因调控新“秘钥”

近年来,环状单链DNA(CssDNA)因其稳定性高、免疫原性弱、可编程性强,成为基因调控、细胞治疗等医学合成生物学领域很有潜力的分子工具之一。近期,中国科学院杭州医学研究所研究员宋杰团队针对此前开发的......

大连化物所应邀发表人工智能用于催化剂合成的Perspective文章

近日,我所能源与环境小分子催化研究中心(509组群)邓德会研究员团队与新加坡南洋理工大学李昊博博士团队合作,受邀撰写了人工智能在催化剂设计与合成领域的Perspective评述文章,系统梳理了人工智能......

同济大学成立五大研究院,围绕“四大创新”发力

5月20日,同济大学举行人工智能赋能学科创新行动发展大会,并宣布学校围绕“工程智能”系统布局的首批五大研究院——工程智能研究院、医学人工智能研究院、极端环境建造研究院、自主智能机器人研究院、航空运输与......

商务部再回应美国对人工智能芯片出口管制

在今天(22日)下午召开的商务部例行新闻发布会上,新闻发言人就美国对人工智能芯片出口管制问题进行回应。商务部新闻发言人何咏前:中方已多次阐明立场,美方滥用出口管制,对中国进行遏制打压,违反国际法和国际......

天大学者提出全新DNA存储系统

随着信息技术的飞速发展,传统存储方式已经逐渐无法满足大数据时代的需求。在此背景下,DNA信息存储技术应运而生,通过利用DNA分子存储数据,已经被视为未来大规模数据存储的潜力介质。每克DNA能够存储数百......