发布时间:2024-08-07 09:37 原文链接: 人工智能新模型可解码DNA隐藏“语言”

科技日报北京8月6日电 (记者张佳欣)DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将人类DNA视为文本,通过学习其规则和上下文来提取DNA序列的功能信息。这一新工具有望彻底改变基因组学并加速个性化医疗的发展。相关研究论文发表在新一期《自然·机器智能》杂志上。

基于DNA序列训练的大型语言模型(艺术图)。
图片来源:物理学家组织网


大型语言模型通过文本训练,发展出了在多种语境下使用语言的能力。研究人员设想将生命代码DNA当作一种语言,训练了一个大型语言模型——GROVER。

在语言方面,人们谈论的是语法、句法和语义。而对于DNA来说,这意味着学习核苷酸的序列等。就像GPT模型学习人类语言一样,GROVER基本上学会了DNA“语言”。

研究表明,GROVER不仅能准确地预测接下来的DNA序列,还可用来提取具有生物学意义的上下文信息,例如识别DNA上的基因启动子或蛋白质结合位点。此外,GROVER还学习了“表观遗传”过程,即在DNA序列不发生改变的情况下,基因表达的可遗传变化。

GROVER有望解锁DNA中蕴含着关于人类本质、疾病易感性以及对治疗反应的关键信息。研究人员相信,通过语言模型理解DNA的规则,将有助于揭示隐藏在DNA中的生物意义,从而推动基因组学和个性化医学发展。

 


相关文章

人工智能加速催生“化学反应”

化学是一门研究物质组成、结构、性质与变化规律的学科,其发展史是人类突破自然表象、揭示物质本质的历史。从古代炼金术士对“点石成金”的痴迷,到现代科学家操控原子合成新物质,在好奇心的驱动下,人类正不断向着......

《关于促进和规范“人工智能+医疗卫生”应用发展的实施意见》政策解读

一、文件制订背景近年来,党中央、国务院高度重视人工智能发展,2025年8月国务院印发《关于深入实施“人工智能+”行动的意见》(国发〔2025〕11号),要求探索推广人人可享的高水平居民健康助手,有序推......

关于促进和规范“人工智能+医疗卫生”应用发展的实施意见

国家卫生健康委办公厅、国家发展改革委办公厅等五部门发布关于促进和规范“人工智能+医疗卫生”应用发展的实施意见通知。国卫办规划发〔2025〕30号各省、自治区、直辖市及新疆生产建设兵团卫生健康委、发展改......

中国科学院举办职工技能大赛AI领域比赛

10月31日,中国科学院第四届职工技能大赛人工智能领域比赛决赛在中国科学院自动化研究所成功举办。院直属机关党委常务副书记、院工会主席房自正,院直属机关党委副书记、院工会常务副主席杨旭,自动化研究所所长......

李乐成:加快推进人工智能赋能新型工业化

工业和信息化部党组书记、部长李乐成在《党建》杂志发表署名文章《加快推进人工智能赋能新型工业化》。文章指出,“面对新一代人工智能技术快速演进的新形势,要充分发挥新型举国体制优势,坚持自立自强,突出应用导......

自立自强与开放合作已成中国智造双重底色

2025年世界科技与发展论坛虽已落下帷幕,“人工智能促进科技与发展”的主题仍在全球科技界激荡回响。在业界看来,这场论坛不仅展现了中国智造的技术硬实力,更清晰传递出一个核心信号:“开放合作”的包容姿态与......

2025年世界科技与发展论坛:人工智能协同创新破解全球发展难题

近日,由中国科学技术协会主办的2025年世界科技与发展论坛在北京举行。作为中国科协“开放合作月”重要活动之一,本届论坛以“人工智能促进科技与发展”为主题,围绕人工智能与未来产业、开放科学与全球合作等四......

清华大学在人工智能辅助发现空间物理规律取得新进展

近日,记者从清华大学丘成桐数学科学中心获悉,该中心副教授周源与清华大学智能产业研究院、电子工程系副教授马剑竹合作,提出了一个可从观测数据中自动推导出空间物理规律的神经符号模型——PhyE2E(Phys......

刚刚,一重大专项2025年度第一批项目申报指南发布

关于发布新一代人工智能国家科技重大专项2025年度第一批项目申报指南的通知各有关单位:为加快实施新一代人工智能国家科技重大专项(以下简称“重大专项”),根据重大专项阶段性实施计划部署,现将2025年度......

拿破仑的军队是如何灭亡的?DNA揭示令人意外的疾病因素

1812年,法国皇帝拿破仑一世从俄罗斯莫斯科撤退时,其大部分军队因饥饿、疾病和寒冷的冬天而损失殆尽。如今,对这撤退途中丧生的30万士兵的部分遗骸的DNA的分析发现,两种未曾预料到的细菌性疾病很可能增加......