DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将人类DNA视为文本,通过学习其规则和上下文来提取DNA序列的功能信息。这一新工具有望彻底改变基因组学并加速个性化医疗的发展。相关研究论文发表在新一期《自然·机器智能》杂志上。
大型语言模型通过文本训练,发展出了在多种语境下使用语言的能力。研究人员设想将生命代码DNA当作一种语言,训练了一个大型语言模型——GROVER。
在语言方面,人们谈论的是语法、句法和语义。而对于DNA来说,这意味着学习核苷酸的序列等。就像GPT模型学习人类语言一样,GROVER基本上学会了DNA“语言”。
研究表明,GROVER不仅能准确地预测接下来的DNA序列,还可用来提取具有生物学意义的上下文信息,例如识别DNA上的基因启动子或蛋白质结合位点。此外,GROVER还学习了“表观遗传”过程,即在DNA序列不发生改变的情况下,基因表达的可遗传变化。
GROVER有望解锁DNA中蕴含着关于人类本质、疾病易感性以及对治疗反应的关键信息。研究人员相信,通过语言模型理解DNA的规则,将有助于揭示隐藏在DNA中的生物意义,从而推动基因组学和个性化医学发展。
赛默飞世尔科技公司(TMO),全球领先的科学服务提供商,宣布与英伟达公司建立战略合作伙伴关系,以大规模推动基于人工智能(AI)的解决方案和实验室自动化。该合作将利用英伟达人工智能(AI)平台和赛默飞世......
在近日一项发表于《自然》的研究中,科学家绘制出迄今最详尽的人类活细胞内DNA折叠、环状缠绕和移动的图谱,展示了基因组结构随时间推移的变化情况,揭示了隐藏的基因调控机制,是了解DNA结构如何塑造人类生物......
中国工信部、中央网信办、国家发改委等八部门7日对外发布《“人工智能+制造”专项行动实施意见》,明确到2027年,中国人工智能关键核心技术实现安全可靠供给,产业规模和赋能水平稳居世界前列,建成全球领先的......
兴都库什—喀喇昆仑—喜马拉雅(HKH)地区的冰湖变化,是气候变化的重要指示器。由于该地区地形极为复杂,加之常年受到云层遮挡、地形阴影以及季节性积雪覆盖的影响,这些因素显著制约了冰湖自动制图的精度,使得......
一项近日发表于《科学》的研究指出,像ChatGPT 这样的人工智能(AI)写作工具正在大幅提升科研生产力。研究人员借助AI工具使论文发表数量最多增加了50%。但这也有不利的一面,AI生成的文......
由美国特朗普政府主导“创世纪计划”(GenesisMission)近日新增24家人工智能领域企业为合作方,包括英伟达、AMD、OpenAI、微软、亚马逊AWS及谷歌母公司Alphabet等。目前“创世......
教育部办公厅关于公布第二批中小学人工智能教育基地名单的通知教基厅函〔2025〕32号各省、自治区、直辖市教育厅(教委),新疆生产建设兵团教育局:根据《教育部办公厅关于开展第二批中小学人工智能教育基地推......
中央广播电视总台12月24日发布2025年度国内、国际十大科技新闻。2025年度国内十大科技新闻是:1.我国建设三大世界级科技创新中心;2.国务院印发《关于深入实施“人工智能+”行动的意见》;3.天问......
近日,山东沂讯信息科技有限公司成立,法定代表人为柳升华,注册资本5000万元,经营范围包括人工智能公共服务平台技术咨询服务、集成电路设计、人工智能基础软件开发等。企查查股权穿透显示,该公司由科大讯飞全......
国家知识产权局办公室关于发布“人工智能+”知识产权公共服务应用场景建设名单的通知国知办函服字〔2025〕1040号各省、自治区、直辖市和新疆生产建设兵团知识产权局:为贯彻落实《国务院关于深入实施“人工......