人工智能(AI)技术随着科技的飞速发展已广泛渗透至多个领域。在生命健康层面,AI凭借其独特优势在推动基因组医学的创新发展中扮演着重要角色,尤其是在罕见遗传疾病诊断中展现出了巨大的潜力。然而,利用基因测序技术对海量的基因组变异进行大规模、高效精准的致病因素识别,仍然是一个挑战。因此,基于基因检测大数据,并以AI算法作驱动的智能化筛选工具的研发,将进一步推进罕见病的诊断进程。作为中国基因科技领域的的先行者,华大基因长期致力于多组学大数据技术的创新,其研发出的大语言模型驱动的新方法GeneticTransformer(GeneT),对助力科研与临床应用转化、加速生命科学研究步伐以及深化生命大数据应用具有重要意义。

  近十年来,人工智能(AI)在罕见遗传病致病基因和变异筛选领域取得巨大进步。这些方法通过语义的相似性将患者表型与已知致病基因相关联,并结合变异位点注释信息构建评分或预测模型,以此过滤与排序候选变异,其代表性工具包括Exomiser,VAAST,Xrare,AMELIE,GEM,Emedgene,andAI-MARRVEL等。尽管这些工具在临床诊断中展现出重要价值,但其多数是基于表型语义相似性度量,需将患者临床表型信息转化为标准化表型词条,并通过遗传分析专家进行校准。这一过程不仅耗时耗力,还对基因型与表型关联数据库的全面性以及患者临床表型描述的精准度存在高度依赖,大大加深了筛选罕见遗传病致病基因和变异的难度。而大型语言模型(LLM)的最新发展,为罕见病的分析解读提供了新的视角与策略。其在处理大规模文本数据及复杂问题上的能力,可更为高效地助力临床医师与科研人员识别疾病相关基因与变异,以此推进个性化精准医疗进程。

image.png

  作为全球精准医学与公共卫生领域的先行者,华大基因AI团队在近期研究工作中开创性地应用了微调大语言模型对罕见遗传病致病变异进行有效识别,研发出了大语言模型驱动的新方法GeneticTransformer(GeneT),以助力提升遗传病分析解读能力。该方法基于公开数据构建的数万例阴阳性病例训练数据集,将资深遗传病分析专家解读思维链构建的提示词作为模型微调的逻辑基础,指引基础大语言模型学习筛选罕见遗传病致病变异的能力。GeneT在模拟样本及真实临床样本中致病变异召回率分别高达99%和98%,分析效率提升了20倍。华大基因的这一成果有望取代传统表型驱动筛选方法,推动罕见遗传病的研究与临床应用,助力患者群体获得精准诊疗。

  华大基因的AI科研团队创新性地引入大语言模型,以识别罕见遗传病的致病变异。该模型相较于传统工具及遗传病人工筛选在真实临床场景验证展现出显著优势,能灵活应对多样化的临床表型信息,实现变异筛选与排序的高效精准,并结合RAG技术,提供更新且更及时的数据库检索服务,有望解决当前遗传病分析解读中的痛点与难点。未来,华大基因将持续深耕基因科技领域,通过不断创新推动精准医疗发展,帮助罕见遗传病患者获得更为高效的精准诊疗,为增加人类健康福祉贡献力量。


相关文章

赛默飞宣布与英伟达建立战略合作伙伴关系,利用AI推动科学仪器的发展

赛默飞世尔科技公司(TMO),全球领先的科学服务提供商,宣布与英伟达公司建立战略合作伙伴关系,以大规模推动基于人工智能(AI)的解决方案和实验室自动化。该合作将利用英伟达人工智能(AI)平台和赛默飞世......

工信部等八部门启动“人工智能+制造”专项行动

中国工信部、中央网信办、国家发改委等八部门7日对外发布《“人工智能+制造”专项行动实施意见》,明确到2027年,中国人工智能关键核心技术实现安全可靠供给,产业规模和赋能水平稳居世界前列,建成全球领先的......

研究提出一种基于人工智能技术的冰湖制图框架

兴都库什—喀喇昆仑—喜马拉雅(HKH)地区的冰湖变化,是气候变化的重要指示器。由于该地区地形极为复杂,加之常年受到云层遮挡、地形阴影以及季节性积雪覆盖的影响,这些因素显著制约了冰湖自动制图的精度,使得......

AI工具使用导致科研成果数量骤增质量下滑

一项近日发表于《科学》的研究指出,像ChatGPT 这样的人工智能(AI)写作工具正在大幅提升科研生产力。研究人员借助AI工具使论文发表数量最多增加了50%。但这也有不利的一面,AI生成的文......

24家科技AI巨头已加入美国“创世纪计划”

由美国特朗普政府主导“创世纪计划”(GenesisMission)近日新增24家人工智能领域企业为合作方,包括英伟达、AMD、OpenAI、微软、亚马逊AWS及谷歌母公司Alphabet等。目前“创世......

教育部办公厅关于公布第二批中小学人工智能教育基地名单的通知

教育部办公厅关于公布第二批中小学人工智能教育基地名单的通知教基厅函〔2025〕32号各省、自治区、直辖市教育厅(教委),新疆生产建设兵团教育局:根据《教育部办公厅关于开展第二批中小学人工智能教育基地推......

中央广播电视总台发布2025年度国内、国际十大科技新闻

中央广播电视总台12月24日发布2025年度国内、国际十大科技新闻。2025年度国内十大科技新闻是:1.我国建设三大世界级科技创新中心;2.国务院印发《关于深入实施“人工智能+”行动的意见》;3.天问......

科大讯飞新设子公司含AI及集成电路业务

近日,山东沂讯信息科技有限公司成立,法定代表人为柳升华,注册资本5000万元,经营范围包括人工智能公共服务平台技术咨询服务、集成电路设计、人工智能基础软件开发等。企查查股权穿透显示,该公司由科大讯飞全......

“人工智能+”知识产权公共服务应用场景建设名单发布

国家知识产权局办公室关于发布“人工智能+”知识产权公共服务应用场景建设名单的通知国知办函服字〔2025〕1040号各省、自治区、直辖市和新疆生产建设兵团知识产权局:为贯彻落实《国务院关于深入实施“人工......

北京市“人工智能+”能源高价值应用场景评审结果

北京市发展和改革委员会发布关于北京市“人工智能+”能源高价值应用场景评审结果公示。根据《国家能源局综合司关于组织开展“人工智能+”能源试点工作的通知》(国能综通科技〔2025〕168号)相关要求,我委......