发布时间:2025-12-16 15:08 原文链接: 2025蛋白质组学大会之聚焦计算与人工智能蛋白质组学

  2025年10月14日上午,计算与人工智能蛋白质组学(Computational and AI Proteomics)专题分论坛顺利召开。本场会议由本领域学者谢鹭教授、温翰教授、迟浩教授、曾文锋教授、Yasset Perez-Riverol教授共同召集和组织。来自海内外的多位知名学者围绕该领域的前沿进展,分享了最新的研究成果与应用实践,展示了计算方法与人工智能技术在蛋白质组学研究中的广阔前景。

分会报告

Prof. Wilson Wen Bin Goh

Nanyang Technological University, Singapore

Harnessing AI-Driven Proteome Analytics to Transform Mental Health Management: A Singapore Perspective

  Goh教授介绍了蛋白质组学研究的最新进展及其与人工智能结合在心理健康领域的应用。他指出,在高通量实验中,蛋白质谱清单对于深入理解个体生物学特征具有重要意义,并阐述了人工智能在提高谱图质量、优化数据处理流程及扩大检测覆盖范围等方面的关键作用。此外,Goh教授探讨了精神健康问题的普遍性与早期干预的必要性,并分享了基于多组学数据的队列研究。该研究通过整合多层次生物信息构建预测模型,旨在实现精神健康问题的早期识别与干预,为精神疾病的精准预防与治疗提供新的研究思路。

Prof. Yasset Perez-Riverol

European Bioinformatics Institute, UK

Quantms: A Hub for high-quality proteomics data to power AI development

  Perez-Riverol教授的报告聚焦于人工智能在生物数据处理与分析中的应用及其面临的主要挑战。首先,他阐述了数据量、元数据、基准测试、数据质量与格式规范在生物信息学研究中的关键作用,并指出数据生成算法与分析工具的可持续性对于结果的可重复性具有重要意义。报告特别强调了元数据管理的复杂性,尤其是在不同仪器和实验来源下实现数据注释一致性与准确性方面的困难。随后,Perez-Riverol教授指出,随着公共质谱数据的快速增长,传统计算模式难以满足大规模、自动化重分析的需求。针对这一问题,他介绍了Quantms平台,一个基于Nextflow/nf-core框架开发的开源云端分析工作流。Quantms遵循FAIR原则,支持三种主要实验类型(DDA-LFQ、TMT/DDA-plex、DIA-LFQ),可在云计算或高性能集群环境下并行运行,自动完成从原始数据处理到蛋白定量结果生成的全流程分析与标准化输出。

Prof. Shin Kawano

Kitasato University, Japan

jPOST and JPDM: Attempts to Collect Metadata

  Kawano教授介绍了jPOST环境(Japan Proteome Standard Repository/Database)在促进公共蛋白质质谱数据再利用与重分析方面的最新进展。该平台包括jPOSTrepo(原始质谱数据仓库)与jPOSTdb(基于统一流程的重分析数据库),采用统一协议及UniScore评分体系实现MS数据的标准化再分析。由于元数据不足限制了数据再利用,日本蛋白质组学学会创办了Journal of Proteome Data and Methods (JPDM),发表包含详细元数据描述的文章,并与jPOST平台建立互联机制,实现基于标准化Excel文件的自动重分析。截至2024年,jPOSTrepo已收录2800余个项目、超过100TB数据,覆盖全球50多个国家。该体系显著提升了数据的可重用性与分析可重复性,为FAIR原则和开放科学在蛋白质组学领域的落地提供了有效范例。

Prof. Mingliang Ye

Dalian Institute of Chemical Physics, Chinese Academy of Sciences, China

Glyco-Decipher and PELSA-Decipher Facilitate Proteome-Wide Identification of Site -Specific Glycoforms and Ligand-Target Proteins

  Ye 教授介绍了团队在蛋白质组学数据解析软件开发方面的最新进展。首先,他介绍了Glyco-Decipher软件,该工具可用于高灵敏度解析N-糖肽质谱谱图。在分析过程中,Glyco-Decipher不依赖糖库信息,而是利用不同糖肽共享肽段骨架碎裂规律的特征,建立了基于模式识别的肽段序列鉴定方法。该策略显著提升了完整糖肽的鉴定灵敏度,并可识别未知糖链及其修饰,为位点特异性糖型解析和糖基化功能研究提供了有力工具。随后,Ye教授介绍了配套开发的PELSA-Decipher软件。该软件实现了从肽段定量差异分析、蛋白质局部稳定性解析到浓度依赖性分析的全流程数据处理。通过整合UniProt蛋白结构域信息,PELSA-Decipher可直观展示局部稳定性变化区域,支持用户自定义目标区域分析与可视化结果输出。

Prof. Cheng Chang

National Center for Protein Sciences (Beijing), China

A Foundation Model for Decoding Dark Proteome through Self-Supervised Learning

  Chang教授介绍了基于人工智能大模型在“暗蛋白质组(dark proteome)”研究中的最新进展。暗蛋白质组指传统质谱技术难以检测或注释的蛋白及肽段,包括基因变异产生的蛋白变体、非典型转录翻译产物、微型蛋白和未知修饰蛋白等。尽管全球已有PRIDE、iProX等大型质谱数据库积累了海量原始数据,但相关资源尚未得到充分利用。为此,Chang教授团队构建了π-MSNet,一个覆盖53个物种、可持续更新的蛋白质组学数据库,为人工智能预训练模型提供了大规模基础数据支持。基于此,团队开发了自监督学习模型π-SPECFormer,通过双阶段预训练实现质谱嵌入学习、de novo序列解析及翻译后修饰识别。模型在癌症队列中的应用表明,π-SPECFormer 能高效解析突变肽段的“暗蛋白质组”,展示了预训练模型在质谱数据解析中的显著潜力,为疾病标志物发现和精准蛋白质组学研究提供了新思路与技术框架。

Prof. Wenfeng Zeng

Westlake University, China

FennOmix-MHC: A Foundation Model for Peptide–HLA Representation Learning and Shared Epitope Discovery

  Zeng教授的报告围绕FennOmix-MHC基础模型展开,探讨其在肽段-MHC结合表征学习及表位预测中的应用。报告指出,T细胞治疗的核心在于识别疾病特异性抗原,而这些抗原通常由MHC/HLA分子呈递的肽段介导。然而,当前基于基因组学和AI的抗原预测方法存在高假阳性率,难以有效识别真实呈递的肽段。为解决这一问题,曾教授的团队开发了FennOmix-MHC,一种基于对比学习(con的预训练模型,用于实现肽段与MHC等位基因间的高效表征学习。FennOmix-MHC为表位发现及免疫治疗靶点筛选提供了高效、可扩展的新思路,显著降低了假阳性率,并有助于发现跨个体、跨疾病的共享抗原表位,为精准免疫治疗和疫苗设计奠定了数据与模型基础。

Prof. Jianhui Liu

Dalian Institute of Chemical Physics, Chinese Academy of Sciences, China

Microbial Resource Mining Based on Computational Proteomics

  Liu教授介绍了基于计算蛋白质组学的微生物资源挖掘研究进展,重点阐述了宏蛋白质组学(metaproteomics)在微生物群落功能解析与资源开发中的作用。宏蛋白质组学可结合宏基因组与宏转录组数据,从蛋白水平揭示微生物群落的时空动态特征,在疾病管理、农业生产及环境治理等领域具有重要应用价值。报告指出,宏蛋白质组学研究面临低覆盖率、低注释率及定量重复性差等挑战,尤其存在大量序列与功能未知的“暗蛋白”。为此,刘教授团队开发了基于数据非依赖采集(DIA)的定量方法MetaSpaR-DIA,MetaSpaR-DIA在肽段鉴定准确率、定量一致性及物种注释深度方面均优于传统方法。

Prof. Yongge Li

DP Technology, Beijing, China

Dynamical Foundation Models for Biology: A Neural ODE Case Study on Proteomics

  Li研究员围绕动态生物基础模型(Dynamical Foundation Models)的发展展开,探讨了如何通过人工智能与组学数据融合推动生物系统建模的可解释性与预测能力。回顾了当前组学基础模型,如Geneformer与GeneCompass,在单细胞转录组数据中捕获基因表达模式的能力。然而,现有模型大多停留于相关性层面,难以刻画扰动后的动态变化与因果关系。接着,Li研究员介绍了扰动感知基础模型(Perturbation-aware Foundation Model)与GraphOmicsODE框架,结合图神经网络与神经微分方程,实现了多组学数据下生物过程的时序建模。此外,Li研究员介绍了ProteinTalks平台,利用大规模扰动蛋白质组数据,实现药物反应预测与动态蛋白表达模拟。这些研究推动了从相关到因果、从转录组到蛋白质组、从静态到动态的模型演进,为精准医学与药物机制研究提供了新范式。

相关文章

第24届国际蛋白质组(HUPO)大会圆满落幕——πHuB计划引领全球蛋白质组学和精准医学新航向

2025年11月9日至13日,第24届国际人类蛋白质组组织(HUPO)大会在加拿大多伦多盛大召开。本次大会以“蛋白质组学赋能泛健康(OneHealthPoweredbyProteomics)”为主题,......

第24届国际蛋白质组(HUPO)大会圆满落幕——πHuB计划引领全球蛋白质组学和精准医学新航向

2025年11月9日至13日,第24届国际人类蛋白质组组织(HUPO)大会在加拿大多伦多盛大召开。本次大会以“蛋白质组学赋能泛健康(OneHealthPoweredbyProteomics)”为主题,......

2025蛋白质组学大会之蛋白质组动态

2025年10月14日14点在广州白云国际会议中心国际会堂珠水厅,第12届AOHUPO大会暨第8届AOAPO大会暨π-HuB国际大科学计划第三届全球峰会暨第13届CNHUPO大会“ProteomeDy......

2025蛋白质组学大会之蛋白质组动态

2025年10月14日14点在广州白云国际会议中心国际会堂珠水厅,第12届AOHUPO大会暨第8届AOAPO大会暨π-HuB国际大科学计划第三届全球峰会暨第13届CNHUPO大会“ProteomeDy......

2025蛋白质组学大会之蛋白质组动态

2025年10月14日14点在广州白云国际会议中心国际会堂珠水厅,第12届AOHUPO大会暨第8届AOAPO大会暨π-HuB国际大科学计划第三届全球峰会暨第13届CNHUPO大会“ProteomeDy......

2025蛋白质组学大会之蛋白质组动态

2025年10月14日14点在广州白云国际会议中心国际会堂珠水厅,第12届AOHUPO大会暨第8届AOAPO大会暨π-HuB国际大科学计划第三届全球峰会暨第13届CNHUPO大会“ProteomeDy......

2025蛋白质组学大会之蛋白质组动态

2025年10月14日14点在广州白云国际会议中心国际会堂珠水厅,第12届AOHUPO大会暨第8届AOAPO大会暨π-HuB国际大科学计划第三届全球峰会暨第13届CNHUPO大会“ProteomeDy......

2025蛋白质组学大会之聚焦计算与人工智能蛋白质组学

2025年10月14日上午,计算与人工智能蛋白质组学(ComputationalandAIProteomics)专题分论坛顺利召开。本场会议由本领域学者谢鹭教授、温翰教授、迟浩教授、曾文锋教授、Yas......

2025蛋白质组学大会之聚焦计算与人工智能蛋白质组学

2025年10月14日上午,计算与人工智能蛋白质组学(ComputationalandAIProteomics)专题分论坛顺利召开。本场会议由本领域学者谢鹭教授、温翰教授、迟浩教授、曾文锋教授、Yas......

2025蛋白质组学大会之聚焦计算与人工智能蛋白质组学

2025年10月14日上午,计算与人工智能蛋白质组学(ComputationalandAIProteomics)专题分论坛顺利召开。本场会议由本领域学者谢鹭教授、温翰教授、迟浩教授、曾文锋教授、Yas......