一种新型计算工具为高效识别蛋白质变异提供了新方法,该方法可捕捉传统技术常忽略的变异,从而拓展了科学家检测疾病相关突变的能力。

  加州大学洛杉矶分校(UCLA)泌尿学与人类遗传学教授保罗・布特罗斯(Paul Boutros)表示,这种名为 moPepGen(多组学肽生成器)的方法能让研究人员更充分地利用质谱实验中产生的数据。布特罗斯及其团队于周一在《自然・生物技术》(Nature Biotechnology)上发表了该方法的详细内容。

  “质谱实验中的大部分数据都被丢弃了,” 布特罗斯说,“我们未能理解机器信号所揭示的特定蛋白质或其产物的存在信息。”

  他解释道,这些 “缺失” 的数据涵盖了样本中可能存在的不同物种(如细菌)、种系遗传变异,以及不同类型的基因表达(如可变剪接和融合)。这些所谓的 “非规范蛋白质序列” 构成了 “暗蛋白质组”,而传统质谱实验通常依赖 “规范序列”(即最常见的序列)来识别样本成分,因此暗蛋白质组常被忽略。

  “大多数质谱分析的工作方式,基本上是对照规范蛋白质序列进行‘字典查询’。” 布特罗斯说。

  然而,他进一步指出,即使每种蛋白质都存在规范序列,遗传变异仍会导致绝大多数蛋白质由非规范序列组成。这产生了海量可能的变异体,使得创建像规范序列那样全面的 “字典” 在计算上难以实现。

  moPepGen 采用三层嵌套的图论计算模型,系统模拟基因表达及翻译为蛋白质的过程,迭代分析转录变异、肽段变异和肽段切割。与许多其他平台不同,该方法适用于单核苷酸多态性(SNPs)、小片段插入 / 缺失(indels)和 RNA 编辑位点等多种小变异的任意组合。

  “这种方法大幅降低了冗余性,”UCLA 博士后、论文第一作者朱承昊(Chenghao Zhu)说,“moPepGen 无需逐一测试所有可能的组合,而是每个图仅进行一次计算机模拟翻译,从而使过程更高效且可扩展。”

  布特罗斯表示,该方法的 “魔力” 在于其速度极快,可轻松集成到现有任何质谱分析流程中,且成本低廉。

  随着质谱技术开发者推出更强大的新仪器,该算法应运而生。例如,赛默飞世尔科技(Thermo Fisher Scientific)、Sciex 和布鲁克(Bruker)等公司近期更新了其旗舰蛋白质组学平台,包括提升质谱仪处理离子的数量、改进灵敏度,以及优化离子从碰撞池转移至飞行时间(TOF)分析器的效率。

  “如今我们有了可广泛应用的工具,我们非常希望将其用于存在大量非典型基因表达的领域。” 布特罗斯说。

  前列腺癌就是这样的领域之一。他指出,前列腺癌是所有癌症类型中基因表达最不典型的疾病之一。

  “它以富含非编码 RNA、剪接变体、融合基因和环状 RNA 等‘奇特’特征而闻名。” 他说。

  布特罗斯补充道,前列腺癌也是生物标志物发现的理想目标,因为这些肿瘤常向尿液中释放细胞和遗传物质。作为液体活检样本,尿液具有显著优势:与血液等样本相比,它支持更频繁、更广泛的纵向采样。例如,每天多次采样可帮助研究人员考虑样本采集时间、饮食、运动等变量的影响。

  “所有这些因素都会影响生理状态,” 布特罗斯说,“但当采样频率足够高时,我们就能轻松规避这些变量的干扰。这使尿液成为极具吸引力的癌症生物标志物。”

  为此,布特罗斯、朱承昊及其团队首先将 moPepGen 与 customProDBJ 和 pyQUILTS 两种常用算法进行基准测试,分析了五个前列腺癌肿瘤样本中的蛋白质变异。

  在识别种系体细胞点突变和 indels 衍生的肽段时,三种方法表现相当;但在分析可变剪接、RNA 编辑、RNA 环化和转录融合等更复杂的过程时,仅 moPepGen 能评估由这四种机制产生的肽段。

  随后,他们分析了五个前列腺肿瘤、八个肾脏肿瘤和 376 个细胞系的蛋白质基因组数据。在所有样本中,moPepGen 识别出多种此前未被检测到的、由不同分子变化引起的蛋白质变异。该分析还显示,与其他几种方法相比,moPepGen 检测到的独特蛋白质变异体数量约为后者的四倍,证实了其性能优势。

  尽管该方法刚刚正式发表,但数月前已通过 BioRxiv 和 GitHub 平台公开。布特罗斯表示,已有其他研究人员联系他,表达了将其用于癌症及细菌蛋白质组学等领域研究的兴趣。

  瑞士苏黎世联邦理工学院(ETH Zurich)分子系统生物学研究所系统生物学教授鲁道夫・艾伯索尔德(Rudolf Aebersold)在电子邮件中指出,moPepGen 为蛋白质组学领域做出了重要贡献,它提供了一种生成更具功能相关性数据的方法。

  “除了本文所述的样本特异性非规范肽段的鉴定,” 他说,“其他同样有趣的扩展应用还包括对规范或非规范肽段及蛋白质的背景特异性修饰检测,以及它们参与的背景特异性相互作用研究。探索将推断功能不同蛋白质亚型的方法与本文提出的方法结合使用,以确定新发现的非规范肽段是否参与或定义具有独特生物学功能的蛋白质亚型,将是一个有趣的方向。”

  布特罗斯还提到,moPepGen 已引起一些商业机构的兴趣。他目前正与潜在商业合作伙伴洽谈,但尚未到透露细节的阶段。

  他表示,moPepGen 对研究的核心贡献在于其揭示 “暗蛋白质组” 的能力,这有助于探索更基础的问题,例如不同组织中暗蛋白质组的丰度差异,以及不同仪器和制备柱是否能更好地解析暗蛋白质组成分。

  “我们能否借此更好地理解仪器或实验方案的优化设计?” 布特罗斯问道,“我常思考如何更好地理解疾病、治愈癌症等研究目标,但另一个层面是:‘我们如何更精准地测量和量化样本?’”


相关文章

中山检验质谱培训第三天聚焦临床检验中的质谱技术进展

2025年6月18-20日,第十届中山检验液相色谱-质谱技术临床应用培训班在复旦大学附属中山医院举办。培训班的第三天,众多临床检验技术人员和相关领域的专家学者齐聚一堂,共同探讨和交流质谱技术在临床的最......

中山检验液相色谱质谱培训班精彩继续覆盖多领域的临床应用

2025年6月19日,第十届中山检验液相色谱-质谱技术临床应用培训班进入第二天的议程,继续在复旦大学附属中山医院检验科举行,吸引了众多临床检验技术人员和相关领域的专家学者参与。复旦大学附属中山医院检验......

计算工具为“暗蛋白质组”研究打开新窗口,助力生物标志物发现

一种新型计算工具为高效识别蛋白质变异提供了新方法,该方法可捕捉传统技术常忽略的变异,从而拓展了科学家检测疾病相关突变的能力。加州大学洛杉矶分校(UCLA)泌尿学与人类遗传学教授保罗・布特罗斯(Paul......

计算工具为“暗蛋白质组”研究打开新窗口,助力生物标志物发现

一种新型计算工具为高效识别蛋白质变异提供了新方法,该方法可捕捉传统技术常忽略的变异,从而拓展了科学家检测疾病相关突变的能力。加州大学洛杉矶分校(UCLA)泌尿学与人类遗传学教授保罗・布特罗斯(Paul......

计算工具为“暗蛋白质组”研究打开新窗口,助力生物标志物发现

一种新型计算工具为高效识别蛋白质变异提供了新方法,该方法可捕捉传统技术常忽略的变异,从而拓展了科学家检测疾病相关突变的能力。加州大学洛杉矶分校(UCLA)泌尿学与人类遗传学教授保罗・布特罗斯(Paul......

十载同行谱新篇第十届中山检验液相色谱质谱技术临床应用培训班开幕

2025年6月18日,第十届中山检验液相色谱-质谱技术临床应用培训班在复旦大学附属中山医院隆重开幕。本次培训班由复旦大学附属中山医院检验科、美国临床质谱学会(MSACL)、北美华人临床化学协会(NAC......

创新引领结构蛋白质组学的进步,创新支持大小分子多组学的一机式需求,创新拓展数据挖掘的纵深

——专访布鲁克质谱业务高管:RohanThakur质谱业务总裁,StefanFoser全球制药行业副总裁,Jeff李剑峰大中国区总经理多组学的需求是推动质谱技术进步最重要的增长动力。当高分辨高置信度地......

创新引领结构蛋白质组学的进步,创新支持大小分子多组学的一机式需求,创新拓展数据挖掘的纵深

——专访布鲁克质谱业务高管:RohanThakur质谱业务总裁,StefanFoser全球制药行业副总裁,Jeff李剑峰大中国区总经理多组学的需求是推动质谱技术进步最重要的增长动力。当高分辨高置信度地......

布鲁克公司(BRKR)收购Biocrates以扩展多组学解决方案

布鲁克公司(BrukerCorporation,股票代码:BRKR)近日宣布收购总部位于奥地利因斯布鲁克的代谢组学定量分析全球领导者——BiocratesLifeSciencesAG。此次交易的财务条......

安捷伦在HPLC2025上展示新品与创新成果

2025年6月16日,北京——安捷伦科技公司在HPLC2025上全球首发了新一代HybridMultisampler,并重点展示新型液相色谱单四极杆质谱仪。这些新产品旨在提高实验室效率,同时为研究人员......