发布时间:2019-08-19 16:35 原文链接: 质谱技术助力全新定量蛋白质组数据差异分析计算模型

  8月13日,国际学术期刊Cell Discovery 在线发表了中国科学院上海营养与健康研究所中科院计算生物学重点实验室(马普计算生物学研究所)邵振课题组研究论文“MAP: model-based analysis of proteomic data to detect proteins with significant abundance changes”,报道了一种新计算模型MAP,用于统计分析基于同位素标记产生的定量蛋白质组数据并鉴定其中差异表达的蛋白质。

  基于同位素标记和质谱技术的定量蛋白质组实验(如iTRAQ、TMT和SILAC等)能同时检测数千甚至上万个蛋白质在不同样本之间的相对丰度或表达差异。这类数据已有的差异表达分析方法大多依赖于对并行或已有的技术重复数据进行前期比较来构建实验的技术误差模型,并以它为基础检验每个蛋白质在被比较样本之间表达差异的统计显著性。该方法占用了有限的实验通道,也难以保证误差模型的精确适用性。

  针对这一局限,在MAP模型中研究人员发展了一种新颖的分步回归(step-by-step regression)分析流程,实现直接对被比较的两个iTRAQ样本构建技术误差模型。在此类研究中,一个常用的经验假设是技术误差对样本间每个蛋白质iTRAQ信号log2比率(log2-ratio)的贡献服从以0为中心的正态分布N(0, σ2)。其中,方差σ2依赖于该蛋白质的信号强度,并且常被用一个指数衰减函数来刻画其依赖关系,即所要构建的全局误差函数。MAP模型首先使用滑动窗口扫描两个样本的M-A图,同时对窗口中0附近的log2比率进行线性建模,以其斜率的平方作为误差函数的局域估计。然后,对所得局域估计进行第二轮指数拟合,获得被比较样本的全局误差函数,并以它为参照计算每个蛋白质信号差异的显著性P值(图1)。

  同位素标记定量蛋白质组数据长期存在比率压缩的难题。研究人员使用MAP模型分别比较分析了三个批次产生的小鼠胚胎干细胞分化前后蛋白质组数据,发现蛋白质iTRAQ信号log2比率在不同批次间关联很低(图2a),可能是因为技术误差对其贡献所服从的正态分布N(0, σ2)在批次间各不相同。根据MAP模型,研究人员提出使用每个批次的全局误差函数对其中每个蛋白质iTRAQ信号的log2比率进行重标度(rescaling),使得在不同批次中技术误差对其贡献均服从标准正态分布N(0, 1),从而发展了一个新的Z统计量。比较不同批次蛋白质Z统计量之间的关联,可以发现它具有明显更好的可重复性(图2b)。

  为方便蛋白质组领域研究者使用MAP模型进行数据分析,研究人员搭建了一个网络服务平台(http://bioinfo.sibs.ac.cn/shaolab/MAP)。该平台额外搭载了一个整合分析模块,能够通过整合多个批次生物重复比较结果的次优P值或者平均Z统计量来最终鉴定差异表达蛋白质,并新发展了一种分析方法用于估测基于这些统计量所定义差异表达蛋白质的错误发现率(FDR)。此外,在用于双样本比较的MAP模型基础上,研究人员还通过分别用样本方差和卡方分布分位数取代原分步回归建模流程中所使用的log2比率和标准正态分布分位数,进一步发展了适用于多样本比较的拓展eMAP模型。

  上述研究由营养与健康所研究助理李木山和博士研究生涂世奇等在研究员邵振的指导下,与中科院植物生理生态研究所、复旦大学上海医学院和美国西南医学中心等多家单位的研究人员合作完成,得到国家自然科学基金委、科技部和中科院等的资助。

图1:MAP模型的分步回归分析流程:(a)局域线性拟合;(b)全局指数拟合构建技术误差模型;(c)计算每个蛋白质信号差异的显著性P值。

图2:不同批次蛋白质iTRAQ信号的log2比率(a)和Z统计量(b)的皮尔森关联系数。

相关文章

杭州质谱大会系列专访——张新荣教授

——张新荣:生命科学应用驱动质谱创新【导读】2020-2023年中国质谱学术大会将于2023年6月9-13日在杭州举办,本次大会是中国质谱界的一次盛会,旨在促进学界团结进步、和谐发展、共赢未来,提高学......

杭州质谱大会系列专访——江桂斌院士

——江桂斌:抓住机遇,共谋发展见证中国质谱40年成就导读:2020-2023年中国质谱学术大会将于2023年6月9-13日在杭州举办,本次大会是中国质谱界的一次盛会,旨在促进学界团结进步、和谐发展、共......

SCIEX临床质谱新品重磅上市|Citrine™TripleQuad™System

SCIEX新一代液相色谱串联质谱检测系统Citrine™TripleQuad™System(注册证编号:国械注进20232220176)重磅发布!感谢您的一路同行,在未来,SCIEX将继续秉承“倾听客......

打造世界一流实验室,NuSEHGL标杆实验室揭牌仪式

2023年5月15日,Nu-SEHGL标杆实验室揭牌仪式在中国地质大学(北京)国际会议中心成功召开。阿美特克集团和中国地质大学(北京)双方代表出席了本次活动。Nu-SEHGL标杆实验室是英国Nu仪器公......

SCIEX临床质谱新品重磅上市|Citrine™TripleQuad™System

SCIEX新一代液相色谱串联质谱检测系统Citrine™ TripleQuad™ System(注册证编号:国械注进20232220176)重磅发布!感谢您的一路同行,在未来,SC......

新色谱柱助力生物药分析,东曹亮相第十四届色谱质谱会

5月5日-8日,由中国化学会色谱专业委员会、北京理化分析测试技术学会色谱专业委员会主办,北京理化分析测试技术学会、云南师范大学承办的“第十四届全国生物医药色谱质谱及相关技术学术交流会”于云南省普洱市盛......

德国应用化学:蛋白质复合物原位解析新技术

作为生命活动的执行者,蛋白质通过相互作用形成复合物等形式行使其特定的生物学功能。近日,中国科学院大连化学物理研究所研究员张丽华、研究员赵群等研制了一种基于糖苷键的质谱可碎裂型交联剂,显著地提高了交联信......

生成式AI设计出非天然蛋白质

加拿大多伦多大学研究人员开发了一种人工智能系统,可以使用生成扩散来创建自然界中不存在的蛋白质。该系统有望使治疗蛋白的设计和测试更加高效和灵活,从而加速人类药物开发。研究发表在最新一期《自然·计算科学》......

第十四届全国生物医药色谱质谱学术交流会云南普洱开幕

5月5日-8日,由中国化学会色谱专业委员会、北京理化分析测试技术学会色谱专业委员会主办,北京理化分析测试技术学会、云南师范大学承办的“第十四届全国生物医药色谱质谱及相关技术学术交流会”于云南省普洱市盛......

空间多组学质谱技术让微观世界更“清晰”

2023年4月26-27日,由中国科学院高能物理研究所主办,中国科学院高能物理研究所测试中心、中国科学院纳米生物效应与安全性重点实验室、中国科学院-香港大学金属组学与健康和环境联合实验室承办的“空间多......