分析测试百科网讯 在新冠肺炎COVID-19疫情肆虐全球之际,PCR技术在快速筛查中已大显神威,但进入临床后如何更早地区分轻症和重症患者,从而更准确地治疗和用药?5月27日中国研究人员在《Cell》发表文章,利用蛋白质组学和代谢组学的全景式分析,发现了重症患者体内应对病毒进攻特征性的分子改变,并结合机器学习筛选出COVID-19重症患者特征性的22个蛋白质和7个代谢物,有望为临床医生提供有指导意义的诊断和治疗线索。这项研究的一位主要参与者是西湖大学生命科学学院的特聘研究员郭天南博士。分析测试百科网小编近日采访到郭天南博士,他将分享一个蛋白质组学研究者对于COVID-19及各类挑战性难题的探索,追溯蛋白质组学发展的历程,展望蛋白质组学的未来,期望为组学研究者、为正在攻克新冠病毒、肿瘤等人类科学和临床难题的读者们带来启示。

西湖大学 郭天南特聘研究员

《Cell》:COVID-19重症患者血清特征性分子改变

  目前,临床上评估COVID-19重症患者的依据,主要是根据临床特征进行经验性诊断,如呼吸频率(≥30次/min)、平均血氧饱和度(静息状态下≤93%)或动脉血氧分压/氧浓度(≤300 mmHg)等。但是,出现这些临床表现的患者已经进展到临床重症阶段,需要立即接受专业的监护,否则可能迅速死亡。所以,开发新的方法在早期评估哪些病例可能会成为临床上的重症患者是一个关键性问题。小编自己“理解”了一下:一般病人感到呼吸很困难才认为是重症,如果有一种方法可以抽一管血测定一下就提前知道、提早治疗,将为病人争取更宝贵的治疗时间,降低死亡率。

  5月27日,郭天南团队在《Cell》发表了新冠肺炎研究论文,通过对65位COVID-19患者和53个对照组个体的血清进行蛋白质组学和代谢组学的分析,共鉴定并量化了894种蛋白质和941种(包括36种药物及其代谢产物)代谢产物,并描绘了重症患者血清蛋白质组和代谢组学的特征。

2.jpg

COVID患者血清样本的蛋白组和代谢组分析

  该项研究基于蛋白质组学和代谢组学分析病毒感染后新冠重型患者血清中发生的独特的分子病理变化,为新冠肺炎血清学特征表达谱提供了一个全景式的描述。同时,团队通过机器学习,筛选出含有22个蛋白质和7个代谢物的血液生物标志物组合,建立了可区分COVID-19重型和非重型患者的蛋白质和代谢分子模型,模型准确率在训练队列中准确率为93.5%,两个独立验证队列准确率分别为70%和84.2%,这对新冠肺炎重症患者早期识别与治疗具有非常重要的意义。

  同时团队也筛选获得一组特征性变化分子,包含93种蛋白质和204个代谢物。通路分析显示这些差异性变化分子主要富集于3个信号通路上:血小板脱颗粒、补体系统信号通路和巨噬细胞失调,该研究结果若能在更大的队列中得到验证,将有望为临床医生提供有指导意义的诊断和治疗线索。在该研究的蛋白质组学分析中,团队使用了Q Exactive HF-X辅助TMTpro 16plex标记定量蛋白质组学技术,以及TripleTOF 6600做靶向蛋白质组学多重反应监测技术(MRM-HR)。

3.jpg

  据悉,目前世界各地使用组学研究COVID-19的团队较少,除郭天南团队,仅有德国的Markus Ralser研究组近期使用超短梯度的SWATH对COVID-19血液样品进行了分析。

  “这项研究工作是我们团队与临床团队和代谢组学研究团队一起合作的,通过发挥三方的长处,强强联合、跨界合作,最终完成了这篇文章。”郭天南说到。今后团队会继续开发适用于各种临床需求的蛋白质组技术和基于蛋白质检测的临床应用,同时联合其他领域的科研团队,让生命科学的研究更加全面。

西湖大学蛋白质组大数据实验室

  郭天南2006年毕业于华中科技大学同济医学院临床医学七年制,同时获得武汉大学生物科学双学位,2012年获得新加坡南洋理工大学博士学位,2012-2017年在瑞士苏黎世联邦理工大学Ruedi Aebersold教授实验室从事博士后研究,2017年8月加入西湖大学前身任特聘研究员。在加入西湖大学之前,郭天南曾在澳大利亚悉尼大学儿童医学研究所ProCan任Scientific Director,肿瘤蛋白质组Group Leader,悉尼大学医学院兼聘高级讲师。

  西湖大学是由施一公、饶毅、潘建伟、陈十一等七位倡议人提出并成立于2018年,施一公任首任校长。西湖大学定位“高起点、小而精、研究型”,致力于集聚一流师资、打造一流学科、培育一流人才、产出一流成果。西湖大学由西湖教育基金会举办,得到了各级政府和社会力量的支持,其行政制度是为了科研活动有效配置,给PI极大的自由探索的灵活度,让PI能专注于科学研究。郭天南表示:“西湖大学给予PI们极大的信任和自主性,独特的行政制度配合科研需求,能够快速有效推进我们的研究。”

实现精准医学的路径:快速、取样量少、准确定量

  在生命体内,各个蛋白质就像机械钟表的齿轮般协同合作、互相调控,从而实现一系列精密且复杂的生命活动。因此,检测生物体中蛋白质的种类和含量,对探究生命活动的奥秘有着不可替代的重要意义。对此,郭天南表示:“我们团队的使命是在尽可能短的时间内,从尽可能小量的生物样本中,对尽可能多的蛋白质进行准确定量,进而解析生命活动的数学规律,最终实现基于蛋白质组的精准医疗。”

  目前,团队主要在甲状腺结节诊断、非靶向蛋白质组检测、DIA张量、压力循环技术处理活检组织样品四大方面进行研究,并且已经取得了一些进展。

  助力甲状腺结节诊断,提高诊断的准确性

  甲状腺结节是一种人群高发的疾病,从尸检的统计报告中显示,大约50%的人患有甲状腺结节,目前有10%左右甲状腺结节在体检的时候被发现。患有甲状腺结节的患者通常会进行细针穿刺,从细胞病理学上来看大部分都是良性,很少一部分为恶性。但是,此外有大约30%的结节无法明确诊断。对于无法诊断的甲状腺结节,大部会被手术切除,而手术后的结节通过术后细致的病理诊断后发现,大约有80%的结节属于良性结节,在不压迫血管神经的情况下并不需要手术切除。这也是甲状腺癌过度诊断的原因之一。

  下面这张截图来自2018年发表在Nature Reviews Endocrinology上的文章,该文总结了目前市面上商业使用的分子测试甲状腺结节良恶性试剂盒的效果。这些试剂盒的灵敏度达到83%~100%,但是特异性只有10%~52%。这里的特异性是指:被诊断为恶性肿瘤的人群中,只有10%~52%的患者真正患有恶性肿瘤。也就是说,许多只患有良性结节的患者,他们的甲状腺仍旧被切除了。

4.jpg

  对此,郭天南表示:“为了解决这一问题,我们从蛋白质角度进行入手。我们采集了来自于新加坡的1725个甲状腺组织的蛋白质组,同时通过机器学习建立一个区分甲状腺结节良恶性的模型。然后在另外三家独立的临床医院的288个石蜡样本进行模型验证,综合准确率高达90.62%。我们随后在另外一家独立的医院进行了前瞻性的穿刺样本验证。最终结果显示,我们的模型准确率大约在90%左右。”利用这项技术,有望协助临床医生提高甲状腺结节诊断的准确性。

  微流短梯度非靶向蛋白质组检测结合靶向蛋白质组验证流程,降低质谱检测蛋白质成本

  从蛋白质组学的通用技术来看,对于一种疾病,可采用标志物发现-定量-验证的流程,但该周期一般较长、检测成本高、临床大批量样本检测稳定性不高。郭天南团队联合SCIEX开发了微流短梯度的非靶向蛋白质组(SWATH-MS)检测结合靶向蛋白质组(MRM-HR)验证的流程,并通过已经在一个200例临床前列腺癌及前列腺增生的队列系统评价该流程的可行性,包括:大大提高蛋白质组的检测通量,减低蛋白质检测的成本,更重要的是增加大批量临床样本检测的稳定性。

  实例表明,团队利用扫描速度较快的SCIEX TripleTOF6600 检测约200例的前列腺癌和前列腺增生的组织多肽样本,15分钟即可有效定量到4037个蛋白质,是传统2小时SWATH 方法鉴定到的80%的蛋白,但只需要25%的时间消耗。而对于蛋白质组学大数据更有意义的优势在于将批次间效应(batch effect) 降低20%。

  郭天南表示:“对于大批量临床样本首先需经过科学的批次设计,考虑对实验结果可能的影响因素,诸如年龄、性别、病理类型、分型和分期等,平均随机分布到不同批次间,从而弱化批次间效应。除了不同类型的样本引入的误差,对于长梯度的蛋白质组方法还存在仪器误差,尤其是液相的色谱柱对保留时间以及肽段分离的影响较大。我们的方法增加了色谱柱利用效率,就可以减弱这种批次效应。”

  DIA张量(DIA Tensor)

  目前传统的蛋白质组分析方法需要鉴定蛋白后才可以建立机器学习模型并作临床诊断,需要较多的分析步骤和分析时间。郭天南团队联合合作者开发了一种新型的分析,基于DIA的蛋白质组数据的方法和存储格式--DIA张量(DIA Tensor),结合深度学习可以直接应用于临床的诊断预测。新方法可以直接对原始数据分析,通过生成DIAT张量的方式并直接应用于深度学习模型,直接进行临床预测。郭天南表示:“随着DIA蛋白组数据的质量和数量的增加,我们可以预见本技术在临床诊断中的潜力,为提供疾病分型诊断提供有效解决方案。”

  压力循环技术处理活检组织样品,提速检测样品速度

  多数临床样本为了能够长久保存,通常是经过福尔马林固定、石蜡包埋的坚硬的柱状组织,从中提取足够的多肽是一大难题。PCT( Pressure Cycling Technology)压力循环技术采用的是高压到低压来回循环的方式,使样品在这种压力循环的过程中得到彻底的释放。郭天南团队运用PCT技术处理活检组织样品(~0.5mg)的速度可提高一倍,只需要大约3小时即可处理16个组织样品,从组织到多肽。平均11.25分钟处理一个组织样品,非常适用于高通量临床蛋白质组学。该方法不仅适用于新鲜的组织样品处理,也适用于石蜡块、石蜡切片和石蜡柱,有效处理石蜡柱是团队开发的PCT独有特色。同先前的实验方法相比,这种技术不需要增加任何新的或特殊的试剂。团队进一步优化了试剂浓度后,使国产的胰酶效力毫不逊色进口产品,方法性价比非常高。

  “作为临床应用,我们不仅使用了高通量15分钟的高液相流速SWATH(SCIEX TripleTOF6600),测试了每天处理60个以上的复杂组织样品的高通量蛋白质组; 而且也测试了PulseDIA (Thermo QE HFX)和16-plex TMT (Thermo QE HFX),进行了通量较低、但是高深度的蛋白质组定量。质谱方法的选择依临床问题和样品而定。”郭天南小结说。

蛋白质组学25年发展历程

  谈到蛋白质组学的发展和技术趋势,郭天南首先简要回顾了蛋白质组的发展历程。

  蛋白质组学不是凭空诞生的一个新学科,而是基于一系列蛋白质的生物化学研究和多肽质谱的研究衍生发展而来的,所有这些相关学科的研究都被串起来,成为这一新学科的基石。

  1994年 “proteome” (蛋白质组)一词首次出现在博士研究生马克·威尔金斯博士毕业论文中。

  1997年 瑞士苏黎世联邦理工大学的皮特·詹姆斯在他发表于剑桥大学《生物物理学》季刊首次提出蛋白质组学(proteomics)一词。

  1997年,人类基因组计划进行得如火如荼,2001年,《科学》(Science)杂志和《自然》(Nature)杂志分别出版专刊,报道了人类基因组计划草图的完成,兴奋地宣告解读了人类生命的编码的完成,并预告了蛋白质组时代的来临。

  生命科学的中心法则清楚地表明,基因只是遗传编码,在生命活动中真正发挥作用的主要是蛋白质,并且蛋白质组学比基因组学要复杂得多。在人们早期研究中,发现人类基因组中的基因数(约33,000个基因)远少于人类蛋白质组中的蛋白质数(至少200,000个蛋白质),因此,在《科学》杂志报道人类基因组计划完成的专刊上,华盛顿大学的斯坦利·菲尔茨(Stanley Fields)预言蛋白质组学将很快取代基因组学成为生命科学研究的焦点。不久之后,《自然》杂志的专刊则在显著版面报道了人类蛋白质组学组织(HUPO)的成立,并宣告生命科学正式进入蛋白质组学时代。

5.jpg

中心法则

  21世纪初,随着色谱-质谱技术的高速发展,为蛋白质组研究注入了新的活力,比如蛋白质的鉴定、蛋白质结构的解析、靶向蛋白质定量、蛋白质降解的研究等的重大突破,都得益于色谱-质谱技术。“目前,基于液相色谱-质谱联用(LC-MS/MS)的DIA技术(data-independent acquisition,数据非依赖采集)以及单细胞蛋白质组学分析都是目前人们研究的热点。”郭天南说到。

蛋白质组学面临的挑战

  展望未来,郭天南也提到临床蛋白质组学面临的一些挑战:已经发展到一定程度的色谱-质谱技术仍有需要突破的“技术瓶颈”:如何对更小重量的组织进行深度蛋白质组分析?如何更快的进行深度蛋白质组学分析?如何进一步降低蛋白质组学分析的成本以利于多中心临床队列的分析?这都是未来需要解决的问题。目前面临的挑战包括:样本的质量控制,数据的联合分析,深度挖掘及解读。

  一般认为,相较于基因组学,蛋白质组学的发展似乎有点儿慢。对此,郭天南认为主要是因为蛋白质的复杂性和多变性,完全意义上的蛋白质组学至今仍是一个科学理想,因为至今无人知道一个生物体内到底有多少蛋白质。蛋白质组学的发展在大众看来稍落后于基因组学。

  但是随着色谱-质谱技术在过去的20年高速发展,越来越多的生物医学科学家的研究受益于这项技术,比如未知蛋白质的鉴定、蛋白质相互作用的鉴定、翻译后修饰的鉴定、蛋白质结构的解析、靶向蛋白质定量、蛋白质降解的研究等。有些方法比如靶向蛋白质组学,正在走向临床试验。

临床样本数据库:从组织样本到数字文件

  2015年,郭天南和当时瑞士的团队结合压力循环技术(PCT)和SWATH-MS技术,提出一种将临床组织样本转换为单个数字文件的方法,应用该方法对样本的蛋白组学信息进行记录,方便研究人员对样本信息进行反复分析和对比。“这一方法的提出对增加临床样本的利用效率具有重要意义,我们将这一研究成果发表于《Nature Medicine》,得到了当时澳大利亚以及美国相关机构的认可与支持。”郭天南说到 。

6.jpg

  活体组织检查(biopsy)简称"活检",是指应诊断、治疗的需要,从患者体内切取、钳取或穿刺等取出病变组织,进行病理学检查的技术。这是诊断病理学中最重要的部分,对绝大多数送检病例都能做出明确的组织病理学诊断,被作为临床的最后诊断。活检取出的组织样本一般量比较少,对于病人疾病的检测和诊断非常重要。但每一个临床样本都具有其独特性,样本的量非常有限并且类似于组织活检这样的小样本经常会在一系列检验分析之后被消耗殆尽。

  “针对上述问题,我们提出一种结合压力循环技术(PCT)和SWATH-MS技术的方法,能够将小量的组织样本转变成单个数字文件,该类文件基于质谱技术,记录着样本的蛋白组学信息,并具有快速和可重复性特点。”郭天南说到。该方法导出的蛋白质组学图谱文件能够用于不同样本之间特定蛋白质的分析、重分析、对比以进行检测和量化。随后,这项技术被英国曼切斯特大学Stoller Centre和澳大利亚悉尼大学医学院ProCan所采用。ProCan计划在5-7年内规划运用这项技术完成7万个肿瘤组织样品的蛋白质组的检测,并建立相应的生物信息数据库,辅助精准医疗。

未来展望

  最后,我们请郭天南展望一下质谱和组学技术的未来,他表示:

  “希望未来的质谱技术达到更高的通量,可以分析更小量的样品,准确度更高,更好的同AI技术融合,能够解决临床的实际问题。

  我们非常渴望看到,蛋白质组学技术能够在3年内参与到多个临床试验,5年内进入临床诊疗,10年内希望蛋白质组学,能够进入千家万户,为实现大健康计划贡献独有的力量。”

相关文章

郭天南:全景式组学研究为新冠重症早诊断提供决策依据

分析测试百科网讯在新冠肺炎COVID-19疫情肆虐全球之际,PCR技术在快速筛查中已大显神威,但进入临床后如何更早地区分轻症和重症患者,从而更准确地治疗和用药?5月27日中国研究人员在《Cell》发表......

郭天南:全景式组学研究为新冠重症早诊断提供决策依据

分析测试百科网讯在新冠肺炎COVID-19疫情肆虐全球之际,PCR技术在快速筛查中已大显神威,但进入临床后如何更早地区分轻症和重症患者,从而更准确地治疗和用药?5月27日中国研究人员在《Cell》发表......

郭天南:全景式组学研究为新冠重症早诊断提供决策依据

分析测试百科网讯在新冠肺炎COVID-19疫情肆虐全球之际,PCR技术在快速筛查中已大显神威,但进入临床后如何更早地区分轻症和重症患者,从而更准确地治疗和用药?5月27日中国研究人员在《Cell》发表......

郭天南:全景式组学研究为新冠重症早诊断提供决策依据

分析测试百科网讯在新冠肺炎COVID-19疫情肆虐全球之际,PCR技术在快速筛查中已大显神威,但进入临床后如何更早地区分轻症和重症患者,从而更准确地治疗和用药?5月27日中国研究人员在《Cell》发表......

郭天南:全景式组学研究为新冠重症早诊断提供决策依据

分析测试百科网讯在新冠肺炎COVID-19疫情肆虐全球之际,PCR技术在快速筛查中已大显神威,但进入临床后如何更早地区分轻症和重症患者,从而更准确地治疗和用药?5月27日中国研究人员在《Cell》发表......

都是谁?去过哪?北京11日至今新增297例新冠患者一览

6月27日0时至24时,新增报告本地确诊病例14例、疑似病例1例、无症状感染者3例;无新增报告境外输入确诊病例、疑似病例、无症状感染者。6月11日0时至6月27日24时,累计报告本地确诊病例311例,......

多名患者“核酸阴、抗体阳”抗体检测比核酸更“靠谱”?

两种检测方法各有利弊。核酸检测的优点在于直接、早期即能适用,缺点在于从采样到检测环节较多,结果易被影响。抗体检测十分灵敏,但存在窗口期,较为滞后。昨日,北京11人确诊为新冠肺炎患者,有10人完成流调。......

陈薇团队:新型冠状病毒抗体研究取得重大突破

我国科学家在新型冠状病毒抗体研究中取得重大突破,由中国工程院院士、军事科学院军事医学研究院研究员陈薇领衔的团队,发现了首个靶向刺突蛋白N端结构域的高效中和单克隆抗体。北京时间6月22日22:00,国际......

李凤琴:新冠病毒不会在食品间传播但可能被污染

新冠病毒不会在食品之间传播。食品不会感染新型冠状病毒,但有可能被污染。国家卫生健康委员会专家组专家、国家食品安全风险评估中心微生物实验室主任李凤琴23日在发布会上这样说。李凤琴表示,新冠病毒是不会在食......

北京一外卖小哥确诊!每天接50单左右

6月23日下午,北京召开第130场新冠肺炎疫情防控工作新闻发布会。北京市疾病预防控制中心主任曾晓芃介绍,6月22日0时至24时,北京市新增新冠肺炎确诊病例13例,其中男性9例,女性4例;平均年龄37岁......