发布时间:2023-08-03 16:39 原文链接: 深圳先进院等建立单细胞轨迹推断技术

  7月31日,中国科学院深圳先进技术研究院合成生物学研究所胡政课题组与厦门大学数学科学学院周达课题组合作,在《自然-生物技术》(Nature Biotechnology)上,发表了题为PhyloVelo enhances transcriptomic velocity field mapping using monotonically expressed genes的研究论文。该研究提出了新颖的单细胞分化轨迹推断的算法框架,并命名为PhyloVelo。该方法通过联合单细胞转录组数据和谱系示踪数据,鉴定随细胞分裂而表达量呈单调递增或递减的基因即单调表达基因,并利用演化方法估计单调基因的RNA转录变化速度,以构建单细胞转录组速度场(RNA velocity fields),实现对细胞分化轨迹的高精准推断。

  细胞分化和命运决定是生命的奥秘之一,也是生命科学领域的核心问题,揭示其规律和机制对于探索生命现象和促进医学发展具有重要意义。然而,准确地追踪细胞的动态分化轨迹并非易事,尤其是在疾病等干扰情况下的细胞命运转换过程,存在较大的随机性和难以预测性。当前,单细胞转录组测序(scRNA-seq)是研究细胞分化的强有力的技术,可通过分析单个细胞的转录组状态来推断细胞分化的动态过程。尤其是基于信使RNA(mRNA)的剪切动力学而发展起来的RNA速度模型(RNA velocity),可预测单细胞转录组在“过去”或“未来”时间的状态,是单细胞轨迹推断的经典算法。然而,由于单细胞测序技术与mRNA转录/剪切动力学的高度复杂性,RNA速度模型在实际应用中常出现错误推断或不稳健的问题。

  本研究提出利用单细胞系统发育树的枝长信息代替物理时间,联合单细胞转录组数据,可以探究基因表达随着枝长(即时间)的变化规律,特别是鉴定随细胞分裂而表达量呈单调递增或递减的基因(即单调表达基因),其RNA变化速度可以利用分子演化模型进行定量估计,从而构建单细胞转录组速度场,实现对细胞分化轨迹的高精准推断(图1)。

  PhyloVelo算法主要分为两部分。第一步是单调表达基因(monotonically expressed gene,MEGs)的识别,利用单细胞转录组数据和细胞系统发育树(cell phylogeny)信息,通过带漂移的扩散过程模型(diffusion process)和零膨胀的负二项分布(ZINB)来估计每个基因在系统发育树上各个时间点的表达水平;进而,利用表达水平估计值和对应系统发育树时间的相关性,筛选出那些随着谱系时间线性单调增加或减少的基因,即单调表达基因MEGs(图1)。第二步是基因表达变化速度的估计,假设每个MEG的表达水平随着时间的变化速率是恒定的,即扩散方程中的漂移系数是常数;通过最大似然估计,可以得到每个MEG的漂移系数,从而得到每个细胞的单调基因表达变化速度的向量;将这个向量映射到降维空间(tSNE, UMAP等)重建RNA速度场,可推断每个细胞在过去一个单位时间(如一个细胞分裂或突变)的转录组状态,即逆时间重建细胞分化轨迹(图1)。

  该研究在多种仿真数据和真实数据上对PhyloVelo算法的准确性和鲁棒性进行了验证。PhyloVelo均能够高准确地推断仿真数据中的线性、分叉和趋同等复杂分化结构,与真实分化轨迹高度一致(图2)。此外,PhyloVelo还在小鼠早期胚胎发育中表现出优于RNA velocity的性能,能够准确地识别出红细胞系列中血液/内皮祖细胞作为最早期的细胞类型,且与细胞增殖能力呈强相关(图3)。

  除了小鼠胚胎发育外,PhyloVelo还准确解析了小鼠和人类的肿瘤演化、免疫细胞动态发育等其他生物过程中的复杂分化轨迹,并量化了细胞类型之间的状态转换概率。例如,在肺癌模型中,PhyloVelo揭示了癌细胞的逆向分化轨迹。在抗PD-1治疗后的CD8+ T细胞中,PhyloVelo发现活化CD8+ T细胞的来源在免疫治疗前后有明显的变化,表明T细胞高度的命运可塑性。

  总之,PhyloVelo是利用单细胞谱系和转录组数据重建细胞命运转变的新方法,具有高度的准确性和鲁棒性。PhyloVelo可以克服传统RNA velocity方法的局限性,并可以发现隐藏在转录组数据中的“时钟基因”,为揭示细胞分化的分子机制提供线索。PhyloVelo为探索生物发育和疾病进展提供了有力的工具,并为未来的单细胞谱系和转录组数据分析提供了新视角。为了方便使用,研究团队在线发布了使用手册和具体应用案例(详见https://phylovelo.readthedocs.io/en/latest/)。

  研究工作得到国家重点研发计划、国家自然科学基金、广东省杰出青年基金、中央高校基本科研业务费专项资金、中国博士后基金和深圳合成生物学创新研究院等的支持。该研究由深圳先进院和厦门大学共同完成。

image.png

图1.PhyloVelo算法框架示意图

image.png

图2.PhyloVelo准确推断仿真数据中的细胞分化轨迹

image.png

图3.PhyloVelo重构小鼠血液系统发育的细胞分化轨迹

image.png

图4.PhyloVelo使用手册网站截图

相关文章

大脑共变模式揭秘基因/心理与疼痛敏感性之谜

疼痛是不愉快的主观体验,但对疼痛感知的敏感性存在较大的个体间差异。探究疼痛敏感性个体差异的产生机制,对于阐释慢性疼痛的易感性并进行个性化疼痛管理具有重要意义。已有研究提示,疼痛敏感性的个体差异可能受到......

医疗AI引领范式革命,国内首家人工智能医院正式揭牌

经过十年深耕,人工智能已广泛应用于医疗领域,嵌入影像学、信息学、生命科学等各个应用场景,为医疗流程降本增效,甚至颠覆传统范式。然而,由于缺乏统筹的人工智能厂商,医院内的人工智能应用往往分散、间断,无法......

学者同聚北师大,Urimarker2023共讨新发展

——第三届尿液生物标志物学术研讨会(Urimarker2023)顺利召开11月4日-11月5日,第三届尿液生物标志物学术研讨会(Urimarker2023)于北京师范大学圆满落幕。本次研讨会采用线上线......

Cellectis股价飙升超180%!阿斯利康又投2.45亿

今日,阿斯利康与Cellectis达成了一项利润丰厚的合作协议,将向这家法国生物技术公司投资2.45亿美元,进一步加强了其致力于开发细胞和基因疗法产品的承诺。该消息令Cellectis的股价在周三盘前......

挑战中显韧性,Revvity第三季度业绩稳健

近日,Revvity公布了其第三季度财务业绩报告。报告中显示本季度调整后收入为6.71亿美元,与去年同期的7.12亿美元相比有所下降。按报告分部划分的第三季度财务概况生命科学2023年第三季度收入为3......

基于高通量测序技术(NGS)的肿瘤基因变异检测伴随诊断试剂的检测范围

基于高通量测序技术(NGS)的肿瘤基因变异检测伴随诊断试剂的检测范围可以包括哪些基因及位点?基于高通量测序技术(NGS)检测人福尔马林固定石蜡包埋(FFPE)组织样本的肿瘤基因变异检测伴随诊断试剂,针......

西南华大生命科学研究院落地重庆

西南华大生命科学研究院(简称“西南华大研究院”)揭牌仪式暨时空病理学术交流会26日在重庆金凤实验室举行,来自全国科研院所、医院、高校的专家学者们与会,探讨时空组学技术在病理研究上的最新进展。时空组学技......

中国生命科学产业设施基金CLSRAVentureI完成8.75亿美元募资

10月19日,康桥医疗健康产业设施平台(CBCHIP)宣布旗下中国生命科学产业设施基金(CLSRAVentureI)成功完成第二轮募资,总金额达到8.75亿美元。这一重要资金募集标志着CBCHIP在推......

清华脑与智能实验室团队:揭示基因信息如何利用细胞形成组织空间形态

近日,清华大学脑与智能实验室与北京大学前沿交叉学科研究院组成的国际科学家团队开发了一种新的计算方法,可以利用单细胞转录组数据重构细胞的空间组织。研究表明,这种名为DeNovoCoalescentEmb......

单台近2千万!富集离子淌度高分辨质谱仪采购项目公开招标

近日,西湖实验室(生命科学和生物医学浙江省实验室)富集离子淌度高分辨质谱仪采购项目进行公开招标。预算金额1980万元,采购一台富集离子淌度高分辨质谱仪。具体如下:一、项目编号:WLL-HW-GK-WM......