发布时间:2023-08-02 10:08 原文链接: 深圳先进院等建立单细胞轨迹推断技术

  7月31日,中国科学院深圳先进技术研究院合成生物学研究所胡政课题组与厦门大学数学科学学院周达课题组合作,在《自然-生物技术》(Nature Biotechnology)上,发表了题为PhyloVelo enhances transcriptomic velocity field mapping using monotonically expressed genes的研究论文,提出了新颖的单细胞分化轨迹推断的算法框架,并命名为PhyloVelo。该方法通过联合单细胞转录组数据和谱系示踪数据,鉴定随细胞分裂而表达量呈单调递增或递减的基因即单调表达基因,并利用演化方法估计单调基因的RNA转录变化速度,以构建单细胞转录组速度场(RNA velocity fields),实现对细胞分化轨迹的高精准推断。

  细胞分化和命运决定是生命的奥秘之一,也是生命科学领域的核心问题,揭示其规律和机制对于探索生命现象和促进医学发展具有重要意义。然而,准确地追踪细胞的动态分化轨迹并非易事,尤其是在疾病等干扰情况下的细胞命运转换过程,存在较大的随机性和难以预测性。当前,单细胞转录组测序(scRNA-seq)是研究细胞分化的强有力的技术,可以通过分析单个细胞的转录组状态来推断细胞分化的动态过程。尤其是基于信使RNA(mRNA)的剪切动力学而发展起来的RNA速度模型(RNA velocity),可预测单细胞转录组在“过去”或“未来”时间的状态,是单细胞轨迹推断的经典算法。然而,由于单细胞测序技术与mRNA转录/剪切动力学的高度复杂性,RNA速度模型在实际应用中常出现错误推断或不稳健的问题。

  本研究提出利用单细胞系统发育树的枝长信息代替物理时间,联合单细胞转录组数据,可以探究基因表达随着枝长(即时间)的变化规律,特别是鉴定随细胞分裂而表达量呈单调递增或递减的基因(即单调表达基因),其RNA变化速度可以利用分子演化模型进行定量估计,从而构建单细胞转录组速度场,实现对细胞分化轨迹的高精准推断(图1)。

  PhyloVelo算法主要分为两部分。第一步是单调表达基因(monotonically expressed gene,MEGs)的识别,利用单细胞转录组数据和细胞系统发育树(cell phylogeny)信息,通过带漂移的扩散过程模型(diffusion process)和零膨胀的负二项分布(ZINB)来估计每个基因在系统发育树上各个时间点的表达水平;进而,利用表达水平估计值和对应系统发育树时间的相关性,筛选出那些随着谱系时间线性单调增加或减少的基因,即单调表达基因MEGs(图1)。第二步是基因表达变化速度的估计,假设每个MEG的表达水平随着时间的变化速率是恒定的,即扩散方程中的漂移系数是常数;通过最大似然估计,可以得到每个MEG的漂移系数,从而得到每个细胞的单调基因表达变化速度的向量;将这个向量映射到降维空间(tSNE, UMAP等)重建RNA速度场,可推断每个细胞在过去一个单位时间(如一个细胞分裂或突变)的转录组状态,即逆时间重建细胞分化轨迹(图1)。

  该研究在多种仿真数据和真实数据上对PhyloVelo算法的准确性和鲁棒性进行了验证。PhyloVelo都能够高准确地推断仿真数据中的线性、分叉和趋同等复杂分化结构,与真实分化轨迹高度一致(图2)。此外,PhyloVelo还在小鼠早期胚胎发育中表现出优于RNA velocity的性能,能够准确地识别出红细胞系列中血液/内皮祖细胞作为最早期的细胞类型,且与细胞增殖能力呈强相关(图3)。

  除了小鼠胚胎发育外,PhyloVelo还准确解析了小鼠和人类的肿瘤演化、免疫细胞动态发育等其他生物过程中的复杂分化轨迹,并量化了细胞类型之间的状态转换概率。例如,在肺癌模型中,PhyloVelo揭示了癌细胞的逆向分化轨迹。在抗PD-1治疗后的CD8+ T细胞中,PhyloVelo发现活化CD8+ T细胞的来源在免疫治疗前后有明显的变化,表明T细胞高度的命运可塑性。

  总之,PhyloVelo是利用单细胞谱系和转录组数据重建细胞命运转变的新方法,具有高度的准确性和鲁棒性。PhyloVelo可以克服传统RNA velocity方法的局限性,并可以发现隐藏在转录组数据中的“时钟基因”,为揭示细胞分化的分子机制提供线索。PhyloVelo为研究生物发育和疾病进展提供了有力的工具,也为未来的单细胞谱系和转录组数据分析提供了新视角。为了方便使用,研究团队在线发布了使用手册和具体应用案例(详见https://phylovelo.readthedocs.io/en/latest/)。

  研究工作得到国家重点研发计划、国家自然科学基金、广东省杰出青年基金、中央高校基本科研专项资金、中国博士后基金和深圳合成生物学创新研究院等的支持。该研究由深圳先进院和厦门大学共同完成。

图1.PhyloVelo算法框架示意图


图2. PhyloVelo准确推断仿真数据中的细胞分化轨迹


图3. PhyloVelo重构小鼠血液系统发育的细胞分化轨迹


图4. PhyloVelo使用手册网站截图

相关文章

被“真”单细胞光环掩盖的高通量分析

01、二代“真”单细胞蛋白质组学质谱:timsTOFUltra2023年6月5日,在第71届ASMS会议上,布鲁克公司重磅发布了timsTOFUltra,“真”单细胞蛋白质组学正式进入第二代。图1:成......

美国NIH坚持要求外国合作者共享原始数据

近期,美国国立卫生研究院(NIH)坚持要求实施此前提出的一项新政策,即其资助的外国合作伙伴定期分享实验室记录以及其他原始数据。对此,数百名研究人员以及相关组织表示抗议,他们警告说,该举措可能会阻碍国际......

深圳先进院等建立单细胞轨迹推断技术

7月31日,中国科学院深圳先进技术研究院合成生物学研究所胡政课题组与厦门大学数学科学学院周达课题组合作,在《自然-生物技术》(NatureBiotechnology)上,发表了题为PhyloVeloe......

深圳先进院等建立单细胞轨迹推断技术

7月31日,中国科学院深圳先进技术研究院合成生物学研究所胡政课题组与厦门大学数学科学学院周达课题组合作,在《自然-生物技术》(NatureBiotechnology)上,发表了题为PhyloVeloe......

单细胞和空间组学技术在肝脏领域应用

近期,中国科学院上海营养与健康研究所李虹研究组在《肝脏病学杂志》(JournalofHepatology)上,发表了题为Single-cellandspatiallyresolvedtranscrip......

揭秘早期哺乳动物的发育过程

由于小鼠的易实验性和强遗传性,其一直是生物医学研究中使用广泛的动物模型。但是,胚胎学研究发现,小鼠早期发育的许多方面与其他哺乳动物不同,从而使有关人类发育的推论复杂化。英国剑桥大学等研究团队合作构建了......

多方面“全面开花”中国经济回升向好势不可挡

央视网消息:通过数据看经济,今天的《新闻联播》关注了哪些领域?央视网为您梳理。数据一:增长13.3%。财政部7月19日上午召开新闻发布会,发布上半年财政收支情况。今年上半年,全国一般公共预算收入119......

肝脏生物学中单细胞和空间组学技术的成果与挑战

近期,中国科学院上海营养与健康研究所李虹研究组在《肝脏病学杂志》(JournalofHepatology)上,发表了题为Single-cellandspatiallyresolvedtranscrip......

上半年中国经济表现如何?有哪些新变化和新特点?

2023年时间已经过半,近期各部门陆续公布上半年的经济数据,上半年中国经济表现如何?有哪些新变化和新特点?记者采访了多位高端智库的权威专家和研究机构的首席经济学家,来听听他们对于上半年经济形势的分析和......

基于液质联用的单细胞蛋白质组学研究进展

摘要    蛋白质是细胞功能的主要执行者,由于其无法在体外进行扩增,单细胞蛋白质组学技术相较单细胞基因组学和转录组学技术而言发展相对滞后。传统的蛋白质组学技术可......