发布时间:2023-08-02 10:08 原文链接: 深圳先进院等建立单细胞轨迹推断技术

  7月31日,中国科学院深圳先进技术研究院合成生物学研究所胡政课题组与厦门大学数学科学学院周达课题组合作,在《自然-生物技术》(Nature Biotechnology)上,发表了题为PhyloVelo enhances transcriptomic velocity field mapping using monotonically expressed genes的研究论文,提出了新颖的单细胞分化轨迹推断的算法框架,并命名为PhyloVelo。该方法通过联合单细胞转录组数据和谱系示踪数据,鉴定随细胞分裂而表达量呈单调递增或递减的基因即单调表达基因,并利用演化方法估计单调基因的RNA转录变化速度,以构建单细胞转录组速度场(RNA velocity fields),实现对细胞分化轨迹的高精准推断。

  细胞分化和命运决定是生命的奥秘之一,也是生命科学领域的核心问题,揭示其规律和机制对于探索生命现象和促进医学发展具有重要意义。然而,准确地追踪细胞的动态分化轨迹并非易事,尤其是在疾病等干扰情况下的细胞命运转换过程,存在较大的随机性和难以预测性。当前,单细胞转录组测序(scRNA-seq)是研究细胞分化的强有力的技术,可以通过分析单个细胞的转录组状态来推断细胞分化的动态过程。尤其是基于信使RNA(mRNA)的剪切动力学而发展起来的RNA速度模型(RNA velocity),可预测单细胞转录组在“过去”或“未来”时间的状态,是单细胞轨迹推断的经典算法。然而,由于单细胞测序技术与mRNA转录/剪切动力学的高度复杂性,RNA速度模型在实际应用中常出现错误推断或不稳健的问题。

  本研究提出利用单细胞系统发育树的枝长信息代替物理时间,联合单细胞转录组数据,可以探究基因表达随着枝长(即时间)的变化规律,特别是鉴定随细胞分裂而表达量呈单调递增或递减的基因(即单调表达基因),其RNA变化速度可以利用分子演化模型进行定量估计,从而构建单细胞转录组速度场,实现对细胞分化轨迹的高精准推断(图1)。

  PhyloVelo算法主要分为两部分。第一步是单调表达基因(monotonically expressed gene,MEGs)的识别,利用单细胞转录组数据和细胞系统发育树(cell phylogeny)信息,通过带漂移的扩散过程模型(diffusion process)和零膨胀的负二项分布(ZINB)来估计每个基因在系统发育树上各个时间点的表达水平;进而,利用表达水平估计值和对应系统发育树时间的相关性,筛选出那些随着谱系时间线性单调增加或减少的基因,即单调表达基因MEGs(图1)。第二步是基因表达变化速度的估计,假设每个MEG的表达水平随着时间的变化速率是恒定的,即扩散方程中的漂移系数是常数;通过最大似然估计,可以得到每个MEG的漂移系数,从而得到每个细胞的单调基因表达变化速度的向量;将这个向量映射到降维空间(tSNE, UMAP等)重建RNA速度场,可推断每个细胞在过去一个单位时间(如一个细胞分裂或突变)的转录组状态,即逆时间重建细胞分化轨迹(图1)。

  该研究在多种仿真数据和真实数据上对PhyloVelo算法的准确性和鲁棒性进行了验证。PhyloVelo都能够高准确地推断仿真数据中的线性、分叉和趋同等复杂分化结构,与真实分化轨迹高度一致(图2)。此外,PhyloVelo还在小鼠早期胚胎发育中表现出优于RNA velocity的性能,能够准确地识别出红细胞系列中血液/内皮祖细胞作为最早期的细胞类型,且与细胞增殖能力呈强相关(图3)。

  除了小鼠胚胎发育外,PhyloVelo还准确解析了小鼠和人类的肿瘤演化、免疫细胞动态发育等其他生物过程中的复杂分化轨迹,并量化了细胞类型之间的状态转换概率。例如,在肺癌模型中,PhyloVelo揭示了癌细胞的逆向分化轨迹。在抗PD-1治疗后的CD8+ T细胞中,PhyloVelo发现活化CD8+ T细胞的来源在免疫治疗前后有明显的变化,表明T细胞高度的命运可塑性。

  总之,PhyloVelo是利用单细胞谱系和转录组数据重建细胞命运转变的新方法,具有高度的准确性和鲁棒性。PhyloVelo可以克服传统RNA velocity方法的局限性,并可以发现隐藏在转录组数据中的“时钟基因”,为揭示细胞分化的分子机制提供线索。PhyloVelo为研究生物发育和疾病进展提供了有力的工具,也为未来的单细胞谱系和转录组数据分析提供了新视角。为了方便使用,研究团队在线发布了使用手册和具体应用案例(详见https://phylovelo.readthedocs.io/en/latest/)。

  研究工作得到国家重点研发计划、国家自然科学基金、广东省杰出青年基金、中央高校基本科研专项资金、中国博士后基金和深圳合成生物学创新研究院等的支持。该研究由深圳先进院和厦门大学共同完成。

图1.PhyloVelo算法框架示意图


图2. PhyloVelo准确推断仿真数据中的细胞分化轨迹


图3. PhyloVelo重构小鼠血液系统发育的细胞分化轨迹


图4. PhyloVelo使用手册网站截图

相关文章

全球首个奶牛多组织单细胞表达图谱诞生

中国农业大学动物科学技术学院教授孙东晓团队构建了覆盖奶牛59种组织、179万个细胞的多组织单细胞表达图谱,为解析牛重要性状遗传调控机制、推进精准育种及探索人类疾病的牛模型研究提供了重要资源。9月5日,......

科学家首次评估单细胞固氮蓝藻的全球固氮通量

厦门大学教授史大林团队基于在西北太平洋副热带流涡区开展的高分辨率观测,定量分析了固氮生物群落的丰度、结构和固氮速率,进而应用广义加性模型刻画的优势固氮蓝藻的生态位特征预测了其在全球海洋的主要分布格局,......

数据“中毒”会让AI“自己学坏”

在一个繁忙的火车站,监控摄像头正全方位追踪站台的情况,乘客流量、轨道占用、卫生状况……所有信息实时传输给中央人工智能(AI)系统。这个系统的任务是帮助调度列车,让它们安全准点进站。然而,一旦有人恶意干......

科学家开发出基因挖掘新策略

得益于双子叶模式植物拟南芥和单子叶模式植物水稻的遗传学研究,植物发育生物学在过去40年取得了长足发展。植物分生组织(干细胞)的建立与维持机制、重要组织和器官的分化轨迹及其核心调控网络已初步建立。这些基......

研究提出单细胞多组学新方法实现胰腺癌循环肿瘤细胞多维度解析

近日,中国科学院广州生物医药与健康研究院研究员林达等报道了新开发的单细胞多组学技术——Uni-C。该方法可在一个细胞中同时解析基因组大尺度结构变异(如SV、CNV、ecDNA)、小尺度突变(SNP/I......

国家数据局召开推动地方数据集团创新发展专题座谈会

为推动地方数据集团创新发展,服务全国一体化数据市场培育建设,7月23日,国家数据局组织召开座谈会。国家数据局党组书记、局长刘烈宏出席会议并讲话,局党组成员、副局长沈竹林、夏冰、余英出席会议。局党组成员......

水稻多器官单细胞多组学图谱问世

记者杨舒从中国农业科学院生物技术研究所获悉,该所作物耐逆性调控与改良创新团队日前联合国内外研究机构,构建了首个水稻的多器官单细胞多组学图谱,系统解析了水稻不同细胞类型的功能及其对复杂性状的调控作用,有......

智能化养猪助力育种领域全新探索

随着人工智能(AI)、自动化等技术的持续突破,利用传感器进行数据采集与高速传输,并通过物联网存储海量数据,正持续推进智能化养殖业发展,逐渐成为推动猪育种向精准化、高效化、智能化转型的核心驱动力。从整个......

6月杭州|首届单细胞蛋白质组学术会议第一轮通知

作为当前生物医学研究的前沿热点领域,单细胞蛋白质组学通过在单细胞层面上探索蛋白质表达模式,精确揭示细胞异质性,为解码生命过程和疾病发生机制提供了独特视角,已成为赋能精准医疗和生物医药创新的关键技术,是......

解锁布鲁克BeaconDiscovery™,开启活体单细胞功能分析新时代

BeaconDiscovery™单细胞功能表征平台将帮助研究者解锁活体单细胞功能分析的全部潜力。它采用Beacon®的光电定位(OEP)和微流体芯片光技术,使研究人员能够实时探索多模态和动态细胞反应,......