发布时间:2021-06-01 09:55 原文链接: mtSC:单细胞类型自动鉴定的新方法

  单细胞测序技术有助于刻画细胞层面的异质性,为进一步探索细胞功能和内在作用机制等奠定了基础。在单细胞转录组测序数据的分析过程中,细胞类型鉴定是必须且重要的一步。常规的细胞类型鉴定依赖于细胞类型标记基因,这种方法费时费力且不稳定,可重复性差,易导致不同实验室的鉴定结果不可比较。随着单细胞测序技术的迅猛发展,众多科学家联名在2017年提出人类细胞图谱计划(The Human Cell Atlas),于2020年提出了人类癌症图谱计划(The Human Tumor Atlas),海量的已标注细胞类型的单细胞转录组测序数据越来越多,利用这些数据作为参考数据集(reference)来鉴定新测序的细胞(single cell assignment against the reference),正成为一种细胞注释的新思路。

  2021年5月29日,同济大学生命科学与技术学院生物信息系刘琦教授课题组(段斌,陈绍奇,陈晓涵为文章共同第一作者)在Nucleic Acids Research线上发表了题为Integrating multiple references for single cell assignment的研究论文,发布了基于人工智能多任务深度度量学习的整合同一组织的多个来源的参考数据集进行单细胞类型自动鉴定的新方法mtSC,以及简单易用的python包平台,和包含人类、小鼠在内的多个组织器官的预训练的完整reference数据集,为有效利用海量的单细胞测序数据,进一步提高细胞类型自动鉴定性能等提供了可借鉴的工具和资源。

  已有的利用参考数据集来鉴定细胞类型的方法大多只基于一个参考数据集,这导致了两个主要缺陷:(1)一个参考数据集的细胞类型数量以及每个细胞类型的细胞数量非常有限,这往往导致“unassigned”和错误的鉴定结果;(2)细胞类型鉴定的结果很大程度上依赖于参考数据集的质量和注释的准确性,这使得只用一个参考数据集的方法结果极不稳定。因此,整合同一组织的不同来源的数据可以很大程度上解决以上痛点,但是,如何有效整合多个参考数据集用于细胞类型鉴定尚缺乏详细的探讨。

  基于以上考量,作者提出了一种基于人工智能多任务深度度量学习的细胞类型鉴定框架mtSC,刘琦课题组之前的工作scLearn已经证明度量学习可以更好的刻画参考数据集的特征,提升细胞类型的鉴定效果,在此基础上,mtSC将度量学习推广至多任务场景,构建了多任务深度度量学习的计算框架。在该框架下,多个参考数据集可视为多个相关的任务。该方法的核心思想是:尽管每个参考数据集来自不同平台,存在批次效应,但是其内在的生物信息是一致的,故可以通过参数共享的多任务学习模式,来揭示其共性特征,同时消除其批次信息。另外,该框架通过避免了对数据层面的直接整合而可以解决批次过矫正(over-correction)的问题。

  该工作通过在多达27套的单细胞benchmark数据集上的基准测试,证明了mtSC具有普适而优良的细胞类型鉴定性能。mtSC计算平台基于python语言开发,同时提供了多达27套预训练的高质量的单细胞转录组测序reference数据集,其中包含了脑细胞,胰腺细胞,免疫细胞等等各个组织的单细胞参考数据集,方便用户后续进行相关领域的研究。需要特别指出的是,该工作进一步的分析指出随着参考数据集的增多,该方法的性能可以进一步提升,同时对于跨物种的细胞类型鉴定也有着很好的效果。综上所述,随着单细胞测序技术的快速发展,单细胞测序数据将不断积累,该类多数据源整合分析的工具将可以发挥更大的作用。

  图1. mtSC的算法框架

  刘琦教授课题组长期从事基于人工智能和组学数据分析的肿瘤精准治疗、药物发现以及基因编辑方面的研究工作,近年来逐步形成了“AI-Omics”交叉融合的研究范式。目前关注的研究方向之一是基于人工智能面向单细胞测序数据开发组学分析平台,及其在肿瘤免疫和细胞治疗领域的应用。2019年,课题组基于人工智能主题学习(Topic model)模型,在Nature Communications发表了针对于单细胞CRISPR筛选数据分析的计算平台MUSIC (Model-based Understanding of single cell CRISPR screening)。2020年,基于度量学习(Metric learning)思想,课题组在Science Advances发表了单细胞细胞类型鉴定的计算平台scLearn (Learning for single cell assignment)。本次工作是刘琦教授课题组继以上两个工作之后在单细胞测序数据整合分析领域的又一有益探索。

  刘琦教授课题组长期招聘生物信息学以及数据科学背景的研究生、博士后以及助理研究院,提供和国内外主流制药公司、CRO公司、AI制药初创公司以及互联网大厂的合作机会。


相关文章

基因组精确注释新方法:增强子鉴定新技术

近日,中国农业科学院深圳农业基因组研究所动物功能基因组学创新团队研发出增强子鉴定新技术。该技术与传统技术相比,平均分辨率提高了约10倍,为基因组的精确注释提供了新方法。相关研究成果发表在《核酸研究》(......

2023获批数创新高,明年这9款疗法可能获批|细胞和基因疗法年度盘点

美国FDA曾在几年前预计,到2025年,每年将批准10-20款细胞和基因疗法。随着这一领域在全球范围内的迅猛发展,今年批准的细胞和基因疗法再创新高,不仅朝着这一目标大步迈进,也为全球病患带来了更多创新......

省重点实验室,精准“狙击”让癌细胞无处遁形

设计系列纳米酶,与光热治疗、光动力治疗、免疫治疗等结合,用于癌症、老年病等重大疾病的治疗;突破太阳能电池关键技术瓶颈,构建高能、低成本、高效率的全新有机太阳能电池体系,将有机太阳能电池效率快速提升至1......

首个免疫细胞图谱,揭示人类肺部发展中免疫细胞的秘密作用

国际研究团队将先进的单细胞技术与肺部器官样体研究相结合,以绘制人类早期肺部免疫细胞的发展过程。他们的研究结果概述了这些细胞在人类肺部组织的发育过程中如何起到积极而密切的指导作用,揭示了免疫系统和呼吸系......

推动细胞和基因疗法工艺标准的发展

Polyplus,萨多利斯集团的一部分,已同意与韩国细胞和基因疗法(CGT)的CDMOMarkHerz合作,开发以降低治疗产品每剂的成本并提高质量为重点的新的CGT效率标准。团队将通过利用Polypl......

近红外光驱动的分子凿岩锤:治疗癌症的突破

以下是对您提供的文本的中文翻译:使用于医学成像的荧光合成染料类别,嵌入在癌细胞的膜中并快速振动,诱发坏死。由于整个分子的振动持续时间不到一皮秒,这些振动的氨基青黄素可以在低光水平或浓度下干扰事物的运作......

公安食药环检验鉴定实验室正式揭牌

公安食药环检验鉴定实验室揭牌仪式12月4日在京举行。为全面贯彻党的二十大精神,贯彻落实国务院关于打击环境资源犯罪专项报告精神,按照公安部党委部署要求,公安部食品药品犯罪侦查局、公安部鉴定中心联合建立公......

麻省理工学院革新细胞成像技术:观察活细胞内部活动的新方法

利用可开关的荧光标签,麻省理工学院的工程师们可以研究细胞中的分子如何相互作用来控制细胞的行为,研究人员开发出一种方法,可以同时观察到多达七种不同的分子,甚至有可能观察到比这更多的分子。活细胞会受到多种......

一文速览!10月国内外15家生物药企融资超40亿!

据不完全统计,10月份,共有15家国内外创新生物药企完成了融资事件,总金额超40亿人民币。从融资轮次来看,早期融资仍占多数,其中B轮以前融资占比超过75%,仅有2家企业完成B轮融资。从融资金额来看,披......

拜耳携手上海医药,共建拜耳Co.Lab共创平台

2023年11月7日,在第六届中国国际进口博览会(以下简称“进博会”)上,拜耳与上海医药共同宣布了一项重要的合作协议。根据协议,双方将携手共建拜耳Co.Lab共创平台,以推动包括细胞与基因疗法等领域的......