发布时间:2021-03-09 09:41 原文链接: 研究开发单细胞测序分析TEs表达的工具包

  中国科学院广州生物医药与健康研究院(以下简称广州健康院)陈捷凯课题组和南方科技大学Andrew Hutchins课题组合作开发出单细胞测序分析转座元件表达的工具包scTE。相关研究3月5日发表于《自然—通讯》。据悉,生物岛实验室副研究员何江平为该论文第一作者,陈捷凯、Andrew Hutchins为论文共同通讯作者。

转座元件(TEs)是人类基因组中含量最多的遗传信息,是指一类能够在基因组内移动的DNA序列。TEs的插入和跳跃可以改变基因组遗传信息,是物种进化的重要原动力。尽管大部分TEs已经丧失了“跳跃”的能力,成为了基因组中的“分子化石”。但近年来研究发现,TEs可以通过影响染色质表观遗传修饰、转录因子结合、RNA编辑以及染色质构象等,对基因表达起着非常重要的调控作用。

据介绍,单细胞转录组测序(scRNA-seq)是研究细胞命运状态的绝佳技术。近年来,更多的单细胞测序技术以及相应的生物信息学分析方法也在不断改进,总体的目标是扩展能捕获的信息及挖掘能代表生物学功能的潜在维度。然而,目前从scRNA-seq数据分析的工具包都只定量基因的表达,分析TEs的表达还比较困难,缺乏相关研究需要的生物信息学分析的工具包,因而忽略了基因组中含量最多的TEs来源的遗传信息。

为填补这一研究的空白,研究人员开发了能够从scRNA-seq数据中同时定量基因和TEs的表达的生物信息学工具包——scTE。由于TEs为多拷贝重复序列,与常规基因不同,同一类TEs通常有成千上万个不同的拷贝遍布在全基因组,并且每个拷贝间的序列高度相似,因此,针对TEs的分析通常难以做到单位点准确定量。

为解决这一问题,同时由于常规scRNA-seq只有较短的测序读长的因素,scTE采用了针对TEs家族层面的定量策略,这一策略忽略了基因组位置信息,提高了TEs的定量准确性。研究人员利用scTE,通过分析小鼠胚胎发育和人类疾病scRNA-seq数据,发现了一系列细胞命运、疾病状态特异性高表达的TEs,提示这些TEs的表达可能与胚胎发育或疾病的发生发展有关,也证明了通过scRNA-seq分析TEs的表达很有必要。

相对scRNA-seq研究转录组而言,单细胞ATAC-seq(scATAC-seq)等单细胞基因组技术研究的对象是染色质,染色质开放性与表观遗传修饰情况在很大程度上决定了基因表达丰度,以scATAC-seq为代表的单细胞基因组学技术的开发,让获得“高分辨率”的单细胞精度的染色质开放/修饰图谱变为可能,有利于构建从DNA到RNA再到表型的调控网络,寻找与表型强相关的核心调控因子。

然而,以scATAC-seq为代表的单细胞基因组测序数据存在几个特点:一、高维度。每个细胞中可以检测到可能开放的区域可以高达几十万个;二、数据的稀疏性。由于技术原因,导致大量开放的区域没有检测到信号。由于以上原因,目前对scATAC-seq数据的生物信息学还存在比较大的挑战。

研究人员提出由于TEs多拷贝的特点,通过累积TEs信号可以去除数据的稀疏性,降低数据的维度,或许能够有效解决scATAC-seq数据以上难题。他们利用scTE,发现仅利用TEs信号,能够将scATAC-seq数据中主要细胞类型区分开来,提示TEs信息对scATAC-seq等单细胞基因组数据的分析是很好的补充。

相关文章

科学家发现首个可直接导致精神疾病的基因

近日,一项发表于《分子精神病学》的研究发现,单个基因GRIN2A可直接导致精神疾病。而此前的研究认为,精神疾病是由许多基因共同作用所致。根据世界卫生组织(WHO)数据,2021年全球每7人中就有1人患......

方显杨研究组与合作者共同开发了一种新型活细胞DNA成像技术

三维基因组互作与表观遗传修饰是基因表达调控的重要因素,其动态变化与细胞生长发育及癌症等疾病的发生发展密切相关。解析染色质在活细胞内的时空动态,是理解基因调控机制的重要科学问题。现有基于CRISPR-C......

胚胎“体检”狙击遗传肿瘤10年诞生百名“无癌宝宝”

11月1日,在长沙举行的第五届湖南省抗癌协会家族遗传性肿瘤专业委员会学术年会上,中信湘雅生殖与遗传专科医院(下称中信湘雅)首席科学家卢光琇宣布,该院第100位通过胚胎植入前遗传学检测(PGT)技术阻断......

我国科研人员找到导致反复“试管”失败的“基因钥匙”

10月16日,记者从中信湘雅生殖与遗传专科医院获悉,该院研究员林戈、副研究员郑伟团队,联合山东大学、上海交通大学医学院等单位的科研团队开展合作攻关,系统揭示了卵子与早期胚胎质量问题导致女性反复“试管”......

全球首个奶牛多组织单细胞表达图谱诞生

中国农业大学动物科学技术学院教授孙东晓团队构建了覆盖奶牛59种组织、179万个细胞的多组织单细胞表达图谱,为解析牛重要性状遗传调控机制、推进精准育种及探索人类疾病的牛模型研究提供了重要资源。9月5日,......

科学家首次评估单细胞固氮蓝藻的全球固氮通量

厦门大学教授史大林团队基于在西北太平洋副热带流涡区开展的高分辨率观测,定量分析了固氮生物群落的丰度、结构和固氮速率,进而应用广义加性模型刻画的优势固氮蓝藻的生态位特征预测了其在全球海洋的主要分布格局,......

衰老如何改变我们的基因

衰老对身体产生的可见影响有时与基因活动的无形变化有关。DNA甲基化的表观遗传过程会随着年龄增长而变得不再精确,造成基因表达的变化。而这种变化与随着年龄增长而出现的器官功能衰退和疾病易感性增加有关。如今......

为何有人衰老更快?揭秘背后的400个基因

有些人比同龄人更显年轻,而有些人看着更显老;有些人年逾九旬仍身心康健,而另一些人早在数十年前就饱受糖尿病、阿尔茨海默病或行动障碍的困扰;有些人能轻松应对严重摔伤或流感侵袭,而有些人一旦住院就再难康复。......

科学家开发出基因挖掘新策略

得益于双子叶模式植物拟南芥和单子叶模式植物水稻的遗传学研究,植物发育生物学在过去40年取得了长足发展。植物分生组织(干细胞)的建立与维持机制、重要组织和器官的分化轨迹及其核心调控网络已初步建立。这些基......

研究提出单细胞多组学新方法实现胰腺癌循环肿瘤细胞多维度解析

近日,中国科学院广州生物医药与健康研究院研究员林达等报道了新开发的单细胞多组学技术——Uni-C。该方法可在一个细胞中同时解析基因组大尺度结构变异(如SV、CNV、ecDNA)、小尺度突变(SNP/I......