发布时间:2021-11-09 10:20 原文链接: 多物种转录图谱综合数据库已对用户免费开放

  随着高通量测序技术的发展,转录组测序(RNA-seq)已成为系统研究基因转录及转录后水平调控状态的常规方法,并在多个物种中得到广泛应用。海量转录组数据以前所未有的速度产生,以数据驱动为导向的大规模数据整合、挖掘与解析面临挑战。为更充分展现转录组数据蕴含的丰富信息,服务生物医学基础研究领域需求,构建标准化数据分析流程和结构化元信息审编模型,建立面向多物种基因转录特征的数据集成与管理资源十分必要。

  近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心在Nucleic Acids Research上,发表了题为Gene Expression Nebulas (GEN): a comprehensive data portal integrating transcriptomic profiles across multiple species at both bulk and single-cell levels的论文,建立了基于常规转录组测序(Bulk RNA-seq)和单细胞转录组测序(scRNA-seq)数据挖掘解析的多物种转录图谱整合型数据库——Gene Expression Nebulas(GEN)。GEN应用结构化审编模型和标准化数据处理流程,对组织和细胞水平转录组测序数据集进行统一分析,实现了多物种多层面转录调控水平信息的系统整合。目前,GEN整合了323个高质量转录组数据集,涵盖30个物种的50,500个样本和15,540,169个细胞,提供基准参考、遗传、表型、环境、时间、空间六类生物学场景下的转录图谱,为生物医学领域科研人员剖析基因遗传调控结构和功能机制提供基础资源。

  基于严格的数据质控标准,GEN审编来自GSA、GEO、ENA和DRA数据库的高质量原始转录组测序数据和详细元数据信息,并利用自主搭建的标准化流程分析处理相应数据,为用户提供包括基因/转录本表达、环形RNA表达、RNA选择性剪接和RNA编辑四个层面的转录图谱。同时,GEN为30个物种的1,191,846个基因提供丰富的注释信息,包括基本注释(如基因组位置、生物类型、功能描述),以及基于基因表达数据的定量(不同实验条件下的表达水平)和定性(差异表达所处的生物学场景)的增值注释。此外,为方便下游个性化分析,GEN还为用户提供表达谱数据分析及可视化的在线及离线工具,包括基于Bulk RNA-seq表达谱的差异表达分析、加权基因共表达网络分析、功能富集分析和基因调控网络推断,以及基于scRNA-seq表达谱的质量控制、数据标准化、缩放和回归、降维、基于图的聚类、细胞簇标记基因识别、细胞标记、细胞轨迹推断和细胞类型注释等多项分析功能。

  GEN对用户免费开放,具备友好的浏览、检索与可视化功能,方便用户探索多生物学场景下基因/转录本的表达及转录特征。研究团队将持续维护并定期更新GEN,以不断整合更多物种的转录图谱数据资源和集成更丰富的数据分析功能。

  研究工作得到中科院战略性先导科技专项、国家重点研发计划、中科院青年创新促进会等的资助。

GEN数据库内容和功能模块概览

相关文章

科学家绘出表观遗传和转录起始研究“框架图”

10月7日,《科学》在线发表复旦大学教授徐彦辉课题组的研究成果。研究人员解析了包含+1核小体的PIC-Mediator复合物结构,首次展示了转录起始复合物与+1核小体的紧密结合,表明+1核小体对转录起......

复旦大学Science最新发文:揭示+1核小体调控转录起始机制

作为基因表达调控的核心,转录起始过程发生在基因启动子区,通过染色质重塑复合物剔除核小体暴露出启动子,允许转录起始复合物(preinitiationcomplex,PIC)的组装,在中介体(Mediat......

基因组学研究重建苔类植物演化历程获突破

深圳市仙湖植物园研究团队与合作者使用转录组数据,首次对苔类目级系统框架进行了重建,得到了高支持的系统发育树。相关研究9月8日在线发表于AnnalsofBotany。该论文第一作者为深圳市仙湖植物园董珊......

科学家解析致病菌中新型转录调控的分子机制

铜绿假单胞菌是条件性致病菌,危害人类身体健康。近日,在铜绿假单胞菌中报道了一个新型的转录因子SutA(survivalundertransitionA)。SutA对于维持细菌厌氧条件下的基因转录至关重......

复旦研究团队发现并揭示新的转录起始检查点RPAP2

基因转录是中心法则的关键环节,以DNA为模板产生RNA用于蛋白质合成。发生在基因启动子区的转录起始过程是基因表达调控的核心,细胞在复杂且精密的调控信号下,将抑制或促进转录起始前复合物在基因启动子区的装......

基于转录调控因子的2羟基戊二酸生物传感器

2-羟基戊二酸(2-Hydroxyglutarate,2-HG)是2-酮基戊二酸(2-Ketoglutarate,2-KG)的结构类似物,存在两种手性异构体L-2-HG和D-2-HG。2-HG可抑制多......

揭示肠道细菌调控表观转录组修饰促进结直肠癌转移机制

结直肠癌是常见恶性肿瘤之一,是全世界发病人数第三、死亡人数第二的恶性肿瘤。结直肠癌在我国同样不容乐观。尽管结直肠癌的治疗手段不断发展,但晚期转移性结直肠癌患者的预后生存仍然不理想,我们需要对结直肠癌的......

武汉大学发现一个新的结直肠癌的致癌转录因子

结直肠癌是世界上发病率和死亡率最高的恶性肿瘤之一。近日,武汉大学生命科学学院的一项最新研究成果,揭示了一个新的结直肠癌的致癌转录因子,为结直肠癌的研究提供了重要的表观基因组数据和新的关键调控因子,相关......

调控油桐种子油脂积累的分子机制

近日,中国科学院武汉植物园、湖北大学、中南林业科技大学的科研人员合作在《植物学杂志》上发表了最新研究成果。通过对转录组数据进行深入分析,研究人员挖掘到一个属于I类同源结构域亮氨酸拉链(HD-ZIP)转......

多物种转录图谱综合数据库已对用户免费开放

随着高通量测序技术的发展,转录组测序(RNA-seq)已成为系统研究基因转录及转录后水平调控状态的常规方法,并在多个物种中得到广泛应用。海量转录组数据以前所未有的速度产生,以数据驱动为导向的大规模数据......