发布时间:2021-11-09 10:20 原文链接: 多物种转录图谱综合数据库已对用户免费开放

  随着高通量测序技术的发展,转录组测序(RNA-seq)已成为系统研究基因转录及转录后水平调控状态的常规方法,并在多个物种中得到广泛应用。海量转录组数据以前所未有的速度产生,以数据驱动为导向的大规模数据整合、挖掘与解析面临挑战。为更充分展现转录组数据蕴含的丰富信息,服务生物医学基础研究领域需求,构建标准化数据分析流程和结构化元信息审编模型,建立面向多物种基因转录特征的数据集成与管理资源十分必要。

  近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心在Nucleic Acids Research上,发表了题为Gene Expression Nebulas (GEN): a comprehensive data portal integrating transcriptomic profiles across multiple species at both bulk and single-cell levels的论文,建立了基于常规转录组测序(Bulk RNA-seq)和单细胞转录组测序(scRNA-seq)数据挖掘解析的多物种转录图谱整合型数据库——Gene Expression Nebulas(GEN)。GEN应用结构化审编模型和标准化数据处理流程,对组织和细胞水平转录组测序数据集进行统一分析,实现了多物种多层面转录调控水平信息的系统整合。目前,GEN整合了323个高质量转录组数据集,涵盖30个物种的50,500个样本和15,540,169个细胞,提供基准参考、遗传、表型、环境、时间、空间六类生物学场景下的转录图谱,为生物医学领域科研人员剖析基因遗传调控结构和功能机制提供基础资源。

  基于严格的数据质控标准,GEN审编来自GSA、GEO、ENA和DRA数据库的高质量原始转录组测序数据和详细元数据信息,并利用自主搭建的标准化流程分析处理相应数据,为用户提供包括基因/转录本表达、环形RNA表达、RNA选择性剪接和RNA编辑四个层面的转录图谱。同时,GEN为30个物种的1,191,846个基因提供丰富的注释信息,包括基本注释(如基因组位置、生物类型、功能描述),以及基于基因表达数据的定量(不同实验条件下的表达水平)和定性(差异表达所处的生物学场景)的增值注释。此外,为方便下游个性化分析,GEN还为用户提供表达谱数据分析及可视化的在线及离线工具,包括基于Bulk RNA-seq表达谱的差异表达分析、加权基因共表达网络分析、功能富集分析和基因调控网络推断,以及基于scRNA-seq表达谱的质量控制、数据标准化、缩放和回归、降维、基于图的聚类、细胞簇标记基因识别、细胞标记、细胞轨迹推断和细胞类型注释等多项分析功能。

  GEN对用户免费开放,具备友好的浏览、检索与可视化功能,方便用户探索多生物学场景下基因/转录本的表达及转录特征。研究团队将持续维护并定期更新GEN,以不断整合更多物种的转录图谱数据资源和集成更丰富的数据分析功能。

  研究工作得到中科院战略性先导科技专项、国家重点研发计划、中科院青年创新促进会等的资助。

GEN数据库内容和功能模块概览

相关文章

守护第三纪孑遗“基因库”专家共议野核桃资源保育与核桃产业发展

新疆伊犁河谷腹地、巩留县城南侧,近万株第三纪孑遗的珍贵古老树种——野核桃,正沉默地伫立。这里是亚洲现存规模最大的野生核桃群落。“野核桃是我国重要的野生果树种质资源,具有极高的科研、保护与利用价值。”1......

遗传发育所揭示水稻RNA识别结构域蛋白抑制外源基因沉默的机制

植物是复杂的生物系统。植物体内基因的表达受到多种水平的调控,如转录水平、转录后水平、DNA甲基化/去甲基化等,从而对基因表达进行精密高效的调控。中国科学院遗传与发育生物学研究所张劲松研究组筛选OsEI......

全球最大古人类基因库创建,基因和疾病历史传播情况绘成

1月11日,大型国际专家团队分析了34000年前生活在西欧和亚洲的近5000名人类的骨骼和牙齿化石,创建出世界上最大的古人类基因库。通过对古人类DNA进行测序并将其与现代样本进行比较,团队绘制了基因和......

遗传发育所玉米籽粒发育机制研究获进展

RNA编辑广泛存在于植物的线粒体和叶绿体中。RNA编辑作为一种RNA转录后加工机制,对于调控基因表达具有重要意义。RNAC-U的编辑是胞嘧啶(C)经过脱氨转变为尿嘧啶(U)的过程。在此过程中,PPR(......

肿瘤细胞葡萄糖感知与代谢调控通路研究领域取得新进展

南方科技大学饶枫团队与天津医科大学赵丽团队、北京生命科学研究所王凤超团队合作在肿瘤细胞葡萄糖感知与代谢调控通路研究领域取得新进展,研究成果以“葡萄糖诱导CRL4COP1-p53信号轴促进糖代谢以驱动肿......

揭秘早期哺乳动物的发育过程

由于小鼠的易实验性和强遗传性,其一直是生物医学研究中使用广泛的动物模型。但是,胚胎学研究发现,小鼠早期发育的许多方面与其他哺乳动物不同,从而使有关人类发育的推论复杂化。英国剑桥大学等研究团队合作构建了......

上海欧易生物医学单细胞转录组测序和分析申报ANTOP奖啦

带着三月的未完成,在四月奔跑起来,即使道路泥泞,也会收获遍野的烂漫。2023年ANTOP奖的申报和评审工作如火如荼的开展。由上海欧易生物医学科技有限公司申报的“高通量单细胞转录组测序杰出分析”ANTO......

NatureAging:揭示调控灵长类器官衰老的表观转录组机制

m6A是目前已知的真核细胞mRNA上最常见的一类化学修饰,其建立、读取和擦除分别受到相应甲基化酶(writer)、结合蛋白(reader)以及去甲基化酶(eraser)的动态可逆调控。研究表明,m6A......

我国科学家成功获得长春花叶片单细胞转录组图谱

长春花为夹竹桃科长春花属植物,在中草药用途上,全草入药有止痛、消炎等功效。单萜类吲哚生物碱(MIAs)是植物中最多样的特殊代谢产物,具有重要的药用价值。长春花能够合成130多种MIAs,是研究单萜吲哚......

研究揭示细菌固有转录终止的结构基础

1月12日,中国科学院分子植物科学卓越创新中心合成生物学重点实验室张余研究团队、美国威斯康辛大学麦迪逊分校RobertLandick团队与浙江大学冯钰团队合作,在《自然》(Nature)上,发表题为S......