随着高通量测序技术的发展,转录组测序(RNA-seq)已成为系统研究基因转录及转录后水平调控状态的常规方法,并在多个物种中得到广泛应用。海量转录组数据以前所未有的速度产生,以数据驱动为导向的大规模数据整合、挖掘与解析面临挑战。为更充分展现转录组数据蕴含的丰富信息,服务生物医学基础研究领域需求,构建标准化数据分析流程和结构化元信息审编模型,建立面向多物种基因转录特征的数据集成与管理资源十分必要。
近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心在Nucleic Acids Research上,发表了题为Gene Expression Nebulas (GEN): a comprehensive data portal integrating transcriptomic profiles across multiple species at both bulk and single-cell levels的论文,建立了基于常规转录组测序(Bulk RNA-seq)和单细胞转录组测序(scRNA-seq)数据挖掘解析的多物种转录图谱整合型数据库——Gene Expression Nebulas(GEN)。GEN应用结构化审编模型和标准化数据处理流程,对组织和细胞水平转录组测序数据集进行统一分析,实现了多物种多层面转录调控水平信息的系统整合。目前,GEN整合了323个高质量转录组数据集,涵盖30个物种的50,500个样本和15,540,169个细胞,提供基准参考、遗传、表型、环境、时间、空间六类生物学场景下的转录图谱,为生物医学领域科研人员剖析基因遗传调控结构和功能机制提供基础资源。
基于严格的数据质控标准,GEN审编来自GSA、GEO、ENA和DRA数据库的高质量原始转录组测序数据和详细元数据信息,并利用自主搭建的标准化流程分析处理相应数据,为用户提供包括基因/转录本表达、环形RNA表达、RNA选择性剪接和RNA编辑四个层面的转录图谱。同时,GEN为30个物种的1,191,846个基因提供丰富的注释信息,包括基本注释(如基因组位置、生物类型、功能描述),以及基于基因表达数据的定量(不同实验条件下的表达水平)和定性(差异表达所处的生物学场景)的增值注释。此外,为方便下游个性化分析,GEN还为用户提供表达谱数据分析及可视化的在线及离线工具,包括基于Bulk RNA-seq表达谱的差异表达分析、加权基因共表达网络分析、功能富集分析和基因调控网络推断,以及基于scRNA-seq表达谱的质量控制、数据标准化、缩放和回归、降维、基于图的聚类、细胞簇标记基因识别、细胞标记、细胞轨迹推断和细胞类型注释等多项分析功能。
GEN对用户免费开放,具备友好的浏览、检索与可视化功能,方便用户探索多生物学场景下基因/转录本的表达及转录特征。研究团队将持续维护并定期更新GEN,以不断整合更多物种的转录图谱数据资源和集成更丰富的数据分析功能。
研究工作得到中科院战略性先导科技专项、国家重点研发计划、中科院青年创新促进会等的资助。
论文链接:https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab878/6378435
GEN数据库内容和功能模块概览
近日,中国科学院生物物理研究所徐涛研究组和何顺民研究组在《基因组、蛋白质组与生物信息学报》杂志发表论文。两位科学家牵头的“女娲”中国人群基因组计划旨在构建中国人群的全基因组数据资源,支撑中国人群的疾病......
中外团队历时10年,在东南亚人群基因组研究领域取得里程碑式突破。北京时间14日晚,“东南亚人群基因组计划”首期成果发表在国际期刊《自然》上,东南亚人群的遗传演化之谜被揭开。论文通讯作者之一、中国科学院......
东南亚是全球最重要的人类演化区域之一。该地区人群拥有极高的遗传多样性,但基因组学研究长期缺失,制约了人类环境适应性进化与疾病遗传机制的深度解析,因而被称为全球人类基因组研究“最后一块拼图”。中国科学院......
近日,中国农业科学院郑州果树研究所(以下简称郑果所)特色浆果与干果种质改良课题组在国际期刊《植物生物技术杂志》(PlantBiotechnologyJournal)上发表研究论文,该研究组装了首个石榴......
中国农业大学教授韩振海团队基于30份苹果属植物高质量基因组,系统解析了苹果属数千万年的演化历程,并构建了首个苹果属图形泛基因组,发布了苹果属遗传多样性全景图。日前,相关研究成果发表于《自然-遗传学》。......
假根羽藻(Bryopsiscorticulans)是在北温带海洋潮间带广泛分布的大型绿藻。假根羽藻生存需适应不断变化的潮汐、温度和紫外线辐射等环境因素。涨潮时,假根羽藻的光合蛋白可在蓝绿光和绿光为主的......
英国《自然》和《自然-方法》杂志9日发表的一组论文显示,科研人员绘制出迄今最大、最详细的哺乳动物大脑连接图谱。这一成果来自由150余名神经科学家参与的“大脑皮层网络机器智能”(MICrONS)项目。这......
以色列耶路撒冷希伯来大学近日发布公报说,该校研究人员绘制出一份较为全面的人类基因“隐秘开关”图谱,有助于推动遗传疾病等方面研究。人类遗传物质脱氧核糖核酸(DNA)上的基因可以被甲基化,这可以使相关基因......
近日,中国农业科学院郑州果树研究所猕猴桃资源与育种创新团队组装构建了首个全红型四倍体软枣猕猴桃参考基因组近完成图,利用该图鉴定了新的色泽调控模块,为猕猴桃色泽改良奠定基础。相关研究成果发表在《分子园艺......
在传统医学的宝库中,天冬(Asparaguscochinchinensis)作为一味重要的中药材,其加工后的块根——天门冬,在东亚地区尤其是中国,有着悠久的药用历史。它不仅能治疗多种疾病,如胃痛、便秘......