发布时间:2020-10-23 17:04 原文链接: 代谢组学常使用的数据库

  代谢组主要是对小分子代谢物(一般50-1500 Da)进行高通量定性和定量分析,代谢组分析产生了大量的生物信息数据。代谢组数据库的开发对于归纳总结这些大数据,方便后续的代谢组学数据分析,揭示隐藏在大数据背后的生物学机理具有十分重要的作用。

  目前常用的代谢组学数据库有HMDB、NIST、LMSD、LipidBlast、KEGG和Metlin等,本期小编进行了归纳总结,希望对从事代谢组学研究的大家有所帮助。

  Human

  Metabolome

  Database(HMDB)

  HMDB数据库是由加拿大代谢组学创新中心(TMIC)于2007年创立的代谢组学综合数据库。网站主要收录人体内源性代谢产物,包括化合物简介、化学式、分子量、化学分类、化学性质、代谢通路、部分代谢产物浓度和部分MS/MS图谱等。目前为HMDB Version 4.0,数据库主要包含化学数据、临床数据和分子生物学/生物化学数据,共计114183个代谢物条目。另外DrugBank(包含约2280种药物代谢物信息)、T3DB(包含约3670种常见毒素和环境污染物代谢物信息)、SMPDB(包含约25000个人类代谢物和疾病通路信息)和FooDB(包含约28000种食品成分和食品添加剂代谢物信息)也属于HMDB数据库的一部分。

  NIST

  NIST数据库通常被认为是一个EI-MS数据库,但是在新版的NIST数据库中也包含了小分子化合物的ESI MS/MS质谱图。这些小分子包括代谢物的化学标准品、脂质以及生物活性肽。数据库中还包含了常见的ESI加合离子类型的母离子碎片信息和代谢物二级结构信息。数据库包含了几十万种化合物信息,代谢物只是其中的一部分,数据丰富,但需要人工进行衍生化基团回溯。

  LIPID MAPS Structure Database(LMSD)

  LMSD数据库包含了生物相关的脂质结构以及注释。该数据库包含了超过40000个脂质的结构,这使其成为了目前世界上最大的公共脂质数据库。LMSD数据库将所有的脂质分为八个类别,每个类别又具有自己的下一级分类。所有在LMSD数据库中的脂质化合物都被分配了一个编号。LMSD中的每一个记录包含该脂质对应的分子结构,通用名和系统命名,外部数据库的链接,化合物的物理化学性质等信息。

  LipidBlast

  Fiehn实验室于2013年上线了一款免费的数据库,该数据库基于计算机预测的脂质类化合物的串联质谱信息来帮助研究者对脂质类化合物进行注释。该数据库包含了约200000张MS/MS质谱图,涵盖了来自于29个类别的约100000个化合物。其中,超过一半的数据是从LMSD数据库导入或者使用LMSD Tool来生成。LipidBlast数据库还包含了许多没有被LMSD数据库包含的细菌和植物脂质信息。该数据库使用计算机生成了约80000个正离子模式数据和约130000个负离子模式数据,同时也包含了多种加合离子的类型。

  KEGG

  KEGG数据库是由日本京都大学生物信息学中心的Kanehisa实验室于1995年创立,是国际最常用的生物信息数据库之一,以“理解生物系统的高级功能和实用程序资源库”著称。含有部分代谢组学信息。主要偏重于代谢通路和整合代谢、基因和蛋白通路信息。

  Metabolite Link(Metlin)

  Metlin数据库是由The Scripps Institute Gary Siuzdak创立。网站主要侧重于非靶向代谢组学代谢产物的鉴定,其主要特征是具有大量代谢产物的MS/MS图谱,而且每个化合物都有不同的碰撞能图谱,可以清晰的找到代谢产物的碎片离子,还可获得分子量、化学结构式和化学结构等信息。该数据库包含超过960000种化合物,包括来自不同生物的内源性代谢物和外源性化合物。


相关文章

首个人参完整基因组发布

记者6日从中国农业科学院获悉,该院深圳农业基因组研究所农业生物转录组与代谢组创新团队发表了首个人参端粒到端粒完整基因组,解析了人参重要活性成分——三萜皂苷的形成机制。相关研究成果日前发表于国际期刊《园......

岛津又一合作成果——GCMS特色代谢物数据库正式发布

代谢组学(Metabonomics/Metabolomics)是继基因组学和蛋白质组学之后新近发展起来的一门学科,是系统生物学的重要组成部分,已广泛应用于食品及医药等领域。岛津一直致力于为代谢组学研究......

关于印发《数据库政府采购需求标准(2023年版)》的通知

财库〔2023〕35号党中央有关部门,国务院各部委、各直属机构,全国人大常委会办公厅,全国政协办公厅,最高人民法院,最高人民检察院,各民主党派中央,有关人民团体,各省、自治区、直辖市、计划单列市财政厅......

关于印发《一体式计算机政府采购需求标准(2023年版)》的通知

关于印发《一体式计算机政府采购需求标准(2023年版)》的通知财库〔2023〕31号党中央有关部门,国务院各部委、各直属机构,全国人大常委会办公厅,全国政协办公厅,最高人民法院,最高人民检察院,各民主......

金融机构批量迁移,国产数据库“东风”起

数据库、操作系统和芯片,被视为现代信息技术领域的三大核心,是基础软件“皇冠上的明珠”。随着我国自研数据库能力不断提升,持续经受考验,从银行到保险公司,从到制造企业到新零售行业,越来越多的企业开始将核心......

三个途径解决生成式人工智能知识产权难题

我国目前的生成式人工智能技术创新还处在初级阶段,法律法规的制定应当给科技创新留有一定的发展空间,对产品在研发阶段的数据合法性要求,应当根据数据类型和基本伦理要求,采取开放包容的规范原则。解决生成式人工......

星际富勒烯红外谱数据库的构建与可靠预测取得进展

富勒烯C60的发现起源于人们对星际碳物质的探索,获得1996年诺贝尔化学奖的Kroto教授曾于1980年代末期提出猜想:星际空间中,富勒烯可与其他星际分子/离子通过离子-分子或分子-分子反应形成富勒烯......

研究发布大豆多维组学数据库SoyOmics

大豆(Glycinemax(L.)Merr.)是重要的粮油作物之一,其产量提升、品质改进关乎全球人口的需求和利益。高通量测序技术的发展促使大豆组学研究不断深入。实现大豆多维组学数据的整合分析,将会为大......

应急管理部:建设乡村灾害风险隐患数据库

国务院新闻办公室15日举行新闻发布会。国务院第一次全国自然灾害综合风险普查领导小组办公室副主任、应急管理部风险监测和综合减灾司司长陈胜介绍,下一步,在普查成果转化为乡村自然灾害防治能力的提升上下功夫。......

《永乐大典》高清影像数据库等在国家图书馆发布

发布会现场(崔雪芹摄影)2月8日,《永乐大典》高清影像数据库及《国家珍贵古籍名录》知识库在国家图书馆正式发布。文化和旅游部党组成员、副部长饶权,北京大学党委书记郝平,中宣部出版局局长冯士新,国家图书馆......