近年来,随着“精准医学”计划的发布,如何有效整合海量的高异质性、高复杂性生物医学大数据成为生命科学和医学领域的重大命题和挑战。
近日,华中科技大学生命科学与技术学院的“健康大数据”团队陆续发表了5篇论文,公布了多个重要的数据库,这些成果同期刊发在1月4日的Nucleic Acids Research杂志上。
《Nucleic Acids Research》上发表的5篇论文中所构建的数据库界面
大数据时代特点是数据无处不在,我们身边处处都有大数据。健康大数据是随着近几年数字浪潮和信息现代化而出现的新名词,是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的健康数据的集合。
在最新研究中,围绕哺乳动物长非编码RNA(lncRNA)与遗传变异的关系,郭安源教授研究组在已有研究基础上开发了lncRNASNP2数据库,包括25万多条人类和小鼠lncRNA的约1100万个单核苷酸多态性数据,并整合了功能注释、癌症突变、转录表达、疾病相关信息、结构变异,以及miRNA-lncRNA相互作用等信息,该工作为研究lncRNA的功能和异构体提供了重要数据资源。
针对真核生物泛素及类泛素偶联修饰,薛宇教授课题组系统收录了148种真核生物中13万多个相关调控因子,构建iUUCD 2.0数据库并整合序列、癌症突变、单核苷酸多态性、调控元件、蛋白质相互作用、三级结构、疾病相关信息、药物和靶标、蛋白质翻译后修饰、DNA甲基化、蛋白质表达和蛋白质组信息,该工作对于进一步研究泛素及类泛素偶联的机制具有重要意义;
刘智教授和陈卫华教授两个课题组与德国著名生物信息学家Peer Bork教授合作,系统审编和收集了18,608种噬菌体群与9245种微生物之间的26,572个两两相互作用关系,构建了微生物-噬菌体整合数据库MVP,该数据资源对于未来环境微生物组学研究具有重要的支撑作用。
“健康大数据”团队由郭安源、宁康、薛宇和陈卫华四位教授组成,2016年入选华中科技大学“学术前沿青年团队”,2017年在华中科技大学鄂州工业技术研究院筹建“生物医学信息超算中心”。
代谢组学(Metabonomics/Metabolomics)是继基因组学和蛋白质组学之后新近发展起来的一门学科,是系统生物学的重要组成部分,已广泛应用于食品及医药等领域。岛津一直致力于为代谢组学研究......
财库〔2023〕35号党中央有关部门,国务院各部委、各直属机构,全国人大常委会办公厅,全国政协办公厅,最高人民法院,最高人民检察院,各民主党派中央,有关人民团体,各省、自治区、直辖市、计划单列市财政厅......
关于印发《一体式计算机政府采购需求标准(2023年版)》的通知财库〔2023〕31号党中央有关部门,国务院各部委、各直属机构,全国人大常委会办公厅,全国政协办公厅,最高人民法院,最高人民检察院,各民主......
数据库、操作系统和芯片,被视为现代信息技术领域的三大核心,是基础软件“皇冠上的明珠”。随着我国自研数据库能力不断提升,持续经受考验,从银行到保险公司,从到制造企业到新零售行业,越来越多的企业开始将核心......
我国目前的生成式人工智能技术创新还处在初级阶段,法律法规的制定应当给科技创新留有一定的发展空间,对产品在研发阶段的数据合法性要求,应当根据数据类型和基本伦理要求,采取开放包容的规范原则。解决生成式人工......
富勒烯C60的发现起源于人们对星际碳物质的探索,获得1996年诺贝尔化学奖的Kroto教授曾于1980年代末期提出猜想:星际空间中,富勒烯可与其他星际分子/离子通过离子-分子或分子-分子反应形成富勒烯......
大豆(Glycinemax(L.)Merr.)是重要的粮油作物之一,其产量提升、品质改进关乎全球人口的需求和利益。高通量测序技术的发展促使大豆组学研究不断深入。实现大豆多维组学数据的整合分析,将会为大......
国务院新闻办公室15日举行新闻发布会。国务院第一次全国自然灾害综合风险普查领导小组办公室副主任、应急管理部风险监测和综合减灾司司长陈胜介绍,下一步,在普查成果转化为乡村自然灾害防治能力的提升上下功夫。......
发布会现场(崔雪芹摄影)2月8日,《永乐大典》高清影像数据库及《国家珍贵古籍名录》知识库在国家图书馆正式发布。文化和旅游部党组成员、副部长饶权,北京大学党委书记郝平,中宣部出版局局长冯士新,国家图书馆......
近日,中科院软件所软件工程中心数据库系统可靠性保障团队的两篇论文被ICSE2023接收。ICSE(InternationalConferenceonSoftwareEngineering)是软件工程领......