瑞士苏黎世联邦理工学院科学家在最新一期《自然》杂志上发表论文称,他们开发出一款名为MetaGraph的DNA搜索引擎,能快速、高效地检索公共生物学数据库中的海量信息,为研究生命科学提供了强大的专业工具。
MetaGraph索引及大量DNA、RNA和蛋白质序列档案。图片来源:《自然》网站
MetaGraph的研发,源于科学界对日益庞大的基因测序数据“用不好、找不着”的现实困境。过去几十年来,各类生物学数据库规模呈爆炸式增长,然而原始测序数据往往碎片化、噪声多、体量庞大,科学家难以直接从中高效提取有用信息。
MetaGraph的核心突破在于采用数学中的“图结构”,将相互重叠的DNA片段智能联结。其原理类似于图书索引中将含有相同关键词的句子关联起来,形成知识网络。研究团队整合了7个公共资助数据库,构建出一个跨越病毒、细菌、真菌、植物、动物乃至人类的生命全谱系索引。该索引共涵盖1880万个独特的DNA与RNA序列集,以及2100亿个氨基酸序列集。
基于这一庞大索引,团队开发出了可直接通过文本提示检索原始数据档案的搜索引擎。团队表示,这是一种与生物学数据交互的全新方式——数据被高度压缩,却可随时调取。MetaGraph使研究人员能直接对“序列读取档案”(SRA)等存储库提出生物学问题,该数据库本身包含超过1亿个DNA字母。
为验证其实用性,团队利用MetaGraph扫描了24万多个人类肠道微生物组样本,搜寻抗生素耐药性的遗传标记。仅用一台高性能计算机,约一小时便得出结果,展现出强大的分析效率。
法国巴斯德研究所生物计算专家拉扬·希基评价称,这是一项“重大突破”,为分析DNA、RNA及蛋白质序列等原始生物学数据设立了新标准。这些数据库规模惊人,可达“拍字节”(PB)级别,其条目数量甚至超过谷歌索引中的所有网页。
瑞士苏黎世联邦理工学院科学家在最新一期《自然》杂志上发表论文称,他们开发出一款名为MetaGraph的DNA搜索引擎,能快速、高效地检索公共生物学数据库中的海量信息,为研究生命科学提供了强大的专业工具......
瑞士苏黎世联邦理工学院科学家在最新一期《自然》杂志上发表论文称,他们开发出一款名为MetaGraph的DNA搜索引擎,能快速、高效地检索公共生物学数据库中的海量信息,为研究生命科学提供了强大的专业工具......
瑞士苏黎世联邦理工学院科学家在最新一期《自然》杂志上发表论文称,他们开发出一款名为MetaGraph的DNA搜索引擎,能快速、高效地检索公共生物学数据库中的海量信息,为研究生命科学提供了强大的专业工具......
究竟是什么让人脑与众不同?美国加州大学圣迭戈分校研究团队发现了一个名为HAR123的小型DNA片段,这将是解开人类大脑独特性之谜的关键。相关研究成果发表于新一期《科学进展》杂志。最新研究表明,HAR1......
究竟是什么让人脑与众不同?美国加州大学圣迭戈分校研究团队发现了一个名为HAR123的小型DNA片段,这将是解开人类大脑独特性之谜的关键。相关研究成果发表于新一期《科学进展》杂志。最新研究表明,HAR1......
基因组编辑技术作为生命科学领域的一项重要突破,为基础研究和应用开发提供了技术支撑。以CRISPR及其衍生技术为代表的编辑系统通过可编程的向导RNA引导Cas9等核酸酶靶向基因组特定位点,被广泛应用于特......
神经元中基因编辑的插图。图片来源:杰克逊实验室哪怕在五年前,人们也会认为在活体大脑中进行DNA修复是科幻小说中才有的情节。但现在,科学家已能进入大脑、修复突变,并让细胞在整个生命周期中维持住这种修复效......
国际知名学术期刊《自然》北京时间7月2日夜间在线发表一篇基因组学论文称,研究人员从上埃及Nuwayrat地区一个古王国墓葬中提取到一名古埃及个体的全基因组测序数据,这些数据分析可追溯至古埃及第三至第四......
在一项研究中,科学家对埃及一座墓葬中的一名古埃及人进行了全基因组测序。这些数据可追溯至古埃及第三至第四王朝,揭示了其与北非及中东地区,包括美索不达米亚古人群的亲缘关系,为早期埃及人的遗传多样性研究提供......
近年来,环状单链DNA(CssDNA)因其稳定性高、免疫原性弱、可编程性强,成为基因调控、细胞治疗等医学合成生物学领域很有潜力的分子工具之一。近期,中国科学院杭州医学研究所研究员宋杰团队针对此前开发的......