据说,地球上的微生物总量超过了银河系中的恒星数量,而且病毒总量也要比之前预计的多得多。

在最新的Nature Biotechnology杂志上,美国能源部(DOE)联合基因组研究所(JGI)构建了重要的病毒序列数据库,同时提出了病毒基因组标准,指出了三类基因组质量的分级。
目前虽然许多病毒未知,或者未在实验室培养,但基因组测序和分析方面技术的机制,让研究人员能够从宏基因组和元转录组数据集中识别出超过750,000种未培养的病毒基因组。
质量和分析指南
“病毒是每个微生物生态系统中的关键组成部分,由于JGI生成了大量这些数据,因此对开发病毒基因组标准特别感兴趣,”JGI研究人员,第一作者Simon Roux说,“我们只是部分研究人员,我们庞大的研究机构详细审查了这些数据,并提供指导以帮助确定数据质量。此外,在本文中,我们希望提供的不仅仅是标准,而是包括了对这些数据进行何种类型的分析,帮助想要描述自己实验室新型病毒的研究人员。”
培养病毒已经有了自己的数据质量标准,但这些标准不能直接应用于未经培养的病毒,这些病毒的序列通常是不完整的,并且某些属性只能通过计算方法间接预测。
马里兰大学医学院基因组科学研究所的GSC主席Lynn Schriml说:“未定义的病毒基因组群体共同确定了对于学界什么是值得报道和有价值的东西。”
基因组质量的分类
在这篇论文中,Roux等人指出了未定义病毒基因组的最小信息量,包括来源,病毒基因组鉴定方法和数据质量。JGI先前已经开发了用于报告最小元数据的标准。
“病毒序列数据和微生物组数据的巨大增长需要强大的标准和数据质量指标,从而研究人员能够利用这些数据进行比较分析,”JGI Metagenome计划负责人,文章通讯作者Emiley Eloe-Fadrosh表示,“通过建立和推广‘best practices’,研究人员就可以打破数据可访问性和可重用性的障碍,在最初的项目范围之外扩大研究范围。”
研究团队提出了三类基因组质量:
“Genome fragments”是指由单个或多个片段组成,预测完整性小于90%,或者没有预测基因组大小,注释量小;“high-quality draft genome”代表的是基因组序列完成了90%或更多,片段gaps主要是重复区域。最后,“finished genome”是指由没有gaps的单个连续序列组成的完整基因组和广泛的注释。
11月5日凌晨,中国科学院动物研究所携手华大生命科学研究院、北京基因组研究所(国家生物信息中心),在全球顶尖学术期刊《细胞》(Cell)上发表了最新研究成果,利用华大自主研发的“超广角百亿像素生命照相......
2024年10月12-17日,由中国疾控中心病毒病所应急技术中心主办的全国继续教育项目“2024年新型冠状病毒与猴痘病毒监测检测技术手把手培训班”在四川省成都市成功举办,来自全国31个省(自治区、直辖......
记者10日了解到,国际顶级学术期刊《Cell》在北京时间9日11时发表了中山大学与阿里云合作的科研成果,研究团队利用云计算与AI技术发现了180个超群、16万余种全新RNA病毒,是已知病毒种类的近30......
文|《中国科学报》记者李思辉矛和盾,是冷兵器时代的常见武器。今天,科学家在研究一些病毒性传染病时,发现它们的致病机理,竟然也类似于古代典故中的“以子之矛,攻子之盾”——病毒进入宿主体内后,让宿主体内本......
秋冬季是呼吸道传染病的高发期,这段时间气温下降,昼夜温差大,再加上室内空气流动有限或室内人群密集,呼吸道传染病容易传播开来。如何应对即将到来的呼吸道传染病流行季?婴幼儿、儿童等低年龄段人群该如何预防?......
竹子即竹亚科是禾本科的重要分支,广泛分布于亚洲、非洲和拉丁美洲,约有1,700种。作为一类生长快、多年生、可再生的森林资源,木本竹子越来越多被用作木材的替代品,具有重要的经济价值和生态价值。有研究发现......
弗吉尼亚大学医学院孙杰(JieSun)、臧充之(ChongzhiZang)联合Cedars-Sinai医疗中心PeterChen在Nature杂志上发表了题为Anaberrantimmune-epit......
中国专家团队应用前沿交叉研究方法揭示多种养殖哺乳动物中的潜在跨物种传播风险等,将为构建多维度公共卫生风险评估与新发传染病预测预报体系提供数据支持。北京时间4日23时,最新一期《自然》(Nature)杂......
科技日报北京8月15日电(记者张佳欣)据最新一期《自然》杂志报道,德国康斯坦茨大学和维尔茨堡大学领导的国际研究团队,对动物界最大基因组的拥有者——肺鱼进行了基因组测序。肺鱼基因组约为人类基因组大小的3......
在南美洲发现的一种肺鱼是迄今测序的拥有最大基因组的动物。8月14日,一项发表于《自然》的研究显示,美洲肺鱼的DNA包含了惊人的910亿个化学碱基,是人类基因组的30倍。然而,这910亿个碱基只包含与人......