发布时间:2023-11-21 17:10 原文链接: 万种原生生物基因组计划取得阶段性进展

  原生生物(Protist)是一大类单细胞真核生物的集合,包括单细胞真核藻类和原生动物等,组成了原生生物界。原生生物具有高度多样性,广泛分布于各类水环境中,在生态平衡、物质和能量循环、环境健康、动植物疾病发生等方面发挥重要作用。它们是水生态系统的重要组分,是重要的初级生产力和氧气的制造者、碳循环的关键参与者,是水产动物的优良饵料、人类的营养品、生物能源,是水环境的“哨兵”、水华和赤潮的重要元凶,亦是人、畜、禽、鱼疾病的重要病原、互利共生的“好伙伴”。

  NCBI分类系统已记录的原生生物种类超过6万种,未知数量难以估量。2019年12月,中国科学院水生生物研究所牵头发起万种原生生物基因组计划(Protist 10,000 Genomes Project,P10K),旨在建立一个大规模的原生生物遗传资源数据库,变革原生生物遗传资源数据极度缺乏的局面。

  近日,水生所与中国科学院北京基因组研究所(国家生物信息中心)联合发布了P10K第一批数据。该数据通过万种原生生物基因组数据库(P10K database,https://ngdc.cncb.ac.cn/p10k/)释放共享。相关成果以The P10K database: a data portal for the protist 10000 genomes project为题,发表在《核酸研究》(Nucleic Acids Research)上。P10K第一批数据收录了2959个原生生物数据集,包括1601个基因组和1358个转录组数据集,覆盖原生生物75%的纲和45%的目。其中,P10K团队在公共数据库整合了1858个数据集;新测序了1101个数据集,且以原生动物纤毛虫(Ciliate)为主。新测序数据将原生生物数据集规模整体提升了37%。新测序的样品由P10K团队在国内多种生境中采集、分离。对于不能实验室培养的大部分原生动物,该团队采用单细胞测序方法(约占新测序数据的98%)。同时,为解决大规模单细胞组学数据的分析问题,P10K团队研发了一套针对原生生物单细胞测序数据的组装、去污染、物种鉴定、基因注释和评估的标准化分析流程。质量评估显示,该流程注释的基因组与公共数据库发布的基因组具有相似比例的中高等质量数据。

  作为“万种原生生物基因组计划”的重要组成部分,P10K数据库的建立和数据共享,将有助于推动对真核生物和多细胞生物起源、真核生物多样性、原生生物的极端环境适应以及微生物互作等重要基础科学问题的研究。同时,这一计划将促进对与生态环境保护、污染物降解和转化、营养健康以及疾病防治相关的原生生物遗传资源的挖掘和潜在应用。同时,鉴于原生生物是浮游生物的关键组成部分,P10K数据库将为基于环境DNA的浮游生物鉴定提供支持,助力水生态健康评价。

  尤为重要的是,P10K数据库建立了国家水生生物种质资源库/国家寄生虫资源库(活体种质资源)和国家基因组科学数据中心(遗传资源)之间的联系,对于促进国家科技资源共享服务平台的信息互联互通和数据共享具有重要意义。

  研究工作得到国家重点研发计划、中国科学院战略性先导科技专项、中国科学院国际合作计划、中国科学院青年创新促进会、国家自然科学基金和国际生物科学联合会开放生物多样性和健康大数据计划的资助,并获得国家水生生物种质资源库和中国科学院超级计算武汉分中心的支持。

image.png

“万种原生生物基因组计划”的标志。设计理念:标志由不同原生生物组成。其中,钟虫(纤毛虫)代表字母“P”,裸藻(鞭毛虫)和团藻(绿藻)的组合代表数字“10”,阿米巴代表字母“K”。双螺旋既代表DNA又代表水波,即原生生物生存的水环境。“P”中喷发出诸多原生生物,代表1676年列文虎克发现钟虫之后,高度多样的各种原生生物被发现。

image.png

P10K数据库的特点和功能

相关文章

基因组研究证实:南部非洲智人曾半隔离生活数十万年

一项发表在最新一期《自然》杂志上的研究,通过对生活在10200至150年前的南非个体基因组进行分析,证实了在南部非洲,一群智人在半隔离的状态下生活了数十万年。这是迄今规模最大的对非洲古代DNA的研究,......

因美纳推出5碱基解决方案以驱动多组学发现,开启基因组与表观基因组的同步洞察

• 在美国人类遗传学会(ASHG)年会上,因美纳5碱基解决方案的早期试用客户——伦敦健康科学中心研究所将展示该技术在加速罕见病病例解析方面的强大潜力。• 因美纳专有的5碱基化学技术......

许瑞明研究组合作揭示人逆转座子LINE1靶向整合基因组的重要机制

人类基因组中存在大量具有"跳跃"能力的逆转座子(retrotransposon)序列。在胚胎发育早期、免疫和神经系统等特定阶段和环境下,它们会被激活,发挥重要生理功能;在病毒感染、......

高精度完整基因组助橡胶育种驶入“快车道”

橡胶树是天然橡胶的主要来源。“橡胶树育种面临的主要困难在于周期长和效率低,通过常规育种方法将多抗、高产性状聚合往往需要30~40年。”中国热带农业科学院橡胶研究所研究员程汉告诉《中国科学报》。然而,目......

小麦野生近缘种基因组“密码”被破解

记者宋喜群、冯帆从山东农业大学获悉,该校农学院教授孔令让研究团队首次组装了小麦远缘杂交常用物种中间偃麦草和鹅观草染色体水平的高质量基因组序列,解析了二者基因组结构差异与独立多倍化演化路径,对两者携带的......

烟草分枝发育的“开关基因”被发现

近日,中国农业科学院烟草研究所烟草功能基因组创新团队发现烟草分枝发育“开关基因”,预示着未来作物株型调控有了新靶点。相关研究成果发表在《植物生物技术》(PlantBiotechnologyJourna......

新研究破译薇甘菊入侵基因密码

薇甘菊作为全球十大最具危害的恶性入侵杂草之一,以其惊人的繁殖速度和强大的环境适应性,在亚洲、太平洋地区及中国华南地区造成严重生态破坏。然而,其基因组层面的适应性进化机制长期未被系统解析,制约了科学防控......

研究开发出酵母泛基因组数字模型与代谢网络分析方法

近日,中国科学院大连化学物理研究所研究员周雍进团队与上海交通大学副教授鲁洪中合作,在酵母系统生物学研究中取得新进展。研究团队通过整合分析全球1807株酿酒酵母菌株的基因组与生态位数据,构建了高覆盖度的......

研究揭示人类土地利用驱动原生生物跨气候区分布扩张

人类土地利用正在全球尺度上重塑物种的分布格局。然而,土地利用变化如何影响土壤生物的分布仍缺乏研究,尤其在全球生物同质化背景下,环境因子如何驱动土壤微生物群落分布的重构及机制尚缺乏系统性解析。中国科学院......

基因组大数据还原野猪横跨欧亚的百万年迁徙历程

近日,中国农业科学院农业基因组研究所农业基因编辑技术创新团队深入解析了中亚野猪种群在跨越欧亚大陆百万年的迁徙历程中适应环境的独特遗传密码,为理解大型哺乳动物如何应对环境变化提供了全新视角。相关研究成果......