发布时间:2021-06-29 17:33 原文链接: 认识泛基因组测序

什么是泛基因组?

2005年,Tettelin等人提出了微生物泛基因组概念(pangenome,pan源自希腊语‘παν’,全部的意思),泛基因组即某一物种全部基因的总称。2009 年,Li等人首次采用新全基因组组装方法对多个人类个体基因组进行拼接,发现了个体独有的DNA序列和功能基因,并首次提出了“人类泛基因组”的概念,即人类群体基因序列的总和。2009 年泛基因组测序首次应用于人类基因组学研究;2013 年泛基因组测序应用于动植物研究领域。

如图,泛基因组进而可以分为,核心基因组(core genome)和可变基因组 (variable genome)。核心基因指的是,在所有动植物品系或者菌株中都存在的基。可变基因组是指,在1个以及1个以上的动植物品系或者菌株中存在的基因。如果某个基因,仅存在某一个动植物品系或者菌株中,该基因还可以细分为品系或者菌株特有基因。一般来说,核心基因组控制着生命体基本生成代谢的功能。另外,结构变异中的存在/缺失变化(presnece/absence variation)是泛基因组的重点研究对象,因为可变基因组可能就是使个体产生不同性状(抗病性,抗寒性等)的原因。

为什么我们要开展泛基因组测序?

在漫长的进化过程中,由于地域因素,环境因素等的影响,每个个体都形成了极其特别的遗传性状,单一个体的基因组已经不能涵盖这个物种的所有遗传信息,另外一个原因,由于基因测序变得更加廉价,为近年来火爆的泛基因组的研究提供了可能性。

泛基因组是近年来比较流行的一种研究方向,通过对不同品种基因组进行测序,组装,然后将组装好的基因序列进行整合注释,进而获取这个物种全部的遗传信息并且对每一个个体间遗传变异信息进行解析。

技术路线

组装技术对比

目前比较流行的研究方法与三种:K-mer based assembly,重头组装和 迭代组装)

下面主要给大家讲解讲:重头组装 和 迭代组装两种方法。

重头组装的方法

这是构建泛基因组最经典的方法,分别对多个个体进行,分别的De novo assembly,然后将所得的每个个体的新组装的序列与参考序列reference基因组进行比对,找出比对不上的区域,再进行进一步的assembly,然后注释。此方法需要更多的电脑资源,因为需要对每一个个体进行分别进行重头组装,然后还需要全基因组比对。该方法比较适合基因组相对较小的植物。

迭代组装的方法

相当于一种迭代的方式,分别将每一个材料的reads比对到参考基因组中,然后找出没有比对上的部分进行组装,得到新的基因序列进而扩展原有的参考序列。一步一步这样迭代,直到所有的种系都处理完。最后建立起的泛基因组,再进行注释。这种方法,相对需要更少电脑资源,比较适合构建基因size相对较大的植物泛基因组,但是可能会产生更多的小片段。

应用

泛基因组测序是运用高通量测序及生物信息分析手段,针对不同亚种/个体材料进行测序及泛组装,构建泛基因组图谱,丰富该物种的遗传信息。泛基因组测序不仅可以获得多个基因组,完善该物种的基因集,还可以获得种群甚至个体特有的DNA序列和功能基因信息,为系统进化分析及功能生物学研究奠定基础。泛基因组也可以看作是对重测序数据的一种挖掘,挖掘发现每一个材料中独特的基因,进而进行进一步的分析。

选择不同亚种材料进行泛基因组测序,可以研究物种的起源及演化等重要生物学问题;选择野生种和栽培种等不同特性的种质资源进行泛基因组测序,可以发掘重要性状相关的基因资源,为科学育种提供指导;选择不同生态地理类型的种质资源进行泛基因组测序,可以开展物种的适应性进化,外来物种入侵性等热门科学问题的研究,为分子生态学等学科提供新的研究手段。

还有我认为泛基因组还可以应用到寻找新的snps。

泛基因优势如下:


  1. 对比单一的reference基因,可以有效提高可发现的snps数量



  2. 用泛基因组去calling snps 意味着你可以节省很多电脑资源和分析时间。(正常snap calling需要比对到不同的个体上,但如果通过泛基因组去calling snps,就可以一步到位,因为这个pangenome 相当于所有个体的集合。另外,这也意味着,你得出的snps 组不需要整合(传统的snp calling需要整合,因为需要比对到不同个体上)



  3. 还有一个好处就是,因为pangenome包括了进一步presence/absence variations 的分析,我们可以区别出这种snp是属于核心基因的,还是属于可变基因的。然后,再结合你表现型的数据,这对利用snp提高农作物产量是很有意义的。


参考文献:

  1. Golicz, Agnieszka A., Jacqueline Batley, and David Edwards. "Towards plant pangenomics." Plant biotechnology journal 14.4 (2016): 1099-1105.

  2. Golicz, Agnieszka A., et al. "The pangenome of an agronomically important crop plant Brassica oleracea." Nature communications 7 (2016): 13390.

  3. Hurgobin, Bhavna, and David Edwards. "SNP Discovery Using a Pangenome: Has the Single Reference Approach Become Obsolete?." Biology 6.1 (2017): 21.

代表文献

  1. Li, Ying-hui, et al. "De novo assembly of soybean wild relatives for pan-genome analysis of diversity and agronomic traits." Nature Biotechnology32.10 (2014): 1045-1052.

  2. Maretty, Lasse, et al. "Sequencing and de novo assembly of 150 genomes from Denmark as a population reference." Nature (2017).d


相关文章

研究开发出酵母泛基因组数字模型与代谢网络分析方法

近日,中国科学院大连化学物理研究所研究员周雍进团队与上海交通大学副教授鲁洪中合作,在酵母系统生物学研究中取得新进展。研究团队通过整合分析全球1807株酿酒酵母菌株的基因组与生态位数据,构建了高覆盖度的......

降本提效!我团队研制出系列牛用基因芯片

记者21日从国家乳业技术创新中心获悉,该中心技术研发团队成功研制出奶牛种用胚胎基因组遗传评估芯片和“高产、抗病、长生产期”功能强化基因组预测芯片。该系列基因芯片具有完全自主知识产权,填补了我国基因芯片......

新突破!便携式测序设备助阵,2小时内可诊断脑肿瘤

英国研究人员在新一期美国《神经肿瘤学杂志》上发表论文介绍,他们新开发出一种超快速脑肿瘤基因诊断方法,可以将脑肿瘤的诊断时间从此前的6至8周缩短至2小时。这种脑肿瘤基因诊断方法由英国诺丁汉大学等机构的研......

图形泛基因组为苹果精准育种“加码”

人生尝到的第一口水果很可能就是苹果。它不仅口感大众化,而且营养颇为丰富,是全世界最受欢迎的水果之一。中国工程院院士、中国农业科学院作科所研究员刘旭指出,当前我国苹果种业面临优异种质资源匮乏、核心性状改......

重大突破!新加坡发布长读长RNA测序数据集SGNEx

由新加坡科技研究局基因组研究所领导的科学家团队,发布了迄今全球最大、最全面的长读长RNA测序数据集之一——新加坡纳米孔表达数据集(SG-NEx)。这一成果有望解决疾病研究中长期存在的技术瓶颈,使研究人......

我国学者在野生稻基因解析和种质资源利用领域取得进展

图普通野生稻和亚洲栽培稻泛基因组及进化分析在国家自然科学基金项目(批准号:32388201)等资助下,中国科学院分子植物科学卓越创新中心韩斌院士团队完成了145份亚洲栽培稻及普通野生稻的参考基因组级别......

猿类基因组测序为人类进化研究提供“里程碑”视角

经过20多年的努力,科研人员成功地对6种现存猿类的基因组进行了完整测序,为研究人类进化提供了近距离视角,这被英国《自然》杂志称为“遗传学的一个里程碑”。123名来自多个国家和地区的科研人员组成的团队9......

预算887.8万昆明医科大学第二附属医院2025年05月(至)2025年06月政府采购意向

昆明医科大学第二附属医院2025年05月(至)2025年06月政府采购意向为便于供应商及时了解政府采购信息,根据《财政部关于开展政府采购意向公开工作的通知》(财库〔2020〕10号)等有关规定,现将昆......

因美纳被制裁背后:一家测序巨头的中国困局

事件焦点:为什么是它?3月4日,中国将美国基因测序公司因美纳(Illumina)列入“不可靠实体清单”,引发行业震动。这家生产基因测序仪的公司看似低调,却是全球生物实验室的“水电煤”——它的设备几乎垄......

人转录组测序内参标准物质

通过转录组测序获得人的基因表达谱数据,能进一步挖掘疾病相关的生物标志物,为临床诊断提供依据。目前,由于转录组测序无法溯源,导致不同实验室及测序平台产出的数据可比性和测序结果的准确性面临挑战。中国计量科......