8月7日,《国家科学评论》(National Science Review)在线发表了中国科学院上海营养与健康研究所——马普计算生物学研究所徐书华团队的研究成果“Prioritizing natural selection signals from the deep-sequencing genomic data suggests multi-variant adaptation in Tibetan highlanders”。该研究通过分析深度基因组测序数据和藏族表型数据,构建了藏族人群全基因组水平的适应性遗传变异图谱,首次系统地将藏族人群基因组中与适应性进化相关的功能性变异呈现出来。

  经过国内外近十年的密集研究,人们对藏族高原适应的遗传学基础有了一些初步的认识;其中EPAS1目前领域里普遍认为是藏族适应高原的关键基因,特别是由于在其他高原物种中也发现EPAS1的适应性进化的迹象,因而备受关注。但是迄今未能确定EPAS1基因中与藏族高原适应的功能性变异。这为理解人类在青藏高原上的适应性进化机制留下未解难题。由此也引发一些更根本性的关键问题:(1)有多少基因和遗传变异驱动了人类适应青藏高原的演化?(2)EPAS1在人类高原适应性中发挥作用的关键因素是否并不在EPAS1本身而是否另有出处?(3)是否还有其他基因比EPAS1对人类适应高原起到更关键的作用?

  带着这些问题,徐书华团队与中科院昆明动物研究所、温州医科大学、复旦大学、西藏民族大学等多家单位的研究人员合作,在全基因组水平对藏族人群的高原适应性变异进行了系统性梳理,充分利用深度基因组测序数据的优势,构建了藏族人群全基因组尺度上的适应性遗传变异图谱,鉴定了有相对明确功能的关键遗传变异,包括63个错义突变、7个失活性变异、1298个进化保守性变异,以及509个基因表达数量性状变异;这些分布在基因组范围的功能性变异不一定都与藏族人群的高原适应直接相关,但是大多数都与藏族人群的适应性演化密切相关。高原适应涉及到一系列复杂性状——涉及到的基因可能比医学中研究的一些复杂疾病更为错综繁杂。研究团队进一步发展了一个新统计量(FIS)对鉴定出的适应性遗传变异的相对重要性进行加权排序,发现排在首位的并不是通常认为的EPAS1,而是位于EPAS1下游的一个跨膜蛋白编码基因TMEM247;尤其是发现藏族人群基因组中的TMEM247存在一个高频关键错义变异(rs116983452),可能对藏族人群高原适应具有重要贡献和意义。论文新发现的TMEM247基因关键突变(rs116983452)导致平原人群中高频存在的丙氨酸(Ala)(野生型)与青藏高原人群特有的缬氨酸(Val)(突变型)之间的显著分化,其中94%的藏族人都携带突变型,而在世界其他现代人群体中的频率非常低或者完全缺失,是迄今为止在青藏高原人群基因组中发现的最高频的错义突变。有趣的是,在西伯利亚丹尼索瓦洞穴中发现的距今约5万年的一个古人基因组也携带了这个变异,并且为纯合状态。该研究通过计算推断藏族人群中携带TMEM247-rs116983452适应性变异的序列可追溯至距今约6万年前,这意味着这个藏族特异的高频突变可能继承自早期进入高原的具有古人类血统的祖先并传承至今。

  事实上,人类征服青藏高原的历程悠久而曲折。徐书华团队之前的研究表明,青藏高原人群的遗传起源可追溯至距今4-6万年前的旧石器时代中晚期,早期进入青藏高原的人类族群间发生广泛的基因交流,并与后期进入青藏高原的族群发生进一步遗传混合,最终形成了一个包含现代智人和早期智人多个谱系(包括考古学已经发现的阿尔泰尼安德特人和丹尼索瓦人等,以及其他未知古人类)的遗传构成极其复杂的混合人群。这个过程中,一些曾经帮助人类适应高原环境的古人类基因片段得以保留下来,因高原极端环境的自然选择作用,在现今高原人群中积累到较高的频率。TMEM247-rs116983452-T就是一个典型的例子。

  分析表明,TMEM247-rs116983452-T的频率与人群居住地海拔呈显著正相关,提示与人类在青藏高原的适应可能有密切关系。进一步结合基因表达与多项生理生化表型及体质人类学特征,对高原藏族人群的适应性遗传变异进行了系统性评估;发现TMEM247-rs116983452-T与TMEM247及EPAS1的表达水平都有密切相关,并可能对藏族人群低氧环境下的血红蛋白和红细胞水平等高原适应性性状产生重要的调控。对于平原人群而言,长期暴露于低氧环境中将诱发红细胞增生以提高血液携氧能力,但最终可能过度增生而导致“红细胞增多症”。相比之下,高原世居藏族人群的红细胞和血红蛋白水平保持在相对较低的水平,TMEM247基因的功能突变可能就是产生这种保护性机制的重要遗传因素之一。通过统计模型分析,研究团队发现TMEM247-rs116983452对藏族高原适应性表型的解释度高于EPAS1的变异位点,但二者之间可能存在一定的相互作用,体现了高原适应的复杂性和多基因相互作用效应。该研究提供的这张基因组适应性变异图谱为后续进一步全面深入研究藏族适应高原的遗传基础和分子机制锁定了目标,为揭开人类征服高原极端环境的演化之谜开拓了新的视野。

  该工作由营养与健康所、马普计算生物学所邓恋、张超、苑锴,以及博士研究生高扬(上海科技大学)、潘雨闻等在徐书华的指导下,与中科院昆明动物所、温州医科大学、复旦大学、西藏民族大学等多家单位的研究人员合作完成,得到中科院先导专项、国家自然科学基金委、上海市科委和国家重点研发计划等多项基金的资助。

图:藏族人群适应性变异TMEM247-rs116983452-T的群体遗传解析和功能统计学分析

相关文章

因美纳推出5碱基解决方案以驱动多组学发现,开启基因组与表观基因组的同步洞察

• 在美国人类遗传学会(ASHG)年会上,因美纳5碱基解决方案的早期试用客户——伦敦健康科学中心研究所将展示该技术在加速罕见病病例解析方面的强大潜力。• 因美纳专有的5碱基化学技术......

许瑞明研究组合作揭示人逆转座子LINE1靶向整合基因组的重要机制

人类基因组中存在大量具有"跳跃"能力的逆转座子(retrotransposon)序列。在胚胎发育早期、免疫和神经系统等特定阶段和环境下,它们会被激活,发挥重要生理功能;在病毒感染、......

高精度完整基因组助橡胶育种驶入“快车道”

橡胶树是天然橡胶的主要来源。“橡胶树育种面临的主要困难在于周期长和效率低,通过常规育种方法将多抗、高产性状聚合往往需要30~40年。”中国热带农业科学院橡胶研究所研究员程汉告诉《中国科学报》。然而,目......

小麦野生近缘种基因组“密码”被破解

记者宋喜群、冯帆从山东农业大学获悉,该校农学院教授孔令让研究团队首次组装了小麦远缘杂交常用物种中间偃麦草和鹅观草染色体水平的高质量基因组序列,解析了二者基因组结构差异与独立多倍化演化路径,对两者携带的......

烟草分枝发育的“开关基因”被发现

近日,中国农业科学院烟草研究所烟草功能基因组创新团队发现烟草分枝发育“开关基因”,预示着未来作物株型调控有了新靶点。相关研究成果发表在《植物生物技术》(PlantBiotechnologyJourna......

新研究破译薇甘菊入侵基因密码

薇甘菊作为全球十大最具危害的恶性入侵杂草之一,以其惊人的繁殖速度和强大的环境适应性,在亚洲、太平洋地区及中国华南地区造成严重生态破坏。然而,其基因组层面的适应性进化机制长期未被系统解析,制约了科学防控......

研究开发出酵母泛基因组数字模型与代谢网络分析方法

近日,中国科学院大连化学物理研究所研究员周雍进团队与上海交通大学副教授鲁洪中合作,在酵母系统生物学研究中取得新进展。研究团队通过整合分析全球1807株酿酒酵母菌株的基因组与生态位数据,构建了高覆盖度的......

基因组大数据还原野猪横跨欧亚的百万年迁徙历程

近日,中国农业科学院农业基因组研究所农业基因编辑技术创新团队深入解析了中亚野猪种群在跨越欧亚大陆百万年的迁徙历程中适应环境的独特遗传密码,为理解大型哺乳动物如何应对环境变化提供了全新视角。相关研究成果......

基因组密码被解锁:深度学习模型破解非编码区奥秘

人类基因组中超98%的遗传变异位于非编码区,这些变异通过调控染色质可及性、三维构象、剪接加工等多种分子机制影响基因表达,最终导致疾病发生。由于调控机制的复杂性和细胞类型特异性,目前解读非编码变异的分子......

“女娲”基因组计划发布第八项成果

近日,中国科学院生物物理研究所徐涛研究组和何顺民研究组在《基因组、蛋白质组与生物信息学报》杂志发表论文。两位科学家牵头的“女娲”中国人群基因组计划旨在构建中国人群的全基因组数据资源,支撑中国人群的疾病......