如何可靠地检测新近发生的正选择?上海生命科学研究院计算生物学所李海鹏研究员的最新研究成果实现了20年来理论群体遗传学的一个梦想。
正选择是一个重要的进化力量,它使得携带某个突变的个体相对于不携带这个突变的个体来说有生存和繁殖上的优势。正选择作为一种重要的进化力量,不仅在野生群体和现代人类的进化过程中扮演重要的角色,而且在家养动植物的驯化过程中(例如稻米、狗和猪)均起着决定性的作用。虽然我们无法回到过去,但是在最近1至10万年里发生的正选择事件通常都会在生物体的基因组里留下些蛛丝马迹。所以我们可以检测到这些正选择事件并且定位造成这些适应性进化的突变,进而为研究这些突变的功能开启大门。最终,我们希望通过这些研究来探索进化的根本奥秘——适应性进化的生物学机制。
然而,在检测这些正选择事件的时候,人们发现所研究对象的群体数量在过去几万年里很可能在不断发生变化,这种群体数量的变化造成了相关检验方法(neutrality tests)的高假阳性率。例如,黑腹果蝇最早生活在非洲南部的一小块区域,在1至6万年前开始扩散到世界的其他地区。群体数量的扩张在果蝇的基因组里留下了几乎和正选择一样的痕迹,使得相关检验方法的假阳性率非常高(可以高达80%到90%),这就造成了针对近期正选择的检验可信度很低。
为了降低假阳性率,目前几乎采用的唯一方法是在基因组水平上分析遗传多态数据。然而由于长期进化过程中所遗留下来的信息是有限的以及目前计算分析能力的局限,人们所采用的模型不可能无限地接近于实际,所以要精确估计出自然群体的历史数量变化的参数是相当困难的。所以这一方法仍然难以精确估计出具体的假阳性率,而且其可靠性仍就无法在数学上得到证明。不仅如此,由于一些重要的前提条件无法满足,使得该方法难以运用到绝大多数的野生物种和家养动植物的研究当中。
基于此,在1989年Tajima提出了著名的Tajima’s D检测方法之后,针对其存在的问题,理论群体遗传学研究的一个主要目标就是要建立一个行之有效的方法,使得检测新近发生的正选择不受群体数量变化的影响。实现这个目标成为过去20多年理论群体遗传学追逐的梦想。
李海鹏研究员的最新研究成果把这一梦想变成了实现。他提出了一种全新的通过检验树的拓扑结构策略来检测新近发生的正选择,并建立了相应的统计学方法。数学和计算机模拟两方面均证明了,该统计学假设检验的结果不受群体历史数量变动的影响,比如瓶颈效应和群体扩张。这意味着无论群体的数量在历史上如何变动,这一新方法的假阳性率将保持在统计学假设检验时所设的显著性水平以下。
新的方法不需要任何种群历史的信息或者对种群参数的估计,也无需基因组水平的遗传多态数据,仅仅需要来自于100至1000bp范围内的遗传多态数据,就可以可靠地检测新近发生的正选择。这一新方法的建立将极大地促进相关领域的发展。
该研究成果发表在MBE杂志上(影响因子9.872)(Haipeng Li, 2010, Molecular Biology and Evolution; doi: 10.1093/molbev/msq211)。
橡胶树是天然橡胶的主要来源。“橡胶树育种面临的主要困难在于周期长和效率低,通过常规育种方法将多抗、高产性状聚合往往需要30~40年。”中国热带农业科学院橡胶研究所研究员程汉告诉《中国科学报》。然而,目......
记者宋喜群、冯帆从山东农业大学获悉,该校农学院教授孔令让研究团队首次组装了小麦远缘杂交常用物种中间偃麦草和鹅观草染色体水平的高质量基因组序列,解析了二者基因组结构差异与独立多倍化演化路径,对两者携带的......
近日,中国农业科学院烟草研究所烟草功能基因组创新团队发现烟草分枝发育“开关基因”,预示着未来作物株型调控有了新靶点。相关研究成果发表在《植物生物技术》(PlantBiotechnologyJourna......
薇甘菊作为全球十大最具危害的恶性入侵杂草之一,以其惊人的繁殖速度和强大的环境适应性,在亚洲、太平洋地区及中国华南地区造成严重生态破坏。然而,其基因组层面的适应性进化机制长期未被系统解析,制约了科学防控......
近日,中国科学院大连化学物理研究所研究员周雍进团队与上海交通大学副教授鲁洪中合作,在酵母系统生物学研究中取得新进展。研究团队通过整合分析全球1807株酿酒酵母菌株的基因组与生态位数据,构建了高覆盖度的......
近日,中国农业科学院农业基因组研究所农业基因编辑技术创新团队深入解析了中亚野猪种群在跨越欧亚大陆百万年的迁徙历程中适应环境的独特遗传密码,为理解大型哺乳动物如何应对环境变化提供了全新视角。相关研究成果......
人类基因组中超98%的遗传变异位于非编码区,这些变异通过调控染色质可及性、三维构象、剪接加工等多种分子机制影响基因表达,最终导致疾病发生。由于调控机制的复杂性和细胞类型特异性,目前解读非编码变异的分子......
近日,中国科学院生物物理研究所徐涛研究组和何顺民研究组在《基因组、蛋白质组与生物信息学报》杂志发表论文。两位科学家牵头的“女娲”中国人群基因组计划旨在构建中国人群的全基因组数据资源,支撑中国人群的疾病......
中外团队历时10年,在东南亚人群基因组研究领域取得里程碑式突破。北京时间14日晚,“东南亚人群基因组计划”首期成果发表在国际期刊《自然》上,东南亚人群的遗传演化之谜被揭开。论文通讯作者之一、中国科学院......
东南亚是全球最重要的人类演化区域之一。该地区人群拥有极高的遗传多样性,但基因组学研究长期缺失,制约了人类环境适应性进化与疾病遗传机制的深度解析,因而被称为全球人类基因组研究“最后一块拼图”。中国科学院......