发布时间:2014-04-03 09:15 原文链接: Science:新的基因从何而来,为何而来?

  近日来自加州大学戴维斯分校的研究人员发现了在6株果蝇株系中全部或部分表达的142个转录子,对应于果蝇参考基因组(reference genome)中基因间序列,这第一次利用群体遗传学的方法,尝试探索从头起源的基因在群体中扩散、尚未固定之前的表达和结构,以及这些基因受到的选择和调控情况。

  这一研究成果公布在Science杂志上,来自德国马普研究所的进化生物学Diethard Tautz点评道,“这项研究展示了群体遗传学水平上(基因从头起源)的过程,确实是一个不错的研究成果,说明基因能从无到有。 ”

  为了深入了解这项重要的研究成果,探讨新的基因产生的方式,解析这项研究背后的意义,记者联系了文章的第一作者,赵莉博士,就读者感兴趣的问题请教了她。

  新的基因的产生方式

  随着基因组学的发展,研究人员发现不同生物在基因组大小和基因数目上存在巨大的差异。人类有二万多基因,而有的细菌只有几百个基因。这种差异不仅仅在远缘物种中体现,即使在进化关系很近、分歧年代很近的近缘物种中,基因的种类和数目也不尽相同,这说明生物在进化过程中伴随着基因组大小和基因数目的变化。

  赵莉博士介绍说,近年来,研究人员研究并总结新的基因产生的方式有基因重复(gene duplication),逆转座(retroposition),外显子重排(exon shuffling),基因分裂与融合(gene fission and fusion)以及基因水平转移(gene lateral transfer)等。

  “上述这些机制都是基于已有基因而产生的,直到2006年,加州大学戴维斯分校David Begun研究组(也就是我现在所在的实验室)在果蝇中发现基因可以从头起源(de novo origination),也就是基因片段在外群中是非编码序列,而在新的物种中随着突变和进化选择产生了可以翻译成蛋白的新基因。”

  随后,研究人员在酵母,小鼠,水稻和人类等物种中也发现了从头起源的基因的存在。这支持了基因可以从头起源(从外群的非编码序列到内群的编码蛋白的基因)。上述的这些工作都来自于物种间的比较,因此尽管近缘物种间的分歧时代很短(比如黑腹果蝇和拟果蝇的分歧年代约2-3百万年,人和大猩猩分歧年代约4.76百万年),但是这样比较的的基因已经产生并且固定在种群中,我们对基因产生的过程,尤其是最初的阶段还一无所知。“我们的这个工作通过对黑腹果蝇群体进行研究,对基因产生的过程进行了探索。”

  首次通过群体遗传学解析从头起源基因演化过程

  为了完成这一探索,赵莉博士与她的同事对模式生物黑腹果蝇进行研究。他们对果蝇6个果蝇品系mRNA测序拼装,同时对外群物种进行测序拼装,然后通过一系列的参数比较鉴定了可能的在群体中扩散的从头起源基因。

  赵莉博士说,“我们发现了142个在群体中扩散但是没有固定的可能的从头起源基因。这些基因的表达量中等,约一半的基因属于低频率,但是~30%左右的基因至少的频率至少50%。我们发现基因的表达和在群体中的频率正相关。大部分基因拥有简单的读码框,~40%左右的基因具有多个外显子(exon),还有一部分基因拥有可变剪切的方式,暗示了这些基因可能被复杂的机制调控转录。

  为了了解可能的转录机制,我们对亲本杂交,对子代也进行了测序。通过对子代的基因表达,以及表达的子代的SNP向亲本追溯分析,我们发现基因的表达绝大多数通过顺式调节(cis regulation),也就是可能是基因上游的突变导致可能产生了转录结合序列等原因而激活了转录。”

  通过对这些从头起源的基因的上游序列分析,研究人员还发现了几个可能是转录结合因子的序列。同时,他们对表达de novo基因和不表达的品系进行了序列比对,发现表达从头起源基因的品系在基因的位置有38%左右的杂合度减小。对基因组的序列的模拟也显示从头起源基因和随机的基因组非编码序列受到的选择程度显著不同,这都暗示了从头起源基因可能在这个阶段受到了自然选择。

  这项工作是第一次利用群体遗传学的方法,尝试探索从头起源的基因在群体中扩散、尚未固定之前的表达和结构,以及这些基因受到的选择和调控情况。“我们的工作给出了上述问题在黑腹果蝇生殖系统表达和选择的框架,而对于这些基因是否已经产生生物学功能,如果有,它们的功能如何等问题还尚不清楚。我们也同时在果蝇的其他性别和组织中进行类似工作的探索,希望能通过不同的性别、组织表达的从头起源的比较,对从头起源的基因的起源和演化机制有更深的了解。”

  从头起源基因与自然选择

  除了新的基因从何而来外,还有一个有趣而重要的问题,那就是新的基因为何而来?

  这项研究提出了一些初步数据,指出了这些潜在的从头起源的基因可能都受到了自然选择的影响。理由在于:第一,群体中高频表达的基因比低频表达的基因更长,也更复杂,这提示了选择的作用;其次,研究人员发现了降低杂合度也与选择的模式是一致的。至于这些序列是否会被翻译成蛋白质,或其他方面的功能,还有待观察。

  当然,不是所有的新基因都是有利变化。事实上从理论上推测,大部分还是有害的。但是,认为新基因如此高频率产生的观点,将会给自然选择提供更多的线索。

  对此,赵莉博士解释道,“自然界中很多基因进行出生和死亡的循环过程,这些都和自然选择有关。我们鉴定的这些基因都是雄性中表达的,这些基因很可能经历了性选择(sexual selection),它们可能和雄性生殖(male reproduction)有关。目前我们发现了自然选择的证据,但是这些基因的功能还需要后续的深入研究。”

相关文章

英国生物银行在GWAS中发现了与人类特征的新关联

根据欧洲分子生物学实验室欧洲生物信息学研究所的一对研究人员的一项研究,一套新的分析工具使系统地搜索拷贝数变异与复杂的人类特征或条件之间的联系成为可能。“我们提出了一个强大的CNV到表型发现过程,该过程......

基因检测并非万能,5000人测试10.9%漏检

一项新的研究发现,对疑似患有心肌病或心律失常的患者进行更全面的基因检测会导致额外的诊断,而这些诊断可能会因疾病特异性检测而被遗漏。西北大学的研究人员指出,通过更广泛的测试提高诊断率的可能性与收到不确定......

这两所大学合力揭示了遗传风险基因调控COVID19的新机制

COVID-19是由SARS-CoV-2感染引起的高度传染性疾病,根WHO统计全球累计报告逾5.74亿名次确诊病例,已经造成超过639.5万名患者死亡。SARS-CoV-2进入机体后,通过Spike蛋......

北京基因组所解释了细胞在热刺激反应中染色质构象改变

热刺激是细胞经常面对的环境刺激,热刺激反应是所有细胞普遍具有的刺激反应机制。热刺激诱导的广泛的转录调控是热刺激反应的重要组成部分。近年来,科学家从表观遗传学的各层面对其机制开展了研究。当前,针对染色质......

科学家最新发现“葫芦素”竟是这样护瓜

在植物与环境的互相作用中,有一大类多达20000余种的化合物发挥着重要作用——植物三萜化合物,它们同时也是药物、保健品和化妆品的重要来源。阐明植物三萜化合物合成、调控及运输机理,不仅将为作物品质与抗性......

《自然》:人类是先喝上奶还是先拥有乳糖酶?

人类是先喝上奶还是先拥有能消化乳糖的乳糖酶?国际著名学术期刊《自然》最新发表一篇考古学论文指出,欧洲史前人群可能在演化出能消化乳糖的基因的几千年前,就开始饮用来自家养动物的奶了。这项研究结果为人类饮奶......

DNA重组广泛存在人类基因组中并与发育和疾病有关

科技日报北京7月26日电(记者张梦然)日本理化学研究所综合医学科学中心科学家主导的国际合作研究发现,在人类每个细胞的基因组中,重复数百万次的特定基因组序列重组普遍存在于正常细胞和疾病状态的细胞中。确定......

中科院杜茁团队发现胚胎发育具有“纠错潜能”

生命发育往往并非一帆风顺。很多胚胎在不同发育阶段都会出现各个种类、不同程度的细胞行为异常,但这并不会影响胚胎的最终存活。其背后原因是什么呢?利用单细胞高精度实时追踪技术对秀丽线虫胚胎细胞进行追踪研究,......

我国科学家发现水稻高产基因

记者22日了解到,中国农业科学院作物科学研究所周文彬研究员团队在水稻中研究发现了水稻高产基因OsDREB1C。北京时间7月22日凌晨,相关研究成果在国际著名学术期刊《科学》(Science)杂志以研究......

“多面手”明星基因,同步实现高产早熟

从绿色革命改良作物株型,到杂交水稻大面积推广,粮食单产增长了一倍多。然而,此前研究表明,全球约24~39%的玉米、水稻、小麦以及大豆种植区域单产处于停滞不前甚至下降的态势。7月22日,《科学》在线发表......