发布时间:2017-11-13 08:57 原文链接: 基因组多样性和祖源信息数据库

   11月3日,中国科学院上海生命科学研究院(人口健康领域)计算生物学研究所徐书华课题组的研究成果,以PGG.Population: a database for understanding genomic diversity and genetic ancestry of human populations为题,在线发表在《核酸研究》上。该研究分析了涵盖全球范围107个国家的356个人类族群的基因组多样性和祖源信息,并发布了开放获取的专门数据库——PGG.Population(群体基因组学·族群)。PGG.Population是迄今唯一在基因组水平专门解析人类族群遗传关系和祖源信息的公开数据库,也是目前收集族群数量最大的群体基因组数据库,为研究人员、临床医生及学生和公众理解不同人群的遗传背景提供查询和分析平台。

  人类族群多样性的形成是迁移、隔离、分化、再接触和交流的复杂演化过程。同时,长期对特定环境的适应或能影响特定的性状以及基因组局部区域的多样性变化。相对来讲,人群的基因组多样性在很大程度上决定了其表型多样性——这也是族群特异性的表型可以世代传承的原因。因此,要真正理解人类不同族群在肤色、体质以及疾病等性状上的差异,最终需要回到基因组、追溯人群的演化历程。众多大型国际计划(比如人类单倍体型图计划和千人基因组计划)以及我国此前完成的各类全基因组关联研究(GWAS)集中关注常见主体人群,而对各地少数族群(大多是土著人群)的研究较为缺乏。部分研究人员逐渐意识到,在一个人群研究中的困惑,往往在另一个人群的研究中找到答案,例如科研人员对比青藏高原人群的基因组,了解到为何平原人群无法像藏族人那样舒适地生活在高原上。专家认为,这就是多样性的魅力,也是进化留给我们的财富。

  PGG.Population正是在这样的大背景下建立起来。研究人员通过测序或收集众多人类群体基因组研究数据,对每个族群的基因组重新整合与分析(包括人群的地理语言归属等基本信息、Y染色体与线粒体谱系、群体间亲缘关系、群体遗传结构、遗传混合以及自然选择印记等),并建立数据库,以开放获取的方式向公众展示每个族群的基因组多样性与祖源信息。目前,该数据库包括7122个个体的基因组数据,覆盖107个国家的356个族群,每个族群都有自己的“故事”。该数据库以理解每个人群的基因组多样性与遗传背景为主,对其他研究领域也具有重要的学术意义和应用价值,人类群体基因组数据库建设任重道远。全世界有2000多个族群,而该数据库目前只包括世界族群的1/6。课题组正在收集或产生更多的来自不同族群基因组数据,以覆盖更多的族群,以期用于全面探索亚洲人群尤其是东亚、东南亚族群的演化历史和自然选择等遗传和演化问题。同时,数据库可供遗传学、语言学、体质人类学、医学等行业参考和使用,应用于生物医学等多个领域的研究。此外,科研人员希望公众通过访问和查询该数据库,对人类基因组多样性和人群祖源等方面的知识和信息有更广泛和深入的理解。

  研究工作得到了中科院战略性先导科技专项(B类)、国家自然科学基金委重大研究计划及国家杰出青年科学基金、中科院青年促进会、上海市科委等的资助,并得到国家遗传与发育协同创新中心支持。

相关文章

转移性肿瘤与原发性肿瘤之间的基因组差异是什么?

肿瘤转移性扩散涉及肿瘤细胞从原发性肿瘤中分离、迁移、二次组织定植和生长的多步骤过程。分析原发性肿瘤和转移性肿瘤之间的基因组差异,并量化它们对治疗耐药性的影响有助于研究和利用治疗干预措施,建立更有效、更......

重大突破!染色质扩展显微镜技术可破解基因组秘密

开启或关闭基因的能力是我们在细胞、个体甚至在健康和疾病方面观察到的多样性的基础。这个过程被称为基因转录,涉及到将储存在我们的DNA中的信息转化为RNA。在此之前,科学家们一直依靠不精确的图解和间接的实......

人工智能快速解码脑癌基因组

美国哈佛大学医学院团队设计了一种人工智能(AI)医疗工具,可快速解码脑肿瘤的DNA,以确定其在手术过程中的分子身份,而现有方法需要几天甚至几周的时间才能获得这些关键信息。研究成果7日发表在《医学》杂志......

新进展!构建新型双碱基编辑器

碱基编辑器是基于CRISPR/Cas9发展的新一代基因组编辑技术,可诱导单个碱基的突变,而鲜有关于特异性介导A-to-G和C-to-G双突变的碱基编辑工具的研究。此外,关于碱基编辑系统与染色质环境之间......

“画蛇添足”并非无迹可寻,远古时期的蛇是有脚的

成语有云:画蛇添足,形容做事多此一举。但蛇真的无脚吗?爬行动物专家认为,蛇的祖先是蜥蜴,在远古时期,蛇是有脚的,只是在演化过程中慢慢失去了。近日,这一说法得到了进一步证实。经过5年的研究,基于大规模多......

祝贺!中国科学家组团攻关,取得重大成果

日前,由复旦大学、西安交通大学等国内26个科研单位联合开展研究,绘制出了基于36个族群的中国人泛基因组参考图谱,相关成果于北京时间14日在国际权威学术期刊《自然》杂志发表。这也是我国科学家首次自主进行......

谷子高质量图基因组“面纱”揭开

谷子即小米,起源于中国,作为粮食作物深受老百姓喜爱。近日,中国农业科学院作物科学研究所特色农作物优异种质资源发掘与创新利用团队,通过对谷子种质资源的基因组分析,组装了首个谷子高质量图基因组,系统阐明了......

研究人员成功测序蒙特莫朗西酸樱桃基因组

密歇根州的酸樱桃产量在全美名列前茅,密歇根州立大学的一个研究小组启动了一个项目,旨在确定与酸樱桃树晚开有关的基因,以满足不断变化的气候的需要。他们首先将晚开的樱桃树的DNA序列与一个相关物种--桃子的......

一种单细胞藻类细胞中有7个基因组

一种50多年前收集并在实验室中生长的单细胞藻类,原来是一个由曾经独立的生物组成的奇怪的集合体,里面有不少于7个不同的基因组。4月27日,相关成果发表于《当代生物学》。“据我所知,单个细胞中有7个不同的......

解码基因组“暗物质”,拓宽生命认知疆域

人类约有2万个基因,仅占DNA的2%,剩下的98%是什么?这些区域如同基因组中的“暗物质”,有待科学家去发现。非编码RNA(核糖核酸)是基因组“暗物质”中的一类重要分子,最近十几年才被发现。它们不仅在......