近日,复旦大学、西安交大、中国医学科学院等26家单位联合发布了中国人群泛基因组联盟(CPC)一期研究进展。6月14日,相关成果以《基于36个族群的中国人泛基因组参考图谱》为题发表于《自然》(Nature)主刊。这是我国学者领导的人群基因组研究首次发表在《自然》主刊。

这项研究初步构建了我国人群的泛基因组参考图谱,发现了在人类通用参考基因组上缺失的约1.9亿个碱基对的参考序列;新鉴定了约580万个点突变或小变异以及3.4万个结构变异,涉及大量潜在功能原件包括至少1367个蛋白质编码基因;发现通用参考基因组上缺失的参考序列富集了适应性演化和起源于远古人类的遗传变异,并且与角质化、紫外线辐射应激、DNA修复、免疫反应以及寿命等表型或功能相关。在重构人类演化历程、挽回复杂疾病研究时“丢失的遗传率”等研究和应用中,该图谱具有巨大的潜在价值。

人类参考基因组是广泛用于人类遗传学和医学研究的遗传密码“导航图”,也是解析人类起源与演化、解析人类表型和疾病的遗传基础的根基。据论文通讯作者、复旦大学生命科学学院教授徐书华介绍,上世纪末“人类基因组计划”于2001年首次发表人类基因组草图,此后人类参考基因组经历了数十次的更新迭代,发展到目前广泛使用的第38版本(GRCh38)。直到2022年从“端粒到端粒”联盟(T2T)构建的“无缺口”的T2T-CHM13参考基因组完成图,所有涉及人类遗传学的研究仍然依赖于线性参考基因组。今年正值国际人类基因组计划(HGP)完成20周年,人类参考基因组从“线性一维序列”过渡到“泛基因组多维图谱”。尽管中国作为唯一的发展中国家参与了国际人类基因组计划并作出了贡献,但目前通用的人类参考基因组皆基于欧洲白人为主体样本构建,难以代表非欧裔族群、尤其我国族群的基因组多样性。即便最新发表的人类泛基因组国际联盟(HPRC)收集了全球范围的46例样本,也仅包含3例中国汉族样本。

“中国人群泛基因组联盟”一期36个族群画像集

为了构建高质量高精度的中国人群泛基因组参考图谱,复旦大学徐书华教授、西安交通大学叶凯教授联合国内26家单位发起成立了中国人群泛基因组联盟(CPC)。一期研究中,他们对代表中国36个族群的58个样本采用最新的第三代高保真基因组测序技术进行了深度测序,获取了116个高质量单倍型基因组,并以图基因组的方式构建了高质量中国人群参考泛基因组。

据介绍,该泛基因组图谱共包含约3.01Gb个碱基对的序列信息,在现有人类参考基因组的基础上新增了约1.9亿个碱基对的新序列,包含约590万个小变异(单核苷酸多态性变异和小规模插入/缺失变异)和约3.4万个结构变异(SV),涉及至少1367个蛋白编码基因复制事件等。其中,约500万个碱基对新序列存在于95%以上的单倍型中,被视为中国人群基因组核心序列。

CPC泛基因组图谱作为首个中国人群专属的泛基因组参考图谱,与HPRC泛基因组图谱相比,在中国人群特有的复杂变异解析方面具有显著优势。CPC泛基因组图谱中新发现了1079个基因拷贝数变异,以及包含药物代谢基因CYP2D6等在内的在中国人群中富集而在其他世界人群中出现频率较低的若干基因拷贝数变异;新鉴定出富集在中心粒、端粒等染色体复杂区域的3.4万个结构变异,其中半数以上仅在单个或两个样本中出现。。

CPC新发现的遗传变异影响了具有潜在功能和经受过适应性进化的基因,这些基因可能与亚洲人群特有的疾病易感性及表型多样性有关。有意思的是,研究人员还发现了相当大比例的古人来源基因序列——平均每个族群和每个样本中分别有约15Mb和约9.5Mb的古人来源新序列,包括尼安德特人、丹尼索瓦人等。这将为东亚现代人基因组中的古人基因渗入研究乃至整个古DNA领域提供新的信息资料和线索。

从人类基因组计划中国只承担“1%”的图谱绘制任务,到今天中国人群泛基因组图谱“100%”由中国科学家完成,这项研究成果展现了中国生命科学尤其是基因组学科研水平在过去40年间的历史性跨越,为完整构建中华民族参考泛基因组打下了坚实的基础,也为人类参考泛基因组图谱绘制了“中国画卷”。

“这一成果表明我国科学家在人类基因组学领域的研究水平得到了显著提升。我相信这项工作对我国的人类基因组学和医学中的复杂疾病遗传基础研究等领域会起到重要的推动作用。”中国科学院院士赵国屏这样评价。

中国科学院院士、复旦大学校长金力注意到这项研究鉴别出约3.4万个结构变异,“我想强调的是,基因组结构变异大概是生物进化中从微观到宏观演变的关键遗传基础,也是最有可能连接渐变到跃变这个‘鸿沟’的进化密码。”他认为,通过对基因组结构变异的高精度解析,不但能大幅提升“基因型-表型”关联分析的功效,而且有可能最终帮助我们理解生命演化中重要性状和功能产生的遗传基础和分子机制。

复旦大学徐书华教授、西安交通大学叶凯教授、中国医学科学院褚嘉祐教授和复旦大学陆艳副教授为论文的共同通讯作者。复旦大学博士后高扬,西安交通大学杨晓飞副教授,中国科学院上海营养与健康研究所博士生陈豪、谭昕江,中国医学科学院杨昭庆研究员以及复旦大学邓恋青年研究员为论文的并列第一作者。

相关文章

著名遗传学家《自然》最新发文:首次报道了着丝粒巨大变异背后的因素

一项对人类和一些非人类灵长类动物着丝粒的基因组研究揭示了它们难以想象的多样性和进化变化的速度。虽然着丝粒通过确保细胞分裂时遗传物质的忠实传递,对细胞的正常复制至关重要,但其基因组组织的复杂性几乎不可能......

8年恋爱、4篇论文,他们为科研“吵了无数次”

最近几年,每隔一段时间,张冲就会发一个朋友圈,配文为“这一秒钟科学不重要”。配图则为一篇新上线论文截图,她和丈夫薛瑞栋的名字赫然在列。今年情人节,这个系列的朋友圈再次“更新”。此次的配图为一篇Natu......

基因编辑技术揭开海洋硅藻密度感知的谜底

近日,中国科学院海洋研究所藻类生理过程与精准分子育种团队与合作者利用精准基因编辑技术揭示了海洋硅藻对种群密度信号的感知和传递机制。研究成果发表在《国际微生物生态学学会杂志》上。陆地和海洋中的动物会通过......

124页报告详尽披露Nature两度撤稿作者迪亚斯数据伪造、抄袭等不当行为确凿

兰加·迪亚斯,这个名字一度在物理学界引起轩然大波。他所宣称的“室温超导”发现,曾让全球科学界为之一震,仿佛打开了新世界的大门。然而,在科学界不断的质疑声中,这扇门逐渐显露出裂痕。迪亚斯所发表的室温超导......

基因组系统解析工具开发研究取得重要进展

近日,中国工程院院士、南方海洋科学与工程广东省实验室(广州)教授包振民团队开发国际首个整合宏观/微观进化基因组和功能基因组的综合分析工具(PanSyn,https://github.com/yhw32......

遗传发育所揭示水稻RNA识别结构域蛋白抑制外源基因沉默的机制

植物是复杂的生物系统。植物体内基因的表达受到多种水平的调控,如转录水平、转录后水平、DNA甲基化/去甲基化等,从而对基因表达进行精密高效的调控。中国科学院遗传与发育生物学研究所张劲松研究组筛选OsEI......

中南大学“地球时空基准”国家基础科学中心正式启动

4月1日,“地球时空基准”国家基础科学中心启动会暨学术委员会成立大会在长沙举行。国家自然科学基金委员会地球科学部常务副主任姚玉鹏、副主任张朝林,来自全国地球科学领域的刘经南、周忠和、王会军、陈晓非、陈......

《自然》:自身免疫性疾病治愈曙光初现

去年底,在圣迭戈举行的美国血液学学会年会上,德国埃尔朗根-纽伦堡大学的法比安·缪勒博士报告了一组最新研究数据:15名自身免疫疾病患者在接受CAR-T细胞疗法后重获新生,其中第一批接受治疗的患者已保持了......

迄今最详细人类血液干细胞图谱出炉,有望为白血病提供新疗法

 科学家绘制出迄今最详细人类血液干细胞图谱。图片来源:辛辛那提儿童医院美国科学家借助博弈论和机器学习技术,绘制出迄今最详细人类血液干细胞图谱。借助该图谱,研究团队已经鉴定出80多个不同的造血......

Brain:科学家识别出参与阿尔兹海默病中神经元易感性发生的关键基因

神经变性疾病早期阶段的特征是离散脑细胞群中蛋白质的积累以及这些脑细胞的退化,对于大多数疾病而言,这种选择性的易感性模式是无法解释的,但其对于病理性机制或许能提供重要的见解。阿尔兹海默病是世界上主要的痴......