发布时间:2018-01-12 17:23 原文链接: 中国人类基因组研究有望“弯道超车”

  我国科学家首次完全自主实施国家级人类全基因组项目。

  属于中国人自己独特的基因“密码”有望被精准破译。近日,由哈尔滨工业大学牵头的国家重点研发计划精准医学研究重点专项之“中国十万人基因组计划暨中国人群多组学参比数据库与分析系统建设”项目正式启动,并进入为期4年的项目实施阶段。

  “这是我国科学家首次完全自主实施的国家级人类全基因组项目。”项目负责人、哈工大生物信息技术研究院院长王亚东在启动会上介绍,项目组将选取十万中国自然人群作为研究对象,进行基因组、暴露组、表型组等组学研究,揭示中国人群特有基因组变异、变异频率及其影响,最终绘制完成属于国人自己的基因组变异图谱和多组学健康地图。

  “目前,我国在人类基因组研究方面的总体科学影响力,还不能认为是达到了国际领先水平。” 中国科学院上海生命科学研究院生物医学大数据中心首席科学家、中国科学院院士赵国屏评价道,“在组学研究进入大数据时代这个关键时刻,结合精准医疗方向实施‘中国人群多组学参比数据库与分析系统建设’这一大研究计划,辅以正在开展的大规模人群队列研究和正在筹划中的‘人类表型组’计划,是我们实现‘弯道超车’的大好机遇。”

  为什么要选定“十万人”

  人类基因组变异多数都是无害的,但也有些变异可导致疾病,如癌症、心脑血管疾病、糖尿病等。中国十万人基因组计划就是要比较全面而精准地鉴定中国人的基因组变异及相关的其他组学(包括表型组)数据,形成比较完善的基因组变异参比数据库。这个基本数据基础,将大大促进我国科学和医学工作者,鉴定与不同人群表型(包括各种复杂疾病)相关的基因组变异,以利于疾病防治,保证全民健康。

  “我国尚未建立高精度的中国人参考基因组,大量精准医学前沿研究缺少参考数据,已经成为我国精准医学发展的重大瓶颈问题。”王亚东坦言,启动中国十万人基因组计划就是瞄准了这一瓶颈问题。

  王亚东表示,该计划将构建世界级精度中国人参考基因组和多组学参比数据库,这是我国精准医学发展的重要基础,将满足精准医学研究的关键共性需求,有助于挖掘健康和疾病的遗传与环境风险因素的相关性、建立精准的疾病防治方案。

  那么,为什么要选定十万人作为参比人群?实际上,“研究环境和基因相互作用对健康的影响,研究肿瘤等重大疾病易感性的个体遗传差异,罕见变异(频率低于千分之五)可能是重要的研究对象。”王亚东在接受媒体采访时指出,我国人口接近14亿,遗传结构复杂,根据统计遗传学理论,要达到本项目精确地鉴定罕见变异的目标,即变异检测的精度达到万分之一,十万人只是一个最小限度的基因组测序数量。

  那这十万人又是如何选取出来的呢?一方面是依托精准医学研究专项等国家科研项目,从已有的研究队列中选取样本;另一方面,项目还将建立一个开放的平台,志愿者也可以参与其中。

  为了保证样本的全面性和多样性,项目基本涵盖了我国东北、西北、华北、华中、华东、华南、西南7大地区的汉族样本。同时,还选择了包括藏族、蒙古族、壮族、回族、满族等9个人口数量在500万以上的少数民族群体,在接下来的项目推动过程中,将逐步扩展到56个民族。

  实施过程将面临重大挑战

  人类约有2.5万个基因,要想把十万人每个人体内的基因密码全部解开,面临的首要挑战就是十万人基因组变异检测的计算复杂性和质量控制。

  赵国屏对《中国科学报》记者解释道,全基因组是指全部30亿碱基长的人类基因组序列。只有通过包括全基因组测序又高于现在常用的二代测序的方法,才能够发现基因组上的单核苷酸变异(SNV)、插入/缺失变异(INDEL)和结构变异(SV)等所有基因组变异。

  “在过去的基因组计划,虽然GWAS(全基因组关联分析)研究曾经用到万人以上的样本,但全基因组测序的计划从未有如此大的样本。”赵国屏表示,该项目产生的数据规模巨大,数据总量可达到10PB,从基因组测序数据中检测基因组变异的计算量巨大,可达到2000万CPU小时,需要建立高效的计算分析平台完成所有数据分析工作。

  除此之外,目前,国际上的基因组变异检测方法准确率较低,其中SNP准确率低于99%,INDEL准确率低于95%,SV准确率低于90%。如何确保此次项目数据分析的准确度也是一大难点。

  “因此,我们需要建立高效的计算分析平台完成所有数据分析工作,研发更高精度的基因组分析算法、软件和工作流,以及基因组变异检测的质量控制体系,确保基因组变异检测的准确性。”王亚东说。

  面对庞大数据算法方面的挑战,上海交通大学Bio-X研究院院长、中国科学院院士贺林则建议,除了算法改进和计算机能力的更新,未来侧重点还应考虑放在对海量“垃圾”序列的划界和处理上。

  除此之外,贺林还对《中国科学报》记者指出,中国十万人基因组计划完成之后,立即面对的是如何解读所得到的大量序列数据与健康和疾病之间的关系。建立遗传咨询行业被认为是唯一出路,然而在我国的职业大典上,至今还找不到遗传咨询师这一职业。

  集中力量实现“弯道超车”

  继成功绘制人类基因组测序“中国卷”和水稻基因组图谱后,进入本世纪以来,我国科学家继续向着生命科学的深处进军,继续参与了人类基因组新计划HapMap计划、肿瘤基因组计划和千人基因组计划,并且在成功完成HapMap计划的基础上,针对若干重大疾病,大规模地开展GWAS研究工作,获得了可喜的成就。

  据赵国屏介绍,在过去二十年里,利用人类基因组研究的技术与知识,中国微生物(包括病毒)基因组研究进展迅速,在传染病防控的基础研究与临床应用方面迅速走向国际前沿。另外,中国在干细胞、肿瘤防治、胎儿遗传疾病早期检测、慢性病代谢病防治方面的进步也有目共睹,其中干细胞的研究已经达到了国际前沿水平。但是,我国在基因组,特别是人类基因组研究方面的总体科学影响力,还达不到国际领先的水平。

  赵国屏认为,对基因组的研究,本质上是对基因型的认识。我们目前所使用的关于人类基因组的比较系统和可靠的基础数据,大部分是由以西方人群为主的国际研究项目所提供,这对于服务中国人的健康与医药事业是不适应的。另一方面,以往国际项目对于相应表型信息的采集,基本上是项目导向,比较分散难以整合,再加上其中亚洲人样本有限,也更为开展基因型与表型的相关分析带来了基础性的问题。

  “造成这个问题的根本原因就是我们在过去二十年中,对于我们自己产生的基因组数据的整合、交互和共享没有组织并实施持之以恒的大规模的工程性管理、支撑、服务、研究和开发工作。”赵国屏再次强调说。

  而此次启动的中国十万人基因组计划正好给了我们“弯道超车”的大好机遇。中国人“多组学”相关项目的整合,为中国人类基因组研究走向工程化,为中国人类基因组数据能够真正在整合与共享基础上实现高效的挖掘与研发创造了条件。相信这个项目的扎实推进,一定能为我国健康事业和生命科学研究事业作出根本性的贡献。

  据悉,该项目设立五个课题,分别由哈尔滨工业大学、复旦大学、中国科学院北京基因组研究所、华中科技大学、中国科学院上海生命科学研究院等五个科研单位领衔,将有20个大学、科研院所和企业的166位专家学者参与到项目中。

  “现在我国测序设计和分析能力是有的,但力量却是分散的,这次项目是一个机会,希望能够把力量集中起来。现在,在筹备的过程中,也看到了这方面希望。”赵国屏说。

相关文章

中国在全球创新指数报告中9项指标排名全球第一

10月9日,国家知识产权局举办了“知识产权这十年”专题新闻发布会暨国家知识产权局10月例行新闻发布会。会上有媒体提问:在世界知识产权组织刚刚发布的2022年全球创新指数报告中,中国的排名再次提升,位列......

国产航空轮胎跑出中国“加速度”

航空轮胎对冲击、承载、生热和耐磨等技术指标有着极为苛刻的要求,要实现技术全链条自主可控,并真正地进入良性轨道,具有市场竞争力,获得商业化成功,必须要闯过材料研发、工程化和市场化“三道关”。【深瞳工作室......

动物所等揭示小鼠行为和神经基因的驯化机制

实验小鼠是生物学和医学研究中最常用的哺乳动物模型之一,由野生小家鼠长期驯化而来。实验小鼠和野生小家鼠在体型、生理及行为方面存在很大差异。特别是,实验室驯化下小鼠攻击行为减弱、温顺行为增强。已知实验小鼠......

土库曼斯坦计划建设一条新的天然气管道到中国

10月3日,土库曼斯坦议会上院议长、前总统库尔班古力•别尔德穆哈梅多夫表示,阿什哈巴德(土方首都)和北京正在致力于提高土库曼斯坦对中国的天然气供应,计划建设土中第四条天然气管线,土方是我国最大的管道天......

华大发布最新“中低通道”测序仪,超快速、更灵活、更简单

华大智造科技有限公司(MGI)于9月9日正式推出DNBSEQ-G99*,这是最新型号的中低通量基因测序仪*。作为全球同等通量测序仪中速度最快的测序仪之一,DNBSEQ-G99*特别适用于靶向基因测序和......

邵长伟:以基因技术作锄,誓将沧海变“良田”

他参与绘制了我国第一个鱼类(半滑舌鳎)基因组精细图谱(国际上首个比目鱼基因组图谱),解析了半滑舌鳎发生性逆转的表观调控机制;他主导建成我国保存量最大的海洋渔业生物基因资源库,搭建了种质资源精准鉴定与评......

避菌核病,这项研究让油菜更艳丽

实验室里培育的油菜花课题组供图近日,《植物通讯》上在线发表了题为《利用CRISPR编辑BnaIDA基因创建抗裂角、花器官不脱落和避菌核病甘蓝型油菜新种质》的论文。该研究利用CRISPR/Cas9系统成......

被氯酚污染后鱼类“女宝”更多的分子机制获揭示

2,4-二氯酚通过雌激素受体ESR2a依赖的信号途径导致斑马鱼原始生殖细胞数量增加兰州大学供图氯酚作为化工原料被广泛使用于工农业生产和日常生活中,为水环境普遍存在的一类持久性有机污染物。氯酚类化合物可......

因美纳持续推动“加速器计划”,新投资6家新创业公司

因美纳近日表示,其因美纳“加速器计划”已投资了来自世界各地的六家新创业公司。这些公司包括AcrobatGenomics,这是斯坦福大学的一个衍生公司,它使用高通量CRISPR基因编辑来填补其新疗法的管......

科学家鉴定出“好斗”抑制基因

美国索尔克研究所科学家的一项新研究确定了大脑中的一个基因和一组细胞,它们在抑制果蝇的攻击性方面起着关键作用。该研究结果7日发表在《科学进展》上,或有助于解释帕金森病等疾病——帕金森病有时会导致行为改变......