发布时间:2015-11-19 17:44 原文链接: Nature:回顾人类基因组计划的25年

   25年前,人类基因组计划启动了,时至今日,它所提供的经验仍旧指引着由它开启的,以团队协作为基础的科学研究。

  1989年,人类基因组计划启动前,纽约冷泉港实验室举行的的班伯里会议。弗朗西斯·柯林斯与詹姆斯·沃森位于前排。

  25年前,新落成的美国国家人类基因组研究中心(即现在的国立人类基因组研究所,National Human GenomeResearch Ins,NHGRI)在我们三人的领导下,协同美国国内与国际的合作伙伴,启动了人类基因组计划(Human Genome Project,HGP)。此后发生的一切,成为最具历史意义的重要科学成就之一:通过长达13年的探索,测序人类基因组的三十亿碱基对。

  就在数年前,围绕人类基因组计划的讨论焦点还主要集中在这个问题上:该项目为我们理解人类疾病已经带来,或者会带来怎样的启示?这个问题的答案到现在才水落石出:人类基因组计划不仅大力推动了生物医学研究的发展,还开启了科学探索的新途径。

  作为首个大规模生物学项目,人类基因组计划为之后诸多的团队协作研究项目铺平了道路。仅NHGRI自2000年开始就启动了超过25个此类项目。这为生物医学研究带来了新挑战:譬如,要求来自不同国家与学科的不同团队齐心协力,来共享和分析大规模的数据集。

  现在的年轻学者很容易忽略这样一个事实:很多他们正在努力攻克的问题是25年前他们的前辈想都没想过的。同样容易被忽略的是,人类基因组计划迄今仍在启发这些大规模科学项目的探索。事实上,我们认为今天这些以团队协作为基础的科研之所以能成功,是基于人类基因组计划的六条重要经验。

  六条经验

  通力合作

  人类基因组计划打破了研究学者独自探索,为少数几个科学问题寻求答案的格局,这是势所必然的。同样,它还一反“假说推动研究”的规矩,而是专注于发现能够启发大量后续研究的基础信息。

  人类基因组计划汇集了来自多个国家,多种学科背景和具有不同资历的2000多名研究人员,他们分成若干小组,由不同的基金会支持。该项目的成功源自投资人有力的领导、对这项工作重要性的共识以及研究者甘心为共同的利益而放弃个人成就的意愿。

  不少以团队合作为基础的基因组学项目紧随其后。其中包括:对人类基因组中的序列差异进行分类的“千人基因组项目”(the 1000 Genomes Project);鉴定致癌突变的“癌症基因组图谱项目”(Cancer Genome Atlas);以及,在其他技术中加入基因组测序技术,来研究微生物群落的“人类微生物组计划”(Human Microbiome Project)。

  对于以团队合作为基础的科研而言,一个常见的障碍是参与者不愿意接纳新成员。不过经过多方努力,再加上越来越多的人认识到积累数据和资源对每个人都有益,这一成规最终得以瓦解。

  譬如,直到最近为止,非洲的遗传学家和基因组学家与欧美科学家的合作最为频繁,而与其他非洲研究者合作得较少。“非洲人类遗传与健康新方案”(Human Heredity and Health in Africa,H3Africa)旨在增强非洲基因组学研究。它的关键目标之一就是培养建立起非洲本土的交流合作。由美国国立健康研究所(NIH)和 英国维康信托基金(Britain's Wellcome Trust)在2012至2013年提供给该项目的启动基金资助了24个非洲国家的29次合作;而这些数字还在进一步增长。H3ABioNet是一个旨在促进整个非洲共享专业知识、基础设施和工具的生物信息学网络平台,目前已经包括了15个国家的32个研究团队。

  数据分享最大化

  人类基因组计划改变了生物医学研究中数据分享的旧例。大量基因组图谱定位与测序的数据开始生成之后,要求设立可以缩短数据从生成到发布的时间的政策的呼声就日益增强。1996年,百慕大原则(Bermuda Principles)的实施为这一番努力画上了句点。人类基因组计划主要团队的领导人同意在序列生成后的24小时内,将达到一定规模的基因组序列整合提交到一个公共数据库。

  在那之后的几年中,促进数据共享的工作仍在继续。在2003年,劳德代尔堡协定(Fort Lauderdale Agreement)推广了百慕大原则,而在2008年,NIH将其这种数据共享扩展到全基因组关联性研究中。全基因组关联性研究指的是组织成百上千人,分析其常见的基因组变异,从中找出与感兴趣的性状相关的变异。2014年,一项全面的“基因组数据分享政策”(Genomic Data Sharing Policy)开始实施,要求几乎所有在NIH基金资助下获得或分析的基因组数据都必须拿出来共享。

  数据的广泛共享也带来了新挑战。其中包括分析和移动大批数据时计算和物流上的难点,另外,以人类数据(尤其是基因组和临床数据)为例,怎样保护研究中被试者的隐私也是问题之一。人们正在探索大量新方案以解决此类问题。

  对于稳定可靠且功能强大的计算平台的需求,促使云计算在生物医学研究中的应用飞速增长。人们也提议利用新资源,比如建立一个“公用数据”系统(data commons)来储存已发表和未发表的数据。国际基因组与健康同盟(Global Alliance for Genomics and Health)是一个在2013年成立的国际性联盟组织,它正在准备一个国际性的“基因组与健康相关数据责任分享框架”(Framework for Responsible Sharing of Genomic and Health-related Data)。这将把法律、伦理和技术都纳入考虑范围之中。

  1994年:早期DNA 测序实验室

  有计划地分析数据

  人类基因组计划的筹划有其缺陷。回顾当时,数据分析在计划之初就未获得足够的重视。第一个人类基因组数据是由零化整地建立的。为了获得每条染色体上相邻的序列,必须由计算机把几千条单独整合的序列片段(每条长约100-300千碱基对)拼接在一起。此类计算处理的需求(其实也是技术挑战)在人类基因组计划后期变得愈发明显。通过生物信息学小组艰苦卓绝的努力,这一任务耗费了数月得以完成。如果在计划阶段多花点心思,完成这些工作就会轻松许多。

  近几年来,一些基因组学计划(譬如千人基因组计划和肿瘤基因组图谱计划)展示了及早制定计划是怎样影响数据生成的策略的。最近的美国精准医疗计划(US Precision Medicine Initiative)预期将得到种类异常繁多的数据,于是事先就探讨了整合与分析这些数据的最佳方案——从电子健康档案和基因组分析到环境监控仪和可穿戴身体传感器等等。

  优先发展技术

  1990年10月,人类基因组计划的成员们清醒地认识到,必须把基因组测序与绘制图谱的工具与方法作为一个更大的项目去开发。事实上,这个项目催生了不计其数的关键遗传学技术,并引发了其后的分子生物学、化学、物理学、机器人技术和计算科学的革新,同时也让工具和技术手段的使用策略更富有创意。在某些案列中,人们把多种渐进的改进整合在一起,就获得了革命性的进步,譬如毛细管DNA 测序设备最终被用于生成第一个人类基因组图谱。

  对技术革新的注重在今天的大规模项目中一样重要。这方面的领头羊就是美国脑科学研究所,它的推进创新神经科技行动(Advancing Innovative Neurotechnologies Initiative)目标是彻底改变我们对人类大脑的认识。此计划致力于发展新一代可鉴定大脑中所有的细胞类型的工具,并且建立它们联系的图谱,再记录各种功能和行为相应的神经回路信号。

  追踪进展带来的的社会影响

  人类基因组计划的发起人意识到,从人类基因组测序与图谱建立过程中获得的信息可能为社会带来深远影响。该项目因此成为首个致力于研究更广泛的社会问题(譬如怎样保护个人隐私和避免歧视)的大规模研究项目。NIH为人类基因组计划提供的经费中,有5%拨给了研究ELSI(即伦理、法律与社会意义)问题的分支项目。这是有史以来对生物伦理学研究最大的投资。

  当今,很多前沿的研究都存在社会与伦理学的顾虑。备受关注的例子包括应用CRISPR/Cas9基因编辑工具改变人类与其他物种的基因组,以及为了在传染病爆发时迅速研究可行的治疗方法而快速设计临床试验。遗憾的是,很多以团队合作为基础的项目并不像人类基因组计划这样,包含专门的生物伦理研究程序。我们认为,新的大型方案启动时,对伦理和社会影响的研究也应该是其中一个关键的组成部分。

  到了2006年,DNA测序对人力的需求降低了很多

  大胆而灵活

  人类基因组计划的目标是相当大胆的。鉴于人们不知道人类基因组的测序和分析会得出什么样的结果,一些人抱着怀疑的态度审视这项工作也情有可原。

  我们相信,人类基因组计划成功的关键在于科学带头人们一直保持着一个开放的心态,以及定期暂停项目并进行评估。人类基因组计划最初的5年计划在1993年与1998年分别被修正更新,它的的各个项目也得到了定期的更新。

  只要整个任务是建立在明确的基础、质量标准和评价体系之上,目标大胆规模庞大的项目就有可能成功。此外,还需要对计划的反复调整更新。要是等到最终目标都弄清楚才开始,就会有错失良机的风险,而且很多机会只有在研究者着手工作以后才会出现。这一原则已成为多个大规模计划的规范,其中包括BRAIN和精准医疗计划项目。

  规则颠覆者

  20世纪90年代早期——无论是NIH在人类基因组计划的领导层(詹姆斯·D·沃森与弗朗西斯·E·柯林斯),还是在该项目的第一线(弗朗斯西·D·柯林斯)——我们当中并没有人预见到人类基因组计划的主要收获是新型的科研模式。

  在当今研究生的职业生涯中,他们可能会见证或亲身参与阐明数千种疾病的分子机制、癌症诊断与治疗的革命、微生物组学的成熟、干细胞治疗的常规化应用以及其他令人叹为观止的生物医学成就。

  人类基因组计划的故事是一份珍贵的备忘录,提醒我们该工程的一些成就从根本上引发了研究方式的变革,同时,它也提醒我们,接受和欢迎这些变革是多么的重要。

相关文章

科学家揭示人类基因组古病毒复活驱动衰老

病毒与人类之间的协同进化关系源远流长,二者之间的交锋从未随时间停止过。在这场旷日持久的战争中,一方面,病毒使人类饱受疾病困扰,甚至死亡,并在此过程中对人类基因组不断地利用与改造;另一方面,人类的免疫系......

首个完整人类基因组序列公布

 由美国国家人类基因组研究所、加利福尼亚大学圣克鲁斯分校、华盛顿大学等机构研究人员领衔的国际科研团队3月31日公布了首个完整、无间隙的人类基因组序列。与这项重大成果相关的6篇论文当天发表在美......

DNA重组广泛存在人类基因组中

科技日报北京7月26日电(记者张梦然)日本理化学研究所综合医学科学中心科学家主导的国际合作研究发现,在人类每个细胞的基因组中,重复数百万次的特定基因组序列重组普遍存在于正常细胞和疾病状态的细胞中。确定......

这一基因组序列除了加速人类进化,还具有另一重要作用

哈佛医学院研究人员团队已经证明,参与人类神经发育的调节增强剂在人类基因组的快速进化部分中尤为常见。这些区域被称为人类加速区,或HAR,包含与其他动物相比人类进化得更快的基因,并被认为有助于大脑皮层的进......

破译“生命天书”20年:基因组时代曙光初现

2001年2月15日,被称为破译“生命天书”的人类基因组序列草图正式发表。20年前,我国科学家参与并完成国际“人类基因组计划”(HGP)1%的任务,使我国成为世界上少数几个能独立完成大型基因组分析的国......

20年前人类基因组测序时遗漏的8%的基因组被补全!

人类基因组计划(HumanGenomeProject,HGP)被誉为生命科学的“登月计划”。2001年,由HGP和Celera公司之间相互竞争而又各自独立完成发表了人类基因组草图,被认为是一大里程碑。......

“人类基因组图谱”20年——30亿碱基“拼出”大科学时代

20年前,2001年2月,被誉为生命科学“登月计划”的“人类基因组计划”(HGP)发布首张人类基因组图谱。这是人类生命科学发展历史上的重要“分水岭”。20年来,曾作为单一学科独立发展的生命科学迎来多学......

日本量子密码通信技术传送人类基因组实验成功

据日本《共同社》获悉,日本东芝公司和日本东北大学东北MedicalMegabank机构(仙台市)近日宣布,成功开展了利用可防止信息被偷窥的新一代技术“量子密码通信”传送人类遗传信息(基因组)完整数据的......

你到底有多少基因?科学家公布人类基因数量引发争议

在人类基因组项目完成十多年后,辨别基因仍是一项挑战。估测人类基因组中基因数量的最早尝试涉及喝醉酒的基因学家、美国纽约冷泉港的一个酒吧以及纯粹的臆测。那是2000年。当时,人类基因组序列草图仍在绘制中。......

科学家公布人类基因数量引发争议

估测人类基因组中基因数量的最早尝试涉及喝醉酒的基因学家、美国纽约冷泉港的一个酒吧以及纯粹的臆测。在人类基因组项目完成十多年后,辨别基因仍是一项挑战。那是2000年。当时,人类基因组序列草图仍在绘制中。......