发布时间:2019-02-18 15:13 原文链接: 缺乏数据使用指导原则,基因组数据共享遇阻

   基因组数据共享将生物医学研究推向快车道,但向公共领域发布的现有数据指南一方面承认免费和无条件使用数据的重要性,另一方面还未能解决这种重要性与数据生产者首次发布数据的“权利”之间的关系。

  在美国能源部联合基因组研究所负责人Nikos Kyrpides看来,这种自相矛盾导致了数据生产者和数据使用者对公共数据的使用有着不同的解释和持续的争论。

  “根源在于缺乏数据使用的明确指导原则。”在接受《中国科学报》采访时,Kyrpides再次强调,公共数据应该被视为开放资源,不受限制地被用于分析、解释和发布。相关论文近日在线发表于《科学》。

  时不时遇到“软障碍”

  公共基因组数据使用自由是国际生命科学研究领域的传统与共识,自人类基因组计划实施以来,大量的开放共享基因组数据信息极大地促进了生物医学研究的进步。

  1990年启动并有我国参与的人类基因组计划被看成科学史上的伟大工程,3年前,该计划负责人Eric Green、James Watson和Francis Collins在《自然》上撰文总结了人类基因组计划的6点经验,其中之一是数据共享最大化。

  正是人类基因组计划改变了生物医学研究的数据共享原则,促成了1996年百慕大原则,即同意将超过一定规模的基因组测序数据在产生后的24小时内提交到公共数据库。

  一直以来,促进数据共享仍在继续并有新的变化。2003年劳德代尔堡协定重申和扩大了百慕大原则,认为大规模基因组序列数据的预发布对科学界有巨大的益处,同时指出数据共享限定在团体资源项目。

  自该协定签署以来,实现更广泛、更快速、更有效的数据共享成为学界反复讨论的主题。

  在数据共享大背景下,学术论文在发表时,一般都会公开并共享相关的基因组数据。“但是政府资助的各类科研项目产出的基因组数据,数量更为广泛,在论文发表前共享程度极低。”中国科学院—马普学会计算生物学伙伴研究所研究员张国庆告诉《中国科学报》。

  张国庆使用国际基因组数据时曾被要求填写申请,“但由于审核机制不透明,导致时不时地遇到‘软障碍’”。

  “数据共享政策并不是一成不变的,许多资助机构已经对政策进行了微调。”Kyrpides介绍,比如2014年美国国立卫生研究院制定的基因组数据共享政策,正在创造一个更完善的数据共享生态系统,“这是以前协定所没有的”。

  “这不是自相矛盾吗”

  事态的发展“证明劳德代尔堡协定已过时,需要对其修订以反映科技现状”,Kyrpides认为,协定通常局限于良好的团队资源项目,但不包括所有测序项目。

  在接受《中国科学报》采访时,Kyrpides还指出劳德代尔堡协定的矛盾之处。根据协定,向公共领域发布的数据是任何人都应该且能够不受任何限制地使用的,并且规定这些数据要在出版之前发布,以便让整个团体从中受益。

  这些年,基因测序产生了无数的数据集,其中许多数据集在没有出版的情况下公开发布。但协定同时又提到,“想要使用未公布的公共数据的人应首先得到数据生产者的许可”,Kyrpides表示,“这不是自相矛盾吗”。

  研究人员也提到了赞成限制公共基因组数据使用的人通常有两个理由,一是未验证的预发布数据可能包含错误,二是生成新的数据往往需要耗费很长时间。

  在张国庆看来,数据使用受限主要原因是数据的相关权益不清晰,难以保证样品提供、数据产出、数据管理、数据分析等各方的利益。

  此外,基因组数据相关的个人信息的安全管理要求不清晰也是一方面原因,比如敏感数据。

  “我们承认,对于现有的敏感人类基因数据,一些限制可能是适当的。”Kyrpides也表示。

  不过,研究人员发现对分享敏感数据的抵制正逐渐得到缓解。纵观整个生物医学文献,2015年至2017年,约有1/5已发表的文章共享原始数据,较前几年大幅度增加。

  确定使用原则

  “不受限制地使用公共数据应该与学术界的奖励制度保持一致。”Kyrpides认为,资助机构需要认识到数据共享的意义,并向生成数据的科学家授予适当的荣誉。

  同样重要的是,“要确定有效的方法,为描述数据生成后,协议以及特定数据集的生成提供支持”。Kyrpides告诉记者,更要重新审视资助机构和期刊出版商的数据发布策略。

  研究人员认为,期刊出版商需要重新考虑出版政策,即在手稿提交出版时数据的可用性。Kyrpides等人建议,序列数据及其相关的元数据需要在手稿提交同行评审时与详细协议一起免费提供,而不是在发表后。

  “要推进基因组学领域的发展,就需要制定强有力的政策,促进开放和不受限制的数据共享,促进包容性的团体驱动的研究和培训。”Kyrpides说。


相关文章

细胞与基因治疗成为现代医疗主要趋势

以“细胞基因治疗与再生医学产业发展”为主题的2023年第2期(总第12期)中国药谷院士专家大讲堂日前举办。业内专家普遍认为,近年来,在技术、政策、市场等驱动下,作为一种新兴的治疗方式,细胞与基因治疗成......

Nature子刊:尿路感染可通过修改基因组记住感染史

尿路感染是全球最常见的细菌感染之一,也是本来健康女性的一个主要患病诱因。尿路感染由尿道致病性大肠杆菌(UPEC)这类细菌导致,发生尿路感染的一个最大风险因素为既往感染史。然而,造成反复感染的背后机制却......

首款CRISPR基因编辑疗法距美国上市咫尺之遥

4月3日,VertexPharmaceuticals(Nasdaq:VRTX)和CRISPRTherapeutics(Nasdaq:CRSP)宣布完成了examglogeneautotemcel(ex......

深圳先进院:细胞命运决定机制的研究获进展

细胞分化使基因型相同的细胞产生在形态、结构和生理功能上差异的细胞。关于细胞分化过程的发生,经典表述认为细胞的基因功能以及它们形成的复杂调控网络在时空上控制了基因的表达量,从而编程了细胞命运决定(fat......

定量解析“基因开关”,探索细胞命运决定机制

细胞可以通过命运决定过程来不断适应环境变化,实现和完善其自身功能。理解细胞命运决定的具体机理对于回答复杂生命如何诞生、实现组织和器官再生、以及合成人工生命体等问题非常重要。北京时间3月24日,一项发表......

打开一个基因中的“藏粮密码”主效耐碱基因可增产约20%

“我国人多地少,在工业化和城镇化发展的背景下,确保18亿亩耕地红线,粮食安全生产存在巨大压力。如何破题?”“把边际土地,特别是盐碱地的作用发挥出来,就能大幅缓解这个压力。”3月22日,中国科学院院士李......

中国新能源汽车大数据产业大会召开

3月19日,“中国新能源汽车大数据2023年产业大会”在沈阳市举办。大会由沈阳市人民政府和新能源汽车国家大数据联盟(以下简称“联盟”)共同主办。辽宁省副省长姜有为、工信部装备工业一司副司长郭守刚等共同......

北大重庆大数据研究院将共建“基因智能大数据实验室”

18日在重庆召开的2023世界中联中医药大数据产业高峰论坛上,北京大学重庆大数据研究院与上海睿昂基因科技股份有限公司签署共建“基因智能大数据联合实验室”(以下简称实验室)战略合作协议,双方将发挥各自优......

华大基因2022年度业绩快报,利润同比下滑近42.57%

近日,深圳华大基因股份有限公司发布2022年度业绩快报,报告显示华大基因2022年度营业总收入约71.26亿元人民币,同比上年增加5.32%。2022年度营业利润约10.47亿元人民币,同比上年减少4......

基因组育种大数据计算新工具“天权”发布

近日,国际学术期刊《核酸研究》(NucleicAcidsResearch)发表了华中农业大学动物遗传育种团队开发的基因组育种大数据计算新工具HIBLUP,中文名为“天权”。相关论文被期刊评为“突破性进......