发布时间:2016-08-16 14:09 原文链接: 免费网站“试水”数据二次发布

将来自上百万项生物学研究的知识编译到一个网络中——这是Daniel Himmelstein对Hetionet的诱人描述。Hetionet是将来自药物、基因和疾病的28个公共资源的数据聚合在一起的免费在线资源。不 过,对于一个以公共信息为基础构建的产品来说,获得法律许可异常艰难。

当身为美国宾夕法尼亚大学数据科学家的Himmelstein联系研究人员以获得公开再现其工作的许可时,很多人对于他要询问此事表示惊讶。“我从未想到这里面还存在许可问题。”奥地利科学院分子医学研究中心生物信息学家Jörg Menche说。

Menche很快表示同意,但并非每个人都这么配合。一个研究小组从未答复Himmelstein,还有3个小组给出了答复,但仍未澄清可能的法律纷争。 最终,Himmelstein在今年7月公开了Hetionet的最终版本——去掉了一个禁止再次发布的数据集,但将仍缺少再出版明确许可的3个数据集包 括了进来。Himmelstein表示,这种混乱表明,很多研究人员并不理解简单地公开发布数据集并非意味着其他人能合法地将其再次发布。

在Himmelstein看来,这种混乱会阻碍科学的发展,因为研究人员将不被鼓励把数据集整合到更加有用的资源中。同时,随着科学家在网上发布更多信息,它还会带来越来越多的问题。“科学正愈发依赖于对数据的再次利用。”Himmelstein说。

由于一条数据或者说一个事实无法受到版权保护,因此很多科学家认为,那些未设置使用细则和条款的公开发布的数据集能被再次发布,而不会出现法律问题。不过,英国诺丁汉大学知识产权法专家Estelle Derclaye表示,这种想法未必正确。

欧盟为特定数据库授予独立于版权的权利,目的是保护在编译数据库方面所作的投资。从法律上讲,这些权利会阻止诸如Himmelstein等研究人员在未经同意的情况下再次发布由欧盟各国科学家创建的数据集。

其他国家也有不同层次的法律保护。不过,在像美国这样的不存在单独权力管理数据集的国家,仍会出现混乱。爱丁堡数字监管中心就数据授权发布的指南显示,关于在任何特定情境中数据可能如何被利用的法律立场的缺失很难得到解决。

为此,数据分享的倡导者建议,正在创建公共数据库的研究人员应加上明确的许可,以解释他们想让数据如何得到再次利用和发布以及是否放弃对数据库持有的任何权利。

就Himmelstein来说,他想利用的一些数据集拥有明确的许可——其中一些禁止无限制地再次发布,其他的则没有。Himmelstein表示,他的项目中最令人沮丧的部分在于感觉很多好的数据将被浪费,因为它们的创建者并未讲清楚能否再次发布这些数据。

布里斯托大学知识产权专家Andrew Charlesworth认为,这可能是因为极少有研究人员对法律抱有足够的信心,从而给予Himmelstein明确的指导。

来自华盛顿Policy Bandwidth律师事务所的知识产权律师Jonathan Band表示,即便没有明确的许可,Himmelstein也不可能因发布Hetionet而面临法律的处罚,除非他搞错并违反了为数据集设置的细则和条 款。在网上公开发布其数据集的学者通常想让他们的成果被其他人获取到并且自由地再次发布。Band介绍说,目前还没有人因开展像Himmelstein这 样的项目而惹上麻烦。

不过,Himmelstein并不相信自己在法律上不受阻碍。同时,他感觉此类不确定性可能会阻止其他科学家再现学术数据。Himmelstein表示, 如果有研究人员推出了基于公开数据集研发的商业产品,因未获得明确许可而产生的风险便有可能增加。“我认为,这是一片未经充分测试的‘水域’。大多数学者 不愿冒险引起将有助于澄清这些问题的法律纷争。”


相关文章

台湖将成北京数据基础制度先行区核心

12月5日,记者在本市召开的“两区”建设新闻发布会上了解到,前不久,国务院批复同意《支持北京深化国家服务业扩大开放综合示范区建设工作方案》(以下简称示范区2.0方案),示范区2.0方案围绕推进服务业重......

“生命健康数据空间联合实验室”正式揭牌成立

近日在上海举行的2023全球数商大会健康数据高峰论坛上,“生命健康数据空间联合实验室”正式揭牌成立。据悉,该实验室由复旦大学、上海市生物医药技术研究院和中国信通院上海工创中心牵头,复旦大学附属中山医院......

卫健委发布《卫生健康信息数据元目录 第1部分:总则》等34项卫生行业标准

近日,卫健委发布《卫生健康信息数据元目录第1部分:总则》等34项推荐性卫生行业标准,,涉及总则、标识、实验室检查、医学诊断等项目,详情如下:标准编号标准名称代替标准编号WS/T363.1—2023卫生......

故意的还是不小心?诺奖得主被曝14篇论文数据异常

ThomasC.Südhof于2013年与JamesRothman和RandySchekman共同获得诺贝尔生理学或医学奖,以表彰他们发现了调节细胞内主要运输系统——囊泡运输的机制的突出贡献。在202......

美国NIH坚持要求外国合作者共享原始数据

近期,美国国立卫生研究院(NIH)坚持要求实施此前提出的一项新政策,即其资助的外国合作伙伴定期分享实验室记录以及其他原始数据。对此,数百名研究人员以及相关组织表示抗议,他们警告说,该举措可能会阻碍国际......

深圳先进院等建立单细胞轨迹推断技术

7月31日,中国科学院深圳先进技术研究院合成生物学研究所胡政课题组与厦门大学数学科学学院周达课题组合作,在《自然-生物技术》(NatureBiotechnology)上,发表了题为PhyloVeloe......

多方面“全面开花”中国经济回升向好势不可挡

央视网消息:通过数据看经济,今天的《新闻联播》关注了哪些领域?央视网为您梳理。数据一:增长13.3%。财政部7月19日上午召开新闻发布会,发布上半年财政收支情况。今年上半年,全国一般公共预算收入119......

上半年中国经济表现如何?有哪些新变化和新特点?

2023年时间已经过半,近期各部门陆续公布上半年的经济数据,上半年中国经济表现如何?有哪些新变化和新特点?记者采访了多位高端智库的权威专家和研究机构的首席经济学家,来听听他们对于上半年经济形势的分析和......

中国新能源汽车大数据产业大会召开

3月19日,“中国新能源汽车大数据2023年产业大会”在沈阳市举办。大会由沈阳市人民政府和新能源汽车国家大数据联盟(以下简称“联盟”)共同主办。辽宁省副省长姜有为、工信部装备工业一司副司长郭守刚等共同......

中国首次获得遥感数据融合大赛举办权

近日,中国科学院空天信息创新研究院牵头,联合中科星图股份有限公司、中科星图数字地球合肥有限公司与德国慕尼黑联邦国防军大学共同申请,成功获得遥感数据融合大赛(DataFusionContest,DFC)......