发布时间:2024-03-12 13:31 原文链接: 超200万篇论文从网上消失,原因主要是这两个

  近日,《自然》发表一篇题为《超过200万篇研究论文从互联网上消失》的文章。来自英国伦敦大学伯克贝克学院的研究人员Martin Eve通过研究超过700万篇数字出版物,发现超过200万篇学术文章没有得到妥善的存档和保存。

  这意味着,你辛辛苦苦发表的论文,某天很可能也会凭空消失!

  论文的消失,是什么在“作祟”?

  目前,数字对象标识符(DOI)用于标识和链接特定出版物。这串由数字、字母和符号组成的标识符,就像论文的“身份证号”,具有唯一性,通过它可以方便、可靠地链接到论文全文,保证了在网络环境下对数字化对象的准确提取。

  然而,芬兰赫尔辛基汉肯商学院的Mikael Laakso表示:“许多人盲目认为,只要有DOI,论文就永久存在,但事实并非如此。”他与同事在2021年的报告中指出,从2000年至2019年间,有170多份开放获取期刊从互联网上消失。

  为什么手持“身份证号”,论文也会消失不见呢?其原因多种多样,包括DOI或URL更改失效、数字存档网络服务器故障、期刊或出版商倒闭等。

  这一“奇怪”现象的背后,是两个主要原因在“作祟”:一方面,随着学术产出迅速增长,现有的数字存档系统无法满足所有研究成果的保存需求;另一方面,小型出版商在保存文章方面的风险高于大型出版商。

  纽约市数字档案服务公司Portico的执行董事Kate Wittenberg表示:“保存内容需要花费金钱,小型出版商往往没有足够的资金和技术支持来保留所有的学术成果。”

  那么,作为最大的DOI注册机构,Crossref的表现如何呢?

  Crossref为约2万名会员分配标识符,包括出版商、博物馆和其他机构。Eve参与了Crossref的研发工作,他检查了700万件带有DOI的作品是否保存在档案中。结果显示,尽管有活跃的DOI,但其中28%的作品(超过200万篇文章)并未出现在主要的数字档案中。只有58%的DOI引用至少存储在一个档案里。另外14%的文章因发表时间较晚、非期刊文章或来源不可识别等原因被排除在研究之外。

  Eve也指出了研究的局限性。本研究仅关注带有DOI的文章,并没有在每个数字存储库中搜寻文章。

  DOI,对我们意味着什么?

  有人认为,DOI搜索不到论文,对学术研究影响不大,无须大惊小怪。是这样吗?

  对此,我们要厘清的是,整个科学和研究的认知理论都依赖于脚注链。脚注链上的每篇文献都是知识产生和理论创新的重要组成部分,而引文关系断裂,意味着知识体系的断裂。

  论文作为学术成果的载体,DOI失效意味着相关研究的传播和应用受到阻碍,也无法核实前人的研究信息。最终导致“只能对那些无法亲自阅读的文献产生盲目的信仰”,这显然是不符合科学研究原则的。当研究者无法获取某些关键信息,必然会影响他们的研究进展和学术成果质量。

  读到这里,有人不禁会好奇,类似问题也存在于国内吗?答案是肯定的。

  一位知乎用户发文称:“我有一篇文章被录用了且获得了该论文的DOI,但我通过DOI检索的时候却显示无该文章。”这种困惑不仅存在于论文撰写者,论文引用者同样也会遭遇。有微博网友吐槽:“原来真的有知道题目、知道作者、知道期刊、知道DOI号.......都找不到的论文啊!真是跪了。”

  “警钟”拉响,不容忽视

  Eve的研究正如一声“警钟”,提醒我们切勿忽视数字保存领域所面临的挑战。

  当前中国的DOI注册和应用尚处于初级阶段,但已取得了一定的进步。从2006年起,中国知网开始为大部分的中文学术期刊分配DOI,与国际通用的DOI系统充分整合;到2012年,国家标准委员会发布《数字资源标识符》,正式确立DOI作为我国数字资源表示方法的国家标准。

  可以说,我国学术界和出版界一直积极推广和应用DOI,使得中国的学术成果能够在全球范围内被识别、访问和引用,提升国内论文的国际影响力。尽管如此,我国仍面临着数字保存和长期访问的挑战,毕竟论文DOI无法找到的问题,不仅仅是一个技术性错误。

  正如Eve所言:“虽然大家普遍关注论文发表后能带来的即时收益,但我们同样应关心学术生态系统整体的可持续性问题。试想在你离世100年后,人们是否能读到你辛辛苦苦发表的论文?”

  参考文献:

  https://www.nature.com/articles/d41586-024-00616-5

  http://www.garfield.library.upenn.edu/cifwd.html

  贺燕.走中国DOI发展之路[J].图书馆理论与实践, 2009(7):5.


相关文章

顶尖研究所所长遭Science撤稿,牵出学术造假“窝案”

近日,一场涉及神经科学和癌症研究领域的造假风波席卷学术界。此次风波核心是美国科学院院士LaurieGlimcher。4月19日,Science杂志撤回了一篇2006年4月28日发表的论文,Laurie......

《科学》(20240405出版)一周论文导读

Science,Volume384,Issue6691,5Apr2024《科学》第384卷,6691期,2024年4月5日化学物理Chemical-PhysicsSinglebody-coupledf......

人工智能倒逼出版界“立规矩”

2022年11月,OpenAI发布生成式人工智能(AI)工具ChatGPT。鉴于生成式AI可快速创建文本、图像等内容,两个月后,ChatGPT已作为作者,赫然出现在一些学术论文上。英国纽卡斯尔大学数字......

超200万篇论文从网上消失,原因主要是这两个

近日,《自然》发表一篇题为《超过200万篇研究论文从互联网上消失》的文章。来自英国伦敦大学伯克贝克学院的研究人员MartinEve通过研究超过700万篇数字出版物,发现超过200万篇学术文章没有得到妥......

超200万篇论文从网上消失,原因主要是这两个

近日,《自然》发表一篇题为《超过200万篇研究论文从互联网上消失》的文章。来自英国伦敦大学伯克贝克学院的研究人员MartinEve通过研究超过700万篇数字出版物,发现超过200万篇学术文章没有得到妥......

超200万篇论文从网上消失,原因主要是这两个

近日,《自然》发表一篇题为《超过200万篇研究论文从互联网上消失》的文章。来自英国伦敦大学伯克贝克学院的研究人员MartinEve通过研究超过700万篇数字出版物,发现超过200万篇学术文章没有得到妥......

《数据与情报科学学报(英文)》:致力加深社会对科研生态的理解

正如联合国教科文组织所说,科学是人类最伟大的集体事业。公众、科学家和政府都是科学事业的直接或间接参与者。他们对科学的理解和认知共同影响着科学能否有效地回应社会现实。例如,在流行病期间,保持社交距离等社......

学术风暴席卷!中国高校大规模自查,揭露撤稿和研究不端行为

最新消息:教育部科学技术与信息化司发布通知,要求全国高校进行最近几年的撤稿论文自查,要在2月15日前上报检查结果。尽管这一通知并非最新的消息,实际上,科技部办公厅在2023年4月27日已经发布了《关于......

这一高校院士最新Nature及多篇论文遭质疑

2023年12月13日,中山大学宋尔卫、苏士成(导师宋尔卫)共同通讯在Nature在线发表题为“TumourcircularRNAselicitanti-tumourimmunitybyencodin......

双一流教授连续造假20篇文章,事后竟理直气壮怪“电脑中毒”

2023年,河南大学一教授的19篇文章在Pubpeer网站上被质疑存在图片重复使用等学术不端行为。近日,论文的作者在Pubpeer上对一篇被质疑的论文进行了回应,表示已经向期刊方面提交了勘误。截至目前......