图片来源:《自然》网站
生成式人工智能(AI)工具快速普及,在学术写作领域呈现爆炸式应用势头。使用基于大语言模型(LLM)的生成式AI工具能节省时间,减少语言障碍,让论文更加明白通畅。但这些工具的应用也让剽窃问题变得更复杂。
英国《自然》网站在近日的报道中指出,对利用AI写作是否构成剽窃,以及在什么情况下允许利用AI进行写作,科研界应充分探讨并制定更明确的学术写作AI使用指南。
AI学术写作应用增多
德国蒂宾根大学数据科学家德米特里·科巴克领导的团队,分析了学术数据库PubMed中2010年至2024年6月期间发表的1400万篇论文摘要。他们估计,2024年上半年,至少有10%的生物医学论文摘要(约7.5万篇)使用了LLM进行写作,以LLM为基础的写作“助理”的出现,对学术界产生了前所未有的影响。
同时,有些人认为,AI工具是学术写作的“好帮手”。它们可使文本和概念更清晰,减少语言障碍,使科学家能腾出更多时间进行实验和思考。
剽窃行为很难揪出
2015年的一项研究估计,1.7%的科学家承认有剽窃行为,30%的科学家认识有剽窃行为的同事。
LLM经过训练,可通过“消化”大量以前发表的文章来生成文本。因此,使用它们可能会导致类似剽窃的情况。例如,研究人员将AI生成的论文冒充自己撰写的论文;或者机器生成的论文与某人的论文非常接近,但没有注明来源等等。英国普利茅斯大学生态学家皮特·科顿指出,在AI时代,定义学术不诚信或剽窃,以及合理使用AI的边界,将变得非常困难。
如果LLM稍微修改一下措辞,那么其剽窃人类撰写文本内容的情况很容易被掩盖。因为人们可给出提示,让这些AI工具以复杂的方式(如以某个学术期刊的风格)撰写论文。在2023年对1600名研究人员开展的一项调查中,68%的受访者表示,AI将使剽窃更难被发现。
另外一个核心问题是,使用完全由机器而非人类编写的未署名内容是否算剽窃。德国柏林应用科学大学专家黛博拉·韦伯·沃尔夫表示,尽管有的生成式AI生成的文本看起来与人类书写的内容相差无几,但不能被视为剽窃。
使用界限急需制定
美国马里兰大学可靠人工智能实验室主任索海尔·菲兹副教授认为,使用LLM改写现有论文的内容显然构成抄袭。但使用LLM来帮助表达想法,无论是根据详细的提示生成文本,还是编辑草稿,如果透明地完成,都不应该受到惩罚。科学界应该允许研究人员利用LLM,来轻松、清晰地表达他们的想法。
许多期刊现在都制定了相关政策,允许投稿者在一定程度上使用LLM。《科学》杂志于2023年11月更新了其政策,称作者应该全部披露其在撰写论文过程中的AI技术使用情况,包括使用了哪些AI系统,提示词有哪些等。《自然》杂志也表示,作者应该记录LLM的使用情况。
一项对100家大型学术出版商和100家排名靠前的期刊开展的分析发现,截至2023年10月,24%的出版商和87%的期刊都制定了使用生成式AI的指导方针。几乎所有这些期刊都声明,AI工具不能被列为作者。
沃尔夫强调,科学家迫切需要更明确的学术写作AI使用指南。
检测工具亟待提升
在一部分科学家利用LLM撰写学术论文的同时,也有另一部分科学家正在开发旨在检测LLM使用情况的工具。尽管一些工具的准确率较高,在某些情况下超过90%,但研究表明,大多数工具“名不副实”。在去年12月发表的一项研究中,沃尔夫及其同事评估了学术界广泛使用的14种AI检测工具。结果显示,只有5款工具的准确率高于70%,没有一款工具的得分超过80%。
当研究团队通过替换同义词及重排句子顺序,对AI生成的文本进行微调后,检测工具的准确率下降到平均不足50%。如果研究人员让AI多次改写由人类撰写的文本,检测工具的准确率也会大大降低。
AI检测工具还面临其他问题,比如非英语母语者用英语写作,更有可能被误认为由AI生成。菲兹指出,AI检测工具无法可靠地区分完全由AI编写的文本和作者使用AI润色文本的情况。被错误地指控滥用AI,可能会对这些学者或学生的声誉造成相当大的损害。
图片来源:《自然》网站生成式人工智能(AI)工具快速普及,在学术写作领域呈现爆炸式应用势头。使用基于大语言模型(LLM)的生成式AI工具能节省时间,减少语言障碍,让论文更加明白通畅。但这些工具的应用也......
近日,我院教师王某在香港城市大学的博士学位论文因涉嫌侵权引发诉讼纠纷受到舆论关注。对此,学院高度重视,已经启动事件调查,暂停王某的教学工作。后续将根据相关事实,依法依规作出处理。感谢各界的关心和关注。......
因为接连爆出抄袭事件,计算机视觉领域的顶会——CVPR22(2022年国际计算机视觉与模式识别会议)近日出圈了。6月24日,有爆料者扮演作者,在社交平台发布了一段搞怪视频,“自曝”其论文抄袭十多篇文章......
保罗·萨巴蒂耶大学BertrandFougère由于老辣的剽窃手段,将众多他人发表的文章,重新进行拼接组装,而生成自己的研究成果(在文章里面,不引用这些别人的文章),而被撤稿5篇文章。2020年9月1......
1先说几句题外话吧。你可能还记得,2019年12月份,中国学术界出过一个大新闻——中国著名的生物学家、中国工程院院士曹雪涛,被指控学术论文造假。短时间内,他实验室发表的数十篇论文被人指出,可能存在图片......
3月27日,微博用户@科研狗的基金梦发微博称湖南大学硕士毕业生刘梦洁学位论文涉嫌抄袭自己2017年国家自然科学基金项目申请书,使得自己2019年完成的博士论文的送审和查重受到影响,希望湖南大学给出具体......
经过几个月的详细论证,德国杜塞尔多夫大学2月5日晚宣布,鉴于教育部长沙万32年前的博士论文中有大段抄袭段落,该大学哲学系决定取消其博士头衔。1980年,现任联邦教育部长的沙万撰写了名为“人格与良知”的......
安妮·沙范据《科学》网站消息,德国联邦教育和科研部部长安妮特·沙范()近日被指控其博士论文涉嫌部分剽窃。针对沙范发表于1980年的博士论文,一个匿名者在schavanplag网站称该论文有......
据美国化学学会(ACS)网站报道,因涉嫌“自我剽窃”,ACS旗下权威期刊《美国化学会志》(JACS)近日撤销了ACS前会长罗纳德·布雷斯洛()的一篇学术。这篇发表在今年3月25日JACS网络版上的论文......
4月20日出版的《科学》杂志对中国1000多家科技期刊近日联合签名,支持加强科学道德规范的行动进行了报道。报道说,在这场维护科学道德的“保卫战”中,中国科协所属全国学会主办的1000多种科技期刊负责人......