发布时间:2024-08-08 14:22 原文链接: “帮手”还是“帮凶”?生成式AI学术使用须关注

生成式人工智能(AI)工具快速普及,在学术写作领域呈现爆炸式应用势头。使用基于大语言模型(LLM)的生成式AI工具能节省时间,减少语言障碍,让论文更加明白通畅。但这些工具的应用也让剽窃问题变得更复杂。

英国《自然》网站在近日的报道中指出,对利用AI写作是否构成剽窃,以及在什么情况下允许利用AI进行写作,科研界应充分探讨并制定更明确的学术写作AI使用指南。

AI学术写作应用增多

德国蒂宾根大学数据科学家德米特里·科巴克领导的团队,分析了学术数据库PubMed中2010年至2024年6月期间发表的1400万篇论文摘要。他们估计,2024年上半年,至少有10%的生物医学论文摘要(约7.5万篇)使用了LLM进行写作,以LLM为基础的写作“助理”的出现,对学术界产生了前所未有的影响。

同时,有些人认为,AI工具是学术写作的“好帮手”。它们可使文本和概念更清晰,减少语言障碍,使科学家能腾出更多时间进行实验和思考。

剽窃行为很难揪出

2015年的一项研究估计,1.7%的科学家承认有剽窃行为,30%的科学家认识有剽窃行为的同事。

LLM经过训练,可通过“消化”大量以前发表的文章来生成文本。因此,使用它们可能会导致类似剽窃的情况。例如,研究人员将AI生成的论文冒充自己撰写的论文;或者机器生成的论文与某人的论文非常接近,但没有注明来源等等。英国普利茅斯大学生态学家皮特·科顿指出,在AI时代,定义学术不诚信或剽窃,以及合理使用AI的边界,将变得非常困难。

如果LLM稍微修改一下措辞,那么其剽窃人类撰写文本内容的情况很容易被掩盖。因为人们可给出提示,让这些AI工具以复杂的方式(如以某个学术期刊的风格)撰写论文。在2023年对1600名研究人员开展的一项调查中,68%的受访者表示,AI将使剽窃更难被发现。

另外一个核心问题是,使用完全由机器而非人类编写的未署名内容是否算剽窃。德国柏林应用科学大学专家黛博拉·韦伯·沃尔夫表示,尽管有的生成式AI生成的文本看起来与人类书写的内容相差无几,但不能被视为剽窃。

使用界限急需制定

美国马里兰大学可靠人工智能实验室主任索海尔·菲兹副教授认为,使用LLM改写现有论文的内容显然构成抄袭。但使用LLM来帮助表达想法,无论是根据详细的提示生成文本,还是编辑草稿,如果透明地完成,都不应该受到惩罚。科学界应该允许研究人员利用LLM,来轻松、清晰地表达他们的想法。

许多期刊现在都制定了相关政策,允许投稿者在一定程度上使用LLM。《科学》杂志于2023年11月更新了其政策,称作者应该全部披露其在撰写论文过程中的AI技术使用情况,包括使用了哪些AI系统,提示词有哪些等。《自然》杂志也表示,作者应该记录LLM的使用情况。

一项对100家大型学术出版商和100家排名靠前的期刊开展的分析发现,截至2023年10月,24%的出版商和87%的期刊都制定了使用生成式AI的指导方针。几乎所有这些期刊都声明,AI工具不能被列为作者。

沃尔夫强调,科学家迫切需要更明确的学术写作AI使用指南。

检测工具亟待提升

在一部分科学家利用LLM撰写学术论文的同时,也有另一部分科学家正在开发旨在检测LLM使用情况的工具。尽管一些工具的准确率较高,在某些情况下超过90%,但研究表明,大多数工具“名不副实”。在去年12月发表的一项研究中,沃尔夫及其同事评估了学术界广泛使用的14种AI检测工具。结果显示,只有5款工具的准确率高于70%,没有一款工具的得分超过80%。

当研究团队通过替换同义词及重排句子顺序,对AI生成的文本进行微调后,检测工具的准确率下降到平均不足50%。如果研究人员让AI多次改写由人类撰写的文本,检测工具的准确率也会大大降低。

AI检测工具还面临其他问题,比如非英语母语者用英语写作,更有可能被误认为由AI生成。菲兹指出,AI检测工具无法可靠地区分完全由AI编写的文本和作者使用AI润色文本的情况。被错误地指控滥用AI,可能会对这些学者或学生的声誉造成相当大的损害。


相关文章

第六届糖复合物研究前沿网络学术大会顺利举行——探索生命奥秘新途径

为促进我国糖复合物领域的合作交流,加快国内糖科学的发展,由中国生物化学与分子生物学会糖复合物专业分会主办、复旦大学/糖复合物卫健委重点实验室承办、分析测试百科网协办的第六届糖复合物研究前沿网络学术大会......

江苏省化学化工学会色谱与分离科学专业委员会成立大会暨首届学术研讨会在南京大学成功召开

2024年12月8日,江苏省化学化工学会色谱与分离科学专业委员会成立大会暨首届学术研讨会在南京大学国际会议中心隆重举行。此次会议汇聚了众多高校、企业及科研院所的专家学者和行业精英,共同见证专委会成立,......

《中国国际学术会议发展蓝皮书2024》发布

12月7日,在广州举行的第六届国际科技创新学术交流大会(IAECST2024)上,《中国国际学术会议发展蓝皮书2024》(以下简称《蓝皮书》)正式发布。《蓝皮书》显示,2023年中国国际学术会议数量占......

学术谱系如何跳出“近亲繁殖”怪圈

“好风凭借力,送我上青云。”孙悟空拜菩提祖师为师,成为“齐天大圣”。苏秦、张仪、孙膑、庞涓师从鬼谷子,在战国乱世纵横捭阖名扬天下。获得自然科学桂冠的诺贝尔奖得主之间,“学术谱系”传承之力也不可小觑。今......

多所高校提出使用AI的多个“禁止”,学术论文使用AI边界在哪儿?

随着人工智能技术一路突进,现在人们对于AI工具的应用也越来越多元,尤其是在文稿撰写方面。不少人在网上用AI写文案、写评价,也有高校学生把AI用在了学术论文的撰写过程中。的确,相比线下翻书籍或者线上找资......

学术界算力不足,限制人工智能创新

一项针对全球数十家机构学者的调查显示,许多大学的科研人员对可供他们用于人工智能研究的算力资源有限感到沮丧。据《自然》报道,科研人员接触不到最先进的计算系统,可能会阻碍他们开发大型语言模型和进行其他人工......

普通人读博:一场对学术的大型祛魅

文|《中国科学报》记者徐可莹实习生苏晓“勉强毕业拿到博士学位”“发表过两到三篇一般水平的论文”“毕业年龄超过32岁”“没有勇气再出国做博后”“很不容易找到一份编制内工作”“不咸不淡过完一生”……出身普......

基金委试点开展“委校协同”汇聚资助学术论文数据

国家自然科学基金委员会关于试点开展“委-校协同”汇聚资助学术论文数据的通知国科金发传〔2024〕172号各依托单位:国家自然科学基金委员会(以下简称自然科学基金委)组织建设的科学基金开放获取仓储平台(......

研究发现,团队壮大会影响成员的学术职业前景

处于职业生涯早期的学者,在寻找终身职位和资金方面的压力越来越大。一项研究指出,研究团队不断发展壮大,1970年平均每篇论文1.8位作者,2004年达到3.6位,翻了一番。根据近日发表于《自然-生物技术......

“帮手”还是“帮凶”?生成式AI学术使用须关注

生成式人工智能(AI)工具快速普及,在学术写作领域呈现爆炸式应用势头。使用基于大语言模型(LLM)的生成式AI工具能节省时间,减少语言障碍,让论文更加明白通畅。但这些工具的应用也让剽窃问题变得更复杂。......