发布时间:2024-06-28 18:22 原文链接: 用AI识别AI:西湖大学研究可检测AI生成文本

虚假新闻、恶意产品评论、剽窃……ChatGPT、 GPT-4等AI大语言模型的应用带来便利,但其误用也带来一系列问题。西湖大学工学院张岳教授的“文本智能实验室”日前发布的一项研究提出一种高准确率、高速、低成本、通用的新文本检测方法——Fast-DetectGPT,无需训练即可识别各种AI大语言模型生成的文本内容。


Fast-DetectGPT演示网页

据了解,该研究的论文5月发表在2024年国际表征学习大会上。第一作者、西湖大学文本智能实验室博士鲍光胜6月28日告诉澎湃新闻(www.thepaper.cn),Fast-DetectGPT针对GPT3.5生成的文本识别率可达96%,对GPT4生成的文章的识别率达90%。与斯坦福大学2023年提出的DetectGPT检测方法相比,Fast-DetectGPT 的检测速度提高340倍,检测准确率相对提升75%,在对目前被广泛使用的ChatGPT 和GPT-4 生成文本的检测上,准确率均超过商用系统 GPTZero。

“我的研究方向是自然语言处理,注意到AI大语言模型的应用在多个领域提升了生产力,但其误用也带来了诸如虚假新闻、恶意产品评论、学术不端等问题,去年启动了这项研究,历时约半年完成。” 鲍光胜介绍,AI生成的文本内容流畅连贯,往往难以辨别,这项研究则引入了能区分机器生成文本和人类撰写文本特征差异的统计量——条件概率曲率。

“Fast-DetectGPT的操作基于一个前提:人类和机器在文本生成过程中倾向于选择不同的词汇,人类的选择比较多样,机器则更倾向于选择有更高模型概率的词汇,因为在大规模语料库上预训练的AI模型反映的是人类的集体写作行为,而非个体行为。” 鲍光胜解释,“具体而言,两种文本在词汇使用、句子结构、语法复杂度、语义连贯性等方面有所相同,我们提取覆盖这些区别特征的统计量,分析它们在两种不同文本的分布,当某个文本的统计特征值主要落在机器生成文本的分布中,模型就会判断为AI大语言模型生成的。”

鲍光胜同时表示,Fast-DetectGPT不能完全准确地识别文本是否由机器生成,只是提供概率,在Fast-DetectGPT演示网页的对话框输入一段文本,结果会显示“文本有2%的概率是机器生成”。“当被测文本混合了机器生成文本和人工撰写文本,检测会更难。” 他说,“构建一个更好的内容环境还需要各方的努力。”

 


相关文章

AI融合赋能四大主题深耕,第三届天津生物及临床质谱论坛圆满召开!

2025年10月24日,由(国家级)天津经济技术开发区生物医药产教联合体,分析测试百科网(安特百科(北京)技术发展有限公司)联合主办的第三届天津生物及临床质谱论坛在天津圆满举办。此次论坛获得了多家单位......

AI融合赋能四大主题深耕,第三届天津生物及临床质谱论坛圆满召开!

2025年10月24日,由(国家级)天津经济技术开发区生物医药产教联合体,分析测试百科网(安特百科(北京)技术发展有限公司)联合主办的第三届天津生物及临床质谱论坛在天津圆满举办。此次论坛获得了多家单位......

AI融合赋能四大主题深耕,第三届天津生物及临床质谱论坛圆满召开!

2025年10月24日,由(国家级)天津经济技术开发区生物医药产教联合体,分析测试百科网(安特百科(北京)技术发展有限公司)联合主办的第三届天津生物及临床质谱论坛在天津圆满举办。此次论坛获得了多家单位......

AI融合赋能四大主题深耕,第三届天津生物及临床质谱论坛圆满召开!

2025年10月24日,由(国家级)天津经济技术开发区生物医药产教联合体,分析测试百科网(安特百科(北京)技术发展有限公司)联合主办的第三届天津生物及临床质谱论坛在天津圆满举办。此次论坛获得了多家单位......

AI聊天机器人“阿谀奉承”伤害了科学

近日,一项公布于预印本平台arXiv的研究发现,人工智能(AI)模型的谄媚程度比人类高50%。该研究测试了11个广泛使用的大型语言模型对1.15多万个咨询请求的响应情况,其中不乏涉及不当行为或有害行为......

AI聊天机器人“阿谀奉承”伤害了科学

近日,一项公布于预印本平台arXiv的研究发现,人工智能(AI)模型的谄媚程度比人类高50%。该研究测试了11个广泛使用的大型语言模型对1.15多万个咨询请求的响应情况,其中不乏涉及不当行为或有害行为......

AI“重编程”癌症干细胞促其自毁

美国加州大学圣迭戈分校研究团队开发了一种摧毁癌症干细胞的新方法,该方法在结肠癌的研究中取得了突破。他们利用人工智能精准识别治疗靶点,并通过“重编程”癌症干细胞促使其自我毁灭。这种方法仅针对癌细胞,不影......

2026年,AI向物理世界挺进

2025年已成为人工智能(AI)全面融入人类日常生活的一年。无论是工作、娱乐、学习还是科研,AI的影响力已无处不在。美国《福布斯》杂志近日报道预测,2026年,AI所带来的长远影响将日益清晰,并持续为......

多模态文本智能技术助力AI实现智能推理

随着人工智能(AI)深入各行各业,多模态大模型正在成为AI发展的重要方向之一。近日,第八届中国模式识别与计算机视觉学术会议(PRCV2025)在上海召开,“多模态文本智能大模型前沿技术与应用”论坛同期......

AI“重编程”癌症干细胞促其自毁

美国加州大学圣迭戈分校研究团队开发了一种摧毁癌症干细胞的新方法,该方法在结肠癌的研究中取得了突破。他们利用人工智能精准识别治疗靶点,并通过“重编程”癌症干细胞促使其自我毁灭。这种方法仅针对癌细胞,不影......