
META的CICERO在外交游戏中预谋欺骗的例子。图片来源:PARK GOLDSTEIN 等/《模式》杂志
许多人工智能(AI)系统已学会了欺骗人类,即使是经过训练的、“表现”出有用且诚实的系统。10日发表在《模式》杂志上的一篇文章中,研究人员描述了欺骗性AI的风险,并呼吁政府制定强有力的法规尽快解决这个问题。
论文第一作者、美国麻省理工学院人工智能安全研究员彼得·朴说,开发人员对导致AI出现欺骗这种不良行为的原因,还没有很好的理解。但总的来说,AI欺骗之所以出现,是因为基于欺骗的策略,是在给定的AI训练任务中一种能得到良好反馈的方式,换句话说,欺骗可帮助AI实现目标。
研究人员分析了文献,重点关注AI系统传播虚假信息的方式。通过欺骗,AI系统地学习了如何去操纵他人。
研究人员在分析中发现的最引人注目的例子是Meta公司的CICERO。这是一个专注《外交》游戏的AI系统,《外交》是一款涉及建立联盟征服世界的游戏。Meta声称训练 CICERO “在很大程度上是诚实和乐于助人的 ”,且在玩游戏时“从不故意背刺 ”人类盟友。但该公司与《科学》论文一起发布的数据显示,CICERO并不那么“忠厚”。
研究人员发现这款AI或已成为欺骗大师。虽然Meta成功地训练该AI在《外交》游戏中获胜,但Meta未能训练它诚实地获胜。
AI系统在游戏中作弊看似无害,但它将导致欺骗性AI在能力上出现突破,未来可能会演变成更高级的AI欺骗形式。一些AI系统甚至学会了欺骗旨在评估其安全性的测试。在一项研究中,数字模拟器中的AI生物会“装死”,以骗过旨在消除快速复制AI系统的重要测试。
海军军医大学第二附属医院(上海长征医院)泌尿外科教授任善成团队联合国内多家单位,构建了一种基于人工智能(AI)的前列腺癌影像—病理基础模型,可从磁共振影像中无创预测肿瘤侵袭性,且诊断性能显著优于现有临......
海军军医大学第二附属医院(上海长征医院)泌尿外科教授任善成团队联合国内多家单位,构建了一种基于人工智能(AI)的前列腺癌影像—病理基础模型,可从磁共振影像中无创预测肿瘤侵袭性,且诊断性能显著优于现有临......
8月26日国发〔2025〕11号颁布了《国务院关于深入实施“人工智能+”行动的意见》这一重要文件,其中特别强调“人机协同、跨界融合、共创分享的智能经济和智能社会新形态”,其核心就是要积极构建“人、机(......
8月26日国发〔2025〕11号颁布了《国务院关于深入实施“人工智能+”行动的意见》这一重要文件,其中特别强调“人机协同、跨界融合、共创分享的智能经济和智能社会新形态”,其核心就是要积极构建“人、机(......
一项研究报告称,一名局部瘫痪男子借助一款部分由人工智能(AI)控制的非侵入性脑部设备,成功实现了对机械臂的操控。此外,在执行屏幕端任务时,该AI辅助设备的表现比患者单独使用设备好4倍。脑机接口能够捕捉......
一项研究报告称,一名局部瘫痪男子借助一款部分由人工智能(AI)控制的非侵入性脑部设备,成功实现了对机械臂的操控。此外,在执行屏幕端任务时,该AI辅助设备的表现比患者单独使用设备好4倍。脑机接口能够捕捉......
近日,中国科学院海洋研究所研究员王凡团队联合南京信息工程大学教授张荣华、崂山实验室研究员蔡文炬等,在《自然·通讯》发表研究论文。该研究借助观测数据约束的深度学习方法,大幅降低了对全球关键气候现象厄尔尼......
近日,中国科学院海洋研究所研究员王凡团队联合南京信息工程大学教授张荣华、崂山实验室研究员蔡文炬等,在《自然·通讯》发表研究论文。该研究借助观测数据约束的深度学习方法,大幅降低了对全球关键气候现象厄尔尼......
美国科学家研究发现,一个由人工智能(AI)担任副驾的脑机接口或能让瘫痪人士更好地完成任务。该技术能让瘫痪受试者在移动计算机光标或操作机械臂这类任务中的表现提升为原先的近4倍。相关研究9月1日发表于《自......
美国科学家研究发现,一个由人工智能(AI)担任副驾的脑机接口或能让瘫痪人士更好地完成任务。该技术能让瘫痪受试者在移动计算机光标或操作机械臂这类任务中的表现提升为原先的近4倍。相关研究9月1日发表于《自......