发布时间:2024-05-23 09:48 原文链接: AI心理推断能力或与人类相当,但不意味它们有情商

新一期《自然·人类行为》发表论文显示,在测试追踪他人心理状态能力——也称心智理论(Theory of Mind)的任务中,两类大语言模型(LLM)在特定情况下的表现与人类相似,甚至更好。


研究团队对热门LLM展开测试。图片来源:《自然·人类行为》

心智理论对人类社交互动十分重要,是人类沟通交流和产生共鸣的关键。之前的研究表明,LLM这类人工智能(AI)可以解决复杂的认知任务,如多选决策。不过,人们一直不清楚LLM在心智理论任务(被认为是人类独有的能力)中的表现是否也能比肩人类。

此次,德国汉堡—埃彭多夫大学医学中心团队选择了能测试心智理论不同方面的任务,包括发现错误想法、理解间接言语以及识别失礼。他们随后比较了1907人与两个热门LLM家族——GPT和LLaMA2模型完成任务的能力。

团队发现,GPT模型在识别间接要求、错误想法和误导方面的表现能达到甚至超越人类平均水平,而LLaMA2的表现逊于人类水平;在识别失礼方面,LLaMA2强于人类但GPT表现不佳。研究人员指出,LLaMA2的成功是因为回答的偏见程度较低,而不是因为真的对失礼敏感;GPT看起来的失利,其实是因为对坚持结论的超保守态度,而不是因为推理错误。

研究团队认为,LLM在心智理论任务上的表现堪比人类,不等于它们具有人类般的“情商”,也不意味着它们能掌握心智理论。但他们也指出,这些结果是未来研究的重要基础,并建议进一步研究LLM在心理推断上的表现,以及这些表现会如何影响人类在人机交互中的认知。

(原标题:AI心理推断能力或与人类相当,但不意味着它们有像人那样的情商)


相关文章

多项AI+未来农业大模型成果发布

12月12日,南京农业大学与江苏省南京市江北新区研创园联合举办农业科学AI成果发布会暨人工智能OPC基地揭牌仪式。来自高校、政府、企业、投资机构的近百位代表共同见证5项引领AI+未来农业的成果集中发布......

多项AI+未来农业大模型成果发布

12月12日,南京农业大学与江苏省南京市江北新区研创园联合举办农业科学AI成果发布会暨人工智能OPC基地揭牌仪式。来自高校、政府、企业、投资机构的近百位代表共同见证5项引领AI+未来农业的成果集中发布......

人工智能开放联盟成立

12月16日,由17家高水平大学、8家科技领军企业和科研机构共同发起的人工智能开放联盟(以下简称联盟),在广州举行的2025高校科技成果交易会上宣告成立。联盟理事长、清华大学校长李路明代表联盟理事会向......

“AI已深度融入了生物资源研发和产品创新”

“无论是研发端还是产品端,我们都在深度融合AI。”在2025年腾冲科学家论坛期间,围绕“深化科技成果转化国际合作,助力高新技术产业创新发展”的议题,贝泰妮集团资深研发总监、云南特色植物提取实验室创新原......

“AI已深度融入了生物资源研发和产品创新”

“无论是研发端还是产品端,我们都在深度融合AI。”在2025年腾冲科学家论坛期间,围绕“深化科技成果转化国际合作,助力高新技术产业创新发展”的议题,贝泰妮集团资深研发总监、云南特色植物提取实验室创新原......

姜标:“AI尝百草”,解锁蚊媒防控药物新密码

蚊子,不仅是夏日扰人的“嗡嗡声源”,更是威胁人类健康的“隐形杀手”。作为疟疾、登革热、寨卡病毒病、基孔肯雅热等多种传染病的核心传播媒介,它所带来的健康风险已成为全球性公共卫生挑战。姜标研究员(受访者供......

姜标:“AI尝百草”,解锁蚊媒防控药物新密码

蚊子,不仅是夏日扰人的“嗡嗡声源”,更是威胁人类健康的“隐形杀手”。作为疟疾、登革热、寨卡病毒病、基孔肯雅热等多种传染病的核心传播媒介,它所带来的健康风险已成为全球性公共卫生挑战。姜标研究员(受访者供......

印遇龙:AI赋能育种是生猪产业跨越发展重大机遇

“以AI技术赋能优质猪新品种设计与培育,是实现中国生猪种业体系跨越发展、迈向国际领先的重大机遇。”在12月6日至8日在广州举办的第九届世界创新大会上,中国工程院院士、中国科学院亚热带农业生态研究所研究......

印遇龙:AI赋能育种是生猪产业跨越发展重大机遇

“以AI技术赋能优质猪新品种设计与培育,是实现中国生猪种业体系跨越发展、迈向国际领先的重大机遇。”在12月6日至8日在广州举办的第九届世界创新大会上,中国工程院院士、中国科学院亚热带农业生态研究所研究......

钟南山:大力发展医学AI不是选择题,而是必答题

12月7日,首届大湾区医学AI大会暨2025金域医学大数据与AI生态大会在广州召开。中国工程院院士、广州实验室主任钟南山在大会上指出,大力发展医学人工智能(AI),绝对不是选择题,而是必答题,不跟上就......