发布时间:2023-09-15 13:40 原文链接: AI在创造性思维任务中或超越大部分人类?

  《科学报告》9月14日发表的一项研究指出,大型语言模型(LLM)人工智能(AI)对话机器人在创造性思维任务上能够超越大部分人类,该任务要求受试者想出日常用品的替代用途,这是发散性思维的一个例子。不过,得分最高的人类受试者依然能超过对话机器人的最佳答案。

  发散性思维通常是指与创造性相关的一类思维过程,需要为特定任务想出各种不同创意或对策。发散性思维一般通过替代用途任务(AUT)进行评估,受试者被要求在短时间内想出某个日常用品的其他用途,越多越好。受试者的回答从4个类别进行打分:流利度、灵活性、原创性和精细度。

  在这项研究中,ChatGPT3、ChatGPT4和Copy.Ai完成了4个物品,即绳子、盒子、铅笔、蜡烛的AUT,芬兰图尔库大学Mika Koivisto和挪威卑尔根大学Simone Grassini随后将其与人类的答案进行了比较。

  研究人员通过语义距离,即回答与物品原始用途的相关度,和创造性给回答的原创性打分。他们用一个计算方法在0-2的范围里量化语义距离,同时让不知道作答者身份的人类打分者在1-5的范围里客观评价创造性。

  平均而言,对话机器人的回答在语义距离(0.95相对于0.91)和创造性(2.91相对于2.47)的得分上显著高于人类的回答。人类回答在这两项的得分差距更大——最低分远低于AI的回答,但最高分普遍比AI高。最佳人类回答在8个评分项中的7项都超过了所有对话机器人的最佳回答。

  这项研究结果表明,当前AI对话机器人想创意的能力至少已与一般人类相当。但作者也指出,他们只评价了涉及创造性评估的单项任务的表现。作者认为,今后的研究或能探索如何将AI融入创造性过程来提升人类表现。

相关文章

AI分析组织样本准确预测癌症结果

美国得克萨斯大学西南医学中心研究人员开发了一种新的人工智能(AI)模型,可分析组织样本中细胞的空间排列。12月11日发表在《自然·通讯》上的这一创新方法,准确地预测了癌症患者的结果,标志着在利用AI进......

AI分析组织样本准确预测癌症结果

美国得克萨斯大学西南医学中心研究人员开发了一种新的人工智能(AI)模型,可分析组织样本中细胞的空间排列。12月11日发表在《自然·通讯》上的这一创新方法,准确地预测了癌症患者的结果,标志着在利用AI进......

促进生成式AI赋能抗病毒新药研发,这两个机构达成合作

12月12日,全球健康药物研发中心(GHDDI)与微软研究院科学智能中心(Microsoft?Research?AI4Science)宣布,双方将共同研发全球健康传染病领域的生成式人工智能与基础大模型......

促进生成式AI赋能抗病毒新药研发,这两个机构达成合作

12月12日,全球健康药物研发中心(GHDDI)与微软研究院科学智能中心(Microsoft?Research?AI4Science)宣布,双方将共同研发全球健康传染病领域的生成式人工智能与基础大模型......

便携式AI系统可将大脑思想翻译成语言

据物理学家组织网11日报道,澳大利亚悉尼科技大学科学家开发出了首款便携式、非侵入性的人工智能系统,可解码无声的想法并将其转化为有形的文本。这项技术可帮助那些因疾病或受伤(包括中风或瘫痪)而无法说话的人......

便携式AI系统可将大脑思想翻译成语言

据物理学家组织网11日报道,澳大利亚悉尼科技大学科学家开发出了首款便携式、非侵入性的人工智能系统,可解码无声的想法并将其转化为有形的文本。这项技术可帮助那些因疾病或受伤(包括中风或瘫痪)而无法说话的人......

新刊NEJMAI上线,“AI在医疗领域的应用才刚起步”

经过1年多精心准备,NEJMAI第一期今晨正式上线(ai.nejm.org)。我们在此发表该刊主编IsaacKohane教授撰写的社论。Kohane教授和该刊常务主编CharlotteHaug博士曾多......

新刊NEJMAI上线,“AI在医疗领域的应用才刚起步”

经过1年多精心准备,NEJMAI第一期今晨正式上线(ai.nejm.org)。我们在此发表该刊主编IsaacKohane教授撰写的社论。Kohane教授和该刊常务主编CharlotteHaug博士曾多......

这只火眼金睛的的AI“小猴子”,由华科大团队研发

近日,华中科技大学软件学院教授白翔领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。图为团队将Monkey代码在全球最大......

这只火眼金睛的的AI“小猴子”,由华科大团队研发

近日,华中科技大学软件学院教授白翔领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。图为团队将Monkey代码在全球最大......