当地时间23日一场在线直播中,OpenAI团队揭开了首个AI智能体Operator的神秘面纱。这一创新成果打破了传统应用程序编程接口的限制,赋予了AI直接与图形用户界面交互的能力,就仿佛能像人类那样使用电脑,从而向实现通用人工智能迈进了一步。

团队演示Operator的视频画面。图片来源:OpenAI

演示中,Operator展现了其强大的能力。它不仅能够精确理解指令,还能自主完成复杂任务,如自动填写在线表单、进行网购、创建表情包以及处理重复性浏览器任务等。这一切都是通过一个被称为CUA的新模型实现的。该模型结合了GPT-4o的视觉功能和高级推理技术,并通过强化学习不断优化自己的性能。

值得注意的是,在多个测试环境中,CUA模型的表现令人印象深刻。例如,在OSWORLD上执行计算机使用任务的成功率达到了38.1%,比之前最佳结果提高了近16%;而在WebArena上的成功率更是高达58.1%,提升了22%。尽管这些成绩与人类相比还有一定差距(人类分别为72.4%和78.2%),但CUA在某些特定场景下展示了惊人的效率,比如在网页代理WebVoyager平台上,达到了87%的成功率。

为确保安全性和用户体验,当Operator执行任务时,会采取行动、抓取屏幕截图并创建子计划,形成一个“观察—计划—执行”的闭环。此外,用户可以随时接管控制权,并且在接管期间的所有操作都不会被记录下来,以此保护隐私。即使遇到买错东西或订错酒店的情况,Operator也会在继续行动之前请求人类确认。

面对可能存在的风险,如诈骗网站,OpenAI引入了一个提示注入监视器,类似于防病毒软件的功能,可以在发现可疑行为时立即停止操作。这标志着L3级别的智能体时代正式到来,而OpenAI也重申了其对2025年的展望——这一年将是智能体之年。

随着Operator的发布,未来几个月内,人们或有望见证更多智能体的出现。它们将进一步扩展动作空间,适应更加广泛的应用场景,开启下一轮人机交互革命。目前,Operator仅限于美国的ChatGPT Pro(付费服务)用户试用,不过未来很快会向更多用户提供服务。


相关文章

2025年人工智能医疗器械创新任务揭榜挂帅工作开展

工业和信息化部办公厅国家药品监督管理局综合和规划财务司关于开展2025年人工智能医疗器械创新任务揭榜挂帅工作的通知工信厅联科函〔2025〕30号各省、自治区、直辖市、计划单列市及新疆生产建设兵团工业和......

可解释、可通用的下一代人工智能方法重大研究计划2025年度项目指南

可解释、可通用的下一代人工智能方法重大研究计划2025年度项目指南可解释、可通用的下一代人工智能方法重大研究计划面向人工智能发展国家重大战略需求,以人工智能的基础科学问题为核心,发展人工智能新方法体系......

OpenAI智能体能像人那样使用电脑向实现通用人工智能迈进一步

当地时间23日一场在线直播中,OpenAI团队揭开了首个AI智能体Operator的神秘面纱。这一创新成果打破了传统应用程序编程接口的限制,赋予了AI直接与图形用户界面交互的能力,就仿佛能像人类那样使......

OpenAI智能体能像人那样使用电脑向实现通用人工智能迈进一步

当地时间23日一场在线直播中,OpenAI团队揭开了首个AI智能体Operator的神秘面纱。这一创新成果打破了传统应用程序编程接口的限制,赋予了AI直接与图形用户界面交互的能力,就仿佛能像人类那样使......

OpenAI智能体能像人那样使用电脑向实现通用人工智能迈进一步

当地时间23日一场在线直播中,OpenAI团队揭开了首个AI智能体Operator的神秘面纱。这一创新成果打破了传统应用程序编程接口的限制,赋予了AI直接与图形用户界面交互的能力,就仿佛能像人类那样使......

院士专家共议“人工智能前沿探索与行业前瞻”

1月22日,由中国科学报社主办的第十六届创新发展论坛在江苏省南京市举行。本届创新发展论坛主题为“以高水平科技供给智领产业未来”,围绕“生物制造锚定新坐标”“人工智能前沿探索与行业前瞻”“科技创新引领新......

人工智能会否让人脑持续退化?

人们常说,脑袋大的人更聪明,但近年来的化石发现显示,脑容量小也可能很聪明。过去20年间,越来越多证据表明,一些脑容量小的人群与脑容量大的人群长期共存于地球,而且还有相当“先进”的行为。这些发现颠覆了有......

国产AI大模型DeepSeek升级,性能对标OpenAIo1正式版

1月20日,国产AI大模型DeepSeek正式发布新版本DeepSeek-R1,并同步开源模型权重。开发者表示,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,......

国产AI大模型DeepSeek升级,性能对标OpenAIo1正式版

1月20日,国产AI大模型DeepSeek正式发布新版本DeepSeek-R1,并同步开源模型权重。开发者表示,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,......

2024年度吴文俊人工智能科学技术奖拟授奖项目公示

近日,中国人工智能学会网站公示2024年度吴文俊人工智能科学技术奖拟授奖项目名单。其中,徐宗本院士获科技成就奖提名,张大鹏、王国胤、章毅获科技贡献奖提名。此外,自然科学奖一等奖9项,技术发明奖8项,科......