OpenAI智能体能像人那样使用电脑向实现通用人工智能迈进一步

当地时间23日一场在线直播中,OpenAI团队揭开了首个AI智能体Operator的神秘面纱。这一创新成果打破了传统应用程序编程接口的限制,赋予了AI直接与图形用户界面交互的能力,就仿佛能像人类那样使用电脑,从而向实现通用人工智能迈进了一步。团队演示Operator的视频画面。图片来源:OpenAI演示中,Operator展现了其强大的能力。它不仅能够精确理解指令,还能自主完成复杂任务,如自动填写在线表单、进行网购、创建表情包以及处理重复性浏览器任务等。这一切都是通过一个被称为CUA的新模型实现的。该模型结合了GPT-4o的视觉功能和高级推理技术,并通过强化学习不断优化自己的性能。值得注意的是,在多个测试环境中,CUA模型的表现令人印象深刻。例如,在OSWORLD上执行计算机使用任务的成功率达到了38.1%,比之前最佳结果提高了近16%;而在WebArena上的成功率更是高达58.1%,提升了22%。尽管这些成绩与人类相比还有一......阅读全文

OpenAI也降价了

·GPT-4o mini每百万token的输入价格为15美分,每百万token的输出价格是60美分,比GPT-3.5 Turbo便宜60%以上。7月19日,OpenAI发布GPT-4o mini,加入大模型价格战。在ChatGPT中,免费用户、Plus用户和团队用户即日起可访问GPT-4o mini

OpenAI正式发布GPT4

原文地址:http://news.sciencenet.cn/htmlnews/2024/1/515804.shtm (图片源自网络)3月15日,OpenAI发布了多模态预训练大模型GPT-4,这是其大型语言模型的最新版本。与此前的版本相比,GPT-4具备强大的识图能力,文字输入限制也提升至

智谱AI、OpenAI、谷歌等共同签署前沿人工智能安全承诺

5月21日,第二届人工智能安全峰会在韩国首尔召开。峰会以“安全、创新、包容”为议题,就进一步保障AI安全性、推进AI可持续发展等方案进行讨论。  峰会上,智谱AI、亚马逊、微软、Meta、谷歌、OpenAI等共16家全球主要人工智能公司一道签署前沿人工智能安全承诺(Frontier AI Safet

OpenAI和谷歌再度燃起争霸烽火

谷歌Project Astra亮相发布会。 图片来源:美国Gizmodo网站OpenAI与谷歌的又一次技术交锋刚刚落下帷幕。北京时间5月14日凌晨,OpenAI发布了新一代多模态人工智能(AI)大模型GPT-4o,其先进的AI语音交互技术迅速吸引了人们的目光。一天之后,谷歌在北京时间15日凌晨的I/

OpenAI发布语音模型GPTrealtime

8月28日,美国人工智能公司OpenAI发布了其所谓“最先进的语音到语音模型”GPT-realtime,以及配套的Realtime API(实时应用程序接口)。据OpenAI公司介绍,该模型在理解复杂指令、精准调用工具以及生成自然、富有表现力的语音方面表现突出,并在客户服务、教育、个人助理等多种场景

礼来与OpenAI合作,利用生成式人工智能研发新型抗生素

  抗生素让我们有了战胜致病菌的有力武器,挽救了无数生命。然而,抗生素的广泛应用也带来了一个巨大的危机——抗生素耐药性(AMR),据世界卫生组织(WHO)统计,2019年全球约有120万人死于抗生素耐药性(AMR)所加剧的细菌感染,这已经高于艾滋病导致的死亡人数。更重要的是,照此发展,到2050年,

礼来与OpenAI合作,利用生成式人工智能研发新型抗生素

  抗生素让我们有了战胜致病菌的有力武器,挽救了无数生命。然而,抗生素的广泛应用也带来了一个巨大的危机——抗生素耐药性(AMR),据世界卫生组织(WHO)统计,2019年全球约有120万人死于抗生素耐药性(AMR)所加剧的细菌感染,这已经高于艾滋病导致的死亡人数。更重要的是,照此发展,到2050年,

OpenAI开发神秘项目“草莓”提升模型智能

·使用“草莓”模型的目的是使OpenAI的人工智能不仅能够生成查询答案,还能够提前做好充足计划,自主可靠地在互联网上导航,执行OpenAI所说的“深度研究”。推理是人工智能实现或超人类智能水平的关键。OpenAI正在开发代号为“草莓”(Strawberry)的新推理技术。据路透社当地时间7月12日报

微软正将OpenAI-ChatGPT插件引入Windows-11

ChatGPT从其采集的数据中提取知识,最晚可以追溯到2021年9月--直到现在。有了插件的支持,ChatGPT现在可以访问互联网,像浏览器一样导航到网站,并真实地采集信息。OpenAI正在建立一个ChatGPT版本的应用商店,而微软现在正将这些插件带到Windows 11。ChatGPT插件将通过

OpenAI选择“闭源”,为何反而火了“开源”

原文地址:http://news.sciencenet.cn/htmlnews/2023/12/514533.shtm

OpenAI打包新闻集团版权训练大模型

ChatGPT再扩容,这次将加入十余家媒体的新闻内容。当地时间5月22日,OpenAI宣布与新闻集团(News Corp)达成多年期协议,将获得主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《巴伦周刊》《纽约邮报》《泰晤士报》《太阳报》等十余家媒体。根据协议,OpenAI将能在ChatGP

邮件曝光-OpenAI正式回击马斯克

3月5日,OpenAI在官网发布博文称,公司的使命是确保AGI能够造福全人类,并驳斥了马斯克的所有指控。Open AI这篇博文公开披露OpenAI和马斯克的关系,并将马斯克与OpenAI三位重要创始人奥尔特曼(Sam Altman)、格雷格•布罗克曼(Greg Brockman)、以及伊尔亚•苏茨克

OpenAI又地震:ChatGPT负责人离职

OpenAI内部仍动荡不安,ChatGPT的两位重要负责人选择离开。8月6日,AI(人工智能)巨头OpenAI联合创始人约翰·舒尔曼(John Schulman)在X(推特)发文表示,将离开OpenAI加入另一家AI初创公司Anthropic(OpenAI的竞争对手)。舒尔曼9年前在OpenAI成立

OpenAI推出具备推理能力新AI模型

据ChatGPT制造者美国开放人工智能公司(OpenAI)官网12日报道,该公司已经成功研发出一系列具备推理能力的人工智能(AI)模型,并命名为“OpenAI o1”。这些模型的独特之处在于,其会花更长时间思考问题,再做出响应,就像人类一样。因此,这些模型能对复杂任务进行推理,解决以前模型很难解决的

ChatGPT发布两周年,OpenAI“官司缠身”

ChatGPT的诞生加速了生成式人工智能领域的融资,但这一趋势的引领者OpenAI却因版权问题和转向营利性公司导致“官司缠身”,两周年生日过得似乎并不顺心。美媒《商业内幕》12月1日报道,据CBInsights的数据,仅2022年-2023年,人工智能领域的融资增长了五倍。生成式人工智能热潮中最大的

OpenAI将屏蔽中国开发者API访问?

6月25日,有部分国外开发者在推特、Reddit等海外社交网站上称收到了OpenAI的官方邮件,被告知OpenAI计划从7月9日开始将采取额外措施,阻止来自不在其支持的国家和地区列表中的区域的API(应用程序编程接口)流量。要继续使用OpenAI的服务,需要在受支持的区域中访问该服务。网友发布的截图

OpenAI与苹果合作:“界面”的重要性

近日,苹果在资本市场触底反弹,显示王者归来,并且带动科技股一起补涨。6月10日,苹果宣布与OpenAI构建合作伙伴关系。苹果用户通过呼唤Siri语音助手就能使用ChatGPT,无需支付额外费用就可以在全系统的写作工具中调用ChatGPT,使用其聊天机器人、图像生成等功能。资本市场的反应肯定了苹果与O

马斯克起诉OpenAI-要求其共享技术

原文地址:http://news.sciencenet.cn/htmlnews/2024/3/518282.shtm 中新社旧金山3月1日电 美国企业家埃隆·马斯克当地时间2月29日在旧金山高等法院起诉美国人工智能公司“开放人工智能研究中心”(OpenAI)及其首席执行官萨姆·奥尔特曼等人,称其

OpenAI重磅推出SearchGPT,能否重新定义搜索?

  2024年7月25日,OpenAI正在测试一种新的AI搜索功能原型——SearchGPT。这一原型旨在结合强大的AI模型与实时网络信息,为用户提供快速、及时的答案,并附上清晰且相关的来源链接。  加入等候名单  OpenAI将这一原型开放给一小部分用户和出版商,以获取反馈。尽管这一原型是暂时的,

OpenAI正慢慢转型为医疗保健公司

  最近,OpenAI与WHOOP合作推出了由GPT-4驱动的个性化健康和健身教练。WHOOP Coach为各种健身和健康相关问题提供答案。  例如,它可以解决诸如“我有史以来最低的静息心率是多少?”或“什么样的每周锻炼计划可以帮助我实现目标?”之类的问题,同时根据每个人的独特身体和目标提供个性化指

GPT4o为OpenAI开启超级入口

·基于ChatGPT或GPT-4o,未来人类获得信息的方式很可能会改变,GPT-4o或为OpenAI开启了一个超级入口,这可能会对谷歌带来影响。接下来,OpenAI需要判断的是在产品上的极致体验是否是刚需。“GPT-4o在交互模式上是一个巨大进步。”5月14日,蚂蚁集团副总裁、NextEvo负责人徐

OpenAI推出具备推理能力新AI模型

据ChatGPT制造者美国开放人工智能公司(OpenAI)官网12日报道,该公司已经成功研发出一系列具备推理能力的人工智能(AI)模型,并命名为“OpenAI o1”。这些模型的独特之处在于,其会花更长时间思考问题,再做出响应,就像人类一样。因此,这些模型能对复杂任务进行推理,解决以前模型很难解决的

又反转了!奥尔特曼回归OpenAI--布洛克曼连夜回公司写代码

  美国开放人工智能研究中心(OpenAI)22日在社交平台X上宣布,奥尔特曼将回归OpenAI担任CEO。数天前,奥尔特曼遭OpenAI罢免CEO职位。  晚些时候,奥尔特曼在X上发文称,“我爱OpenAI”。他补充称,当他决定加入微软时,“很明显这曾是对我和团队最好的选择”,“有了新的董事会和萨

为了拥有更多数据,OpenAI牵手“美国贴吧”

·Reddit曾与谷歌母公司Alphabet合作,将其内容用于训练谷歌AI模型,如今与OpenAI合作,将Reddit的内容引入ChatGPT,出售数据用于训练模型被视为Reddit广告业务之外的一个重要收入来源。当地时间5月16日,OpenAI宣布和社交平台、“美国贴吧”Reddit合作,Open

前OpenAI首席科学家成立新公司

从OpenAI离开一个月后,伊尔亚成立了一家公司。6月20日,OpenAI联合创始人、前首席科学家伊尔亚·苏茨克维(Ilya Sutskever)在社交平台X上发文宣布成立新公司SSI(safe superintelligence,安全超级智能)。他表示新公司将致力于追求安全超级智能,“只有一个重点

OpenAI最新模型o3展现强大推理能力

  12月20日,美国开放人工智能研究中心(OpenAI)介绍了其最新的人工智能(AI)推理模型——o3及其轻量版o3-mini。该公司宣称,o3具备更先进、近似人类的推理能力,在代码编写、数学竞赛和掌握人类博士级别的科学知识等方面,均超越了其“前辈”o1。  不过,英国《新科学家》网站在12月22

OpenAI发布新品GPT4o,功能秒杀Siri

·GPT-4o可以对音频、视觉和文本进行实时推理,在232毫秒内响应音频输入,与人类在对话中的响应时间相似。·GPT-4o的文本和图像功能开始在ChatGPT中免费推出,音频模式存在各种新风险而未公开,未来音频输出将仅限于选定的预设声音,并要遵守安全政策。GPT-4o生成图像:机器人正在输入日志条目

OpenAI推出高级语音模式,支持50多种语言

OpenAI正式推出的高级语音模式,已支持50多种语言交流,此外新增五种全新的语音风格供用户选择。值得注意的是,此次更新中并未包含名为“Sky”的语音风格。此前,该语音曾被指与女演员斯嘉丽·约翰逊声音高度相似。9月25日,OpenAI在X平台上宣布,将为ChatGPT的付费用户推出全新的高级语音模式

OpenAI回应“暂停更强大模型研发”公开信

原文地址:http://news.sciencenet.cn/htmlnews/2023/4/498843.shtm近日,OpenAI 联合创始人兼 CEO 萨姆?奥特曼(Sam Altman)在美国麻省理工学院“想象力行动”活动上接受了采访。受访中,奥特曼回应了此前引起广泛关注的、“生命未来研究所

OpenAI推出人工智能搜索引擎,和多家新闻出版商合作

人工智能开发机构OpenAI终于进入搜索引擎市场,正在推出由AI驱动的搜索引擎SearchGPT的测试版,可实时访问互联网上的信息。该产品引用的信息来源将包括新闻集团、美联社、《大西洋》月刊和Vox Media等商业合作伙伴的新闻。随着OpenAI的快速发展,该公司的运营成本也在不断增加。美国科技媒