发布时间:2025-09-02 17:26 原文链接: OpenAI发布语音模型GPTrealtime

8月28日,美国人工智能公司OpenAI发布了其所谓“最先进的语音到语音模型”GPT-realtime,以及配套的Realtime API(实时应用程序接口)。

据OpenAI公司介绍,该模型在理解复杂指令、精准调用工具以及生成自然、富有表现力的语音方面表现突出,并在客户服务、教育、个人助理等多种场景中具备广泛应用潜力。

与传统语音模型不同,GPT-realtime新增了Marin与Cedar两种极具特色的语音,同时对原有8种语音进行了全面升级。模型不仅能生成自然流畅的语音,还能够敏锐捕捉笑声等非语言信号,在句子中间自如切换语言,并可根据场景需求灵活调整语气,使语音交互更贴近真实人类沟通。

通过Realtime API,开发者可实现实时语音输入输出,不必再经过繁琐的多模型转换流程。在实际应用中,这套技术可用于客户服务系统,让虚拟助手即时解答问题,提高效率和体验。它还可应用于教育领域,实现语音对话和口语练习。而在个人助理、办公或智能家居场景中,用户能通过语音快速完成安排或查询信息。结合图像或文本输入,开发者还能打造更智能的虚拟助手或机器人系统。

OpenAI表示,GPT-realtime和Realtime API已于8月28日起面向所有付费开发者开放。

相关文章

赛默飞宣布与OpenAI合作加速药物研发进程

近日,赛默飞世尔科技公司宣布与OpenAI达成战略合作,借助其先进的人工智能技术,推动科学创新和药物开发的进程。此次合作将OpenAI的应用程序编程接口(API)整合到赛默飞世尔的核心业务领域,包括产......

赛默飞宣布与OpenAI合作加速药物研发进程

近日,赛默飞世尔科技公司宣布与OpenAI达成战略合作,借助其先进的人工智能技术,推动科学创新和药物开发的进程。此次合作将OpenAI的应用程序编程接口(API)整合到赛默飞世尔的核心业务领域,包括产......

OpenAI发布语音模型GPTrealtime

8月28日,美国人工智能公司OpenAI发布了其所谓“最先进的语音到语音模型”GPT-realtime,以及配套的Realtime API(实时应用程序接口)。据OpenAI公司介绍,该模型......

OpenAI发布语音模型GPTrealtime

8月28日,美国人工智能公司OpenAI发布了其所谓“最先进的语音到语音模型”GPT-realtime,以及配套的Realtime API(实时应用程序接口)。据OpenAI公司介绍,该模型......

OpenAI发布语音模型GPTrealtime

8月28日,美国人工智能公司OpenAI发布了其所谓“最先进的语音到语音模型”GPT-realtime,以及配套的Realtime API(实时应用程序接口)。据OpenAI公司介绍,该模型......

最新人工智能模型GPT5发布

美国开放人工智能研究中心(OpenAI)7日发布其最新人工智能模型GPT-5。据OpenAI官网介绍,这是迄今为止该机构推出的最强大的人工智能系统,在各类基准测试中超越了先前的模型,在编程、数学、写作......

最新人工智能模型GPT5发布

美国开放人工智能研究中心(OpenAI)7日发布其最新人工智能模型GPT-5。据OpenAI官网介绍,这是迄今为止该机构推出的最强大的人工智能系统,在各类基准测试中超越了先前的模型,在编程、数学、写作......

OpenAI智能体能像人那样使用电脑向实现通用人工智能迈进一步

当地时间23日一场在线直播中,OpenAI团队揭开了首个AI智能体Operator的神秘面纱。这一创新成果打破了传统应用程序编程接口的限制,赋予了AI直接与图形用户界面交互的能力,就仿佛能像人类那样使......

OpenAI智能体能像人那样使用电脑向实现通用人工智能迈进一步

当地时间23日一场在线直播中,OpenAI团队揭开了首个AI智能体Operator的神秘面纱。这一创新成果打破了传统应用程序编程接口的限制,赋予了AI直接与图形用户界面交互的能力,就仿佛能像人类那样使......

国产AI大模型DeepSeek升级,性能对标OpenAIo1正式版

1月20日,国产AI大模型DeepSeek正式发布新版本DeepSeek-R1,并同步开源模型权重。开发者表示,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,......