OpenAI“语音引擎”可从15秒样本复制原声

科技日报北京4月1日电 (记者张梦然)据著名科技网站The Verge报道,OpenAI公司3月29日最新推出了一项名为“语音引擎”(Voice Engine)的人工智能工具,其仅凭一段15秒的声音样本,便能够精准模仿出该人的声音。OpenAI称,该引擎自2022年底以来一直在开发中,实际已在ChatGPT应用程序的“大声朗读”功能中应用,该功能顾名思义会向用户朗读相关内容。用户只需利用15秒的样本来训练声音,就可让它以一种“情感和现实”的方式读出喜欢的任何文本。OpenAI表示,它可用于教育目的,将播客翻译成新语言。OpenAI发布的剪辑听起来令人印象深刻,尽管它们有轻微生硬的机器人痕迹。“语音引擎”展示了一些已经开始应用的例子。如生成更自然、更富有情感的声音;将视频内容翻译成多种语言,以拓宽其全球受众范围。这项技术的一大特色是,在翻译过程中能够保留演讲者原有的口音特征,为翻译增添了更多真实感和个......阅读全文

OpenAI推出高级语音模式,支持50多种语言

OpenAI正式推出的高级语音模式,已支持50多种语言交流,此外新增五种全新的语音风格供用户选择。值得注意的是,此次更新中并未包含名为“Sky”的语音风格。此前,该语音曾被指与女演员斯嘉丽·约翰逊声音高度相似。9月25日,OpenAI在X平台上宣布,将为ChatGPT的付费用户推出全新的高级语音模式

OpenAI“语音引擎”可从15秒样本复制原声

科技日报北京4月1日电 (记者张梦然)据著名科技网站The Verge报道,OpenAI公司3月29日最新推出了一项名为“语音引擎”(Voice Engine)的人工智能工具,其仅凭一段15秒的声音样本,便能够精准模仿出该人的声音。OpenAI称,该引擎自2022年底以来一直在开发中,实际已在Cha

OpenAI发布语音模型GPTrealtime

8月28日,美国人工智能公司OpenAI发布了其所谓“最先进的语音到语音模型”GPT-realtime,以及配套的Realtime API(实时应用程序接口)。据OpenAI公司介绍,该模型在理解复杂指令、精准调用工具以及生成自然、富有表现力的语音方面表现突出,并在客户服务、教育、个人助理等多种场景

OpenAI打包新闻集团版权训练大模型

ChatGPT再扩容,这次将加入十余家媒体的新闻内容。当地时间5月22日,OpenAI宣布与新闻集团(News Corp)达成多年期协议,将获得主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《巴伦周刊》《纽约邮报》《泰晤士报》《太阳报》等十余家媒体。根据协议,OpenAI将能在ChatGP

OpenAI发布新品GPT4o,功能秒杀Siri

·GPT-4o可以对音频、视觉和文本进行实时推理,在232毫秒内响应音频输入,与人类在对话中的响应时间相似。·GPT-4o的文本和图像功能开始在ChatGPT中免费推出,音频模式存在各种新风险而未公开,未来音频输出将仅限于选定的预设声音,并要遵守安全政策。GPT-4o生成图像:机器人正在输入日志条目

GPT4o为OpenAI开启超级入口

·基于ChatGPT或GPT-4o,未来人类获得信息的方式很可能会改变,GPT-4o或为OpenAI开启了一个超级入口,这可能会对谷歌带来影响。接下来,OpenAI需要判断的是在产品上的极致体验是否是刚需。“GPT-4o在交互模式上是一个巨大进步。”5月14日,蚂蚁集团副总裁、NextEvo负责人徐

升级后的ChatGPT更加人性化

5月13日,OpenAI公布了最新的人工智能模型GPT-4o,该模型通过语音模式可以为ChatGPT提供更多类似人类的互动。升级后的ChatGPT能够实时进行包含文本、音频和视频的对话,同时说话时使用的语调和措辞还能传达出强烈的情感和个性。OpenAI的最新模型提供了更像人类的对话体验。图片来源:J

马斯克批OpenAI:训练AI没有最大程度追求真相

马斯克再度表达了对OpenAI等人工智能的担忧。当地时间5月23日,在欧洲最大的科技创新盛会VivaTech大会中,特斯拉CEO埃隆·马斯克表示,人工智能终将取代人类所有的工作,但这不一定是坏事。在马斯克看来,未来的工作将是“可选项”。他说,届时全民都要达到高收入,商品或服务供给充足。但人们面临的问

OpenAI也降价了

·GPT-4o mini每百万token的输入价格为15美分,每百万token的输出价格是60美分,比GPT-3.5 Turbo便宜60%以上。7月19日,OpenAI发布GPT-4o mini,加入大模型价格战。在ChatGPT中,免费用户、Plus用户和团队用户即日起可访问GPT-4o mini

ChatGPT背后:一个天才、百亿融资和1亿月活

此刻,ChatGPT的火热程度已经无需多言。11月30日上线,上线一周获得百万注册用户,成为史上最快到百万用户的产品;1月23日,微软确认了对ChatGPT母公司OpenAI的新一轮数十亿美元投资;2月4日,ChatGPT版搜索引擎曾悄然上线,但几分钟又后迅速下线;2月6日,谷歌预告其智能对话机器人

GPT4很强大但仍有诸多谜团,OpenAI选择只透露这么多

“(该模型) 仍然存在很多问题和错误……但你确实可以看到微积分或法律等技能的飞跃,从某些领域的非常糟糕到相对于人类来说实际上相当好。 ”从长远来看,OpenAI计划构建和部署可以处理多种媒体的系统,包括声音和视频。“我们可以采用所有这些通用知识技能,并将它们传播到各种不同领域。这将技术带入了一个全新

美AI巨头被控秘密“侵吞”数据

人工智能(AI)迅速发展离不开对模型的训练。然而,高质量数据短缺以及部分领域封闭式的数据生态似乎成为AI发展的掣肘。据多家外媒报道,OpenAI、谷歌和Meta等公司正寻求在线信息来训练最新的AI系统。但他们无视既定政策,蓄意改变规则,并试图规避版权法。收集数据“走捷径”英国《泰晤士报》近日刊文指出

ChatGPT火了!国内AI风往哪儿吹

  ChatGPT概念股火了!  连日来,美国人工智能(AI)实验室OpenAI发布的聊天机器人ChatGPT火爆全网,并带动了相关概念股的上涨。  在A股市场,资本大举炒作ChatGPT概念股,部分概念股出现五连板的走势。百度宣布将推出中国版的ChatGPT项目——文心一言(英文名ERNIE Bo

一周热闻回顾(2024年4月7日)

美院原院长与研究生有不正当关系?重庆师范大学通报重庆师范大学近日凌晨在官方微博发布情况通报称,关于网传该校退休教师、美术学院原院长与研究生发生不正当关系的事情,经上级组织审理、核准,学校对黄某某作出了党纪政务处分。同时已将黄某某党纪政务处分情况,告知举报者本人,并在黄某某所在党支部和原学院教职工大会

Sora向好莱坞发起冲击

图片来源:物理学家组织网据美国《洛杉矶时报》网站近日报道,OpenAI公司正与包括资深经纪人和电影工作室的高管等在内的美国好莱坞娱乐业人士密切接触,推销其最新文字转视频技术Sora。对于AI这个“闯入者”,娱乐业几家欢乐几家愁。有人积极拥抱AI的到来,并与其密切合作;但也有人心怀警惕,担心AI会砸掉

OpenAI正式发布GPT4

原文地址:http://news.sciencenet.cn/htmlnews/2024/1/515804.shtm (图片源自网络)3月15日,OpenAI发布了多模态预训练大模型GPT-4,这是其大型语言模型的最新版本。与此前的版本相比,GPT-4具备强大的识图能力,文字输入限制也提升至

ChatGPT将变身AI语音助手?挑战Siri和谷歌语音助手

新品发布在即,奥特曼的最新表态或暗示OpenAI意在人工智能语音助手。当地时间5月11日,人工智能(AI)巨头OpenAI CEO山姆·奥特曼(Sam Altman)在一档播客节目中称,OpenAI将继续改进并提升ChatGPT的语音功能质量,并表示相信语音交互是通向未来交互方式的一个重要途径。奥特

OpenAI和谷歌再度燃起争霸烽火

谷歌Project Astra亮相发布会。 图片来源:美国Gizmodo网站OpenAI与谷歌的又一次技术交锋刚刚落下帷幕。北京时间5月14日凌晨,OpenAI发布了新一代多模态人工智能(AI)大模型GPT-4o,其先进的AI语音交互技术迅速吸引了人们的目光。一天之后,谷歌在北京时间15日凌晨的I/

OpenAI推出人工智能搜索引擎,和多家新闻出版商合作

人工智能开发机构OpenAI终于进入搜索引擎市场,正在推出由AI驱动的搜索引擎SearchGPT的测试版,可实时访问互联网上的信息。该产品引用的信息来源将包括新闻集团、美联社、《大西洋》月刊和Vox Media等商业合作伙伴的新闻。随着OpenAI的快速发展,该公司的运营成本也在不断增加。美国科技媒

为了拥有更多数据,OpenAI牵手“美国贴吧”

·Reddit曾与谷歌母公司Alphabet合作,将其内容用于训练谷歌AI模型,如今与OpenAI合作,将Reddit的内容引入ChatGPT,出售数据用于训练模型被视为Reddit广告业务之外的一个重要收入来源。当地时间5月16日,OpenAI宣布和社交平台、“美国贴吧”Reddit合作,Open

视频生成器Sora让人喜忧交加

原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517690.shtm   ?一位时尚女性漫步于充满城市标牌的东京街道上,道路两边霓虹灯闪烁,透出阵阵暖意。Sora可根据这一文本内容生成逼真视频(图为视频截图)。图片来源:Sora/OpenAI继

官方的ChatGPT-App现在扩展到另外11个国家

OpenAI在一条推文中宣布,官方版ChatGPT移动应用现在可以在更多国家使用。上周OpenAI首次发布其移动应用时,该应用只在iOS和美国提供。现在,许多生活在欧洲、韩国、新西兰等地的人将能够从App Store下载该应用。ChatGPT应用程序是一个没有任何广告的免费应用程序。已经熟悉Chat

斯坦福大学复制出ChatGPT人工智能-训练成本不到600美元

斯坦福大学的Alpaca人工智能在许多任务上的表现与惊人的ChatGPT相似--但它建立在一个开源的语言模型上,训练成本不到600美元。看来这些神一样的人工智能已经便宜得吓人了,而且很容易复制。六个月前,只有研究人员和博学者在关注大型语言模型的发展。但去年年底ChatGPT的推出震惊了世界:机器现在

ChatGPT涉嫌侵权?普利策奖得主提起诉讼

原文地址:http://news.sciencenet.cn/htmlnews/2023/9/508358.shtm 中新网9月12日电 据路透社报道,包括普利策小说奖得主迈克尔·夏邦(Michael Chabon)在内的几名美国作家,日前在旧金山联邦法院起诉美国人工智能公司OpenAI,指控其

GPT5在路上了?OpenAI透露开始训练下一个前沿模型

中新网5月29日电(中新财经记者 吴涛)“OpenAI 最近开始训练其下一个前沿模型,我们预计最终的系统将使我们在通往AGI的道路上更上一层楼。”近日,OpenAI对外公布,OpenAI 董事会成立了安全与保障委员会,并透露出下一个模型的消息。目前尚不能确定该模型是否为传言中的GPT-5,毕竟命名权

小说作者起诉科技巨头英伟达侵犯版权训练AI平台

原文地址:http://news.sciencenet.cn/htmlnews/2024/3/518878.shtm这起诉讼将英伟达拖入了围绕生成式人工智能引发的越来越多的诉讼中。开发聊天机器人ChatGPT的OpenAI以及其他科技公司在美国面临多起来自版权所有者的诉讼,包括作家、视觉艺术家和音乐

OpenAI开发神秘项目“草莓”提升模型智能

·使用“草莓”模型的目的是使OpenAI的人工智能不仅能够生成查询答案,还能够提前做好充足计划,自主可靠地在互联网上导航,执行OpenAI所说的“深度研究”。推理是人工智能实现或超人类智能水平的关键。OpenAI正在开发代号为“草莓”(Strawberry)的新推理技术。据路透社当地时间7月12日报

“王炸”功能只给看,自然语言处理“战国时代”即将到来?

北京时间3月15日凌晨,人工智能初创公司OpenAI公布新一代人工智能语言模型GPT-4。与ChatGPT所用的模型相比,GPT-4不仅能够处理图像内容,而且在回答的细节和表述方面更有价值和人情味。“这是OpenAI努力扩展深度学习的最新里程碑。”OpenAI在当天的声明中这样表示。鉴于这是一个只训

OpenAI选择“闭源”,为何反而火了“开源”

原文地址:http://news.sciencenet.cn/htmlnews/2023/12/514533.shtm

微软正将OpenAI-ChatGPT插件引入Windows-11

ChatGPT从其采集的数据中提取知识,最晚可以追溯到2021年9月--直到现在。有了插件的支持,ChatGPT现在可以访问互联网,像浏览器一样导航到网站,并真实地采集信息。OpenAI正在建立一个ChatGPT版本的应用商店,而微软现在正将这些插件带到Windows 11。ChatGPT插件将通过