OpenAI再出王炸,视频生成大模型Sora备受关注

人工智能(AI)领域的巨头OpenAI再次引发关注,其最新推出的视频生成大模型Sora因其出色的逼真度和想象力广受赞誉。相较于传统视频生成领域的平均4秒长度,Sora能够生成长达60秒的视频,这一创新无疑颠覆了行业的常规。 据OpenAI官网介绍,Sora是一种扩散模型,其生成视频的过程从看似静态噪声的视频开始,通过逐步消除噪声来转换生成视频。这一模型具备生成完整视频或扩展已有视频的能力,确保视频主题在暂时离开视野时仍保持一致。此外,Sora还借鉴了GPT模型,采用Transformer架构,并建立在DALL·E和GPT模型的研究基础上,利用DALL·E 3的重述技术为视觉训练数据生成高度描述性的标题,从而更精准地遵循用户的文本指令。 OpenAI对Sora寄予厚望,认为它是能够理解和模拟现实世界的模型基础,并相信这一功能将成为实现通用人工智能(AGI)的重要里程碑。这一观点得到了业界的广泛认同,甚至有行业观察者认为AG......阅读全文

OpenAI再出王炸,视频生成大模型Sora备受关注

  人工智能(AI)领域的巨头OpenAI再次引发关注,其最新推出的视频生成大模型Sora因其出色的逼真度和想象力广受赞誉。相较于传统视频生成领域的平均4秒长度,Sora能够生成长达60秒的视频,这一创新无疑颠覆了行业的常规。  据OpenAI官网介绍,Sora是一种扩散模型,其生成视频的过程从看似

视频生成器Sora让人喜忧交加

原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517690.shtm   ?一位时尚女性漫步于充满城市标牌的东京街道上,道路两边霓虹灯闪烁,透出阵阵暖意。Sora可根据这一文本内容生成逼真视频(图为视频截图)。图片来源:Sora/OpenAI继

Sora很惊艳,但“实现AGI”言之过早

  2月15日,一手缔造了ChatGPT的OpenAI再放“大招”,发布了其第一个文生视频大模型Sora。在官方分享的演示视频中,该模型可以根据用户输入的提示词,生成长达一分钟连贯稳定的高清视频。  虽然Sora还未公开应用,但已引发大量关注。原因无他,OpenAI发布的演示视频一度让人们无法分辨这

OpenAI又失大将!Sora研发负责人跳槽谷歌

OpenAI再走一员大将。当地时间10月4日,人工智能(AI)巨头OpenAI的文生视频大模型Sora团队研发负责人蒂姆·布鲁克斯(Tim Brooks)宣布离职,加入谷歌DeepMind。Tim Brooks宣布加入谷歌布鲁克斯表示,将在谷歌继续从事视频生成和世界模拟器方面的工作,“我迫不及待地想

OpenAI发布语音模型GPTrealtime

8月28日,美国人工智能公司OpenAI发布了其所谓“最先进的语音到语音模型”GPT-realtime,以及配套的Realtime API(实时应用程序接口)。据OpenAI公司介绍,该模型在理解复杂指令、精准调用工具以及生成自然、富有表现力的语音方面表现突出,并在客户服务、教育、个人助理等多种场景

AI视频生成模型Sora来了

原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517625.shtm

OpenAI打包新闻集团版权训练大模型

ChatGPT再扩容,这次将加入十余家媒体的新闻内容。当地时间5月22日,OpenAI宣布与新闻集团(News Corp)达成多年期协议,将获得主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《巴伦周刊》《纽约邮报》《泰晤士报》《太阳报》等十余家媒体。根据协议,OpenAI将能在ChatGP

OpenAI开发神秘项目“草莓”提升模型智能

·使用“草莓”模型的目的是使OpenAI的人工智能不仅能够生成查询答案,还能够提前做好充足计划,自主可靠地在互联网上导航,执行OpenAI所说的“深度研究”。推理是人工智能实现或超人类智能水平的关键。OpenAI正在开发代号为“草莓”(Strawberry)的新推理技术。据路透社当地时间7月12日报

全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型

被OpenAI抢先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,以及在硬件方面发布的第六代Tenso

当模型足够大,就可以模拟现实世界

今年,OpenAI公司的视频生成模型Sora又火了一把,同时也带火了DiT。纽约大学计算机系助理教授谢赛宁称,Sora是基于自己和威廉·皮布尔斯(William Peebles)共同提出的DiT(一个能够直接生成4K分辨率图像的模型)框架设计而成。6月14日,在2024智源大会上,围绕“语言模型是否

Sora带来的深层次影响值得关注

上个月,OpenAI公司推出了文生视频人工智能(AI)模型Sora。OpenAI展示了Sora利用少量简短文字提示即可创建逼真视频的能力,并提供了包括一位女士在闪烁着霓虹灯的东京街道漫步,以及一只狗在两个窗台之间跳跃的视频片段。Sora所展现的能力和潜力很快引起了科技界、商界和投资界的高度关注。Op

OpenAI推出具备推理能力新AI模型

据ChatGPT制造者美国开放人工智能公司(OpenAI)官网12日报道,该公司已经成功研发出一系列具备推理能力的人工智能(AI)模型,并命名为“OpenAI o1”。这些模型的独特之处在于,其会花更长时间思考问题,再做出响应,就像人类一样。因此,这些模型能对复杂任务进行推理,解决以前模型很难解决的

OpenAI推出具备推理能力新AI模型

据ChatGPT制造者美国开放人工智能公司(OpenAI)官网12日报道,该公司已经成功研发出一系列具备推理能力的人工智能(AI)模型,并命名为“OpenAI o1”。这些模型的独特之处在于,其会花更长时间思考问题,再做出响应,就像人类一样。因此,这些模型能对复杂任务进行推理,解决以前模型很难解决的

谁会成为中国版-Sora?

  鏖战一年的“百模大战”还未结束,两个海外AI巨头又给国内科技大厂出了难题。  就在春节假期的尾声,谷歌和OpenAI毫无征兆地放出了各自的 AI新“核武”。  谷歌拿出的新一代多模态大模型Gemini 1.5 Pro,将性能提升到了百万级别,完全秒杀了OpenAI的GPT-4 Turbo,暂居地

OpenAI最新模型o3展现强大推理能力

  12月20日,美国开放人工智能研究中心(OpenAI)介绍了其最新的人工智能(AI)推理模型——o3及其轻量版o3-mini。该公司宣称,o3具备更先进、近似人类的推理能力,在代码编写、数学竞赛和掌握人类博士级别的科学知识等方面,均超越了其“前辈”o1。  不过,英国《新科学家》网站在12月22

OpenAI回应“暂停更强大模型研发”公开信

原文地址:http://news.sciencenet.cn/htmlnews/2023/4/498843.shtm近日,OpenAI 联合创始人兼 CEO 萨姆?奥特曼(Sam Altman)在美国麻省理工学院“想象力行动”活动上接受了采访。受访中,奥特曼回应了此前引起广泛关注的、“生命未来研究所

美AI巨头被控秘密“侵吞”数据

人工智能(AI)迅速发展离不开对模型的训练。然而,高质量数据短缺以及部分领域封闭式的数据生态似乎成为AI发展的掣肘。据多家外媒报道,OpenAI、谷歌和Meta等公司正寻求在线信息来训练最新的AI系统。但他们无视既定政策,蓄意改变规则,并试图规避版权法。收集数据“走捷径”英国《泰晤士报》近日刊文指出

OpenAI也降价了

·GPT-4o mini每百万token的输入价格为15美分,每百万token的输出价格是60美分,比GPT-3.5 Turbo便宜60%以上。7月19日,OpenAI发布GPT-4o mini,加入大模型价格战。在ChatGPT中,免费用户、Plus用户和团队用户即日起可访问GPT-4o mini

Sora向好莱坞发起冲击

图片来源:物理学家组织网据美国《洛杉矶时报》网站近日报道,OpenAI公司正与包括资深经纪人和电影工作室的高管等在内的美国好莱坞娱乐业人士密切接触,推销其最新文字转视频技术Sora。对于AI这个“闯入者”,娱乐业几家欢乐几家愁。有人积极拥抱AI的到来,并与其密切合作;但也有人心怀警惕,担心AI会砸掉

OpenAI对中国地区停止服务,国产大模型“抢客”

OpenAI“断供”,国产大模型“抢客”忙。6月25日,人工智能(AI)巨头OpenAI通过官方推送邮件告知API(应用接口)用户,自7月9日起,将阻止来自未列入支持国家和地区名单的区域的API流量,如要继续使用OpenAI的服务,需要在受支持的区域进行访问。OpenAI API通知邮件OpenAI

对标Sora,快手发布文生视频大模型“可灵”

近日,国内头部短视频平台“快手”发布了首个“Sora级”的文生视频大模型“可灵”,并宣布面向用户开放。据快手方面介绍,可灵大模型为快手AI团队自研,采用与Sora相似的技术路线,并结合多项自研技术,能够生成大幅度的合理运动、能够模拟物理世界特性、具备强大的概念组合能力和想象力,效果对标Sora。其生

4日直播|Sora来了中国AI如何迎接挑战

原文地址:http://news.sciencenet.cn/htmlnews/2024/3/518339.shtm   直播时间:3月4日(周一)19:00——20:00 直播平台: (中国科学报微博直播间链接) 中国科学报微博 【主持人简介】 赵广立

海外AI领域发展迅猛,建议关注三条关键主线

       天风证券(601162)发布研究报告称,对比海外,看好国内大企业深度使用大模型赋能旗下应用,也看好未来算力继续高增长,建议关注AI多模态、AI应用及华为链+三条主线。  (1)AI多模态:万兴科技(300624)(300624.SZ)、美图公司(01357)(与海外组联合覆盖)、易点天

OpenAI和谷歌再度燃起争霸烽火

谷歌Project Astra亮相发布会。 图片来源:美国Gizmodo网站OpenAI与谷歌的又一次技术交锋刚刚落下帷幕。北京时间5月14日凌晨,OpenAI发布了新一代多模态人工智能(AI)大模型GPT-4o,其先进的AI语音交互技术迅速吸引了人们的目光。一天之后,谷歌在北京时间15日凌晨的I/

推动人工智能产业快速发展要把保障数据安全放在突出位置

  美国人工智能公司OpenAI推出GPT Store,掀起AI应用新潮流;谷歌遭遇裁员风波,聚焦AI战略调整;特斯拉创始人埃隆·马斯克起诉OpenAI,指控其背离了初衷,将人工智能用于盈利而非为人类福祉服务……近期,人工智能领域大模型声势高涨,产品与服务推陈出新,但同时也伴随着诸多争议,尤其是在数

人工智能产品竞争日趋激烈

  北京时间5月15日凌晨,谷歌举办了年度I/O开发者大会。正如外界预期,人工智能成为这次大会的核心内容。根据发布会官方统计,两个小时的开发者大会共提及“人工智能(AI)”121次。会上,谷歌发布了众多有关AI的产品和服务,AI“全家桶”的创新性如何,引发外界关注。  具体来看,谷歌对旗下的AI大模

OpenAI-发布新一代大模型,更擅长推理也更贵

传说中的“草莓”现身,9月12日晚间,OpenAI正式对外发布一款名为o1的新模型,这款模型为该公司下一代 “推理” 模型中的第一个,o为“Orion(猎户座)”,这款模型可以比人类更快地回答更复杂的问题。与以前的模型相比,在编写代码和解决多步骤问题方面做得更好。但它也比此前发布的GPT-4o更贵,

OpenAI正式发布GPT4

原文地址:http://news.sciencenet.cn/htmlnews/2024/1/515804.shtm (图片源自网络)3月15日,OpenAI发布了多模态预训练大模型GPT-4,这是其大型语言模型的最新版本。与此前的版本相比,GPT-4具备强大的识图能力,文字输入限制也提升至

人工智能如何赋能科学研究?他们这样说

4月12日上午,中国科学院深圳先进技术研究院(简称“深圳先进院”)举办“探Sora真相,论AI未来”人工智能沙龙讲座。本次活动邀请到人工智能领域的专家学者围绕人工智能领域前沿技术进行了深入探讨和分析,并讨论了Sora对AI基础技术的推进作用。论坛现场 毛景洋摄“人工智能带来科学研究范式的改变,正在深

30秒让文字变视频-智谱AI发布清影

一段几百字的创意,等待30秒后就可以变成1440×960清晰度的视频。7月26日,在智谱AI开放日活动现场,清影上线智谱清言App。用户输入一段文字后,再选择自己想要风格,如卡通3D、黑白、油画、电影感等,配上智谱清言App自带的音乐,就可以生成AI视频片段。清影文生视频的截图 智谱AI供图除了让文