Sora很惊艳,但“实现AGI”言之过早

2月15日,一手缔造了ChatGPT的OpenAI再放“大招”,发布了其第一个文生视频大模型Sora。在官方分享的演示视频中,该模型可以根据用户输入的提示词,生成长达一分钟连贯稳定的高清视频。 虽然Sora还未公开应用,但已引发大量关注。原因无他,OpenAI发布的演示视频一度让人们无法分辨这是人为摄制的还是人工智能(AI)生成的作品,以至于许多人评价它们“毫无AI感”。 国内外的圈内“大佬”纷纷下场对Sora给出肯定的回应。2月16日,360公司创始人周鸿祎发表千字长文点赞,指出Sora展现的是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破……这就离AGI(通用人工智能)真的不远了,不是10年或20年的问题,可能一两年就可以实现。埃隆·马斯克则在一条分享Sora生成视频的帖子下回复:“gg humans(人类完蛋了)。” 媒体纷纷引用这些评价,并将Sora与“世界模型”“通用人工智能”等词语联系起来,大有S......阅读全文

OpenAI再出王炸,视频生成大模型Sora备受关注

  人工智能(AI)领域的巨头OpenAI再次引发关注,其最新推出的视频生成大模型Sora因其出色的逼真度和想象力广受赞誉。相较于传统视频生成领域的平均4秒长度,Sora能够生成长达60秒的视频,这一创新无疑颠覆了行业的常规。  据OpenAI官网介绍,Sora是一种扩散模型,其生成视频的过程从看似

全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型

被OpenAI抢先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,以及在硬件方面发布的第六代Tenso

对标Sora,快手发布文生视频大模型“可灵”

近日,国内头部短视频平台“快手”发布了首个“Sora级”的文生视频大模型“可灵”,并宣布面向用户开放。据快手方面介绍,可灵大模型为快手AI团队自研,采用与Sora相似的技术路线,并结合多项自研技术,能够生成大幅度的合理运动、能够模拟物理世界特性、具备强大的概念组合能力和想象力,效果对标Sora。其生

OpenAI又失大将!Sora研发负责人跳槽谷歌

OpenAI再走一员大将。当地时间10月4日,人工智能(AI)巨头OpenAI的文生视频大模型Sora团队研发负责人蒂姆·布鲁克斯(Tim Brooks)宣布离职,加入谷歌DeepMind。Tim Brooks宣布加入谷歌布鲁克斯表示,将在谷歌继续从事视频生成和世界模拟器方面的工作,“我迫不及待地想

Sora带来的深层次影响值得关注

上个月,OpenAI公司推出了文生视频人工智能(AI)模型Sora。OpenAI展示了Sora利用少量简短文字提示即可创建逼真视频的能力,并提供了包括一位女士在闪烁着霓虹灯的东京街道漫步,以及一只狗在两个窗台之间跳跃的视频片段。Sora所展现的能力和潜力很快引起了科技界、商界和投资界的高度关注。Op

谁会成为中国版-Sora?

  鏖战一年的“百模大战”还未结束,两个海外AI巨头又给国内科技大厂出了难题。  就在春节假期的尾声,谷歌和OpenAI毫无征兆地放出了各自的 AI新“核武”。  谷歌拿出的新一代多模态大模型Gemini 1.5 Pro,将性能提升到了百万级别,完全秒杀了OpenAI的GPT-4 Turbo,暂居地

Sora很惊艳,但“实现AGI”言之过早

  2月15日,一手缔造了ChatGPT的OpenAI再放“大招”,发布了其第一个文生视频大模型Sora。在官方分享的演示视频中,该模型可以根据用户输入的提示词,生成长达一分钟连贯稳定的高清视频。  虽然Sora还未公开应用,但已引发大量关注。原因无他,OpenAI发布的演示视频一度让人们无法分辨这

4日直播|Sora来了中国AI如何迎接挑战

原文地址:http://news.sciencenet.cn/htmlnews/2024/3/518339.shtm   直播时间:3月4日(周一)19:00——20:00 直播平台: (中国科学报微博直播间链接) 中国科学报微博 【主持人简介】 赵广立

视频生成器Sora让人喜忧交加

原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517690.shtm   ?一位时尚女性漫步于充满城市标牌的东京街道上,道路两边霓虹灯闪烁,透出阵阵暖意。Sora可根据这一文本内容生成逼真视频(图为视频截图)。图片来源:Sora/OpenAI继

OpenAI打包新闻集团版权训练大模型

ChatGPT再扩容,这次将加入十余家媒体的新闻内容。当地时间5月22日,OpenAI宣布与新闻集团(News Corp)达成多年期协议,将获得主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《巴伦周刊》《纽约邮报》《泰晤士报》《太阳报》等十余家媒体。根据协议,OpenAI将能在ChatGP

OpenAI和谷歌再度燃起争霸烽火

谷歌Project Astra亮相发布会。 图片来源:美国Gizmodo网站OpenAI与谷歌的又一次技术交锋刚刚落下帷幕。北京时间5月14日凌晨,OpenAI发布了新一代多模态人工智能(AI)大模型GPT-4o,其先进的AI语音交互技术迅速吸引了人们的目光。一天之后,谷歌在北京时间15日凌晨的I/

腾讯大模型上线文生视频并宣布开源

据腾讯官微消息,腾讯今日宣布,混元大模型上线并开源文生视频能力。据介绍,该模型参数量为130亿,已经在Hugging Face平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。这也是当前最大的视频开源模型。

OpenAI又地震:ChatGPT负责人离职

OpenAI内部仍动荡不安,ChatGPT的两位重要负责人选择离开。8月6日,AI(人工智能)巨头OpenAI联合创始人约翰·舒尔曼(John Schulman)在X(推特)发文表示,将离开OpenAI加入另一家AI初创公司Anthropic(OpenAI的竞争对手)。舒尔曼9年前在OpenAI成立

微软正将OpenAI-ChatGPT插件引入Windows-11

ChatGPT从其采集的数据中提取知识,最晚可以追溯到2021年9月--直到现在。有了插件的支持,ChatGPT现在可以访问互联网,像浏览器一样导航到网站,并真实地采集信息。OpenAI正在建立一个ChatGPT版本的应用商店,而微软现在正将这些插件带到Windows 11。ChatGPT插件将通过

当模型足够大,就可以模拟现实世界

今年,OpenAI公司的视频生成模型Sora又火了一把,同时也带火了DiT。纽约大学计算机系助理教授谢赛宁称,Sora是基于自己和威廉·皮布尔斯(William Peebles)共同提出的DiT(一个能够直接生成4K分辨率图像的模型)框架设计而成。6月14日,在2024智源大会上,围绕“语言模型是否

采用Sora同款架构,混元文生图大模型宣布开源

5月14日,腾讯宣布其旗下混元文生图大模型全面升级,并对外开源。据了解,这是首个中文原生的类Sora 架构开源模型,填补了国产大模型在文生图先进架构上的空白。目前,主流的文生图开源生态基本围绕英文建设,如Stable Diffusion 等主流开源模型,虽然一定程度支持中文输入,但其核心数据集仍以英

一周热闻回顾(2024年2月18日)

原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517619.shtm2月13日,复旦大学类脑智能科学与技术研究院教授冯建峰、研究员程炜团队联合复旦大学附属华山医院教授郁金泰团队展开联合攻关,采用大规模蛋白质组学数据和人工智能算法发现了预测未来痴呆风险的

ChatGPT发布两周年,OpenAI“官司缠身”

ChatGPT的诞生加速了生成式人工智能领域的融资,但这一趋势的引领者OpenAI却因版权问题和转向营利性公司导致“官司缠身”,两周年生日过得似乎并不顺心。美媒《商业内幕》12月1日报道,据CBInsights的数据,仅2022年-2023年,人工智能领域的融资增长了五倍。生成式人工智能热潮中最大的

30秒让文字变视频-智谱AI发布清影

一段几百字的创意,等待30秒后就可以变成1440×960清晰度的视频。7月26日,在智谱AI开放日活动现场,清影上线智谱清言App。用户输入一段文字后,再选择自己想要风格,如卡通3D、黑白、油画、电影感等,配上智谱清言App自带的音乐,就可以生成AI视频片段。清影文生视频的截图 智谱AI供图除了让文

OpenAI发布语音模型GPTrealtime

8月28日,美国人工智能公司OpenAI发布了其所谓“最先进的语音到语音模型”GPT-realtime,以及配套的Realtime API(实时应用程序接口)。据OpenAI公司介绍,该模型在理解复杂指令、精准调用工具以及生成自然、富有表现力的语音方面表现突出,并在客户服务、教育、个人助理等多种场景

OpenAI对中国地区停止服务,国产大模型“抢客”

OpenAI“断供”,国产大模型“抢客”忙。6月25日,人工智能(AI)巨头OpenAI通过官方推送邮件告知API(应用接口)用户,自7月9日起,将阻止来自未列入支持国家和地区名单的区域的API流量,如要继续使用OpenAI的服务,需要在受支持的区域进行访问。OpenAI API通知邮件OpenAI

这一板块又现涨停潮!减肥药“热辣滚烫”

今日早盘,A股小幅震荡整理,多空双方围绕上证指数2900点展开争夺,沪深300也在3400点附近徘徊。  值得关注的是,两市成交急剧萎缩,观望情绪再次升温。盘面上,Sora概念、减肥药、短剧游戏、ST等板块涨幅居前,半导体、汽车、酿酒、航空等板块跌幅居前。  Sora概念狂飙  ChatGPT热潮未

AI视频生成模型Sora来了

原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517625.shtm

OpenAI开发神秘项目“草莓”提升模型智能

·使用“草莓”模型的目的是使OpenAI的人工智能不仅能够生成查询答案,还能够提前做好充足计划,自主可靠地在互联网上导航,执行OpenAI所说的“深度研究”。推理是人工智能实现或超人类智能水平的关键。OpenAI正在开发代号为“草莓”(Strawberry)的新推理技术。据路透社当地时间7月12日报

升级后的ChatGPT更加人性化

5月13日,OpenAI公布了最新的人工智能模型GPT-4o,该模型通过语音模式可以为ChatGPT提供更多类似人类的互动。升级后的ChatGPT能够实时进行包含文本、音频和视频的对话,同时说话时使用的语调和措辞还能传达出强烈的情感和个性。OpenAI的最新模型提供了更像人类的对话体验。图片来源:J

推动人工智能产业快速发展要把保障数据安全放在突出位置

  美国人工智能公司OpenAI推出GPT Store,掀起AI应用新潮流;谷歌遭遇裁员风波,聚焦AI战略调整;特斯拉创始人埃隆·马斯克起诉OpenAI,指控其背离了初衷,将人工智能用于盈利而非为人类福祉服务……近期,人工智能领域大模型声势高涨,产品与服务推陈出新,但同时也伴随着诸多争议,尤其是在数

OpenAI推出高级语音模式,支持50多种语言

OpenAI正式推出的高级语音模式,已支持50多种语言交流,此外新增五种全新的语音风格供用户选择。值得注意的是,此次更新中并未包含名为“Sky”的语音风格。此前,该语音曾被指与女演员斯嘉丽·约翰逊声音高度相似。9月25日,OpenAI在X平台上宣布,将为ChatGPT的付费用户推出全新的高级语音模式

OpenAI-发布新一代大模型,更擅长推理也更贵

传说中的“草莓”现身,9月12日晚间,OpenAI正式对外发布一款名为o1的新模型,这款模型为该公司下一代 “推理” 模型中的第一个,o为“Orion(猎户座)”,这款模型可以比人类更快地回答更复杂的问题。与以前的模型相比,在编写代码和解决多步骤问题方面做得更好。但它也比此前发布的GPT-4o更贵,

OpenAI推出具备推理能力新AI模型

据ChatGPT制造者美国开放人工智能公司(OpenAI)官网12日报道,该公司已经成功研发出一系列具备推理能力的人工智能(AI)模型,并命名为“OpenAI o1”。这些模型的独特之处在于,其会花更长时间思考问题,再做出响应,就像人类一样。因此,这些模型能对复杂任务进行推理,解决以前模型很难解决的

OpenAI推出具备推理能力新AI模型

据ChatGPT制造者美国开放人工智能公司(OpenAI)官网12日报道,该公司已经成功研发出一系列具备推理能力的人工智能(AI)模型,并命名为“OpenAI o1”。这些模型的独特之处在于,其会花更长时间思考问题,再做出响应,就像人类一样。因此,这些模型能对复杂任务进行推理,解决以前模型很难解决的