Sora很惊艳,但“实现AGI”还言之过早
原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517680.shtm......阅读全文
AI视频生成模型Sora来了
原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517625.shtm
对标Sora,快手发布文生视频大模型“可灵”
近日,国内头部短视频平台“快手”发布了首个“Sora级”的文生视频大模型“可灵”,并宣布面向用户开放。据快手方面介绍,可灵大模型为快手AI团队自研,采用与Sora相似的技术路线,并结合多项自研技术,能够生成大幅度的合理运动、能够模拟物理世界特性、具备强大的概念组合能力和想象力,效果对标Sora。其生
OpenAI再出王炸,视频生成大模型Sora备受关注
人工智能(AI)领域的巨头OpenAI再次引发关注,其最新推出的视频生成大模型Sora因其出色的逼真度和想象力广受赞誉。相较于传统视频生成领域的平均4秒长度,Sora能够生成长达60秒的视频,这一创新无疑颠覆了行业的常规。 据OpenAI官网介绍,Sora是一种扩散模型,其生成视频的过程从看似
Sora很惊艳,但“实现AGI”言之过早
2月15日,一手缔造了ChatGPT的OpenAI再放“大招”,发布了其第一个文生视频大模型Sora。在官方分享的演示视频中,该模型可以根据用户输入的提示词,生成长达一分钟连贯稳定的高清视频。 虽然Sora还未公开应用,但已引发大量关注。原因无他,OpenAI发布的演示视频一度让人们无法分辨这
谁会成为中国版-Sora?
鏖战一年的“百模大战”还未结束,两个海外AI巨头又给国内科技大厂出了难题。 就在春节假期的尾声,谷歌和OpenAI毫无征兆地放出了各自的 AI新“核武”。 谷歌拿出的新一代多模态大模型Gemini 1.5 Pro,将性能提升到了百万级别,完全秒杀了OpenAI的GPT-4 Turbo,暂居地
视频生成器Sora让人喜忧交加
原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517690.shtm ?一位时尚女性漫步于充满城市标牌的东京街道上,道路两边霓虹灯闪烁,透出阵阵暖意。Sora可根据这一文本内容生成逼真视频(图为视频截图)。图片来源:Sora/OpenAI继
Sora带来的深层次影响值得关注
上个月,OpenAI公司推出了文生视频人工智能(AI)模型Sora。OpenAI展示了Sora利用少量简短文字提示即可创建逼真视频的能力,并提供了包括一位女士在闪烁着霓虹灯的东京街道漫步,以及一只狗在两个窗台之间跳跃的视频片段。Sora所展现的能力和潜力很快引起了科技界、商界和投资界的高度关注。Op
人工智能如何赋能科学研究?他们这样说
4月12日上午,中国科学院深圳先进技术研究院(简称“深圳先进院”)举办“探Sora真相,论AI未来”人工智能沙龙讲座。本次活动邀请到人工智能领域的专家学者围绕人工智能领域前沿技术进行了深入探讨和分析,并讨论了Sora对AI基础技术的推进作用。论坛现场 毛景洋摄“人工智能带来科学研究范式的改变,正在深
快手“可灵”大模型将开放图生视频功能
当前,随着国内企业的争相入局,国产文生视频大模型迈入加速发展阶段。记者从快手方面获悉,自上周四向国内用户开放邀测后,截至6月13日,快手旗下文生视频大模型“可灵”的排队申请人数已超7万人。值得关注的是,快手“可灵”目前开放的是文生视频功能,近日还将开放图生视频功能。相比文生视频,图生视频的方式可以减
当模型足够大,就可以模拟现实世界
今年,OpenAI公司的视频生成模型Sora又火了一把,同时也带火了DiT。纽约大学计算机系助理教授谢赛宁称,Sora是基于自己和威廉·皮布尔斯(William Peebles)共同提出的DiT(一个能够直接生成4K分辨率图像的模型)框架设计而成。6月14日,在2024智源大会上,围绕“语言模型是否
让Sora提速10多倍,南开团队开源MDTv2
南开新闻网讯(记者 高雨桐)2024年伊始,Open AI(美国开放人工智能研究中心)公司发布首个AI(人工智能)文字生成视频大模型Sora,通过计算机视觉技术模拟现实世界的动态变化,可以一次生成60秒流畅逼真的视频,被视为继ChatGPT之后人工智能技术的又一重大突破。但从实测Sora的一些“翻车
清华大学等发布超长时长、高性价比的Sora级视频生成大模型
近日,北京极佳视界科技有限公司联合清华大学自动化系正式发布我国首个超长时长、高性价比的Sora级视频生成大模型“视界一粟 YiSu”。据介绍,“视界一粟 YiSu”可生成1分钟以上的视频,并拥有超大运动、超强表现力等优势;此外,该模型成本更低、速度更快,有望更快实现长视频生成的大规模产品应用。清华大
南开新成果可让Sora核心组件训练提速10多倍
2024年伊始,人工智能大模型ChatGPT母公司Open AI发布首个人工智能文字生成视频大模型Sora,通过计算机视觉技术模拟现实世界的动态变化,可以一次生成60秒流畅逼真的视频,被视为继ChatGPT之后人工智能技术的又一重大突破。但从实测Sora的一些“翻车”视频中可以看出,AI仍然存在着无
4日直播|Sora来了中国AI如何迎接挑战
原文地址:http://news.sciencenet.cn/htmlnews/2024/3/518339.shtm 直播时间:3月4日(周一)19:00——20:00 直播平台: (中国科学报微博直播间链接) 中国科学报微博 【主持人简介】 赵广立
辨识AI视频越来越难?办法不是没有
原文地址:http://news.sciencenet.cn/htmlnews/2024/3/518255.shtm“Sora之后,眼见不一定为实了。”上面这句感慨,恐怕许多人都感同身受。只需输入一段文字描述,Sora就能生成一段长达一分钟、画面逼真、稳定连贯的高清视频。由于画面过于真实,人们仅凭肉
Sora取名源自日语?日本加速布局AI产业
原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517829.shtm
中国科学家提出用先验知识让AI模型更懂物理规律
美国人工智能科技公司OpenAI开发的视频生成大模型产品Sora,因其能利用大量视觉数据生成逼真图像和视频广受赞誉,但它却被认为仍未掌握物理规律,比如很难准确模拟重力作用和玻璃破碎等。面对这一问题,将人类知识融入深度学习模型是一个潜在解决方案。不过,帮助人工智能(AI)评估不同规则和知识是一项棘手的
Sora向好莱坞发起冲击
图片来源:物理学家组织网据美国《洛杉矶时报》网站近日报道,OpenAI公司正与包括资深经纪人和电影工作室的高管等在内的美国好莱坞娱乐业人士密切接触,推销其最新文字转视频技术Sora。对于AI这个“闯入者”,娱乐业几家欢乐几家愁。有人积极拥抱AI的到来,并与其密切合作;但也有人心怀警惕,担心AI会砸掉
OpenAI又失大将!Sora研发负责人跳槽谷歌
OpenAI再走一员大将。当地时间10月4日,人工智能(AI)巨头OpenAI的文生视频大模型Sora团队研发负责人蒂姆·布鲁克斯(Tim Brooks)宣布离职,加入谷歌DeepMind。Tim Brooks宣布加入谷歌布鲁克斯表示,将在谷歌继续从事视频生成和世界模拟器方面的工作,“我迫不及待地想
大模型又整活,照片也能唱歌说话
文 | 《中国科学报》记者 赵广立不得了,沉睡两千多年的秦陵兵马俑居然“唱”起秦腔来了!在类似的几段视频中,兵马俑不仅能开口唱歌,就连面部表情也惟妙惟肖;仔细看,还能看到他的喉结在动、胸腔共鸣……不仅有兵马俑,还有蒙娜丽莎、奥黛丽·赫本、孔子、鲁迅……只要一张照片和一段音频,他们就能开口说话、唱歌、
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
被OpenAI抢先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,以及在硬件方面发布的第六代Tenso
这一板块又现涨停潮!减肥药“热辣滚烫”
今日早盘,A股小幅震荡整理,多空双方围绕上证指数2900点展开争夺,沪深300也在3400点附近徘徊。 值得关注的是,两市成交急剧萎缩,观望情绪再次升温。盘面上,Sora概念、减肥药、短剧游戏、ST等板块涨幅居前,半导体、汽车、酿酒、航空等板块跌幅居前。 Sora概念狂飙 ChatGPT热潮未
谷歌I/O大会提“AI”121次,发布十余项更新及新品
·本次开发者全程两个小时,谷歌CEO共提及“AI”121次,此次开发者大会,谷歌将搜索业务做了最彻底的AI改造,还更新升级了Gemini1.5Pro版本,同时推出Gemini1.5Flash轻量化小模型。此外,推出自称效果超过Sora的生成视频模型Veo。北京时间5月15日凌晨,谷歌年度开发者I/O
30秒让文字变视频-智谱AI发布清影
一段几百字的创意,等待30秒后就可以变成1440×960清晰度的视频。7月26日,在智谱AI开放日活动现场,清影上线智谱清言App。用户输入一段文字后,再选择自己想要风格,如卡通3D、黑白、油画、电影感等,配上智谱清言App自带的音乐,就可以生成AI视频片段。清影文生视频的截图 智谱AI供图除了让文
海外AI领域发展迅猛,建议关注三条关键主线
天风证券(601162)发布研究报告称,对比海外,看好国内大企业深度使用大模型赋能旗下应用,也看好未来算力继续高增长,建议关注AI多模态、AI应用及华为链+三条主线。 (1)AI多模态:万兴科技(300624)(300624.SZ)、美图公司(01357)(与海外组联合覆盖)、易点天
人工智能产品竞争日趋激烈
北京时间5月15日凌晨,谷歌举办了年度I/O开发者大会。正如外界预期,人工智能成为这次大会的核心内容。根据发布会官方统计,两个小时的开发者大会共提及“人工智能(AI)”121次。会上,谷歌发布了众多有关AI的产品和服务,AI“全家桶”的创新性如何,引发外界关注。 具体来看,谷歌对旗下的AI大模
推动人工智能产业快速发展要把保障数据安全放在突出位置
美国人工智能公司OpenAI推出GPT Store,掀起AI应用新潮流;谷歌遭遇裁员风波,聚焦AI战略调整;特斯拉创始人埃隆·马斯克起诉OpenAI,指控其背离了初衷,将人工智能用于盈利而非为人类福祉服务……近期,人工智能领域大模型声势高涨,产品与服务推陈出新,但同时也伴随着诸多争议,尤其是在数
采用Sora同款架构,混元文生图大模型宣布开源
5月14日,腾讯宣布其旗下混元文生图大模型全面升级,并对外开源。据了解,这是首个中文原生的类Sora 架构开源模型,填补了国产大模型在文生图先进架构上的空白。目前,主流的文生图开源生态基本围绕英文建设,如Stable Diffusion 等主流开源模型,虽然一定程度支持中文输入,但其核心数据集仍以英
“视频精灵”,让AI敢为人师
近日,美国斯坦福大学一个研究团队在预印本论文网站arXiv上发布论文。研究人员将“视频精灵”(VideoSprites)技术应用在网球赛中,建立一种行为模型并将其与基于图像的渲染结合,构建出可交互控制的视频,来模仿顶级网球职业选手的风格和表现。 研究者认为,该系统具备生成逼真游戏视频的能力,
美AI巨头被控秘密“侵吞”数据
人工智能(AI)迅速发展离不开对模型的训练。然而,高质量数据短缺以及部分领域封闭式的数据生态似乎成为AI发展的掣肘。据多家外媒报道,OpenAI、谷歌和Meta等公司正寻求在线信息来训练最新的AI系统。但他们无视既定政策,蓄意改变规则,并试图规避版权法。收集数据“走捷径”英国《泰晤士报》近日刊文指出