发布时间:2024-02-19 09:35 原文链接: OpenAI再出王炸,视频生成大模型Sora备受关注

  人工智能(AI)领域的巨头OpenAI再次引发关注,其最新推出的视频生成大模型Sora因其出色的逼真度和想象力广受赞誉。相较于传统视频生成领域的平均4秒长度,Sora能够生成长达60秒的视频,这一创新无疑颠覆了行业的常规。

  据OpenAI官网介绍,Sora是一种扩散模型,其生成视频的过程从看似静态噪声的视频开始,通过逐步消除噪声来转换生成视频。这一模型具备生成完整视频或扩展已有视频的能力,确保视频主题在暂时离开视野时仍保持一致。此外,Sora还借鉴了GPT模型,采用Transformer架构,并建立在DALL·E和GPT模型的研究基础上,利用DALL·E 3的重述技术为视觉训练数据生成高度描述性的标题,从而更精准地遵循用户的文本指令。

  OpenAI对Sora寄予厚望,认为它是能够理解和模拟现实世界的模型基础,并相信这一功能将成为实现通用人工智能(AGI)的重要里程碑。这一观点得到了业界的广泛认同,甚至有行业观察者认为AGI的实现可能因此从10年缩短到1年。

  事实上,Sora并非首个尝试AI视频生成的模型。在此之前,谷歌发布了VideoPoet模型,而Meta则推出了Emu模型。此外,Pika等文生视频软件也在市场上掀起了一股AI视频应用的热潮。然而,Sora的出现无疑为这一领域带来了新的突破。

  市场分析师普遍认为,Sora及类似产品将在短期内大幅提升图像和短视频的制作效率,改变创意生产及营销工作流,提升短视频产品生产力。对于更复杂的长视频和游戏,虽然模型目前还无法很好地理解因果关系和其他技术难点,但仍可以为美术灵感提供支持。从中长期来看,Sora及同类产品将深度参与信息生产和分发两大环节的变革,使得专业生产内容(PGC)广泛采用AI工具辅助生产,同时用户生产内容(UGC)也将借助AI工具逐步替代PGC。这一过程中,AI生成视频工具的商业化将加速,尽管Sora尚未公布收费标准,但预计其定价将相对较高。

  从投资角度来看,Sora的出现为投资者提供了新的关注点。在下游应用侧,相关受益细分行业包括视频美化、广告营销、短剧、游戏、办公软件等。具体投资标的方面,建议关注美图公司、中文在线、阅文集团、金山软件、三人行等。在上游需求方面,算法和算力方面的公司如英伟达等也值得关注。

  值得注意的是,技术专家普遍认为,未来的技术突破方向将聚焦于多模态技术。只有真正掌握和应用好多模态AI能力,才能打通物理世界和数字世界的壁垒,实现与物理世界最自然的交互。因此,尽管AI视频生成是多模态技术路径中的一个方向,但多模态领域的更大突破仍在等待。

  对于A股公司而言,已有十多家公司提前布局多模态大模型或对AI视频相关研发。例如,海康威视和大华股份都在视觉大模型和多模态大模型研发方面取得了进展。这些公司的早期布局有望在未来的技术浪潮中获得先机。

  总体来说,Sora的出现标志着AI视频生成技术的新里程碑,为相关行业带来了前所未有的机遇和挑战。投资者、企业和研究者都需要密切关注这一领域的发展,以便在未来的技术变革中抢占先机。


相关文章

赛默飞宣布与OpenAI合作加速药物研发进程

近日,赛默飞世尔科技公司宣布与OpenAI达成战略合作,借助其先进的人工智能技术,推动科学创新和药物开发的进程。此次合作将OpenAI的应用程序编程接口(API)整合到赛默飞世尔的核心业务领域,包括产......

赛默飞宣布与OpenAI合作加速药物研发进程

近日,赛默飞世尔科技公司宣布与OpenAI达成战略合作,借助其先进的人工智能技术,推动科学创新和药物开发的进程。此次合作将OpenAI的应用程序编程接口(API)整合到赛默飞世尔的核心业务领域,包括产......

OpenAI发布语音模型GPTrealtime

8月28日,美国人工智能公司OpenAI发布了其所谓“最先进的语音到语音模型”GPT-realtime,以及配套的Realtime API(实时应用程序接口)。据OpenAI公司介绍,该模型......

OpenAI发布语音模型GPTrealtime

8月28日,美国人工智能公司OpenAI发布了其所谓“最先进的语音到语音模型”GPT-realtime,以及配套的Realtime API(实时应用程序接口)。据OpenAI公司介绍,该模型......

最新人工智能模型GPT5发布

美国开放人工智能研究中心(OpenAI)7日发布其最新人工智能模型GPT-5。据OpenAI官网介绍,这是迄今为止该机构推出的最强大的人工智能系统,在各类基准测试中超越了先前的模型,在编程、数学、写作......

最新人工智能模型GPT5发布

美国开放人工智能研究中心(OpenAI)7日发布其最新人工智能模型GPT-5。据OpenAI官网介绍,这是迄今为止该机构推出的最强大的人工智能系统,在各类基准测试中超越了先前的模型,在编程、数学、写作......

国家能源集团发布全球首个千亿级发电行业大模型“擎源”

6月28日,国家能源集团在京举行发布会,正式发布全球首个千亿级发电行业大模型——“擎源”。该模型构建了覆盖安全环保、电力交易、产调中枢、设备检修全链条的智能决策体系,实现电力全场景智慧化升级、模型自主......

中国首个海洋领域开源大模型OceanGPT正式发布

近日,中国首个海洋领域开源大模型OceanGPT(沧渊)在杭州正式发布。该大模型由海洋精准感知技术全国重点实验室(浙江大学)牵头研发,具备基础的海洋专业知识问答,以及声呐图像、海洋观测图等海洋特色多模......

智能识别新模型可减少机器采摘菠萝损伤率

近日,中国热带农业科学院南亚热带作物研究所旱作农业工程团队在基于混合监督学习的菠萝智能识别算法方面取得新进展。该团队设计了一个基于混合监督学习(MIset)的掩蔽自关注实例分割网络,以快速提取菠萝的位......

精准诊断消化道罕见病的医学多模态大模型发布

近日,首个可精准诊断罕见病的医学影像多模态大模型矩阵“明岐”正式亮相。当天,由上海交通大学主办,上海交通大学计算机学院(网络空间安全学院)、上海交通大学国际与公共事务学院、健康长三角研究院共同承办的“......