OpenAI再出王炸，视频生成大模型Sora备受关注

发布时间：2024-02-19 09:35 原文链接： OpenAI再出王炸，视频生成大模型Sora备受关注

　　人工智能（AI）领域的巨头OpenAI再次引发关注，其最新推出的视频生成大模型Sora因其出色的逼真度和想象力广受赞誉。相较于传统视频生成领域的平均4秒长度，Sora能够生成长达60秒的视频，这一创新无疑颠覆了行业的常规。

　　据OpenAI官网介绍，Sora是一种扩散模型，其生成视频的过程从看似静态噪声的视频开始，通过逐步消除噪声来转换生成视频。这一模型具备生成完整视频或扩展已有视频的能力，确保视频主题在暂时离开视野时仍保持一致。此外，Sora还借鉴了GPT模型，采用Transformer架构，并建立在DALL·E和GPT模型的研究基础上，利用DALL·E 3的重述技术为视觉训练数据生成高度描述性的标题，从而更精准地遵循用户的文本指令。

　　OpenAI对Sora寄予厚望，认为它是能够理解和模拟现实世界的模型基础，并相信这一功能将成为实现通用人工智能（AGI）的重要里程碑。这一观点得到了业界的广泛认同，甚至有行业观察者认为AGI的实现可能因此从10年缩短到1年。

　　事实上，Sora并非首个尝试AI视频生成的模型。在此之前，谷歌发布了VideoPoet模型，而Meta则推出了Emu模型。此外，Pika等文生视频软件也在市场上掀起了一股AI视频应用的热潮。然而，Sora的出现无疑为这一领域带来了新的突破。

　　市场分析师普遍认为，Sora及类似产品将在短期内大幅提升图像和短视频的制作效率，改变创意生产及营销工作流，提升短视频产品生产力。对于更复杂的长视频和游戏，虽然模型目前还无法很好地理解因果关系和其他技术难点，但仍可以为美术灵感提供支持。从中长期来看，Sora及同类产品将深度参与信息生产和分发两大环节的变革，使得专业生产内容（PGC）广泛采用AI工具辅助生产，同时用户生产内容（UGC）也将借助AI工具逐步替代PGC。这一过程中，AI生成视频工具的商业化将加速，尽管Sora尚未公布收费标准，但预计其定价将相对较高。

　　从投资角度来看，Sora的出现为投资者提供了新的关注点。在下游应用侧，相关受益细分行业包括视频美化、广告营销、短剧、游戏、办公软件等。具体投资标的方面，建议关注美图公司、中文在线、阅文集团、金山软件、三人行等。在上游需求方面，算法和算力方面的公司如英伟达等也值得关注。

　　值得注意的是，技术专家普遍认为，未来的技术突破方向将聚焦于多模态技术。只有真正掌握和应用好多模态AI能力，才能打通物理世界和数字世界的壁垒，实现与物理世界最自然的交互。因此，尽管AI视频生成是多模态技术路径中的一个方向，但多模态领域的更大突破仍在等待。

　　对于A股公司而言，已有十多家公司提前布局多模态大模型或对AI视频相关研发。例如，海康威视和大华股份都在视觉大模型和多模态大模型研发方面取得了进展。这些公司的早期布局有望在未来的技术浪潮中获得先机。

　　总体来说，Sora的出现标志着AI视频生成技术的新里程碑，为相关行业带来了前所未有的机遇和挑战。投资者、企业和研究者都需要密切关注这一领域的发展，以便在未来的技术变革中抢占先机。

其他网友还关注过

更多与 OpenAI再出王炸，视频生成大模型Sora备受关注相关的新闻

OpenAI再出王炸，视频生成大模型Sora备受关注

其他网友还关注过

赛默飞宣布与OpenAI合作加速药物研发进程

赛默飞宣布与OpenAI合作加速药物研发进程

OpenAI发布语音模型GPTrealtime

OpenAI发布语音模型GPTrealtime

最新人工智能模型GPT5发布

最新人工智能模型GPT5发布

国家能源集团发布全球首个千亿级发电行业大模型“擎源”

中国首个海洋领域开源大模型OceanGPT正式发布

智能识别新模型可减少机器采摘菠萝损伤率

精准诊断消化道罕见病的医学多模态大模型发布