OpenAI再出王炸,视频生成大模型Sora备受关注
人工智能(AI)领域的巨头OpenAI再次引发关注,其最新推出的视频生成大模型Sora因其出色的逼真度和想象力广受赞誉。相较于传统视频生成领域的平均4秒长度,Sora能够生成长达60秒的视频,这一创新无疑颠覆了行业的常规。 据OpenAI官网介绍,Sora是一种扩散模型,其生成视频的过程从看似静态噪声的视频开始,通过逐步消除噪声来转换生成视频。这一模型具备生成完整视频或扩展已有视频的能力,确保视频主题在暂时离开视野时仍保持一致。此外,Sora还借鉴了GPT模型,采用Transformer架构,并建立在DALL·E和GPT模型的研究基础上,利用DALL·E 3的重述技术为视觉训练数据生成高度描述性的标题,从而更精准地遵循用户的文本指令。 OpenAI对Sora寄予厚望,认为它是能够理解和模拟现实世界的模型基础,并相信这一功能将成为实现通用人工智能(AGI)的重要里程碑。这一观点得到了业界的广泛认同,甚至有行业观察者认为AG......阅读全文
辨识AI视频越来越难?办法不是没有
原文地址:http://news.sciencenet.cn/htmlnews/2024/3/518255.shtm“Sora之后,眼见不一定为实了。”上面这句感慨,恐怕许多人都感同身受。只需输入一段文字描述,Sora就能生成一段长达一分钟、画面逼真、稳定连贯的高清视频。由于画面过于真实,人们仅凭肉
OpenAI选择“闭源”,为何反而火了“开源”
原文地址:http://news.sciencenet.cn/htmlnews/2023/12/514533.shtm
微软正将OpenAI-ChatGPT插件引入Windows-11
ChatGPT从其采集的数据中提取知识,最晚可以追溯到2021年9月--直到现在。有了插件的支持,ChatGPT现在可以访问互联网,像浏览器一样导航到网站,并真实地采集信息。OpenAI正在建立一个ChatGPT版本的应用商店,而微软现在正将这些插件带到Windows 11。ChatGPT插件将通过
邮件曝光-OpenAI正式回击马斯克
3月5日,OpenAI在官网发布博文称,公司的使命是确保AGI能够造福全人类,并驳斥了马斯克的所有指控。Open AI这篇博文公开披露OpenAI和马斯克的关系,并将马斯克与OpenAI三位重要创始人奥尔特曼(Sam Altman)、格雷格•布罗克曼(Greg Brockman)、以及伊尔亚•苏茨克
OpenAI又地震:ChatGPT负责人离职
OpenAI内部仍动荡不安,ChatGPT的两位重要负责人选择离开。8月6日,AI(人工智能)巨头OpenAI联合创始人约翰·舒尔曼(John Schulman)在X(推特)发文表示,将离开OpenAI加入另一家AI初创公司Anthropic(OpenAI的竞争对手)。舒尔曼9年前在OpenAI成立
国产-AI-大模型-DeepSeek-升级,性能对标-OpenAI-o1-正式版
1 月 20 日,国产 AI 大模型 DeepSeek 正式发布新版本 DeepSeek-R1,并同步开源模型权重。开发者表示,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,DeepSeek-
GPT4o为OpenAI开启超级入口
·基于ChatGPT或GPT-4o,未来人类获得信息的方式很可能会改变,GPT-4o或为OpenAI开启了一个超级入口,这可能会对谷歌带来影响。接下来,OpenAI需要判断的是在产品上的极致体验是否是刚需。“GPT-4o在交互模式上是一个巨大进步。”5月14日,蚂蚁集团副总裁、NextEvo负责人徐
一周热闻回顾(2024年2月18日)
原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517619.shtm2月13日,复旦大学类脑智能科学与技术研究院教授冯建峰、研究员程炜团队联合复旦大学附属华山医院教授郁金泰团队展开联合攻关,采用大规模蛋白质组学数据和人工智能算法发现了预测未来痴呆风险的
升级后的ChatGPT更加人性化
5月13日,OpenAI公布了最新的人工智能模型GPT-4o,该模型通过语音模式可以为ChatGPT提供更多类似人类的互动。升级后的ChatGPT能够实时进行包含文本、音频和视频的对话,同时说话时使用的语调和措辞还能传达出强烈的情感和个性。OpenAI的最新模型提供了更像人类的对话体验。图片来源:J
这一板块又现涨停潮!减肥药“热辣滚烫”
今日早盘,A股小幅震荡整理,多空双方围绕上证指数2900点展开争夺,沪深300也在3400点附近徘徊。 值得关注的是,两市成交急剧萎缩,观望情绪再次升温。盘面上,Sora概念、减肥药、短剧游戏、ST等板块涨幅居前,半导体、汽车、酿酒、航空等板块跌幅居前。 Sora概念狂飙 ChatGPT热潮未
OpenAI推出高级语音模式,支持50多种语言
OpenAI正式推出的高级语音模式,已支持50多种语言交流,此外新增五种全新的语音风格供用户选择。值得注意的是,此次更新中并未包含名为“Sky”的语音风格。此前,该语音曾被指与女演员斯嘉丽·约翰逊声音高度相似。9月25日,OpenAI在X平台上宣布,将为ChatGPT的付费用户推出全新的高级语音模式
ChatGPT发布两周年,OpenAI“官司缠身”
ChatGPT的诞生加速了生成式人工智能领域的融资,但这一趋势的引领者OpenAI却因版权问题和转向营利性公司导致“官司缠身”,两周年生日过得似乎并不顺心。美媒《商业内幕》12月1日报道,据CBInsights的数据,仅2022年-2023年,人工智能领域的融资增长了五倍。生成式人工智能热潮中最大的
OpenAI与苹果合作:“界面”的重要性
近日,苹果在资本市场触底反弹,显示王者归来,并且带动科技股一起补涨。6月10日,苹果宣布与OpenAI构建合作伙伴关系。苹果用户通过呼唤Siri语音助手就能使用ChatGPT,无需支付额外费用就可以在全系统的写作工具中调用ChatGPT,使用其聊天机器人、图像生成等功能。资本市场的反应肯定了苹果与O
OpenAI正慢慢转型为医疗保健公司
最近,OpenAI与WHOOP合作推出了由GPT-4驱动的个性化健康和健身教练。WHOOP Coach为各种健身和健康相关问题提供答案。 例如,它可以解决诸如“我有史以来最低的静息心率是多少?”或“什么样的每周锻炼计划可以帮助我实现目标?”之类的问题,同时根据每个人的独特身体和目标提供个性化指
马斯克起诉OpenAI-要求其共享技术
原文地址:http://news.sciencenet.cn/htmlnews/2024/3/518282.shtm 中新社旧金山3月1日电 美国企业家埃隆·马斯克当地时间2月29日在旧金山高等法院起诉美国人工智能公司“开放人工智能研究中心”(OpenAI)及其首席执行官萨姆·奥尔特曼等人,称其
OpenAI将屏蔽中国开发者API访问?
6月25日,有部分国外开发者在推特、Reddit等海外社交网站上称收到了OpenAI的官方邮件,被告知OpenAI计划从7月9日开始将采取额外措施,阻止来自不在其支持的国家和地区列表中的区域的API(应用程序编程接口)流量。要继续使用OpenAI的服务,需要在受支持的区域中访问该服务。网友发布的截图
OpenAI重磅推出SearchGPT,能否重新定义搜索?
2024年7月25日,OpenAI正在测试一种新的AI搜索功能原型——SearchGPT。这一原型旨在结合强大的AI模型与实时网络信息,为用户提供快速、及时的答案,并附上清晰且相关的来源链接。 加入等候名单 OpenAI将这一原型开放给一小部分用户和出版商,以获取反馈。尽管这一原型是暂时的,
给“深度伪造”这匹“野马”拴上缰绳
利用生成式人工智能(AI)制造的虚假图片、音频和视频信息等“深度伪造”内容正在快速传播,被用来骚扰他人、诈骗金钱,甚至干扰选举。 英国《新科学家》网站近日报道,美国OpenAI公司的文本—视频模型Sora横空出世,让人们能更快捷、更廉价地制作出视频,事实与虚构的分界线也愈加模糊,进一步加剧了人
GPT4很强大但仍有诸多谜团,OpenAI选择只透露这么多
“(该模型) 仍然存在很多问题和错误……但你确实可以看到微积分或法律等技能的飞跃,从某些领域的非常糟糕到相对于人类来说实际上相当好。 ”从长远来看,OpenAI计划构建和部署可以处理多种媒体的系统,包括声音和视频。“我们可以采用所有这些通用知识技能,并将它们传播到各种不同领域。这将技术带入了一个全新
GPT5在路上了?OpenAI透露开始训练下一个前沿模型
中新网5月29日电(中新财经记者 吴涛)“OpenAI 最近开始训练其下一个前沿模型,我们预计最终的系统将使我们在通往AGI的道路上更上一层楼。”近日,OpenAI对外公布,OpenAI 董事会成立了安全与保障委员会,并透露出下一个模型的消息。目前尚不能确定该模型是否为传言中的GPT-5,毕竟命名权
清华大学等发布超长时长、高性价比的Sora级视频生成大模型
近日,北京极佳视界科技有限公司联合清华大学自动化系正式发布我国首个超长时长、高性价比的Sora级视频生成大模型“视界一粟 YiSu”。据介绍,“视界一粟 YiSu”可生成1分钟以上的视频,并拥有超大运动、超强表现力等优势;此外,该模型成本更低、速度更快,有望更快实现长视频生成的大规模产品应用。清华大
中国科学家提出用先验知识让AI模型更懂物理规律
美国人工智能科技公司OpenAI开发的视频生成大模型产品Sora,因其能利用大量视觉数据生成逼真图像和视频广受赞誉,但它却被认为仍未掌握物理规律,比如很难准确模拟重力作用和玻璃破碎等。面对这一问题,将人类知识融入深度学习模型是一个潜在解决方案。不过,帮助人工智能(AI)评估不同规则和知识是一项棘手的
前OpenAI首席科学家成立新公司
从OpenAI离开一个月后,伊尔亚成立了一家公司。6月20日,OpenAI联合创始人、前首席科学家伊尔亚·苏茨克维(Ilya Sutskever)在社交平台X上发文宣布成立新公司SSI(safe superintelligence,安全超级智能)。他表示新公司将致力于追求安全超级智能,“只有一个重点
为了拥有更多数据,OpenAI牵手“美国贴吧”
·Reddit曾与谷歌母公司Alphabet合作,将其内容用于训练谷歌AI模型,如今与OpenAI合作,将Reddit的内容引入ChatGPT,出售数据用于训练模型被视为Reddit广告业务之外的一个重要收入来源。当地时间5月16日,OpenAI宣布和社交平台、“美国贴吧”Reddit合作,Open
OpenAI发布新品GPT4o,功能秒杀Siri
·GPT-4o可以对音频、视觉和文本进行实时推理,在232毫秒内响应音频输入,与人类在对话中的响应时间相似。·GPT-4o的文本和图像功能开始在ChatGPT中免费推出,音频模式存在各种新风险而未公开,未来音频输出将仅限于选定的预设声音,并要遵守安全政策。GPT-4o生成图像:机器人正在输入日志条目
OpenAI公布2025年将发布的技术产品:AGI、Agents、GPT4o升级版
OpenAI首席执行官萨姆·奥特曼(Sam Altman)12月31日凌晨公布了2025年即将发布的技术产品。分别是:AGI(通用人工智能)、Agents(智能体)、更好的GPT-4o升级版、更好的记忆存储、更好的上下文窗口、“Grow up mode”(成人模式)、深度研究特色功能、更好的Sora
从ChatGPT看“从0到1”和“从1到100”
■吕乃基 转眼间,OpenAI发布ChatGPT已经一年多,但围绕其展开的话题仍然很“热”。 “从0到1”和“从1到100”是近年来常见于媒体的表述,前者指原始创新,后者意为原始创新落到实处并在各领域得到广泛应用。然而,究竟何为“1”?OpenAI发布ChatGPT前后的过程,其主线即“从0
从ChatGPT看“从0到1”和“从1到100”
转眼间,OpenAI发布ChatGPT已经一年多,但围绕其展开的话题仍然很“热”。 “从0到1”和“从1到100”是近年来常见于媒体的表述,前者指原始创新,后者意为原始创新落到实处并在各领域得到广泛应用。然而,究竟何为“1”?OpenAI发布ChatGPT前后的过程,其主线即“从0到100”,
挑战英伟达!OpenAI接洽博通联合开发AI芯片
为了减轻对英伟达的依赖,OpenAI一直在推进自研芯片计划。7月19日,据外媒报道,由公司CEO山姆·奥特曼(Sam Altman)牵头,OpenAI正与包括博通(Broadcom Inc.)在内的半导体设计公司就开发新芯片进行洽谈,以减轻对英伟达的依赖并加强供应链。一位知情人士表示:“人工智能的限
OpenAI核心安全团队解散,还签了封口协议
随着首席科学家伊尔亚的离开,OpenAI核心安全团队“超级对齐”被曝解散。同时,一份“封口协议”又把OpenAI推上风口浪尖。5月14日,OpenAI联合创始人、首席科学家伊尔亚·苏茨克维(Ilya Sutskever)宣布离职,几小时后,超级对齐团队负责人杨·莱克(Jan Leike)也宣布离职。