清华大学等发布超长时长、高性价比的Sora级视频生成大模型
近日,北京极佳视界科技有限公司联合清华大学自动化系正式发布我国首个超长时长、高性价比的Sora级视频生成大模型“视界一粟 YiSu”。据介绍,“视界一粟 YiSu”可生成1分钟以上的视频,并拥有超大运动、超强表现力等优势;此外,该模型成本更低、速度更快,有望更快实现长视频生成的大规模产品应用。清华大学自动化系和极佳科技的研究人员在视频生成技术路线上有着深入积累和独特理解,在不同技术路线方面拥有丰富经验。“视界一粟 YiSu”是基于团队自研的视频生成大模型技术,融合了LLM(大型语言模型)和扩散模型的自研架构,结合各种路线的优势,在多模态融合、训练效率、推理效率、模型效果等方面均获得较大优化,成为视频生成的最佳方案之一。不过,视频生成并不是“视界一粟 YiSu”的终点,极佳科技认为更重要的目标是走向世界模型。世界模型对自动驾驶、通用机器人等物理世界的通用智能至关重要,在数据生成、闭环仿真、端到端方案等方面都拥有关键的作用。在世界模......阅读全文
AI视频生成模型Sora来了
原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517625.shtm
OpenAI再出王炸,视频生成大模型Sora备受关注
人工智能(AI)领域的巨头OpenAI再次引发关注,其最新推出的视频生成大模型Sora因其出色的逼真度和想象力广受赞誉。相较于传统视频生成领域的平均4秒长度,Sora能够生成长达60秒的视频,这一创新无疑颠覆了行业的常规。 据OpenAI官网介绍,Sora是一种扩散模型,其生成视频的过程从看似
腾讯大模型上线文生视频并宣布开源
据腾讯官微消息,腾讯今日宣布,混元大模型上线并开源文生视频能力。据介绍,该模型参数量为130亿,已经在Hugging Face平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。这也是当前最大的视频开源模型。
生成式法律大模型呼之欲出
原文地址:http://news.sciencenet.cn/htmlnews/2023/7/504932.shtm7月15日,由上海交通大学主办,上海交通大学凯原法学院、智慧法院研究院、人民法院矛盾纠纷源头治理研究基地、上海市法学会公司法务研究会联合承办的“生成式法律大模型专题研讨会”成功举行。
国内首个纯自研视频大模型开放使用
7月30日,曾在今年中关村论坛期间亮相发布的首个国产纯自研视频大模型Vidu宣布在全球范围内上线,向公众提供服务,其开放了文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P。据了解,Vidu能够准确理解并生成提示词中的文字,包括字母、数字等,并能生成文字特效。对于第一
快手“可灵”大模型发布图生视频功能
6月21日,快手的视频生成大模型“可灵”再进化,正式推出图生视频功能,支持用任意静态图像生成5s视频,并且可搭配不同的文本内容,实现丰富的视觉叙事。上传经典油画《蒙娜丽莎》,可灵能够让蒙娜丽莎戴上墨镜,并赋予她灵动的眼神交流,让名画中的人物活灵活现——这正是可灵图生视频功能的生动实践。给自己戴上墨镜
快手“可灵”大模型发布图生视频功能
6月21日,快手的视频生成大模型“可灵”再进化,正式推出图生视频功能,支持用任意静态图像生成5s视频,并且可搭配不同的文本内容,实现丰富的视觉叙事。 上传经典油画《蒙娜丽莎》,可灵能够让蒙娜丽莎戴上墨镜,并赋予她灵动的眼神交流,让名画中的人物活灵活现——这正是可灵图生视频功能的生动实践。 此
生成式AI时代,大模型数据安全如何保障?
在生成式AI(人工智能)时代,数据安全的出路可能会是“用魔法打败魔法”,知识产权保护也可能要提前到token(字符串)层面。4月26日,在2024中关村论坛上,人工智能企业与学者就AI大模型的数据安全问题进行了讨论。中关村论坛数据安全治理与发展论坛现场 澎湃新闻记者 秦盛 摄“在生成式人工智能时代
快手“可灵”大模型将开放图生视频功能
当前,随着国内企业的争相入局,国产文生视频大模型迈入加速发展阶段。记者从快手方面获悉,自上周四向国内用户开放邀测后,截至6月13日,快手旗下文生视频大模型“可灵”的排队申请人数已超7万人。值得关注的是,快手“可灵”目前开放的是文生视频功能,近日还将开放图生视频功能。相比文生视频,图生视频的方式可以减
对标Sora,快手发布文生视频大模型“可灵”
近日,国内头部短视频平台“快手”发布了首个“Sora级”的文生视频大模型“可灵”,并宣布面向用户开放。据快手方面介绍,可灵大模型为快手AI团队自研,采用与Sora相似的技术路线,并结合多项自研技术,能够生成大幅度的合理运动、能够模拟物理世界特性、具备强大的概念组合能力和想象力,效果对标Sora。其生
“能打字就能做视频”,智象多模态大模型升级
12月28日,安徽人工智能产业先导区启动活动在合肥举行,智象未来科技有限公司(以下简称智象未来)作为安徽人工智能产业先导区的零号入驻企业正式落地合肥。活动现场,智象未来正式发布智象多模态生成大模型3.0版。梅涛介绍智象多模态生成大模型3.0 主办方 供图“智象多模态生成大模型3.0版全面升级图像和
清华大学等发布超长时长、高性价比的Sora级视频生成大模型
近日,北京极佳视界科技有限公司联合清华大学自动化系正式发布我国首个超长时长、高性价比的Sora级视频生成大模型“视界一粟 YiSu”。据介绍,“视界一粟 YiSu”可生成1分钟以上的视频,并拥有超大运动、超强表现力等优势;此外,该模型成本更低、速度更快,有望更快实现长视频生成的大规模产品应用。清华大
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
被OpenAI抢先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,以及在硬件方面发布的第六代Tenso
谷歌大模型爆红后被质疑造假,承认演示视频剪辑
科技巨头谷歌的新大模型Gemini一夜爆红,受到市场看好,但有分析指出,谷歌在Gemini的宣传资料中存在夸大宣传的嫌疑。 当地时间12月6日,谷歌宣布推出“最大、最强、最通用”的新大型语言模型Gemini。Gemini将是首个直接在手机上运行的大模型,被应用于谷歌Pixel 8 Pro智能手
一键点、万物动,图生视频大模型来了
原文地址:http://news.sciencenet.cn/htmlnews/2024/3/519252.shtm基于输入模型的图片,只需点击对应区域,加上少量提示词,就可以让图片中原本静态的区域动起来,一键转换成视频。在图生视频大模型的帮助下,图生视频就是这么简单。3月15日,腾讯和清华大学、香
谷歌大模型爆红后被质疑造假,承认演示视频剪辑
科技巨头谷歌的新大模型Gemini一夜爆红,受到市场看好,但有分析指出,谷歌在Gemini的宣传资料中存在夸大宣传的嫌疑。 当地时间12月6日,谷歌宣布推出“最大、最强、最通用”的新大型语言模型Gemini。Gemini将是首个直接在手机上运行的大模型,被应用于谷歌Pixel 8 Pro智能手
港科大团队发布香港生成式人工智能大模型
2月25日,由香港科技大学主导成立的研究机构香港生成式人工智能研发中心(HKGAI)发布生成式人工智能大模型HKGAI V1。据了解,HKGAI V1是中国首个基于人工智能大模型“深度求索”(DeepSeek)进行全参数微调、持续训练产生的大模型。该模型以香港最大的大模型本地知识库为支撑,可识别粤语
面向跨模态遥感数据的生成式预训练大模型发布
以深度学习为代表的人工智能技术已被应用于多种遥感图像解译任务中。遥感数据幅宽大、场景内容复杂,一幅标准景图像往往就可达数十亿像素,覆盖上万平方公里,与自然场景数据存在较大差异。大多数现有的深度神经网络模型是利用自然场景图像预训练的权重来进行初始化,在遥感数据解译任务上的性能和普适性有待进一步提升。中
肿瘤细胞诱导血管生成模型
肿瘤细胞诱导血管生成实验可以用于:把一定数量的肿瘤细胞移植到机体内,诱导宿主局部的血管生成。实验方法原理肿瘤血管生成是指肿瘤微环境诱导的在原有血管基础上生成以毛细血管为主的血管系统,并在肿瘤组织内建立血液循环的过程。肿瘤血管生成与肿瘤微环境密切相关,受多种促血管生成因子和(或)血管生成抑制因子的调节
肿瘤细胞诱导血管生成模型实验
细胞培养技术 实验方法原理 无论原发性肿瘤还是继发性肿瘤,一旦生长直径超过1~2 mm,都会有血管生成。这是由于肿瘤细胞自身可分泌多种生长因子,诱导血管生成。
肿瘤细胞诱导血管生成模型实验
实验方法原理 无论原发性肿瘤还是继发性肿瘤,一旦生长直径超过1~2 mm,都会有血管生成。这是由于肿瘤细胞自身可分泌多种生长因子,诱导血管生成。 实验材料
大模型驱动的基因组环形可视化生成研究获进展
近日,中国科学院计算机网络信息中心科研团队研发出大模型驱动的基因组环形可视化智能生成框架AuraGenome。AuraGenome突破“人工-脚本-静态”传统范式,开创“自然语言-智能体-交互”新模式,能够将基因组数据快速转化为高质量、可交互的可视化结果,并支持全流程的可追溯与复用。在急性髓系白血病
生成式AI下一站:文本转视频
原文地址:http://news.sciencenet.cn/htmlnews/2023/4/498451.shtm 聊天机器人ChatGPT的爆红,让生成式人工智能(AI)成为科技领域的“当红炸子鸡”。除了如今“霸屏”的类似ChatGPT的语言模型之外,生成式AI领域还有大量其他技术:文本生成
视频生成器Sora让人喜忧交加
原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517690.shtm ?一位时尚女性漫步于充满城市标牌的东京街道上,道路两边霓虹灯闪烁,透出阵阵暖意。Sora可根据这一文本内容生成逼真视频(图为视频截图)。图片来源:Sora/OpenAI继
面对大模型应用门槛高-如何大模型发挥更大价值?
原文地址:http://news.sciencenet.cn/htmlnews/2022/9/485510.shtm 人工智能预训练大模型的研发,面临着数据规模大、数据质量参差不齐、模型体积大、训练难度高、算力需求大等一系列挑战。在这样的背景下,如何加速大模型的产业落地,让大模型发挥更大价值?
抢抓大模型行业机会
机器人在7月6日举行的2023世界人工智能大会展会现场进行投篮表演。大会展示包括大模型、芯片、机器人、智能驾驶等领域的科技成果。 新华社记者 方 喆摄 今年以来,自ChatGPT发布后,多家企业先后发布了自己的大模型产品,业内称之为“百模大战”。与此同时,产业界对大模型的关注点也在发生变化,从
AI大模型“拿捏”电池寿命
作为现代生活中不可或缺的能源载体,电池的重要性不言而喻。从清晨唤醒我们的闹钟,到随身携带的手机、平板电脑等智能设备,无一不依赖于电池提供的稳定电力。此外,随着科技的发展,电动汽车、无人机等新兴领域也广泛应用了各类高性能电池,推动了绿色出行和智能科技的进步。因此,电池不仅极大地便利了我们的日常生活,还
用AI生成数据训练AI或导致模型崩溃
《自然》24日正式发表的一篇研究论文指出了一个人工智能(AI)严重问题:用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出,这被称为“模型崩溃”。研究显示,原始内容会在9次迭代以后,变成不相关的“胡言乱语”(演示中一个建筑文本最终变成了野兔的名字),这凸显出使用可靠数据训练
用AI生成数据训练AI或导致模型崩溃
科技日报北京7月25日电 (记者张梦然)《自然》24日正式发表的一篇研究论文指出了一个人工智能(AI)严重问题:用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出,这被称为“模型崩溃”。研究显示,原始内容会在9次迭代以后,变成不相关的“胡言乱语”(演示中一个建筑文本最终变成了野
动物胚胎作为体内抗血管生成药物筛选模型
机体新血管的形成,通常情况下,除了女性月经周期和胚胎发育外,很少发生,但在病理情况下,如损伤治愈、炎症、糖尿病性视网膜病变、银屑病及硬皮病等都有血管生成,特别是实体肿瘤的生长和转移与血管生成密切相关。因此,抑制血管生成可能是抗肿瘤生长和转移的有救途径。建立各种体内血管生成模型及体外检测与血管生成有关