国内首个纯自研视频大模型开放使用

7月30日,曾在今年中关村论坛期间亮相发布的首个国产纯自研视频大模型Vidu宣布在全球范围内上线,向公众提供服务,其开放了文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P。据了解,Vidu能够准确理解并生成提示词中的文字,包括字母、数字等,并能生成文字特效。对于第一人称、延时摄影等镜头语言,也能精准表达,用户只需要细化自己所输入的提示词,就能大幅提升视频的可控性。同时,Vidu支持大幅度、精准的动作生成,保持高流畅、高动态的画面效果。此外,在“图生视频”板块中,Vidu上线了角色一致性功能,用户可以上传人像图或者自定义的角色图,然后通过文字描述指定该角色在任意场景中做出任意动作。......阅读全文

腾讯大模型上线文生视频并宣布开源

据腾讯官微消息,腾讯今日宣布,混元大模型上线并开源文生视频能力。据介绍,该模型参数量为130亿,已经在Hugging Face平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。这也是当前最大的视频开源模型。

国内首个纯自研视频大模型开放使用

7月30日,曾在今年中关村论坛期间亮相发布的首个国产纯自研视频大模型Vidu宣布在全球范围内上线,向公众提供服务,其开放了文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P。据了解,Vidu能够准确理解并生成提示词中的文字,包括字母、数字等,并能生成文字特效。对于第一

快手“可灵”大模型发布图生视频功能

6月21日,快手的视频生成大模型“可灵”再进化,正式推出图生视频功能,支持用任意静态图像生成5s视频,并且可搭配不同的文本内容,实现丰富的视觉叙事。上传经典油画《蒙娜丽莎》,可灵能够让蒙娜丽莎戴上墨镜,并赋予她灵动的眼神交流,让名画中的人物活灵活现——这正是可灵图生视频功能的生动实践。给自己戴上墨镜

快手“可灵”大模型发布图生视频功能

  6月21日,快手的视频生成大模型“可灵”再进化,正式推出图生视频功能,支持用任意静态图像生成5s视频,并且可搭配不同的文本内容,实现丰富的视觉叙事。  上传经典油画《蒙娜丽莎》,可灵能够让蒙娜丽莎戴上墨镜,并赋予她灵动的眼神交流,让名画中的人物活灵活现——这正是可灵图生视频功能的生动实践。  此

对标Sora,快手发布文生视频大模型“可灵”

近日,国内头部短视频平台“快手”发布了首个“Sora级”的文生视频大模型“可灵”,并宣布面向用户开放。据快手方面介绍,可灵大模型为快手AI团队自研,采用与Sora相似的技术路线,并结合多项自研技术,能够生成大幅度的合理运动、能够模拟物理世界特性、具备强大的概念组合能力和想象力,效果对标Sora。其生

快手“可灵”大模型将开放图生视频功能

当前,随着国内企业的争相入局,国产文生视频大模型迈入加速发展阶段。记者从快手方面获悉,自上周四向国内用户开放邀测后,截至6月13日,快手旗下文生视频大模型“可灵”的排队申请人数已超7万人。值得关注的是,快手“可灵”目前开放的是文生视频功能,近日还将开放图生视频功能。相比文生视频,图生视频的方式可以减

“能打字就能做视频”,智象多模态大模型升级

12月28日,安徽人工智能产业先导区启动活动在合肥举行,智象未来科技有限公司(以下简称智象未来)作为安徽人工智能产业先导区的零号入驻企业正式落地合肥。活动现场,智象未来正式发布智象多模态生成大模型3.0版。梅涛介绍智象多模态生成大模型3.0  主办方 供图“智象多模态生成大模型3.0版全面升级图像和

全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型

被OpenAI抢先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,以及在硬件方面发布的第六代Tenso

谷歌大模型爆红后被质疑造假,承认演示视频剪辑

  科技巨头谷歌的新大模型Gemini一夜爆红,受到市场看好,但有分析指出,谷歌在Gemini的宣传资料中存在夸大宣传的嫌疑。  当地时间12月6日,谷歌宣布推出“最大、最强、最通用”的新大型语言模型Gemini。Gemini将是首个直接在手机上运行的大模型,被应用于谷歌Pixel 8 Pro智能手

一键点、万物动,图生视频大模型来了

原文地址:http://news.sciencenet.cn/htmlnews/2024/3/519252.shtm基于输入模型的图片,只需点击对应区域,加上少量提示词,就可以让图片中原本静态的区域动起来,一键转换成视频。在图生视频大模型的帮助下,图生视频就是这么简单。3月15日,腾讯和清华大学、香

谷歌大模型爆红后被质疑造假,承认演示视频剪辑

  科技巨头谷歌的新大模型Gemini一夜爆红,受到市场看好,但有分析指出,谷歌在Gemini的宣传资料中存在夸大宣传的嫌疑。  当地时间12月6日,谷歌宣布推出“最大、最强、最通用”的新大型语言模型Gemini。Gemini将是首个直接在手机上运行的大模型,被应用于谷歌Pixel 8 Pro智能手

AI视频生成模型Sora来了

原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517625.shtm

面对大模型应用门槛高-如何大模型发挥更大价值?

原文地址:http://news.sciencenet.cn/htmlnews/2022/9/485510.shtm 人工智能预训练大模型的研发,面临着数据规模大、数据质量参差不齐、模型体积大、训练难度高、算力需求大等一系列挑战。在这样的背景下,如何加速大模型的产业落地,让大模型发挥更大价值?

OpenAI再出王炸,视频生成大模型Sora备受关注

  人工智能(AI)领域的巨头OpenAI再次引发关注,其最新推出的视频生成大模型Sora因其出色的逼真度和想象力广受赞誉。相较于传统视频生成领域的平均4秒长度,Sora能够生成长达60秒的视频,这一创新无疑颠覆了行业的常规。  据OpenAI官网介绍,Sora是一种扩散模型,其生成视频的过程从看似

抢抓大模型行业机会

  机器人在7月6日举行的2023世界人工智能大会展会现场进行投篮表演。大会展示包括大模型、芯片、机器人、智能驾驶等领域的科技成果。 新华社记者 方 喆摄  今年以来,自ChatGPT发布后,多家企业先后发布了自己的大模型产品,业内称之为“百模大战”。与此同时,产业界对大模型的关注点也在发生变化,从

AI大模型“拿捏”电池寿命

作为现代生活中不可或缺的能源载体,电池的重要性不言而喻。从清晨唤醒我们的闹钟,到随身携带的手机、平板电脑等智能设备,无一不依赖于电池提供的稳定电力。此外,随着科技的发展,电动汽车、无人机等新兴领域也广泛应用了各类高性能电池,推动了绿色出行和智能科技的进步。因此,电池不仅极大地便利了我们的日常生活,还

人工智能模型消化80小时的视频以学习手语

对于聋人和重听者来说,像Alexa和Siri这样的语音识别技术反而可能是有效沟通的障碍。研究人员利用人工智能开发了一种将手语转换为文本的工具,可能会增加聋人社区的包容性和可及性。翻译手语需要精确理解手语者的姿势,以产生准确的文字转写。巴塞罗那超级计算中心(BSC)和加泰罗尼亚理工大学(UPC)的研究

厦大尝试AI大模型破译甲骨文

近日,厦门大学信息学院自然语言处理实验室教授史晓东团队申报的“基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型”入选“探元计划2024”“创新探索型项目”TOP10榜单。基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型。厦门大学供图甲骨文也被称作“殷墟文字”,距今已有三千多年历史,是世界四大古文

大模型热要多点冷思考

  行业大模型聚焦特定领域、针对特定场景、解决特定问题,能结合企业自身独特优势去精耕细作并赋能行业,从而形成差异化优势。走向细分领域才有更多机会,综合考虑行业专业性、持续迭代和综合成本等因素,行业大模型更容易实现商业价值落地。  用“百模大战”来形容当下人工智能大模型的火热程度一点也不夸张。数据显示

首个量子领域大模型上线了!

  百度量子计算研究所所长段润尧介绍,该量子领域大模型是在百度文心一言的基础上,使用量子领域高质量数据进行更有针对性的训练和优化而成的。它能更好地理解量子知识,执行量子领域相关任务。  据介绍,百度量子领域大模型将充分发挥技术协同效应,并提升现有大模型在训练速度、模型性能、交互效率等各个方面的能力。

释放AI大模型促消费潜力

  今年的《政府工作报告》提出持续推进“人工智能+”行动,旨在抓住人工智能技术突破机遇,使我国数字技术与制造优势、市场规模优势充分结合,推动人工智能大模型广泛应用,真正赋能千行百业、走进千家万户。在构建新发展格局战略背景下,AI大模型在激活内需市场、促进消费升级等方面充满“模”力。  随着人工智能技

“大模型不是万能的”

“大模型不是万能的,不能过度神话它。”这句话,《中国科学报》记者今年在不同场合听到多次。最近一次,是在“CCF太原大模型赋能文物古建保护与传承论坛”上。自2022年底OpenAI推出大语言模型产品ChatGPT以来,世界仿佛一下子“觉醒”到大模型时代——不仅各“大厂”都在奋力发展大模型,喊出了“所有

中科闻歌发布雅意大模型

原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502201.shtm

北京加快大模型应用落地见效

7月1日,2024全球数字经济大会人工智能专题论坛在中关村国家自主创新示范区会议中心举办。记者从论坛获悉,北京已发布的大模型产品有71个,约占全国一半,人工智能产业高地建设成效显著。未来,北京将加快实现大模型应用落地见效。人工智能在数字经济产业发展中具有很强的“头雁”效应,以大模型为代表的生成式人工

伏羲系列气象大模型2.0面世

中新社上海6月3日电 (记者 陈静)3日,“走进智能气象”主题活动暨智能气象创新生态联盟成立仪式在上海举办。全新升级、面向产业应用的伏羲系列气象大模型2.0(下文简称:“伏羲”2.0)面世,以“伏羲”2.0为核心的智能气象创新生态联盟同期成立。“伏羲”是人工智能驱动的次季节尺度气象大模型,可提供42

压缩算法为大语言模型“瘦身”

据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。团队举例称,当人们使用ChatGPT时,请求

国内首个渔业大模型范蠡大模型1.0发布

  6月15日,范蠡大模型1.0 发布暨新质生产力推动京津冀现代渔业发展研讨会在京举行。会上发布了国内首个渔业大模型范蠡大模型1.0。  范蠡大模型1.0由国家数字渔业创新中心主任、中国农业大学信息与电气工程学院教授李道亮团队联合中国联通、中国电信、中国移动三家运营商,以及全国主要水产院校和科研机构

国内首个渔业大模型范蠡大模型1.0发布

6月15日,范蠡大模型1.0 发布暨新质生产力推动京津冀现代渔业发展研讨会在京举行。会上发布了国内首个渔业大模型范蠡大模型1.0。范蠡大模型1.0由国家数字渔业创新中心主任、中国农业大学信息与电气工程学院教授李道亮团队联合中国联通、中国电信、中国移动三家运营商,以及全国主要水产院校和科研机构共同研发

大模型激活经济发展新动能

  今年的政府工作报告提出,支持大模型广泛应用,并将其作为激发数字经济创新活力的核心举措之一。此举体现了我国对人工智能技术和数字经济发展的前瞻性布局,大模型成为带动千行百业生产力提升的新工具,更有望成为推动社会全面进步的重要力量。  作为人工智能领域前沿技术,大模型具有强大的数据处理和智能分析能力,

讯飞星火正式发布语音大模型

原文地址:http://news.sciencenet.cn/htmlnews/2024/1/516953.shtm“听说今年尔滨特别火,作为南方小土豆还挺想去玩一下的。要不你用东北话介绍下有啥好玩的呗?”1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪