采用Sora同款架构,混元文生图大模型宣布开源

5月14日,腾讯宣布其旗下混元文生图大模型全面升级,并对外开源。据了解,这是首个中文原生的类Sora 架构开源模型,填补了国产大模型在文生图先进架构上的空白。目前,主流的文生图开源生态基本围绕英文建设,如Stable Diffusion 等主流开源模型,虽然一定程度支持中文输入,但其核心数据集仍以英文为主,对中国的语言、美食、文化、习俗都理解不够,容易因翻译而产生语义分歧乃至生成错误。建设中文原生的大模型以及相应的开源生态迫在眉睫。据腾讯文生图负责人芦清林介绍,混元文生图大模型以中文原生为基础,支持中英文双语输入及理解,更理解中文语境,对中国的古诗词、俚语、美食、文化、习俗等都有更好的生成效果。升级后的混元文生图模型采用了基于Transformer的扩散模型架构(简称DiT架构,是此前爆红的文生视频产品Sora 背后的关键技术),具备更强的可扩展性,参数量越多、性能越强,可持续提升视觉模型生成效果及效率。目前,腾讯混元文生图模型......阅读全文

腾讯大模型上线文生视频并宣布开源

据腾讯官微消息,腾讯今日宣布,混元大模型上线并开源文生视频能力。据介绍,该模型参数量为130亿,已经在Hugging Face平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。这也是当前最大的视频开源模型。

采用Sora同款架构,混元文生图大模型宣布开源

5月14日,腾讯宣布其旗下混元文生图大模型全面升级,并对外开源。据了解,这是首个中文原生的类Sora 架构开源模型,填补了国产大模型在文生图先进架构上的空白。目前,主流的文生图开源生态基本围绕英文建设,如Stable Diffusion 等主流开源模型,虽然一定程度支持中文输入,但其核心数据集仍以英

手机就能跑!腾讯推出4款可端侧部署的开源模型

8月4日,腾讯混元宣布开源4款小尺寸模型,参数规模分别为0.5B、1.8B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗端侧场景,且支持垂直领域低成本微调。据介绍,新开源的4个模型属于融合推理模型,具备推理速度快、性价比高的特点,用户可根据使用场景灵活选择模型思

MOSS!今日正式开源上线

复旦大学自然语言处理实验室开发的新版 MOSS 模型今日正式上线,成为国内首个插件增强的开源对话语言模型。目前,MOSS 模型已上线开源,相关代码、数据、模型参数已在 Github 和 Hugging Face 等平台开放,供科研人员下载。据介绍,MOSS 是一个支持中英双语和多种插件的开源对话语言

LongCatVideo正式发布并开源

近日,美团LongCat团队发布并开源LongCat-Video视频生成模型,以统一模型在文生、图生视频基础任务上达到开源SOTA,并依托原生视频续写任务预训练,实现分钟级长视频连贯生成,保障跨帧时序一致性与物理运动合理性。据研发团队介绍,作为基于Diffusion Transformer(DiT)

对标Sora,快手发布文生视频大模型“可灵”

近日,国内头部短视频平台“快手”发布了首个“Sora级”的文生视频大模型“可灵”,并宣布面向用户开放。据快手方面介绍,可灵大模型为快手AI团队自研,采用与Sora相似的技术路线,并结合多项自研技术,能够生成大幅度的合理运动、能够模拟物理世界特性、具备强大的概念组合能力和想象力,效果对标Sora。其生

《自然》发文盛赞中国开源AI模型DeepSeek

最近,由来自杭州的“深度求索”初创团队开发的DeepSeek系列AI模型,引发了全球范围的关注。1月24日,知名学术期刊《自然》也发文关注该模型及相应产品,称“中国开发的大语言模型DeepSeek-R1以亲民价格和开放性挑战了OpenAI的推理模型GPT-o1的地位,令科学家们感到兴奋”。《中国科学

北京人工智能数据运营平台发布

  日前,北京人工智能数据运营平台在2024北京智源大会上发布,“行业数据集—场景应用创新计划”同步启动。北京智源人工智能研究院理事长、北京大学教授黄铁军表示,构建大模型生态首先要建立数据流通机制,推动从数据到智能的正反馈。  汇聚数据超700万亿字节  “如果没有开源数据集,很难想象人工智能怎样才

腾讯元宝!混元大模型推出APP版

5月30日,腾讯宣布旗下混元大模型全面升级,基于混元大模型的App“腾讯元宝”正式上线,苹果及安卓应用商店均可下载。相比此前测试阶段的混元小程序版本,面向工作效率场景,腾讯元宝提供了AI搜索、AI总结、AI写作等核心能力;面向日常生活场景,元宝的玩法也更加丰富,提供了多个特色AI应用,并新增了创建个

Meta发布最新开源大模型Llama-4

  据路透社报道,当地时间4月6日,美国科技公司Meta推出了开源人工智能模型Llama 4。据介绍,该模型目前有Scout和Maverick两个版本,是Meta迄今为止最先进的模型,也是同类产品中多模态性最强的模型。  报道称,Llama 4系列采用了先进的混合专家架构,这一架构在模型训练及用户查

全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型

被OpenAI抢先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,以及在硬件方面发布的第六代Tenso

中国首个海洋领域开源大模型OceanGPT正式发布

近日,中国首个海洋领域开源大模型OceanGPT(沧渊)在杭州正式发布。该大模型由海洋精准感知技术全国重点实验室(浙江大学)牵头研发,具备基础的海洋专业知识问答,以及声呐图像、海洋观测图等海洋特色多模态数据的自然语言解读能力。其采用的领域知识增强“慢思考”推理机制,相较现有通用大模型能有效降低幻觉式

学者开源物理传热启发的视觉表征模型vHeat

  近日,鹏城实验室网络智能研究部视觉智能研究所与中国科学院大学电子电气与通信工程学院共同合作,分别在GitHub和OpenI启智社区开源了物理传热启发的高效视觉表征模型vHeat。  研究团队认为,CNN和ViT的卷积算子与自注意力算子都是特征内部的像素传播过程,分别是一种信息传递的形式,从而联想

学者开源物理传热启发的视觉表征模型vHeat

  近日,鹏城实验室网络智能研究部视觉智能研究所与中国科学院大学电子电气与通信工程学院共同合作,分别在GitHub和OpenI启智社区开源了物理传热启发的高效视觉表征模型vHeat。  研究团队认为,CNN和ViT的卷积算子与自注意力算子都是特征内部的像素传播过程,分别是一种信息传递的形式,从而联想

学者开源物理传热启发的视觉表征模型vHeat

近日,鹏城实验室网络智能研究部视觉智能研究所与中国科学院大学电子电气与通信工程学院共同合作,分别在GitHub和OpenI启智社区开源了物理传热启发的高效视觉表征模型vHeat。vHeat与ViT核心算子计算复杂度对比。研究团队供图研究团队认为,CNN和ViT的卷积算子与自注意力算子都是特征内部的像

腾讯安全发布“数字安全免疫力”模型框架

原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502954.shtm

通义千问14B模型开源,“免费可商用”

原文地址:http://news.sciencenet.cn/htmlnews/2023/9/509255.shtm9月25日,阿里云开源通义千问140亿参数模型“Qwen-14B”及其对话模型“Qwen-14B-Chat”,免费可商用。阿里云CTO周靖人介绍说,Qwen-14B是一款支持多种语言的

谁会成为中国版-Sora?

  鏖战一年的“百模大战”还未结束,两个海外AI巨头又给国内科技大厂出了难题。  就在春节假期的尾声,谷歌和OpenAI毫无征兆地放出了各自的 AI新“核武”。  谷歌拿出的新一代多模态大模型Gemini 1.5 Pro,将性能提升到了百万级别,完全秒杀了OpenAI的GPT-4 Turbo,暂居地

腾讯:以“产业实用”作为发展大模型的核心战略

5月17日,“腾讯云生成式AI产业应用峰会”在北京举办。会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生介绍了腾讯混元大模型、行业大模型的最新能力升级,并推出“知识引擎”等多个智能工具和场景应用。汤道生。腾讯云 供图会上,基于混元大模型的一站式AI智能体创作与分发平台——腾讯元器首次亮相

鹏城实验室发布“鹏城·脑海”通用AI大模型

原文地址:http://news.sciencenet.cn/htmlnews/2023/9/509318.shtm近日,中国工程院院士、鹏城实验室主任高文在2023华为全联接大会上正式发布了“鹏城·脑海”(PengCheng Mind)通用AI大模型,以国产化基座大模型为新一代AI大模型发展构筑新

2022语言与智能技术竞赛这天举办

3月30日,聚焦自然语言处理(NLP)领域的2022语言与智能技术竞赛(以下简称 NLP竞赛)正式启动报名。为便利参赛者,竞赛将联手“千言”数据集开源项目,发布中文领域首个搜索知识对话数据集、首个面向实际应用场景的中文大规模段落检索数据集等多个重磅数据集。本次竞赛覆盖跨模态、知识驱动、可信学习等人工

大模型应该如何卷应用?开源闭源谁更有未来?

AI企业曾经受困于投入和回报难成比例的问题,在今年的人工智能大会上,大模型的“变现”之路也成为外界关注焦点。“(商业化)就像小时候玩打砖块的游戏,把砖块精准地打到一个缝隙里去,首先要知道缝隙在哪儿,路径在哪儿。”7月5日,2024世界人工智能大会暨人工智能全球治理高级别会议(简称“WAIC2024”

大气化学新机制与自主模型开源研发

  在国家大气污染治理实践中,明确何时启动红色、橙色或黄色预警是一项重要需求。数值模式作为综合表征排放源、物理传输及化学转化过程的核心工具,能够提供精准的重污染预报。  然而,以往的模式预报大气复合污染组分偏差大,难以满足精准治污需求。在科学家看来,这主要是由于预报模式没有充分考虑我国大气复合污染形

揭秘“腾讯混元”诞生背后的“生产车间”

在国内的头部人工智能大模型研发队伍中,腾讯混元大模型率先采用“混合专家(MoE)”结构,模型参数规模突破万亿,处于中国大模型第一梯队。许多人可能不知道,在锻造“混元”的过程中,腾讯选择的是从零开始的自研路线。大模型的锻造,是一个在约束条件下高效地把工程、算法、数据以及业务应用整个串联起来的工作,其对

海洋传输带水流模型图公布

  英国《自然》杂志网站报道,近日出版的《自然地理科学》杂志公布了科学家公认的海洋传输带水流模型图,为构建更加精确的气候变化模型提供了依据。研究指出,在过去的50年里,经向翻转环流(MOC)变得更加复杂,海洋环流在赤道附近增长得越来越慢,而在北方却变得更加强烈。   论文主要作者、

首个万字创作大模型“中文逍遥”在京发布

原文地址:http://news.sciencenet.cn/htmlnews/2023/10/510212.shtm

中关村开源生态论坛暨大模型智能应用技术大会举办

原文地址:http://news.sciencenet.cn/htmlnews/2024/1/516894.shtm1月27日,中关村论坛永久会址建成后的首场活动—2024中关村论坛系列活动之中关村开源生态论坛暨大模型智能应用技术大会正式举办。大会聚集大模型生态上下游领军企业和技术专家,邀请海内外开

腾讯汤道生:行业需要可控可追溯可修正的大模型

  “虽然大家对通用大模型期待很高,但它不一定是满足行业场景需求的最优解。”6月19日,腾讯云在国家科技传播中心召开行业大模型及智能应用技术峰会。会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生作上述说。  他认为,用户尤其企业用户更需要有行业针对性的行业大模型:“企业所需要的是在实际场

为大模型而生!腾讯云自研星脉高性能计算网络

原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503635.shtm

腾讯汤道生:行业需要可控可追溯可修正的大模型

原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503207.shtm