腾讯机器学习框架升级,可节省一半算力成本

原文地址:http://news.sciencenet.cn/htmlnews/2023/11/512960.shtm......阅读全文

腾讯元宝!混元大模型推出APP版

5月30日,腾讯宣布旗下混元大模型全面升级,基于混元大模型的App“腾讯元宝”正式上线,苹果及安卓应用商店均可下载。相比此前测试阶段的混元小程序版本,面向工作效率场景,腾讯元宝提供了AI搜索、AI总结、AI写作等核心能力;面向日常生活场景,元宝的玩法也更加丰富,提供了多个特色AI应用,并新增了创建个

揭秘“腾讯混元”诞生背后的“生产车间”

在国内的头部人工智能大模型研发队伍中,腾讯混元大模型率先采用“混合专家(MoE)”结构,模型参数规模突破万亿,处于中国大模型第一梯队。许多人可能不知道,在锻造“混元”的过程中,腾讯选择的是从零开始的自研路线。大模型的锻造,是一个在约束条件下高效地把工程、算法、数据以及业务应用整个串联起来的工作,其对

采用Sora同款架构,混元文生图大模型宣布开源

5月14日,腾讯宣布其旗下混元文生图大模型全面升级,并对外开源。据了解,这是首个中文原生的类Sora 架构开源模型,填补了国产大模型在文生图先进架构上的空白。目前,主流的文生图开源生态基本围绕英文建设,如Stable Diffusion 等主流开源模型,虽然一定程度支持中文输入,但其核心数据集仍以英

预训练模型创业渐入佳境

2月10日,创新工场在京宣布,北京澜舟科技公司已完成近亿元Pre-A轮融资,此次融资由联想创投、斯道资本共同领投,创新工场跟投。本轮融资澜舟科技将主要用于自然语言处理(NLP)核心产品的开发和前瞻性研究。澜舟科技的新一轮融资,是时下围绕人工智能预训练大模型的创新创业渐入佳境的生动体现。在澜舟科技创始

“腾讯探元计划2023”收官

近日,以“中华文化+科技创新”为方向的“腾讯探元计划2023”正式收官。该计划致力于为行业提供有价值的技术或解决方案,针对关键应用场景,推动优秀技术与文化场景的共创落地建设,促进关键技术创新应用解决文化行共性关键痛点,实现共创共益发展。“腾讯探元计划2023”在全国共征集了315个创新方案,遴选出2

腾讯大模型上线文生视频并宣布开源

据腾讯官微消息,腾讯今日宣布,混元大模型上线并开源文生视频能力。据介绍,该模型参数量为130亿,已经在Hugging Face平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。这也是当前最大的视频开源模型。

OpenAI打包新闻集团版权训练大模型

ChatGPT再扩容,这次将加入十余家媒体的新闻内容。当地时间5月22日,OpenAI宣布与新闻集团(News Corp)达成多年期协议,将获得主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《巴伦周刊》《纽约邮报》《泰晤士报》《太阳报》等十余家媒体。根据协议,OpenAI将能在ChatGP

腾讯安全发布“数字安全免疫力”模型框架

原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502954.shtm

腾讯:以“产业实用”作为发展大模型的核心战略

5月17日,“腾讯云生成式AI产业应用峰会”在北京举办。会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生介绍了腾讯混元大模型、行业大模型的最新能力升级,并推出“知识引擎”等多个智能工具和场景应用。汤道生。腾讯云 供图会上,基于混元大模型的一站式AI智能体创作与分发平台——腾讯元器首次亮相

手机就能跑!腾讯推出4款可端侧部署的开源模型

8月4日,腾讯混元宣布开源4款小尺寸模型,参数规模分别为0.5B、1.8B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗端侧场景,且支持垂直领域低成本微调。据介绍,新开源的4个模型属于融合推理模型,具备推理速度快、性价比高的特点,用户可根据使用场景灵活选择模型思

全国首个DNA存储领域预训练大模型“ChatDNA”发布

近年来,DNA 和人工智能一直都是科技发展的热门议题。随着科学技术的进步,它们之间便有了无限的可能性。例如,DNA 和人工智能可以帮助我们更快地研究特定基因组的变异和功能。科学家可以使用人工智能算法来分析大量的 DNA 序列,从而发现有价值的变异和基因功能,为疾病的治疗提供线索。DNA 是生物世界中

用AI生成数据训练AI或导致模型崩溃

科技日报北京7月25日电 (记者张梦然)《自然》24日正式发表的一篇研究论文指出了一个人工智能(AI)严重问题:用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出,这被称为“模型崩溃”。研究显示,原始内容会在9次迭代以后,变成不相关的“胡言乱语”(演示中一个建筑文本最终变成了野

用AI生成数据训练AI或导致模型崩溃

  《自然》24日正式发表的一篇研究论文指出了一个人工智能(AI)严重问题:用AI生成的数据集训练未来几代机器学习模型,可能会严重“污染”它们的输出,这被称为“模型崩溃”。研究显示,原始内容会在9次迭代以后,变成不相关的“胡言乱语”(演示中一个建筑文本最终变成了野兔的名字),这凸显出使用可靠数据训练

《自然》封面:以AI生成数据训练AI,模型变傻?

大模型有许多“崩”的时候,但有一种崩溃叫做“自毁前程”——近日,《自然》发表在封面的一篇论文指出,用AI生成的数据集训练未来几代机器学习模型,可能会“污染”它们的输出。这项由英国牛津大学、剑桥大学、帝国理工学院、加拿大多伦多大学等多所高校联合开展的研究显示,原始内容会在数代内变成不相关的“胡言乱语”

大模型训练遇“算力荒”,“超智融合”来帮忙

论及当下计算技术的发展方向和趋势,“超智融合”当仁不让——在今年6月发布的2024年全球“最节能超算”榜单(Green500)上,位列榜单前三的超算都采用了“超智融合”的技术理念。超智融合,顾名思义,意即“采用融合架构,集成超算和智算的功能”。在当前大模型训练不断需要大算力支持的时代背景下,超智融合

高文:将训练大模型底座面向全社会开放

·高文表示,开发大模型不是拍脑袋、喊口号那么容易,而是必须拥有算力,只有投入几十亿元甚至上百亿元才能做出“像样的东西”,但这笔资金对于高校和初创企业而言是一个门槛。“我们基本的想法就是用鹏城实验室的算力、公开渠道的数据,训练出大模型底座面向全社会开放,供研究人员、创业者使用。”5月22日,中国工程院

《自然》封面:以AI生成数据训练AI,模型变傻?

  大模型有许多“崩”的时候,但有一种崩溃叫做“自毁前程”——  近日,《自然》发表在封面的一篇论文指出,用AI生成的数据集训练未来几代机器学习模型,可能会“污染”它们的输出。这项由英国牛津大学、剑桥大学、帝国理工学院、加拿大多伦多大学等多所高校联合开展的研究显示,原始内容会在数代内变成不相关的“胡

一键点、万物动,图生视频大模型来了

原文地址:http://news.sciencenet.cn/htmlnews/2024/3/519252.shtm基于输入模型的图片,只需点击对应区域,加上少量提示词,就可以让图片中原本静态的区域动起来,一键转换成视频。在图生视频大模型的帮助下,图生视频就是这么简单。3月15日,腾讯和清华大学、香

腾讯汤道生:行业需要可控可追溯可修正的大模型

原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503207.shtm

腾讯汤道生:行业需要可控可追溯可修正的大模型

  “虽然大家对通用大模型期待很高,但它不一定是满足行业场景需求的最优解。”6月19日,腾讯云在国家科技传播中心召开行业大模型及智能应用技术峰会。会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生作上述说。  他认为,用户尤其企业用户更需要有行业针对性的行业大模型:“企业所需要的是在实际场

为大模型而生!腾讯云自研星脉高性能计算网络

原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503635.shtm

支持超10万卡组网,腾讯星脉网络2.0发布

大模型持续迭代,AI基础设施成为云厂商的核心竞争力之一。7月1日,腾讯宣布其自研星脉高性能计算网络全面升级,升级后的星脉网络2.0搭载自研的网络设备与AI算力网卡,支持超10万卡大规模组网,网络通信效率比上一代提升60%,预期将大模型训练效率提升20%。腾讯云副总裁王亚晨在发布活动中表示,如果将大模

面向跨模态遥感数据的生成式预训练大模型发布

以深度学习为代表的人工智能技术已被应用于多种遥感图像解译任务中。遥感数据幅宽大、场景内容复杂,一幅标准景图像往往就可达数十亿像素,覆盖上万平方公里,与自然场景数据存在较大差异。大多数现有的深度神经网络模型是利用自然场景图像预训练的权重来进行初始化,在遥感数据解译任务上的性能和普适性有待进一步提升。中

首个支持30种方言混说语音大模型发布

“唔该查吓电话费吖”“侬帮阿拉查下话费好伐?”中国电信万号智能客服每天接到几百万通电话,其中许多是用方言拨打,尤其是一些老人习惯说方言、只会说方言,智能客服及人工客服都难以理解,沟通效率大打折扣。近日,中国电信人工智能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型——星辰超

学术论文正被高价出售给大模型训练,作者却零收入

·越来越多的学术出版商正将研究论文卖给科技公司用以训练人工智能(AI)模型,而作者收入为零。大语言模型(LLM)因训练数据问题再次引发争议。日前,国际著名期刊《自然》(《Nature》)杂志编辑伊丽莎白·吉普尼(Elizabeth Gibney)发布一篇题为《你的论文被用来训练人工智能模型了吗?几乎

闭合式四肢骨折固定训练模型功能解析

知能医学模型供应的这款闭合式四肢骨折固定训练模型以成年男性躯体为基准,在模型的上肢前臂和下肢小腿上预设了骨折创伤,可供学员了解人体骨折时所具备的反常运动、成角畸形、活动后产生骨擦音,骨折上下肢需及时用夹板固定,防止反复活动造成骨折周围血管神经损伤等现象,可用于练习骨折复位方法及骨折固定的方法。功能特

讯飞联手华为攻克全国产算力下推理模型训练难关

1月15日,科大讯飞发布了我国“全国产”算力平台第一个深度推理大模型——讯飞星火X1。据公开测试,该模型中文数学能力表现突出,目前已应用于教育、医疗等场景。在大模型研发领域,讯飞星火坚持走全国产化路线。据科大讯飞研究院副院长殷兵介绍,尽管在全国产算力平台上训练深度推理模型遭遇了诸多挑战,但科大讯飞携

人类神经元研究新模型面世

科技日报北京4月8日电 (记者刘霞)美国威尔·康奈尔医学院科学家开发出一种创新性人类神经元模型,详细模拟了tau蛋白聚集体在大脑内的传播,这一过程会导致阿尔茨海默病和额颞叶痴呆症患者认知能力下降。新模型有助科学家找到可能阻断tau蛋白传播的新治疗靶点,是阿尔茨海默病研究领域的一项重大进展。相关论文发

人类神经元研究新模型面世

美国威尔·康奈尔医学院科学家开发出一种创新性人类神经元模型,详细模拟了tau蛋白聚集体在大脑内的传播,这一过程会导致阿尔茨海默病和额颞叶痴呆症患者认知能力下降。新模型有助科学家找到可能阻断tau蛋白传播的新治疗靶点,是阿尔茨海默病研究领域的一项重大进展。相关论文发表于5日出版的最新一期《细胞》杂志。

两款“坤元”大模型发布

7月29日,第三届海岸带大会在山东烟台召开。中国科学院地理科学与资源研究所研究员、“坤元”大模型首席科学家苏奋振发布了两款自主研发的大模型——“坤元·感东南”与“坤元·拟千海”。两款大模型分别针对陆和海,构建起陆海智能监测与模拟技术体系。这是遥感与海洋研究融合人工智能的重要成果,有望为区域遥感精准快