发布时间:2021-11-08 17:00 原文链接: 阿里达摩院称其通用性AI模型参数突破10万亿

11月8日,阿里巴巴达摩院公布其多模态大模型“M6”最新进展,宣布其参数规模已从万亿跃迁至10万亿,这一数字远超谷歌、微软此前发布的万亿级模型,成为当前最大的人工智能(AI)预训练模型。

M6是达摩院研发的通用性人工智能大模型,拥有多模态、多任务能力,其认知和创造能力超越传统AI,尤其擅长设计、写作、问答,在电商、制造业、文学艺术、科学研究等领域有广泛应用前景。M6 也是国内首个商业化落地的多模态大模型,目前已在超40个场景中应用。

低碳高效是M6一大优势。据介绍,M6仅使用512张 GPU即可在10天内训练出具有可用水平的10万亿模型。相比去年OpenAI发布的大模型GPT-3,M6实现同等参数规模,能耗仅为其1%。

与传统AI相比,拥有巨量参数的大模型拥有成百上千倍“神经元”数量,且预先学习过海量知识,在一些问题上能够表现出像人类一样“举一反三”的学习能力。因此,大模型被普遍认为是未来的“基础模型”,将成下一代AI基础设施。然而,大模型的算力成本也相当高昂,比如训练1750亿参数语言大模型GPT-3所需能耗,相当于从地球开车往返月球的消耗。

今年5月,通过专家并行策略及优化技术,达摩院M6团队将万亿模型能耗降低超八成、效率提升近11倍。10月,M6再次通过更细粒度的CPU offload、共享—解除算法等创新技术,让收敛效率进一步提升7倍,这使得模型规模扩大10倍的情况下,能耗未显著增加。这一系列突破极大降低了大模型研究门槛,让一台机器训练出一个千亿模型成为可能。

基于M6模型,达摩院联合阿里云推出M6服务化平台,为大模型训练及应用提供完备工具,让大模型实现“开箱即用”。达摩院还推出了当前最大规模的中文多模态评测数据集MUGE,覆盖图文描述、文本生成图像、跨模态检索任务,填补了中文多模态权威评测基准缺失的空白。

相关文章

杨善林院士:强化基础研究,夯实AI“领跑”根基

杨善林,管理科学与信息系统工程专家、中国工程院院士,长期从事决策科学与智能系统技术领域的科学研究和人才培养工作。获国家科技进步奖二等奖2项、教育部自然科学奖一等奖1项、教育部人文社会科学奖一等奖1项、......

杨善林院士:强化基础研究,夯实AI“领跑”根基

杨善林,管理科学与信息系统工程专家、中国工程院院士,长期从事决策科学与智能系统技术领域的科学研究和人才培养工作。获国家科技进步奖二等奖2项、教育部自然科学奖一等奖1项、教育部人文社会科学奖一等奖1项、......

孙凝晖:“AI赋能科学发现”最大作用是突破人类认知极限

近日,由中国计算机学会主办的第21届全国高性能计算学术大会在内蒙古鄂尔多斯召开。大会上,中国工程院院士、中国计算机学会理事长孙凝晖在题为《AI(人工智能)赋能科学发现》报告中,分享了对这一备受关注话题......

孙凝晖:“AI赋能科学发现”最大作用是突破人类认知极限

近日,由中国计算机学会主办的第21届全国高性能计算学术大会在内蒙古鄂尔多斯召开。大会上,中国工程院院士、中国计算机学会理事长孙凝晖在题为《AI(人工智能)赋能科学发现》报告中,分享了对这一备受关注话题......

扫描件秒变数据库,AI让数码多功能机“读懂”文档

在办公领域,随着人工智能(AI)技术加速渗透,各行业正迎来智能化转型的关键节点。近日,在于上海召开的“富士胶片商业创新(中国)有限公司成立三十周年庆祝仪式”上,多位专家共同探讨AI新浪潮下的业务转型之......

扫描件秒变数据库,AI让数码多功能机“读懂”文档

在办公领域,随着人工智能(AI)技术加速渗透,各行业正迎来智能化转型的关键节点。近日,在于上海召开的“富士胶片商业创新(中国)有限公司成立三十周年庆祝仪式”上,多位专家共同探讨AI新浪潮下的业务转型之......

数据“中毒”会让AI“自己学坏”

在一个繁忙的火车站,监控摄像头正全方位追踪站台的情况,乘客流量、轨道占用、卫生状况……所有信息实时传输给中央人工智能(AI)系统。这个系统的任务是帮助调度列车,让它们安全准点进站。然而,一旦有人恶意干......

数据“中毒”会让AI“自己学坏”

在一个繁忙的火车站,监控摄像头正全方位追踪站台的情况,乘客流量、轨道占用、卫生状况……所有信息实时传输给中央人工智能(AI)系统。这个系统的任务是帮助调度列车,让它们安全准点进站。然而,一旦有人恶意干......

AI创新助力解决纳米递送难题

“以AI创新解决纳米递送难题,不断推进自主研发的创新进程,为CGT(细胞与基因治疗)产业高质量发展提供中国递送方案。”近日,剂泰科技基于该系统孵化的OpenCGT(细胞与基因治疗)平台在北京大兴落地,......

AI创新助力解决纳米递送难题

“以AI创新解决纳米递送难题,不断推进自主研发的创新进程,为CGT(细胞与基因治疗)产业高质量发展提供中国递送方案。”近日,剂泰科技基于该系统孵化的OpenCGT(细胞与基因治疗)平台在北京大兴落地,......