发布时间:2021-07-14 14:40 原文链接: 跨模态通用人工智能平台“紫东太初”研发出炉

  7月9日,中国科学院自动化研究所在2021世界人工智能大会(WAIC2021)上就人工智能的最新进展进行报告,发布了自动化所研发的跨模态通用人工智能平台——“紫东太初”。

  “紫东太初”跨模态通用人工智能平台以多模态大模型为核心,基于全栈国产化基础软硬件平台,可支撑全场景AI应用。多模态预训练模型被广泛认为是从限定领域的弱人工智能迈向通用人工智能路径的探索。“紫东太初”跨模态通用人工智能平台瞄准成为实现通用人工智能的目标,对促进智能世界的发展具有重要意义。

  依托面向超大规模的高效分布式训练框架,自动化所构建了具有性能优良的中文预训练模型、语音预训练模型和视觉预训练模型,并开拓性地通过跨模态语义关联实现了视觉-文本-语音三模态统一表示,构建了三模态预训练大模型,赋予跨模态通用人工智能平台多种核心能力。

  “紫东太初”兼具跨模态理解和生成能力。与单模态和图文两模态相比,其采用一个大模型就能够灵活支撑图-文-音全场景AI应用,具有了在无监督情况下多任务联合学习、并快速迁移到不同领域数据的能力。引入语音模态后的多模态预训练模型,可实现共性图文音语义空间表征和利用,并直接实现三模态的统一表示。特别的是,该研究使“以图生音”和“以音生图”成为现实,为更广泛、更多样的下游任务提供了模型基础支撑,达成AI在如视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。

  此外,自动化所研发团队还提出了弱关联三模态数据的语义统一表达,可同时支持三种或任两种模态弱关联数据进行预训练,有效降低了多模态数据收集与清洗成本。

  总结来说,此跨模态通用人工智能平台包括三大关键技术和六大核心能力。三大关键技术是多模态理解与生成的多任务统一建模、面向国产化软硬件的高效训练与部署、多模态预训练模型架构设计与优化。六大核心能力体现为多模态统一表示与语义关联、跨模态内容转化与生成、预训练模型网络架构设计、标注受限自监督模型学习、模型适配与分布式训练、模型轻量化与推理加速。

  会上,自动化所长徐波展示了基于“紫东太初”平台打造的虚拟人“小初”,并进行通用多模态大模型的人机对话演示,展示了不同模态间的互相转换和生成实例,涵盖视频描述、智能问答、图像检索、吟诗作赋、中文续写、双语翻译、语音识别等多个功能。这表明,通过图文音三模态的关联与协同能够有效提升机器的理解和生成能力。

  “大数据+大模型+多模态”将改变当前单一模型对应单一任务的人工智能研发范式,多模态大模型将成为不同领域的共性平台技术,是迈向通用人工智能路径的探索,具有广阔的应用前景;全栈国产化通用人工智能平台的实践对我国实现AI领域科技创新具有重要意义。


相关文章

科研团队成功利用人工智能蛋白语言模型揭示生命演化奥秘

为什么不同生物在适应相似环境时,会独立演化出相似的功能?一项最新研究从蛋白质的“高阶特征”层面揭示了这一生命演化奥秘的重要机制。这项研究由中国科学院动物研究所邹征廷研究员团队完成,成功利用人工智能领域......

北京市2025“中央引导地方”人工智能专项立项公示

北京市科学技术委员会、中关村科技园区管理委员会关于发布2025年度“中央引导地方”专项人工智能领域部分方向拟立项课题公示的通知根据《中央引导地方科技发展资金管理办法》等文件要求,现将2025年度“中央......

重庆“人工智能+科学技术”计划项目申报通知发布

关于申报2025年“人工智能+科学技术”计划项目的通知各有关单位:为深入贯彻落实《国务院关于深入实施“人工智能+”行动的意见》(国发〔2025〕11号),市科技局启动实施2025年度“人工智能+科学技......

AI重塑商业逻辑,高校教育如何迎头赶上?

“当人工智能(AI)重构商业逻辑,当可持续发展成为全球命题,商学教育该如何重塑其DNA?学术界与产业界又该构建怎样的共生生态?”9月5日,北师香港浸会大学校长陈致在首届粤港澳大湾区未来商业论坛上致辞时......

未来智能社会什么样?从AI到AI+

8月26日国发〔2025〕11号颁布了《国务院关于深入实施“人工智能+”行动的意见》这一重要文件,其中特别强调“人机协同、跨界融合、共创分享的智能经济和智能社会新形态”,其核心就是要积极构建“人、机(......

AI“副驾”增强脑机接口操控力

美国科学家研究发现,一个由人工智能(AI)担任副驾的脑机接口或能让瘫痪人士更好地完成任务。该技术能让瘫痪受试者在移动计算机光标或操作机械臂这类任务中的表现提升为原先的近4倍。相关研究9月1日发表于《自......

人工智能与先进计算融合创新学术会议在沪召开

8月30日,“人工智能与先进计算融合创新学术会议”在复旦大学举行,400余位专家学者参会,共同探讨如何实现人工智能(AI)与先进计算的融合创新,让AI真正走出“工具”窠臼,迈向“自主智能”新纪元。会议......

研究人员提出生成式人工智能预报洪水新方法

近日,南方科技大学环境科学与工程学院教授郑一团队与中国科学院大气物理研究所等多家单位合作,在《地球物理研究快报》发表最新研究成果,他们提出了生成式人工智能预报洪水的新防范,不仅为洪水预报技术带来了新思......

人工智能助力化学家研发高韧性塑料

麻省理工学院(MIT)与杜克大学的研究人员通过引入机器学习模型识别的应力响应分子,成功研制出抗撕裂性更强的聚合物材料。这项强化聚合物材料的新策略有望催生更耐用的塑料,从而减少塑料废弃物。研究团队利用机......

研究发现蜜蜂大脑能用极少细胞完成复杂视觉任务

一项关于蜜蜂如何利用飞行运动实现高度精准学习与识别复杂视觉模式的新发现,可能标志着下一代人工智能开发方式的重大变革。英国谢菲尔德大学科研团队构建了蜜蜂大脑的数字模型,揭示这些运动如何产生清晰高效的脑部......