7月9日,中国科学院自动化研究所在2021世界人工智能大会(WAIC2021)上就人工智能的最新进展进行报告,发布了自动化所研发的跨模态通用人工智能平台——“紫东太初”。
“紫东太初”跨模态通用人工智能平台以多模态大模型为核心,基于全栈国产化基础软硬件平台,可支撑全场景AI应用。多模态预训练模型被广泛认为是从限定领域的弱人工智能迈向通用人工智能路径的探索。“紫东太初”跨模态通用人工智能平台瞄准成为实现通用人工智能的目标,对促进智能世界的发展具有重要意义。
依托面向超大规模的高效分布式训练框架,自动化所构建了具有性能优良的中文预训练模型、语音预训练模型和视觉预训练模型,并开拓性地通过跨模态语义关联实现了视觉-文本-语音三模态统一表示,构建了三模态预训练大模型,赋予跨模态通用人工智能平台多种核心能力。
“紫东太初”兼具跨模态理解和生成能力。与单模态和图文两模态相比,其采用一个大模型就能够灵活支撑图-文-音全场景AI应用,具有了在无监督情况下多任务联合学习、并快速迁移到不同领域数据的能力。引入语音模态后的多模态预训练模型,可实现共性图文音语义空间表征和利用,并直接实现三模态的统一表示。特别的是,该研究使“以图生音”和“以音生图”成为现实,为更广泛、更多样的下游任务提供了模型基础支撑,达成AI在如视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。
此外,自动化所研发团队还提出了弱关联三模态数据的语义统一表达,可同时支持三种或任两种模态弱关联数据进行预训练,有效降低了多模态数据收集与清洗成本。
总结来说,此跨模态通用人工智能平台包括三大关键技术和六大核心能力。三大关键技术是多模态理解与生成的多任务统一建模、面向国产化软硬件的高效训练与部署、多模态预训练模型架构设计与优化。六大核心能力体现为多模态统一表示与语义关联、跨模态内容转化与生成、预训练模型网络架构设计、标注受限自监督模型学习、模型适配与分布式训练、模型轻量化与推理加速。
会上,自动化所长徐波展示了基于“紫东太初”平台打造的虚拟人“小初”,并进行通用多模态大模型的人机对话演示,展示了不同模态间的互相转换和生成实例,涵盖视频描述、智能问答、图像检索、吟诗作赋、中文续写、双语翻译、语音识别等多个功能。这表明,通过图文音三模态的关联与协同能够有效提升机器的理解和生成能力。
“大数据+大模型+多模态”将改变当前单一模型对应单一任务的人工智能研发范式,多模态大模型将成为不同领域的共性平台技术,是迈向通用人工智能路径的探索,具有广阔的应用前景;全栈国产化通用人工智能平台的实践对我国实现AI领域科技创新具有重要意义。
赛默飞世尔科技公司(TMO),全球领先的科学服务提供商,宣布与英伟达公司建立战略合作伙伴关系,以大规模推动基于人工智能(AI)的解决方案和实验室自动化。该合作将利用英伟达人工智能(AI)平台和赛默飞世......
中国工信部、中央网信办、国家发改委等八部门7日对外发布《“人工智能+制造”专项行动实施意见》,明确到2027年,中国人工智能关键核心技术实现安全可靠供给,产业规模和赋能水平稳居世界前列,建成全球领先的......
兴都库什—喀喇昆仑—喜马拉雅(HKH)地区的冰湖变化,是气候变化的重要指示器。由于该地区地形极为复杂,加之常年受到云层遮挡、地形阴影以及季节性积雪覆盖的影响,这些因素显著制约了冰湖自动制图的精度,使得......
一项近日发表于《科学》的研究指出,像ChatGPT 这样的人工智能(AI)写作工具正在大幅提升科研生产力。研究人员借助AI工具使论文发表数量最多增加了50%。但这也有不利的一面,AI生成的文......
由美国特朗普政府主导“创世纪计划”(GenesisMission)近日新增24家人工智能领域企业为合作方,包括英伟达、AMD、OpenAI、微软、亚马逊AWS及谷歌母公司Alphabet等。目前“创世......
教育部办公厅关于公布第二批中小学人工智能教育基地名单的通知教基厅函〔2025〕32号各省、自治区、直辖市教育厅(教委),新疆生产建设兵团教育局:根据《教育部办公厅关于开展第二批中小学人工智能教育基地推......
中央广播电视总台12月24日发布2025年度国内、国际十大科技新闻。2025年度国内十大科技新闻是:1.我国建设三大世界级科技创新中心;2.国务院印发《关于深入实施“人工智能+”行动的意见》;3.天问......
近日,山东沂讯信息科技有限公司成立,法定代表人为柳升华,注册资本5000万元,经营范围包括人工智能公共服务平台技术咨询服务、集成电路设计、人工智能基础软件开发等。企查查股权穿透显示,该公司由科大讯飞全......
国家知识产权局办公室关于发布“人工智能+”知识产权公共服务应用场景建设名单的通知国知办函服字〔2025〕1040号各省、自治区、直辖市和新疆生产建设兵团知识产权局:为贯彻落实《国务院关于深入实施“人工......
北京市发展和改革委员会发布关于北京市“人工智能+”能源高价值应用场景评审结果公示。根据《国家能源局综合司关于组织开展“人工智能+”能源试点工作的通知》(国能综通科技〔2025〕168号)相关要求,我委......