中国科学院自动化研究所脑网络组研究中心与模式识别国家重点实验室团队提出正交权重修改算法,与情境信息处理模块相结合,使人工神经网络具备了强大的连续学习和情境依赖学习能力,有效解决灾难性遗忘等难题。相关成果已在线发表于Nature Machine Intelligence。
人工智能已成为21世纪最具挑战性的前沿科学领域之一,但究竟什么是“智能”?可以确定的是,个体对复杂、动态环境的高适应性是智能的重要标志。
人类大脑显然是高环境适应性的典范。人不仅可以在新的环境中不断吸收新的知识,而且可以根据不同的环境灵活调整自己的行为。在此方面,深度神经网络(deep neural networks,DNN)与大脑相比存在着很大的差距。传统DNN一方面会受到“灾难性遗忘”问题的困扰,难以在学习新知识的同时保留旧知识,即缺少连续学习(continual learning)的能力;另一方面,DNN往往只能实现预先训练好的固定操作,不能对实际环境中存在情境信息(比如自身状态、环境变化、任务变化等)做出灵活的响应,难以满足复杂多变的需求,即缺少情境依赖学习(contextual-dependent learning)的能力。这两方面能力的缺失是制约当前DNN发展出高水平智能的重要瓶颈。
近日,自动化所脑网络组研究中心与模式识别国家重点实验室余山课题组在克服上述两个核心问题方面取得新进展,为提高人工智能系统对于复杂多变环境的适应性提出了新的思路和方案。在Continual Learning of Context-dependent Processing in Neural Networks 一文中,硕士生曾冠雄、博士后陈阳等提出了正交权重修改(orthogonal weights modification,OWM)算法和情境依赖处理(context-dependent processing,CDP)模块。OWM算法可以有效克服神经网络中的灾难性遗忘,实现连续学习;受大脑前额叶皮层启发的CDP模块可以有效整合情境信息,调制神经网络的信息处理过程。二者的有效结合,使人工神经网络具备了强大的连续学习和情境依赖学习的能力,大大增加了其灵活性和适应性。
OWM算法的核心思想为:在学习新任务时,只在旧任务输入空间正交的方向上修改神经网络权重。如此,权重增量几乎不与以往任务的输入发生作用,从而保证网络在新任务训练过程中搜索到的解,仍处在以往任务的解空间中。OWM通过正交投影算子P与误差反传算法得到的权重增量△WBP作用实现其目的,即最终的权重增量为△W=κP△WBP。
OWM算法实现了对网络中已有知识的有效保护,并可以与现有梯度反传算法完全兼容,在连续学习测试任务中表现出了良好的性能。在连续学习的标准任务disjoint MNIST与shuffled MNIST任务中,OWM算法的表现超过了同类的其他算法。并且,随着学习的任务数目增加,OWM算法的性能优势会进一步加大。利用OWM算法,神经网络可以连续学习识别ImageNet的1000类图片和3755个中文手写体汉字(每个任务仅训练一类图片或一个汉字)。值得一提的是,算法具有优良的小样本学习能力,以手写体汉字识别为例,基于预训练的特征提取器,系统可以从仅仅数个正样本中就能连续地学习新的汉字。
CDP模块则是受前额叶皮层启发提出的。前额叶是大脑中负责认知控制的核心皮层。其同时接收感官输入和情境信号,并选择与当前任务最相关的感官信号指导输出响应。受此启发,作者引入了类似的处理架构——CDP模块,它包括两个子模块:1.编码子模块,其负责将情境信息编码为适当的控制信号;2.“旋转”子模块,其利用编码模块的控制信号处理任务输入(由于其功能上相当于将特征向量在高维空间上进行了旋转,故称为“旋转”子模块)。
若将CDP模块与OWM算法联合使用,神经网络只需要一个分类器,就可以连续学习40种不同的脸部特征的识别任务。并且,当不同的提示信号出现时,其对相应的特征做出判断,效果与引入40个分类器的情况相当。
通过OWM算法有效克服灾难性遗忘,并通过CDP模块实现单个网络基于情境信号的多任务学习,二者结合有望让智能体通过连续不断的学习去适应复杂多变的环境,从而逐步逼近更高水平的智能。
近日,中国人工智能学会网站公示2024年度吴文俊人工智能科学技术奖拟授奖项目名单。其中,徐宗本院士获科技成就奖提名,张大鹏、王国胤、章毅获科技贡献奖提名。此外,自然科学奖一等奖9项,技术发明奖8项,科......
1月11至12日,2025中国自动化与人工智能科普大会暨创新人才贯通式培养研讨会在北京举行。会议由中国自动化学会、中国青少年科技教育工作者协会联合主办,以“跨界融合·创新未来”为主题,共设3场大会报告......
ChatGPT等大语言模型的横空出世,如同一场迅猛的科技风暴,彻底改变了人们的工作与生活模式。然而,在这股浪潮之中,40-60岁的中年群体面临着前所未有的适应性挑战。数字化时代,中年群体,尤其是高校教......
在人工智能时代,人类还能做什么?这不仅是一个技术问题,也是一个哲学问题;不仅涉及事实判断,更关联价值判断。人工智能拥有自我意识吗、有意识的人工智能应当被如何对待、强人工智能是否会统治人类以及自动驾驶出......
四川省副省长李文清9日在国新办新闻发布会上表示,下一步,川渝两地将围绕建设具有全国影响力的重要经济中心,以构建现代化产业体系作为主攻方向,推动重点产业“建圈强链”,发展壮大优势主导产业,共育人工智能、......
胡润研究院1月9日发布《2024胡润中国人工智能企业50强》报告。AI芯片企业寒武纪以2380亿元的价值位居榜首,智能语音企业科大讯飞以1160亿元的价值排名第二,机器视觉和大模型企业商汤科技以500......
据国资委网站消息,1月5日,国务院国资委党委委员、副主任谭作钧出席在中国电信党校举办的中央企业人工智能特训班结业式,指出要深入学习贯彻习近平总书记重要指示精神和党中央、国务院决策部署,大力发展人工智能......
当下,人工智能的火热让人们对其有了深刻的体会。尽管许多人并不完全了解人工智能的工作原理,但一提起人工智能,自动驾驶汽车、智能交互机器人、机器狗、无人机等已广为人知的应用便浮现在人们脑海中。当人工智能深......
记者1月2日从重庆大学获悉,该校人工智能辅导员“润欣”日前全面上线。这是全国思政领域率先建成使用的“大模型+跨业务系统融合”的多智能体人工智能辅导员。它能准确理解并快速响应用户的复杂提问,还能从庞大的......
2024年12月27日,工业和信息化部人工智能标准化技术委员会(以下简称“人工智能标委会”)在京召开成立大会。工业和信息化部总工程师谢少锋出席,工业和信息化部科技司、北京市经济和信息化局、北京市海淀区......