发布时间:2018-03-19 14:22 原文链接: 对抗性神经网络入选MIT十大突破性技术

日前,《麻省理工科技评论》刊文评出了2018年十大突破性技术,“对抗性神经网络”(GAN)赫然在列。

什么是对抗性神经网络?为什么它能入选MIT十大突破性技术?它的发展脉络如何?与我们此前耳熟能详的神经网络有什么区别?能够应用在人工智能的哪些场景?还有哪些关键问题有待攻克?

中国自动化学会混合智能专委会副主任、中国人工智能学会机器学习专委会常委、复旦大学博士生导师张军平教授在接受科技日报记者采访时做了深入浅出的解释。

故事中的GAN幻影

张军平告诉记者,虽然GAN是科技领域的“新贵”,但其实在很久以前的中外小说中就能看到这个想法的影子。

这个想法最早可以追溯到奥地利小说家斯蒂芬·茨威格写于1941年的小说《象棋的故事》。

在该小说中,主人公B博士被长期囚禁在纳粹集中营中。在想尽了各种摆脱空虚和孤独的办法却徒劳无功后,B博士意外得到了一本国际象棋棋谱。

他背完书里的上千棋谱后,用送来的面包做了副国际象棋,开始自己跟自己下棋,最终演变成一盘接一盘的相互疯狂挑战,这令他棋力大涨。出狱后,在一艘游艇上,他居然轻松地在首盘就击败当时的世界冠军。

在中文小说里也有类似的影子,它出现在金庸写于1957年的武侠小说《射雕英雄传》中。

王重阳的师弟周伯通被东邪“黄药师”困在桃花岛的地洞里。为了打发时间,周伯通就用左手与右手打架,自娱自乐。其武功决窍在于要先“左手画圆、右手画方”,分心二用,保证可以同时使出两种武功,从而使得武力倍增。

这两部小说主人公功力大增的关键都是“自己跟自己决斗,试图倾尽全力击败对方”,而结果都是练成后,去跟高手过招时能轻松秒杀对手。用一句俗话来解释,叫“双拳难敌四手”。

让机器学会“左右互搏”

GAN网络的原理本质上就是这两篇小说中主人公练功的人工智能或机器学习版本。

一个网络中有两个角色,修炼的过程中左手扮演攻方,即生成器(generator),试图生成和自然世界中拟完成任务足够相似的目标;右手扮演守方,即判别器(discriminator),试图把这个假的、生成的目标和真实目标区分开来。经过反复多次双手互搏,左手右手的功力都会倍增,从而达到“舍我其谁”的目标。

明白这个道理,就不难明白为什么GAN网络一出,就有独孤求败的感觉了。

正是因为GAN网络的机理是“双手互搏、一心两用”,所以,虽然最初的应用场景是针对图像相关任务,但其机理是普适性的。只要能用这个“诀窍”的地方,都能把自己的功力提升一个档次。不过,需要注意的是,GAN只把双手互搏用来训练自己“双手”的功力。在多数实际应用中,它只用了自己千锤百炼出来的生成器,就得到了非常好的结果。

于是,自2014年GAN网络被Ian J. Goodfellow等人提出,至今其演绎出的各种版本就像攻城掠地般在各个领域蔓延。

在今年的人工智能顶级会议IJCAI、机器学习顶级会议ICML和NIPS、深度学习著名会议ICLR上,光读参会论文的标题,就能发现大量GAN网络的工作痕迹。图像处理、计算机视觉、自然语言处理、语音识别、智能驾驶、安全监控……似乎GAN已经无所不能了。

张军平用几个比较火的人工智能应用场景举例——

在年龄估计中,GAN能通过攻守互搏,基于给定的人脸图像实现对其人衰老或年轻时的样貌生成。

在多视角人脸识别、跨视角步态识别领域,采用类似的机理,实现对人脸角度和步态角度的自动旋转,从而有效提高了多视角、跨视角人脸和步态识别的精度。

在自动驾驶领域,需要对智能汽车进行复杂环境下的虚拟训练。此时,就可以利用GAN来实现与实际交通场景分布一致的图像生成。具体来说,可以先给GAN输入一张随机噪声图像,通过其生成器来最小化与真实场景接近的图像,同时判别器最大化生成场景与真实场景间的差异。经过反复迭代的攻守博弈,从而获得与真实环境一致的交通场景。

“不光在应用领域上有了突破,互搏的方式也有了不少变化。既然可以双手互搏,那当然可以三手甚至更多手的互搏,也可以组团逐对互搏、成串互搏,诸如此类。还可以把圆和方换成其他东西或者所谓的函数或结构来互搏。但万变不离其宗,内在的机理是不变的。”张军平补充道。

GAN有什么“软肋”

“毫无疑问,这种可倍增‘功力’的技术入选MIT年度十大突破性技术是当之无愧的。但值得注意的是,这一技术仍然有较大需要改善的空间。”作为《IEEE Intelligent System》(智能系统)和《IEEE Transactions on Intelligent Transportation Systems 》(智能交通系统)等著名期刊的编委,张军平对GAN的“软肋”了如指掌——

首先,对抗不好是容易出问题的。比如那位B博士。国棋象棋的世界冠军在觉察到他的强烈焦躁与急切情绪后,就有意识地放慢下棋速度。结果诱发了B博士的精神分裂,使得他再次陷入狂乱的自我对弈之中,最终才幡然醒悟而告别了棋局。对抗网也是如此,稳定性一直是其存在的问题之一。尽管理论上Wasserstein GAN (WGAN)可以部分解决其收敛性问题,但实际的效果还没有达到尽人意的地步。

其次,枪打出头鸟,既然这项技术这么牛了,过来挑战的也不少。据不完全报告,似乎已经有十五波“武林高手”对GAN网络的抗击打能力进行了挑战。极端情况,在图像中加一个像素就可能使GAN网络产生误判。

第三,GAN网络也是深度网络的一种,在可解释性这条路上,仍然没有找到非常明确的方向。

最后,双手互搏的基础还是手。而这一基础的结构并没有从近几十年来人工智能发展的框架中脱离出来。

因此,张军平提醒,期望以GAN之奇技,从弱人工智能冲击“能真正推理和解决问题,且有知觉、有自主意识的”的强人工智能还遥遥无期。


相关文章

新神经网络让人工智能像人一样思考

美国科学家开发了一个具有类似人类系统泛化能力的神经网络,挑战了一个已存在35年的观点,即神经网络缺乏系统泛化的能力,不是人脑的可行模型。相关研究近日发表于《自然》。研究者表示,使用新方法或能开发出行为......

科学家构建深度脉冲神经网络学习框架

脉冲神经网络(SpikingNeuralNetwork,SNN)被誉为第三代神经网络,使用更低层次的生物神经系统的抽象。它既是神经科学中研究大脑原理的基本工具,又因稀疏计算、事件驱动、超低功耗的特性,......

新构建!深度脉冲神经网络学习框架“惊蜇”

中国科学院自动化所李国齐研究员和北京大学计算机学院田永鸿教授团队合作构建出深度脉冲神经网络学习框架“惊蜇”。它可以提供全栈式的脉冲深度学习解决方案,能够处理神经形态数据、构建深度脉冲神经网络、部署神经......

AnalyticalChemistry|朱正江课题组基于神经网络构建的离子淌度质谱CCS值数据库

中国科学院上海有机化学研究所生物与化学交叉研究中心朱正江研究员团队在AnalyticalChemistry杂志在线发表了题为“AllCCS2:CurationofIonMobilityCollisio......

科学家利用神经网络设计全新蛋白质

美国麻省理工学院研究人员在新一期《应用物理学杂志》发表的论文中,将注意力神经网络与图神经网络相结合,以更好地理解和设计蛋白质。该方法将几何深度学习与语言模型的两种优势结合起来,不仅可预测现有蛋白质特性......

自动化所研发出全脉冲神经网络的类脑认知智能引擎

中国科学院自动化研究所研究员曾毅带领的类脑认知智能团队,打造出全脉冲神经网络的类脑认知智能引擎(Brain-inspiredCognitiveIntelligenceEngine,简称为BrainCo......

科学家发现与纤维肌痛相关的潜在神经机制

纤维肌痛(FM)是一种难以诊断和治疗的神秘慢性疼痛疾病,以全身反复出现的广泛性疼痛为特征,常伴有疲劳、睡眠障碍、晨僵以及抑郁、焦虑等问题,其病因仍然不为人知。近期,波鸿鲁尔大学与海德堡大学的研究人员发......

科学家发现深度神经网络对幻觉轮廓“视而不见”

近日,中科院自动化所研究员曾毅团队研究发现,从经典的到最先进的深度神经网络都难以像人一样具有较好的幻觉轮廓识别能力。相关研究成果发表于细胞出版社旗下期刊《模式》。神经网络和深度学习模型在过去十年中看似......

类脑神经网络赋能无人机集群涌现自组织避障行为

近日,中国科学院自动化研究所研究员曾毅团队借鉴自然界中群体智能的去中心化、自组织的行为机制,提出了一种无人机集群的自组织生存避障模型。相关研究成果发表于细胞出版社旗下期刊《模式》(Patterns)。......

神经网络打开理解电子相互作用新窗口

据9日《科学》杂志发表的一篇论文,著名的人工智能企业“深度思维”的新研究表明,神经网络可用于构建比以前更准确的电子密度和相互作用图。该研究有助于科学家更好地理解将分子结合在一起的电子之间的相互作用,还......