发布时间:2013-11-29 11:43 原文链接: 科学家尝试让计算机拥有“常识”

  让机器以一种“常识”的方式自行思考是计算领域的“圣杯”。美国卡内基·梅隆大学研究人员正尝试着给计算机植入人工智能的数字化“种子”——让计算机系统不断观看各种图画,并自己决定它看到的内容都是什么意思。研究小组将在12月4日澳大利亚悉尼召开的美国电气与电子工程师协会(IEEE)国际机器人视觉大会报告他们的成果。

  从今年7月开始,在卡内基·梅隆大学,一个名为“尼尔”(NEIL)的计算机程序就在24小时不停地从互联网上搜寻图像。其中有几个关键小步骤,就是它要自己决定这些图像之间的相互关系,尽可能自行理解它们,以此建立起我们所谓的“常识”。

  常识与联想

  “尼尔”是“无休止图像学习”(Never Ending Image Learning)的缩写,其在两个计算机组群上运行,包括200个处理器核。随着它的视图数据越来越多,积累的“常识”也越来越多。常识是人们似乎知道却不曾明说的信息,比如汽车通常是跑在公路上,建筑物往往是垂直的,鸭子看起来很像鹅等。

  “任何智能都要有常识来帮它作决策。”卡内基·梅隆机器人研究所教授阿比纳伍·古普塔说,让一台计算机自己联想,对它来说是完全不同的挑战。比起编制一台超级计算机程序来说,圆满迅速地完成一项任务更难以应付。比如1985年卡内基·梅隆研究人员编制下棋程序让一台计算机下棋;12年后,计算机打败了国际象棋冠军加里·卡斯帕罗夫。

  麻省理工大学人工智能专家凯瑟琳·哈瓦希说,人类能不断利用“不言而喻的假定这一巨大库存”来作决策,而计算机却不能。对一些人类能迅速作出反应的问题,计算机却要花更长时间才能算出来。“长颈鹿能坐上你的汽车吗?我们甚至不用思考就能得出答案。”她说,因为我们对长颈鹿的身体大小有一种常识。

  随着程序运行,“尼尔”逐渐能给图像做次级分类,比如三轮车可以分为小孩用、大人用,还能装上发动机变成三轮摩托;汽车有不同的商标和样式等。然后它慢慢注意到事物之间的联系:斑马往往出现在大草原上,老虎看起来有点像斑马,股票交易所大楼通常挤满了人。

  在短短4个月里,“尼尔”的200个处理器核已经分析了3百万幅图像,从其中50万幅中识别出了1500种物体,1200个场景,并把相关的点连接起来做了2500个关系联想。“尼尔”生成的联想有些是错的,比如“犀牛是一种羚羊”,而有些很奇怪,如“演员在监狱牢房里”或“新闻主播看起来像巴拉克·奥巴马”。

  “我爬,我看,我学习”

  “图像是学习视觉性质的最佳方法,”阿比纳伍·古普塔说,“图像也包括了与这个世界有关的许多常识信息。人类自己学习了这一点,对于‘尼尔’,我们希望它也能像我们一样。”

  伊利诺伊大学芝加哥分校计算机科学系主任、人工智能专家罗伯特·斯洛恩说,“尼尔”的方法会产生有趣的结果,因为只用语言去教一台计算机“会带来各种问题”,“如果它们对着不管什么地方看到的动物,都不停地说‘斑马、斑马、斑马’,我会对这一幕印象深刻。”

  机器人学博士生阿比纳伍·希瑞瓦斯塔伍说,“尼尔”有时也会出错,所以还需要有人工参与。比如谷歌图像搜索可能会“误导”它,让它以为“pink”(意为粉红色)是一位歌星的名字,而不是一种颜色。

  “人们不一定总是知道该怎么去教计算机,以及教它们学什么,但发现它什么时候出错,人们是很擅长的。”希瑞瓦斯塔伍说,人们会告诉“尼尔”,物体、场景等属于哪一类,以便研究分析。

  有时候,“尼尔”的预测能力也让研究人员震惊。在搜寻“苹果”时,不仅给出了水果图,还有苹果电脑;搜索F-18时不仅发现了战斗机,还有F-18级双体船,这是古普塔和他的陆地小组所不知道的。

  “根据我们50年从事计算机视觉研究的经验,你掌握的数据越多,计算机视觉就会变得越好,”古普塔说。“尼尔”的座右铭是“我爬、我看、我学习”,研究人员希望让“尼尔”一直运行下去,这也意味着它可能会一点点地变得越来越聪明;但也可能不会。

  未来角色

  “尼尔”担负着当前计算机视觉的进步。计算机视觉能让计算机程序识别和标记出图像中的物体,找出场景特征,认出图像属性,如颜色、明暗、材质等,所有这一切都力求使人类对它的监管达到最小。反过来,它生成的数据也会进一步加强计算机理解视觉世界的能力。

  古普塔对项目的初步进展感到高兴,“当我们开始这个项目时,不敢确保它是否可行。这还只是个开始。”今后,“尼尔”还要分析YouTube上的大量视频,以寻找事物之间的联系。

  “尼尔”项目的一个目标是,创造世界最大的视图体系知识库,在这个库中,所有的物体、场景、动作、特征以及背景关系都被加上标记并分门别类。目前,ImageNet和Visipedia项目也在人工汇编这些结构数据,但互联网规模如此巨大,单一个Facebook(脸谱)就有超过2000亿幅图像,要分析它们,唯一的希望是教会计算机来做。

  此外,这一项目由谷歌公司和国防部海军研究办公室共同资助。谷歌公司和海军研究办公室都没有回答他们为何要资助“尼尔”,但也有一些线索。“海军研究”网站上指出,“当前的作战空间环境比过去要复杂得多,数据到达决策系统的速度正在提高,而能把这些数据转化为决策方案的人员数量却正在下降。”也就是说,电脑可能在未来战争中作出许多决策,“在许多军事行动中,根本不需要人类到场。”

相关文章

2022中国高性能计算机TOP100榜单发布

11月15日,第4届中国超级算力大会(ChinaSC2022)以“线上+线下”形式在京召开。会上,中国计算机学会高性能计算专业委员会(以下简称CCF高专委)联合中国工业与应用数学学会高性能计算与数学软......

甄别网络谣言,她是“智能女侦探”

“曹娟,你看这条信息是真的还是假的?”每当有重大事件发生的时候,中国科学院计算技术研究所(以下简称计算所)研究员曹娟总是特别忙,很多人会向她求证信息的真假。11月9日,2022年世界互联网领先科技成果......

光量子计算机开发出新理念

日本东京大学、日本电信电话公司等机构参与的一个研究团队日前发布联合公报说,他们利用量子纠缠,找到了能够自由控制量子光脉冲波形的方法,这将有助于光量子计算机等量子技术的开发。据公报介绍,优秀光源的开发具......

胡伟武代表:使命光荣为中国造“芯”

2022年6月24日,龙芯中科成功登陆科创板,成为国产中央处理器(CPU)第一股。这一信息,让龙芯中科技术股份有限公司董事长胡伟武代表又一次成为热点人物。20年前,中国第一枚拥有自主知识产权的通用高性......

中国CAD研究和实践的先行者刘慎权逝世

中国科学院计算技术研究所10月14日发布讣告称,我国优秀的科学工作者、计算机辅助设计与计算机图形学领域的杰出专家、中国科学院计算技术研究所研究员、博士生导师、原CAD研究室主任刘慎权先生2022年10......

首个欧洲量子计算机网络将于2023年投入使用

欧洲高性能计算联合企业(EuroHPCJU)10月4日宣布,将选择捷克、德国、西班牙、法国、意大利、波兰六个成员国来部署史上第一个欧洲量子计算机网络,它将整合这六个国家现有的超级计算机,形成一个量子计......

我国团队首创新算法,让细胞与计算机“对话”

细胞内有数以亿计的碱基、表达程序以及运行策略,而且各不相同。单细胞测序技术可解读单个细胞里的这些信息,但人工干预多、过度依赖人为选定的标记基因使得单细胞测序技术对细胞的注释稳定性较低。可以理解为,同一......

百度发布量子计算机:不是裸机,“开箱即用”

文|《中国科学报》记者赵广立把“量子计算机”与“产业化”联系在一起?是的。成立4年多的百度量子计算研究所,决定在时下热门的量子计算的赛道上,做点不一样的。8月25日,在“量见未来”量子开发者大会上,百......

科学家提出液晶计算机新构想

科技日报北京8月22日电(记者刘霞)两位科学家在最新一期《科学进展》杂志上撰文提出了一种新的计算机制造方法:用液晶构建计算机,这种计算机将使用分子的朝向来存储数据,其计算方式类似量子计算机,但比量子计......

锚定三大使命,60岁的中国计算机学会再出发

2022年是中国计算机学会(CCF)创建六十周年。8月6日,CCF在苏州业务总部&学术交流中心(CCFCCB)举行了创建六十周年庆典活动。来自政府相关部门、学术界、产业界的500多位代表受邀现......