下棋、玩游戏,在与人类的博弈中,人工智能(AI)正在不断成长。近日,英国DeepMind公司的AI智能体DeepNash,就在西洋陆军棋(Stratego)中达到了专业级人类玩家的水平。该成果12月1日发表于《科学》。
事实上,在DeepNash攻克Stratego前,就有报道称AI能够玩“强权外交”这款类似的经典桌游。这是一款具有外交深度的游戏,玩家间存在合作与竞争关系,必要时须通过谈判结交盟友。
“近年来,AI掌握本质不同的游戏的速度相当惊人。”美国密歇根大学计算机科学家Michael Wellman表示,Stratego和“强权外交”这两款游戏大不相同,但它们都极具挑战性,与此前AI已经掌握的游戏也截然不同。
Stratego是一款需在信息缺失情况下进行战略思考的棋盘游戏,类似于中国的军棋。它要比此前AI掌握的国际象棋、围棋或扑克复杂得多。
在游戏中,双方各有40枚棋子,且彼此看不到棋子的真实“身份”。双方轮流移动棋子,来消灭对手的棋子,最终夺得对方军旗或消灭所有能动的棋子的一方获胜。因此,玩家需要进行战略部署、收集信息,并与对方博弈。
一局Stratego游戏中会有10535种可能的布局。相比之下,围棋的布局有10360种可能。此外,在Stratego中,AI需要推理对手超过1066种部署策略,这使德州扑克中初始的106种可能情况相形见绌。
“Stratego中可能出现的结果数量之多及其复杂性,意味着在信息完全的游戏中表现出色的算法,甚至在扑克游戏中表现良好的算法,在这款游戏中都不起作用。”DeepMind研究员Julien Perolat说。
所以Perolat和同事开发了DeepNash,该命名致敬了提出纳什均衡的美国数学家约翰·纳什。
纳什均衡是博弈论中一种解的概念,指满足以下条件的策略组合:任何一位玩家在此策略组合下单方面改变自己的策略(其他玩家策略不变),都不会提高自身的收益。
DeepNash将强化学习算法与深度神经网络相结合,以找到纳什均衡。强化学习包括为游戏的每个状态找到最佳策略。为了学习最佳策略,DeepNash已经与自己进行了55亿次博弈。
今年4月,DeepNash在网络游戏平台Gravon上与人类Stratego玩家进行了两周的比赛。在50场比赛后,DeepNash目前在所有Gravon Stratego玩家中排名第三。
“我们的研究表明,像Stratego这样复杂的涉及不完善信息的游戏,不需要通过搜索技术来解决。”团队成员、DeepMind研究员Karl Tuyls表示,“这是AI迈出的一大步。”
而曾于2019年报告了玩扑克的AI——Pluribus的Meta AI研究员Noam Brown团队,则将目光投向了一个不同的挑战:建立一个可以玩“强权外交”的AI。
“强权外交”是一个最多可由7位玩家参与的游戏,每位玩家代表第一次世界大战前欧洲的主要力量,游戏目标是通过移动部队控制供应中心。重要的是,该游戏需要玩家间进行私人交流和合作,而不是像围棋或Stratego那样进行双人博弈。
“当进行超过两人的零和博弈时,纳什均衡思想对游戏就不再有用了。”Brown说,他们成功训练出了AI——Cicero。在11月22日发表于《科学》的论文中,该团队报告称,在40场游戏中,“Cicero的平均得分是人类玩家的两倍多,在玩过一场以上游戏的参与者中排名前10%”。
Brown认为,可以与人类互动并解释次优甚至非理性人类行为的游戏AI,可以为其在现实世界的应用铺平道路。
相关论文信息:
2025年是“十四五”收官之年,也是“十五五”谋篇布局之年。党中央、国务院高度重视数字中国建设,习近平总书记多次作出重要指示批示。国家数据局会同有关单位,系统总结2025年数字中国建设的最新成果和典型......
近日,由中国科学院学部组织、会聚近300位跨学科院士专家共同研究撰写的重要学术成果——《人工智能赋能科学研究:人工智能学科体系》正式出版发行。该书作为“范式变革:人工智能与科学研究”丛书的总报告,系统......
日前,国家网信办、国家发展改革委、工业和信息化部等五部门联合公布《人工智能拟人化互动服务管理暂行办法》(以下简称《办法》),自2026年7月15日起施行。《办法》明确,拟人化互动服务提供者不得向未成年......
为推动全球共同促进人工智能治理,中国科协所属中国自动化学会、中国电子学会、中国计算机学会、中国人工智能学会等16家科技社团4月13日共同发布《全球人工智能治理科技社团倡议》,倡导以人为本、智能向善,推......
谈到对齐,你会想到什么?是一把尺子,丈量细微的偏差,还是一份共识,守护人类文明的底线?“在人工智能(AI)时代,文化创新需要对齐什么?又该向什么对齐?”3月22日,武夷山的九曲溪畔,在由中国人民大学、......
3月25日,美国总统特朗普公布了总统科学与技术顾问委员会(PCAST)首批成员名单。与往届不同的是,此次任命高度聚焦人工智能(AI)和量子计算领域,成员以科技巨头、商界富豪与政治盟友为主,学术背景科学......
3月17日,由中国检验检测学会与廊坊市科学技术协会共同主办、河北省算力产业研究院承办的“钢铁行业人工智能技术应用培训”在廊坊市京津冀大数据创新应用中心成功举办。作为“科创中国”河北行“提升河北智能检验......
全国政协委员、中国医学科学院阜外医院麻醉中心主任医师敖虎山建议,加强顶层设计,系统化推动融合人工智能、大数据与医疗专业知识的“数字医生”与传统医疗体系实现规模化深度融合,将其作为破解当前医疗服务难题的......
工业和信息化部10日对外发布《关于启动工业数据筑基行动开展面向人工智能赋能的高质量行业数据集建设先行先试的通知》,着力突破工业数据“采”“集”“用”瓶颈。通知提出,到2026年底,培育一批行业数据合作......
近来,在全球人工智能竞争升级的背景下,我国在人工智能人才供给、政策动员与平台化组织等方面取得令人瞩目的阶段性进展。一方面,我国人工智能人才规模与结构优势初步确立。我国人工智能核心产业人才规模2024年......