按照人类的标准来看,国际象棋并不是一项简单的游戏。但对于一个由强大的、几乎是外星人的思维所驱动的人工智能来说,它可以在几小时内就掌握这项琐碎的消遣游戏。
在一篇新论文中,谷歌的研究人员详细介绍了他们人工智能的最新发展——AlphaZero如何在国际象棋中发挥出“超人表现”,在打败世界冠军国际象棋程序stockfish之前,该人工智能只花了四个小时来学习规则。(维基百科注:stockfish是一个免费的开源UCI国际象棋引擎,可用于各种桌面和移动平台。)
换句话说,只需从纽约到华盛顿特区的时间,人类的所有棋子知识甚至超出人类棋子认知部分的知识就被人工智能吸收和超越了。
在只了解国际象棋规则(没有学习策略)的情况下,仅仅4个小时AlphaZero就已经掌握了这个游戏。在某种程度上,它能够使国际象棋程序stockfish得到最好优化。
在对阵stockfish的100场比赛中,AlphaZero以白色(先发优势)赢得了25场比赛,并获得了三场比赛的黑牌。剩下的比赛都是平局,stockfish没有赢,阿尔法也没有输。
国际象棋科学网站Chessable的首席执行官兼国际象棋研究员大卫·克拉马利(David Kramaley)说:“现在我们知道我们的新霸主是谁了。
“毫无疑问,这将彻底改变游戏规则,但也可以想想如何在国际象棋之外应用该技术。这个算法可以应用在城市,大陆,宇宙。”
Alpha Zero由谷歌的DeepMind人工智能实验室开发,它是一款经过调整的、更通用的AlphaGo Zero版本,专攻中国的棋类游戏,围棋。
多年来DeepMind一直在不断完善这个AI,在这个过程中,它打败了一系列的人类冠军,在“神一样”的神经网络面前这些人类冠军像多米诺骨牌一样倒下。
这一胜利在10月取得了惊人的成功,一个全新的完全自主的人工智能的版本诞生了——它通过玩游戏自主学习,无需面对人类——胜过它以前所有的化身。
相比之下,AlphaGo Zero的前辈们在一定程度上学会了如何通过观察人类玩家的动作来玩游戏。
这一努力旨在辅助刚刚起步的人工智能进行策略学习,但似乎在实际中成了一个不利因素,因为AlphaGo Zero完全自主的学习能力在一对一的比赛中表现得很给力且被证明更加有效。
麻省理工学院的计算机科学家尼克·海因斯(Nick Hynes)在10月份对Gizmodo说:“这就好比一个外星文明发明了自己的数学。”
“我们在这里看到的是一个没有人类偏见和假设的模型。任何它认为最优的东西它都可以进行学习,面对相同的概念,它可能确实比我们人类思考的更细致入微。”
不过,这一领域事情进展得非常之快,以至于10月份的成就可能已经过时了。
在新论文中,该团队概述了最新的AlphaZero AI如何利用这种自玩的依赖——也即所谓的“强化学习”并把它应用到更广泛的范围中,使其更加关注解决问题的。
广泛的关注意味着AlphaZero不仅仅会下象棋,它也玩Shogi(又名日本象棋)和围棋。也许一点也不足为奇的是,分别只用了2个小时和8个小时,它就掌握这些游戏。
目前,谷歌和DeepMind的计算机科学家们并没有就这项新研究发表公开评论,这一研究还没有经过同行评议。
但从我们目前所能掌握的情况来看,这个算法在通向人工智能顶峰的路途中令人目眩的表现还远未结束,甚至连国际象棋大师也被眼前的景象所迷惑。
“我之前一直好奇,如果一个优秀的物种降落在地球上并向我们展示他们是如何下棋的,那将会是怎样的情形。”大师彼得·海涅·尼尔森(Peter Heine Nielsen)对BBC说道。
“现在我知道了。”
作者:Peter Dockrill
原创编译:梓色扬光
原文链接:https://futurism.com/4-hours-googles-ai-mastered-chess-knowledge-history/
“本译文仅供个人研习、欣赏语言之用,不欢迎任何转载及用于任何商业用途。如需转载请注明作者和来源。(本译文所涉法律后果均由本人承担。本人同意简书平台在接获有关著作权人的通知后,删除文章。”)