背景
游戏是检验人工智能系统效果的一种重要手段,这得益于游戏本身所具有的对抗性和策略性。
当前在大部分的视频实时策略游戏中已经取得了较好的成绩,如:Atari, Mario, Quake III Arena Capture The Flag, Dota2。但是在星际争霸中则一直没有取得 较好的成绩,这与星际争霸游戏本身的复杂性密不可分。
星际争霸II
星际争霸属Blizzard出品,这是一款伟大的游戏,吸引了众多玩家和职业选手,大型的职业选手比赛已经举办超过20年。
星际争霸有多种玩法,其中最为常见和吸引人的当属1对1模式,比赛时通常以5局定胜负。开始游戏之前,玩家先需要选择种族,不同种族具有不同的优势与弱点。可选的种族有Zerg, Protoss, Terran。刚开局时每位选手会获得基础的人力来收集资源,收集资源可用于建造基础设施、攻击设施、防御设施、添加新的收集人员、攻击人员等。
难点
想要获得一个较好的效果,AI面临以下难题:
- 星际争霸的AI学习过路中并不存在最优解,而是一个不断基于对手变化而不断给出相应应对策略的过程;
- 与国际象棋和围棋等棋类游戏不同,星际争霸中事先并不知道所有可能的处理方法;
- 与现实世界一样,星际争霸中存在因果之间长时影响的问题。即游戏开局的选择可能对结局产生很大的影响;
- 实时也是该类游戏的主要特征之一,棋类游戏有思考时间,存在先后手。而星际争霸所要求的则是对敌方玩家的实时动作做出实时的回应;
- 如前所述,玩家控制的单位和人员是众多的,而每个单位和人员所能进行的操作又平均有10到26种,因而可选的动作空间很大;
效果
在2018年12月举办的赛事中,AlphaStar成功的击败了来自Team Liquid战队的星际争霸顶级人类选手MaNa和TLO。
参考文献
[1] https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/