王者峡谷,风云突变。
8月,吉隆坡结束的王者荣耀最高规格电竞赛事——世界冠军杯半决赛赛场上,有一场特殊的对决上演:五位电竞职业选手组成的赛区联队,对阵腾讯王者荣耀AI绝悟。
最终这场5v5的大战中,思路与人类迥异的AI战队耗时16分15秒,团灭电竞职业高手战队,推掉全部9塔和高地水晶。
这意味着,腾讯AI绝悟的能力,已经精进到王者荣耀电竞职业水平。
同日上海的ChinaJoy,绝悟向顶级业余玩家开放为期四天的1v1体验测试。首日的504场测试中,绝悟测试胜率为99.8%,仅输1场(对方为王者荣耀国服第一后羿)。
这场比赛,五位电竞职业高手组成赛区联队。他们选择的阵容是:曹操(ESTARPRO.XIXI)、娜可露露(EMC.SUN)、武则天(NOVA.SEEK)、狄仁杰(KZ.NIGHT)、张飞(M8HEXA.MIKE)。
腾讯AI绝悟(Wukong)选择的阵容是:达摩(AI_001)、雅典娜(AI_011)、王昭君(AI_100)、虞姬(AI_000)、牛魔(AI_010)。
为了这次比赛,训练使用384块GPU,8.5w核CPU,平均每天自对战局数相当于人类训练440年的量,训练周期持续训练半个月以上。
绝悟,是腾讯AI Lab和与王者荣耀共同探索的前沿研究项目:策略协作型AI。
绝悟这个名字,寓意“绝佳领悟力”。这个AI的研发始于2017年12月。2018年12月,绝悟5v5对阵《王者荣耀》王者段位人类玩家,大战250局,拿下48%的胜率。现在,绝悟已经超越王者段位水准,达到职业电竞选手的层次。
这次在吉隆坡和上海发威的绝悟版本,建立了基于“观察-行动-奖励”的深度强化学习模型,无需人类数据,从白板学习(Tabula Rasa)开始,让AI自己与自己对战。
算法上,模仿人类的决策方法,综合考虑小地图信息、己方视野和英雄属性等多个维度特征,让它兼具大局观与微操,决定在游戏的什么时间该去哪里(去上、中、下路或野区等、单人或配合队友站位),要做什么(游走杀人Gank、带兵线、支援或反野),及具体微操怎么做(确定各自站位和角色、组合技能并释放)。
对战中,在庞大且有不完备信息的地图上,10位参与者要在策略规划、英雄选择、技能应用、路径探索及团队协作上面临大量、不间断、即时的选择,形成了极为复杂的局面,预计有高达10的20000次方种操作可能性。