在游戏世界里,可以重新来过,可以复盘,还有经验可积累。因此,如果“拐弯”后遇到了“堵车”,下次就另外选路好了。
文/张书乐
有朋友问我,游戏程序是死的,人工智能应该就是活的,那么如果人工智能在游戏里和设定好的程序进行对决,结果会如何呢?
乍一听,这就是个诡辩式的命题:两段代码之间的战争?当时听到这个问题时,我自然而然地想到了电影《复仇者联盟2:奥创纪元》里人工智能奥创用光电攻击钢铁侠的管家那一幕。这个想法太过科幻,至少在现实世界里,人工智能对战游戏程序,已经悄然展开。开路先锋依然是这个开发了“阿尔法狗”、击败李世石的谷歌人工智能团队DeepMind。
就在这场著名的围棋人机大战前一年,2015年3月,DeepMind曾对外透露说,他们开发出一项单一算法,能学会49种不同电子游戏,其中包括19世纪70年代的经典游戏“乒乓”(Pong)和“太空侵略者”(Space Invaders)。这台电脑对半数以上的游戏已经相当熟练,足以击败专业的人类玩家。如果用更通俗的说法来解读,就是他们搞了个人工智能程序,会玩游戏,而且玩得还特别“溜”。这则新闻当时并没有多少人关注,反倒是围棋人机大战结束后,爆出“阿尔法狗”将在《星际争霸》中再次挑战人类的新闻时,许多媒体因为不知道那则旧闻的存在,还在津津乐道于“阿尔法狗”到底是“潜入”到电脑里和玩家在游戏里作战,还是操控游戏臂、用“眼睛”识别屏幕上的战局,像个电竞玩家一样面对面决斗。
实际上,这个会玩游戏的人工智能程序早在2013年就已经对外发布了,官方对它的注释是“首个能基于极少量起始信息从头开始学习各种任务的人工智能系统”,这个解释太复杂,让人看不太懂。其实说简单点,它就和科幻片里那些人工智能程序一样,不用人教,自己试着玩下游戏,就能自动在一款陌生游戏里慢慢生存下来,并逐步通关,也就是说,它与人类玩游戏的过程差不多。
那么,这个会玩游戏的人工智能程序,在学习能力上如何呢?笔者没见过实物或者视频,但根据媒体报道,它往往花上几小时学习一款游戏,然后就“精通”了。这样的学习速度不可谓不快!只是人工智能玩家和人类玩家还有一个明显的不同,即精通一款游戏并不能使目前的系统更擅长下一款游戏。说白了,它其实并不知道自己是在玩游戏,而只是在根据自己在游戏中寻找出路的时候不断积累经验,最后形成最佳通关路径,从而击败只能“直行”、不会“拐弯”的游戏程序。当然,这已经是极大的进步了。我们也可以对人工智能和传统程序做个简单的区分,只会“直行”(执行)的叫程序,能够根据路况变化而“拐弯”的就是人工智能。
这也算是一种思考能力吧,尽管只处于人类婴幼儿的智力阶段。毕竟,在游戏世界里,可以重新来过,可以复盘,还有经验可积累。因此,如果“拐弯”后遇到了“堵车”,下次就另外选路好了。可在现实世界中,有多少错误可以重来呢?按照新闻的说法,这个缺陷使它还无法精通“吃豆人”之类的迷宫游戏,因为以它的联想能力,还无法真正把自己的当前行动与深远的后果联系起来。