先引一段报道:
文章来源: 财新网 作者:王烁
今天(10月19日)凌晨,谷歌旗下Deepmind团队在《自然》杂志发表人工智能界期待已久的论文《无须人类知识掌握围棋》(Mastering the game of go without human knowledge),印证了一个人们已经猜到的事实:今天的阿尔法围棋(AlphaGo)已经完全不是人了。
这个阿尔法从零开始,所以,它的名字叫作零(Zero)。
谷歌用这个名字告诉人类,零需要的人类知识是零。它完全没有向人学棋,通过自我对弈学习。学到第36个小时的时候,已经超过李世石版;学过三天,自我对弈490万局,学成出关。
上图是零的成长图,中间那条有从0到72数值的是时间线,对应着从创世到72小时。
从时间线引出来的虚线,指向与相对应的零下的棋。作为一个人类棋手,我看着很感慨:从零开始,它稳定、迅速地变强。
3小时,零在乱下。
10小时,发现简单定式。
16小时,发现小雪崩定式。
19小时,发现死活、厚势与实地的逻辑。
24小时,发现小目一间高挂定式。
36小时,也就是超越李世石版的时候,发现星位一间夹点角定式。
55小时,发现非人类定式。
72小时,出关。
人类学习的时间线是什么样的呢?今天的世界冠军级棋手,5岁学棋,15岁出关,20岁前拿冠军,否则终身无望。
人类学棋十几年,不如阿尔法零学3天。
以下是我自己的感想。
在人工智能面前,人类的棋谱是多余的。
只需要设定围棋规则,
只需要输入黑子白子,
只需要三天,AlphaGo Zero就从一张白纸自学开始,超越人类千年围棋,站在围棋之巅!
我想对于职业棋手来说,难免失落。但更多的是幸运,正是通过人工智能,人们才能一睹非人超神的围棋是什么样!
如果说以前的AlphaGo是这样的:
我的女友是机器人~
那么今天的Zero是这样的:
我的女友是新垣结衣!
因为围棋的规则简单,所以用强化学习的算法。但是真正实现和人差不多的智能,还需要很长的路要走。希望有一天对面坐着一个人工智能的新垣结衣和我下围棋,额~应该是教我下围棋。呵呵!