阿法狗并没有用涉及智能,而是用一种穷举方法(暴力破解),由于强大的计算能力,硬件资源,加上使用了很多统计数学的优化方法,这更像是一个学习能力超快的人类,而不是智能型的棋手。
每下一步棋都要衡量成功率,下的好不好,这倒是让我想到之前一直感到巧妇难为无米之炊的CUDA优化,如果我们能让计算机自己意识到IO瓶颈,自己改进优化方法,调整线程调度,岂不是很好。
估值网络和策略网络正好对应CUDA的当前效率(速度提升)以及任务划分策略(block,thread,grid,wrap,寄存器资源的限制,流处理器)。
至于这种通过网上的棋局自己和自己对弈,则可以通过设置目标加速比和真实案例,让程序自己去调用自己。
可以写一个宿主语言是nvidia的JS,作为(优化的)指令发布端,实际的图像程序作为客户端(执行端),这样也能构成一个B/S框架。(深层次--MVC)