Alpha-Beta减枝算法

算法:采取MinMax算法,利用Alpha-Beta算法减枝。
原理:首先,算法是用于计算出当前下棋所产生的最好价值。
那么,定义自己的价值越高数值越大(正),对手的价值越高数值越小(负)
下棋是你一手我一手的下,根据下棋的步骤,构建决策树
所谓决策树就是:每个节点是当前局面的评分,节点的基数层该自己下棋,偶数层该对手下棋
那么,在遍历决策树时,首先要计算第一层能获取的最大值Max
要想获得第一层,那就遍历第二层(第二层为根节点所能产生的所有走法的评分)
在第二层中找到最小的那个Min(为什么要找最小的?因为第二层是对手下棋,对手最好的走法,对你来说最坏)
要想找第二层的最小值,那就得遍历每个节点的第三层,找到第三层中最大的值(因为该你走),然后比较所有Max中Min的那一个
这一句可能不太清楚,是说对手会遍历你下一手的所有走法,然后找到最差的那个(对他最好)。所以是在Max中找Min
之后一直这样遍历


但是如果这样的话,节点数量会成指数倍增加。效率大大的下降了。
如果每次正常的走法有N个。
那么第一层节点的个数是1,第二层是N,第三层是NN,第四层是NN*N....第N层的节点数将会达到N的N次方。一辈子都算不完了

所以目前的做法有两个
1、限制搜索的层数,只搜索有限层(层数越高当然智能越高,速度也越慢)
2、采用减枝(上面说的思路是每次都会遍历所有子节点,但实际上可以通过一些计算,忽略点大部分节点)

而Alpha-Beta算法就是采用了以上方法的MinMax改进版
步骤如下:
1、如果要找某个节点(即为某个走法)的最优值(我们称为Alpha或者Max),那么需要首先找出第一个子节点的Alpha值
2、通过同样的函数,计算子节点(对手的走法)中最好的值(但对我们来说是最坏的),取反。然后和当前的Alpha和Beta值比较
3、如果大于当前的Beta值,说明如果选择这一步,那对手就会走出对我们更不利的局面,那么基于这个节点的所有子节点都抛弃掉(减枝)
4、如果大于当前的Alpha值,说明找到了更好的走法,把当前的Alpha设定为该值,然后继续找剩下的走法。
5、返回Alpha值,即为最好的走法。
6、重复寻找,一直达到最大深度。


考虑例子:
假设有N个袋子,每个袋子有N个物品(用于模拟下棋,袋子即为走法,物品即为走法的价值)
规则是你可以看所有的物品,然后选择你想要的袋子,然后从袋子中拿走价值最低的那一个。

很显然,最简单的做法是查看所有的袋子,找出每个袋子中,价值最低的物品(Min)
然后在这些物品中选择相对来说最好的(Max)物品所在的袋子。这就是MinMax算法
规则很简单,算法也很简单。但如果袋子和物品很多,需要很多时间才能全部看完并且比较完价值。
如果有时间限制:比如需要在10分钟之内做出决定,那显然目前是办不到的。
其实可以换种办法。
首先查看第一个袋子中全部的物品,找出其中价值最小的物品(设Max和Min都为它)
然后从第二个袋子拿出一个物品,如果这个物品的价值比Min还小,那根据规则(所得物品为袋子中价值最少的物品)
你从这个袋子中获得的物品的价值肯定是小于或者等于这个物品,也就是说肯定小于Min
那就没有必要继续查看这个袋子中的物品了,直接舍弃。
如果比Min大,那就继续查找剩余的物品,直到找到一个比Min还小的物品,那就舍弃这个袋子,或者找完所有物品。
找出其中价值最小的,与Max比较,如果大于Max,则表示选中这个袋子,价值更高。把Max设置为这个物品的价值
重复找之后的袋子,直到找完。这时候,Max物品所在的袋子就是你要选择的袋子

当然,这个例子只是简单的描述Alpha-Beta算法,而且只是Depth为1的情况。

以下是模拟算法:
难点在于Alpha和Beta的位置不断的互相转变,值也在取反。
需要理解了这个函数的参数意义,以及该博弈树是由自己和对手轮流走,参数的算法树
而且对手走的价值高的棋,对于我们来说是最低的
depth:当前层深度
max:当前能找到的最好值(也叫Alpha)
min:当前能找到的最坏值(也叫Beta)
(之所以取相反数,是因为正值表示对一方有利,负值表示对另一方有利)

// 计算对于当前走法的最佳价值
int Alpha(int depth, int max, int min)
{
  if ( depth == 0 )
  {
      return GetCurrentValue(); // 返回当前走法的价值
  }

  MakeAllPass(); // 产生所有走法

  foreach ( Pass p in allPass ) // 遍历所有的走法
  {
    DoPass(p); // 走棋
    // 计算该对手走时,对手会走的最好值(对自己来说最坏)
    // 参数,-min表示对自己最坏值取反(当然对于对手来说最好)
    // 参数,-max表示对自己最好值取反(当然对于对手来说最坏)
    // 返回值,对手能找到的最好值,取反后自然是对自己来说最坏的
    int v = -Alpha(depth - 1, -min, -max);
    UndoPass(p); // 悔棋
    // 如果这个最坏值(v),比现在的min还要坏,那就舍弃当前的v
    // 这一句话翻译的意思是,对手下一步走后产生的价值比上一手还差,那就选上一手的
    // 下面也是同样的道理
    if ( v >= min )
    {
      return min;
    }

    // 如果这个最坏值,比现在的max还要好,那就取这个值为max
    if ( v > max )
    {
     max = v;
    }
  }
  return max;
}

算法用于五子棋游戏:
算法框架其实已经搭建好了,需要实现的函数有
GetCurrentValue():用于计算当前走法的价值
MakeAllPass():用于产生所有有效的走法
DoPass(Pass):下一步棋
UndoPass(Pass):悔一步棋

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 195,980评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,422评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 143,130评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,553评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,408评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,326评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,720评论 3 386
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,373评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,678评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,722评论 2 312
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,486评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,335评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,738评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,009评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,283评论 1 251
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,692评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,893评论 2 335

推荐阅读更多精彩内容

  • 针对曾经火爆的2048游戏,有人实现了一个AI程序,可以以较大概率(高于90%)赢得游戏,并且作者在stackov...
    GarfieldEr007阅读 2,582评论 1 18
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,510评论 18 139
  • 机器学习是做NLP和计算机视觉这类应用算法的基础,虽然现在深度学习模型大行其道,但是懂一些传统算法的原理和它们之间...
    在河之简阅读 20,443评论 4 65
  • Alpha-Beta算法 用于Min-Max的剪枝,一些搜索是没有必要的,故此可以剪除(cut-off)那些没有必...
    方老司阅读 12,469评论 0 4
  • 正午的阳光微微有些毒,虽然还尚未到盛夏,却也不是能在空地上站得久的。青衣的男子头上微微有了薄汗,拱手向对面穿着白衣...
    洛川川阅读 384评论 0 0