zdg收录,使用标签:AI, 围棋, MonteCarlo,时间:2008-5-5 18:45:53 | 相关网摘,我也收藏
我们选择蒙特卡罗算法的原因之一是围棋中应用极小极大算法(Minimax Algorithm,一种在棋类中常用的选择“最佳”的下一步着法的算法,参考这里)来计算2步或3步之后的着法产生的计算量蒙特卡罗算法评估某一着法有多好(差)的方法是由两个随机AI(选择的着法完全随机)对一个给定的盘面下若干盘“虚拟棋”。从一个给定的盘面开始,然后对每一可行着法计算指定数量的后续着法完全随机的“虚拟棋”。之后,我们统计所有可行走法的平均值,以反映出“好”的着法。最后是选择有着最高的平均值的着法,蒙特卡罗AI在真正的棋局中应用这一着法。这是基于假设这一高分着法通常比其它的选择产生的结局都要好来做的。
http://blog.csdn.net/lanphaday/archive/2008/05/04/2387034.aspx