NegMax算法不再使用Minimax的MAX和MINI层级,而是每一级都使用同样的方法。这种思想也形成了另外一种算法,AlphaBeta,我们在稍后会讨论这个算法。在Minimax中,局面状态是一直从玩家的视角来观察,然后选择走法(需要存储棋子的信息以供评价函数使用)。
此算法不再将博弈树划分为多个层级,NegMax对走法采取一致的评价策略,从最坏的角度来评价子节点。从本质上来说,玩家走完之后,对手肯定会试着做出最好的决定,因此,算法指导玩家选择最好的走法,限制对手的可行走法。如果你比较图7-15和图7-18的伪代码,你将会看到两个几乎相同的博弈树,唯一的区别就是局面状态是如何被评分的。注意,对玩家来说,两个可行走法中的第一个是最好的,因为这个走法对对手的限制最多。
图 7-18 NegMax详解输入/输出
输入输出同Minimax。