无敌是多么寂寞，AlphaGo 要在星际 2 再次吊打人类

在两周前落下帷幕的世纪围棋人机大战中，李世石最终以 1:4 的成绩不敌 Google 出品的 AI AlphaGo。显然，AlphaGo 团队已经不满足于围棋一种游戏，暴雪娱乐制作总监 Tim Morten 在 WCS 中国区总决赛上确认：

AlphaGo 接下来将要挑战《星际争霸 2》

但暴雪官方没有透露更多的细节信息，因为关于这场电子竞技领域的人类大战，Google 还在和暴雪处在商谈过程中，而无疑人类也将会派出最高水平的电子竞技选手与 AlphaGo 再次一决高下。

与围棋不同，在《星际争霸 2》中 Alpha 将难以推算出下一步应该做什么，所以暴雪的娱乐制作总监 Time Morten 也预言 AlphaGo 将不会在《星际争霸 2》中战胜人类。但是谁又能说的准呢？毕竟在 AlphaGo 挑战李世石开始之前，人类也是对之后的战局自信满满。

不过星际争霸显然与围棋不同，围棋对人操作的要求更低，只需要玩家谨慎思考然后下出棋子就好。但在星际争霸等一些电子游戏中，APM（Actions Per Minute）每分钟操作次数，换句话来说就是我们常说的手速，是评价一个玩家竞技水平的一个重要指标。而在星际争霸和魔兽争霸 3（WAR3）这两款游戏中 APM 的高低往往象征着玩家操作的精细程度。但从理论上来讲 AlphaGo 的 APM 可以调节到人类完全实现不了的水平，为了与人类的对战更加公平，在真正比赛时 AlphaGo 的 “手速” 很有可能受到限制。

同时作为一款即时战略类游戏，星际争霸对于 AlphaGo 来说还有很多难点需要突破，首先围棋与星际争霸是完全不同的两种游戏，围棋的输入值很小，只需要几个数字就能描述清楚场上的局面，但是即时战略游戏需要有多少数据来处理，可以参考上面那张图，双方的兵力数量、兵种构成、每一个士兵的能力属性、当前时间、地形等等。而所有这些的解析、决策、执行都需要在极短的时间时间内完成，这些需要极大的运算量。而从围棋世纪大战中我们可以看出，AlphaGo 也是需要一个较长的运算时间的，而战局转瞬即逝的星际争霸 2 明显不允许 AlphaGo 来慢慢考虑。

还有一处难点就是每一步的状态改变，所造成的结果不一致。不仅仅是围棋与即时战略游戏，即使是同类游戏的星际争霸 2 和魔兽争霸 3，每走一步对最终的胜负完全是不一样的，即使 AlphaGo 已经能够算是一个围棋大师，在星际争霸 2 中还是需要打造它的团队一点一点重新学习改进。像 AlphaGo 这样 AI 行为还是需要对目标进行数学建模，然后使用各种算法去简化和求解。越是难以数学建模的游戏，构建 AI 的难度就越大，而像星际争霸这样的即时战略游戏，恰好是个很难建模的事务，需要很大的工作量。

那我们什么时候能看到这场星际争霸的人机大战呢？可能还需要挺长一段时间，首先是因为 AlphaGo 的算法哲学其实是经验主义的，也就是说，它并不关心也无法做到理解它每一步为什么这么走的深刻含义，但是它知道这样走能够获取最高的预测胜率（通过一定程度的搜索、试错与枚举）。所以也就是说 AlphaGo 还需要一段时间的学习，先战胜星际争霸界的“樊麾”这些较低段位选手，才能挑战星际争霸界中的“李世石”这样的世界大师。

下次在玩星际争霸的时候，不要喷对面小学生了，也许对面坐着的，可是肩负战胜 AlphaGo 大任的祖国花朵。

题图插图来自：游民星空