无敌是多么寂寞,AlphaGo 要在星际 2 再次吊打人类
在两周前落下帷幕的世纪围棋人机大战中,李世石最终以 1:4 的成绩不敌 Google 出品的 AI AlphaGo。显然,AlphaGo 团队已经不满足于围棋一种游戏,暴雪娱乐制作总监 Tim Morten 在 WCS 中国区总决赛上确认:
AlphaGo 接下来将要挑战《星际争霸 2》
但暴雪官方没有透露更多的细节信息,因为关于这场电子竞技领域的人类大战,Google 还在和暴雪处在商谈过程中,而无疑人类也将会派出最高水平的电子竞技选手与 AlphaGo 再次一决高下。
与围棋不同,在《星际争霸 2》中 Alpha 将难以推算出下一步应该做什么,所以暴雪的娱乐制作总监 Time Morten 也预言 AlphaGo 将不会在《星际争霸 2》中战胜人类。但是谁又能说的准呢?毕竟在 AlphaGo 挑战李世石开始之前,人类也是对之后的战局自信满满。
不过星际争霸显然与围棋不同,围棋对人操作的要求更低,只需要玩家谨慎思考然后下出棋子就好。但在星际争霸等一些电子游戏中,APM(Actions Per Minute)每分钟操作次数,换句话来说就是我们常说的手速,是评价一个玩家竞技水平的一个重要指标。而在星际争霸和魔兽争霸 3(WAR3)这两款游戏中 APM 的高低往往象征着玩家操作的精细程度。但从理论上来讲 AlphaGo 的 APM 可以调节到人类完全实现不了的水平,为了与人类的对战更加公平,在真正比赛时 AlphaGo 的 “手速” 很有可能受到限制。
同时作为一款即时战略类游戏,星际争霸对于 AlphaGo 来说还有很多难点需要突破,首先围棋与星际争霸是完全不同的两种游戏,围棋的输入值很小,只需要几个数字就能描述清楚场上的局面,但是即时战略游戏需要有多少数据来处理,可以参考上面那张图,双方的兵力数量、兵种构成、每一个士兵的能力属性、当前时间、地形等等。而所有这些的解析、决策、执行都需要在极短的时间时间内完成,这些需要极大的运算量。而从围棋世纪大战中我们可以看出,AlphaGo 也是需要一个较长的运算时间的,而战局转瞬即逝的星际争霸 2 明显不允许 AlphaGo 来慢慢考虑。
还有一处难点就是每一步的状态改变,所造成的结果不一致。不仅仅是围棋与即时战略游戏,即使是同类游戏的星际争霸 2 和魔兽争霸 3,每走一步对最终的胜负完全是不一样的,即使 AlphaGo 已经能够算是一个围棋大师,在星际争霸 2 中还是需要打造它的团队一点一点重新学习改进。像 AlphaGo 这样 AI 行为还是需要对目标进行数学建模,然后使用各种算法去简化和求解。越是难以数学建模的游戏,构建 AI 的难度就越大,而像星际争霸这样的即时战略游戏,恰好是个很难建模的事务,需要很大的工作量。
那我们什么时候能看到这场星际争霸的人机大战呢?可能还需要挺长一段时间,首先是因为 AlphaGo 的算法哲学其实是经验主义的,也就是说,它并不关心也无法做到理解它每一步为什么这么走的深刻含义,但是它知道这样走能够获取最高的预测胜率(通过一定程度的搜索、试错与枚举)。所以也就是说 AlphaGo 还需要一段时间的学习,先战胜星际争霸界的 “樊麾” 这些较低段位选手,才能挑战星际争霸界中的 “李世石” 这样的世界大师。
下次在玩星际争霸的时候,不要喷对面小学生了,也许对面坐着的,可是肩负战胜 AlphaGo 大任的祖国花朵。
题图插图来自:游民星空