• 媒体品牌
    爱范儿
    关注明日产品的数字潮牌
    APPSO
    先进工具,先知先行,AIGC 的灵感指南
    董车会
    造车新时代,明日出行家
    玩物志
    探索城市新生活方式,做你的明日生活指南
  • 知晓云
  • 制糖工厂
    扫描小程序码,了解更多

2:0!Dota2 世界冠军 OG 被 OpenAI 碾压,全程人类只推掉两座外塔

公司

2019-04-15 11:01

2:0!

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

AI 向 Dota 界卷土重来,一下子把 Dota 2 世界冠军打得落花流水,在刚刚结束的三局两胜比赛中轻松获胜。

两局比赛加在一起,人类只推掉了 AI 两座外塔。最惨烈的第二局,人类直到最后击杀人头数还是个位数。

这是 OpenAI Five Finals。是 AI 与人类冠军的终极决战,也是它的期末大考。

对决的双方,胜者是多次击败人类玩家的 AI 战队代表 OpenAI Five;败者是(理论上)人类最强 Dota 2 战队,去年的 TI 8 冠军 OG。

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

不要惊讶,毕竟,现在,距「Dota 世界杯」TI8 上接连输给人类职业选手两局,已过去 231 天。如果 AI 在这期间连续不断地训练,已经相当于苦练了 231×180=41580 年的电子竞技。

和 TI8 上相比,AI 体现出了更优秀的团战操作,乱逛、空放大招之类的 bug 也没再出现,进化非常明显。

同时,OpenAI 还展示了比碾压、进化更重要的新能力:他们的 AI 不仅会和人类对抗,还能与人类合作组队一起打 Dota!原来的对手,已经可以做陪练了。

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

另外,如果你对今天的人类代表 OG 不满意,OpenAI 还开放了竞技场,任何人都能注册,组团挑战 AI 或者体验一把和 AI 做队友的感觉。

这就是现实版的你行你上啊!

人类一败涂地

OG 究竟是怎样输给 AI 的呢?

看比赛之前,我们先来了解一下这次决战的规则。

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

比赛在 7.21 版本上进行,OpenAI 赛前宣布,规则限制和去年 8 月 TI8 上一样,然而今天比赛开始时展示的规则还是略有不同:

英雄池包含 17 个英雄,不知道从之前的 18 个之中去掉了哪个:斧王、水晶室女、死亡先知、撼地神牛、矮人直升机、巫妖、恶魔巫师、死灵法师、痛苦女王、剃刀、隐刺、影魔、斯拉克、矮人火枪手、斯温、潮汐猎人、冥界亚龙、巫医。

没有召唤单位和幻象。

之前对圣剑、魔瓶、扫描的限制都没有提到。

好了,正片时间到:一起来看今天的决战。

双方三局两胜。

第一局

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

AI(天辉):火枪、飞机、冰女、死亡先知、斯温

人类(夜魇):小牛、巫医、毒龙、隐刺、影魔

选完阵容,OpenAI Five 认为自己有 67.6% 的胜率。

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

刚刚开局,OpenAI Five 拿下一血,而人类军团也很快杀掉了 AI 方的冰女。之后,双方前期在人头数上一直不相上下。AI 一直在经济上保持总体领先,但最富有的英雄,却一直是人类的大哥影魔。

这也能看出双方策略上的明显区别:OG 是 3 核心+2 辅助的传统人类打法,而 AI 的 5 个英雄经济分配相对平均,比较「大锅饭」。

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

经过几番激烈的推进和团战,游戏进行到 19 分钟左右,AI 对自身胜率的预测已经超过了 90%。自信心爆棚的 AI 一鼓作气攻上了人类的高地。

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

OG 紧接着选择了分路推进,几位解说推测,这是为了尽可能分散 AI,防止它们抱团推进,然而并没有奏效太长时间。

然而,坚持到 38 分钟,人类方的小牛刚刚买活,AI 的最后一波总攻已经推掉了人类的基地。

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

OpenAI Five 赢下第一局。现场,也是一片掌声。

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

这场比赛中,AI 展现了清奇的思路:出门装就选择两个大药,后续的装备也更倾向于买补给品,而不是提高自身属性。

另外,我们前边提到的「大锅饭」政策,以及在比赛前期就频繁买活,都和人类职业选手的习惯大不相同。

第二局

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

AI(天辉):冰女、飞机、斯温、巫医、毒龙

人类(夜魇):火枪、小牛、死亡先知、小鱼人、莱恩

选完英雄,AI 对自身胜率的预测是 60.8%,略低于上一局的阵容。

比赛前两分钟,双方都在一片祥和中各自带线,然而没想到,人类中单 Topson 很快就送出了一血。

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

之后,人类代表们以惊人的速度溃败。

5 分钟时,AI 的信心就已经大幅上升,预测自己有 80% 的胜率;7 分钟,AI 推掉了上路一塔;10 分钟,AI 就已经领先人类 4000 金币,多推了两座塔,还为自己预估了 95% 的胜率。

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

11 分钟,AI 已经攻上了 OG 的高地。

仅仅 21 分钟,OG 的基地被推掉,OpenAI Five 轻松拿下第二局。直到比赛结束,OG 拿下人头还是个位数,被 AI 打成了 46:6。

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

虽然这一局赢得异常轻松,不过对局过程中还是能看出 AI 在细节上有一些不足。比如说面对在复杂树林中绕来绕去的人类,AI 就无能为力。今天的比赛中,Ceb 就靠绕树林救了自己一命。

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

对于 0:2 输给 AI 这个结局,OG 是不太服气的。战队创始人「大爹」N0tail 在赛后采访中说,让他打 10 局,他们有把握找到战胜 AI 的办法;打上 50 局,就能一直稳赢了。

网友们也不太买账。AI 赢 OG,我不服!

大家认为,你们 OG 压根就没好好玩!

在第一局中,OpenAI 前期有略微的劣势,然后开始发力,到第二局几乎就是一直碾压 OG。比赛前后期落差太大,不像是职业 Dota 选手的水平。

很多网友看完比赛后表达了对 Ti8 冠军 OG 的参赛态度不满:简直看不下,」我行我上啊」!

他们认为 OG 和 AI 的比赛就是在瞎打,打不过 AI 就送人头、不打钱,卖装备,毫无职业态度。

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

既然 OG 在乱打,自然也不能证明 AI 有多厉害。有人甚至直接开始嘲讽 OpenAI:

他们应该感谢 OG,是 OG 想尽办法让弱智的 AI 看起来不那么弱智了。

或许是 OpenAI 早就想到了会有众多网友不服,他们接下来所公布进展中,有一项就能解决这个「不服」的问题。

新能力:和人类组团打 Dota

赢下两局之后,AI 并没有休息。它开始展现自己的新能力:

做人类的队友!

是的,现在,AI 可以和人类配合着打 Dota 了。赢下 OG 之后,AI 又开始与人类合作组队,进入了下一局比赛。

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

这个环节的两支队伍,都由两名人类主播和 3 只 AI 组成,英雄选择如下:

天辉:飞机、斯温、毒龙三个 AI 冰女、死亡先知两名人类

夜魇:火枪、剃刀、莱恩 – 三个 AI 小牛、痛苦女王 – 两名人类

这场比赛的一血,就是人类与 AI 合作的结果:天辉方人类控制的冰女和身旁的 AI 队友合作,杀死了对面人类控制的小牛。

而人类和 AI 的配合也并非一直完美。

Open 的 Psyho 透露,OpenAI Five 并没有经历过与人类合作打 Dota 的训练,不过,由于 AI 的队伍本来也是由 5 个神经网络组成,它们之间也没有特别的通信渠道,与人类合作对它们来说应该也不成问题。

然而实际比赛中,人类的体验可能并不好。人类不能向 AI 队友喊话,没有真正的沟通和配合。国外网友评价说,这种感觉就像线上遇到了大神,他却不带你飞。

你行你上!

秀完碾压和合作,OpenAI 公布了一个众多网友期待已久大好消息:

你也能和 AI 打一局了!

「OG 太菜,我行我上」也终于可以付诸实践。

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

OpenAI 开放一个专门的竞技场,名叫 OpenAI Five Arena。人类用户在这个平台上既可以组团对抗 AI,也可以和 AI 组队比赛。

游戏将于太平洋时间 4 月 18 日下午 6 点(北京时间 4 月 19 日上午 9 点)正式上线,4 月 21 日结束。现在,用户已经可以到这个平台注册了。

地址:https://arena.openai.com/

目测等到游戏上线后,还会有排行榜实时更新出来。

两年快速进化

到今天为止,OpenAI 的 Dota AI 诞生两年,已经几次震惊世人。

它最早诞生于 2017 年 3 月,同年 8 月在 TI7 邀请赛最后第一次一鸣惊人。当时,它 1V1 对战人类顶尖高手,让 NAVI 战队的乌克兰职业 DOTA2 选手 Dendi 几分钟就打出了 GG

很多人类表示不服,只会用影魔中单 1V1 当然难以服众。

然而 AI 进化十分迅速。

到 2018 年 6 月底,AI 就掌握了 5V5 技能。OpenAI 为它起了个新名字:OpenAI Five

之后仅仅过了一个多月,OpenAI Five 就在 8 月 6 日击败了超凡 5 级别(天梯 MMR 积分 6500 以上)的人类半职业战队。

再过半个月,就是它上一次亮相了。

那是在 231 天前的 TI8 上,AI 所玩的 Dota 已经和今天一样复杂,然而它的表现并不亮眼。

当时,AI 接连两天先后对战人类职业战队 paiN Gaming 和」中国退役大神队」,都是一败涂地,也暴露了不少缺陷:

比如说,当时的 OpenAI Five 队伍之中没有角色分配,无论是 1 号位还是辅助,打法都差不多;又比如,它总是对自己的胜率预测过高,还会胡乱插眼空放大招,而且一遇到劣势,就会表现得「手足无措」。

然而,比赛技术后仍有人类「带路党」坚信:「这可能是职业队唯一一次赢 ai 了。」

现在,231 天过去了,我们看到 AI 在很多方面都有巨大进步。

最明显的当然要数它的新能力:与人类组队打比赛。

除此之外,AI 这次也没有出现 TI8 版本的那些坏毛病,比如乱逛、空放大招等等,对胜率的估算也相对合理。

但是胡乱插眼这个毛病,在今天的比赛中依然明显。看来经过几万年修炼,AI 依然对插眼毫无兴趣。

去年 TI8 结束后,OpenAI 研究员 David Farhi 曾经向量子位透露过他们的推测:通过强化学习自我对局训练出来的 AI,其实并不会买眼,买眼的行为是人类通过硬编码强制 AI 完成的。而乱插眼,很可能是因为 AI 想要把它随便丢在什么地方,争取一个空白的物品栏。

5 个 LSTM,修炼 45000 年

AI 的快速进化,其实是刻苦训练的结果,也就是不断的自我对局。

OpenAI CTO Greg Brockman 赛前说,他们的 AI 相当于已经练习了 45000 年 Dota。

OpenAI 之前也说过,AI 每天的训练量相当于人类打 180 年游戏;之前输给过 OpenAI 的 MoonMeanderated 则说,AI 一天要打 200 万场比赛。

这样的训练量,远非人类能及,当然对计算力的需求也大到吓人:它们的日常训练,需要 256 块 P100 GPU 和 12.8 万个 CPU 核心。

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

这支「饭量惊人」的 OpenAI Five 战队,包含 5 个智能体(agent),每一个都是包含 1024 个节点的单层 LSTM,能够通过 V 社(Valve)的 Bot API 观察当前游戏状态,控制英雄去移动、攻击、施放技能、使用道具。

它们能够观察到的信息和人类差不多,包括自身、队友和敌人的状况,比如位置、血量、攻击力、护甲、携带物品、能力等等。

这些信息,对于智能体来说是一个包含 20000 数值的列表,而它判断之后发出的行动指令,是 8 个值的列表。

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

如果要以一种拟人的方式描述,AI「眼中」的游戏大概是这个样子:

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

选手们的训练,使用的是扩展版的近端策略优化(PPO)方法,这也是 OpenAI 现在默认的强化学习训练方法。这些智能体的目标是最大化未来奖励的指数衰减和。

既然是 5 个智能体,当然还要让它们能作为一支队伍相互配合。为此,OpenAI 设计了一个「团队精神」超参数来统一控制。这个超参数的范围在 0 到 1 之间,决定了选手对与自身奖励函数和队友平均奖励函数的关注程度分配。

本期人类代表

最后,为不太熟悉 OG 的朋友简单介绍一下今天的人类代表。

OG,就是去年 TI8 上 3:2 击败 PSG.LGD,拿下冠军的那支队伍,现在的阵容和去年夺冠时一样:

2:0!Dota2世界冠军OG被OpenAI碾压,全程人类只推掉两座外塔

一二号位 Ana(Anathan Pham)

Ana 以刷钱能力著称,甚至有「世界第一打野」之称,而对线能力是他的短板。这位澳洲华裔选手,去年 TI8 之后休息了一段时间,今年 3 月刚刚正式归队。

一二号位 Topson(Topias Taavitsainen)

他是 2018 年刚刚加入 OG 的新人,曾经在欧服天梯上排名第一,可谓「路人王」。他迅速从毫无大赛经验的业余玩家,成为 TI8 冠军。因此,他在众多职业选手中显得「思路清奇」,却也常被批评「发挥不稳定」。

三号位 Ceb(Sébastien Debs)

Ceb,又叫 7ckngMad,原本是 OG 的教练,2018 年 3 月,当时的中单 Resolut1on 离队后,他先是入队做替补,又正式成为战队里的职业选手。

四号位 JerAx(Jesse Vainikka)

2016 年,JerAx 从 Liquid 转入 OG,在现在的 OG 阵容里算是一名老将。他曾被称为「欧洲土猫王」,也是一名非常擅长掌控游戏节奏、带起前期优势的辅助。

五号位 N0tail(Johan Sundstein)

N0tail 也被国内网友称为「大爹」,是 OG 创始人,去年刚刚从 1 号位转到 5 号位。

最后,量子位想说,如果你也对上面 5 名人类代表不满意,赶快去 OpenAI Five Arena 注册吧!

本文来自微信公众号量子位(ID:QbitAI),作者为夏乙、晓查,爱范儿经授权发布。

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中

追踪人工智能产品和技术新趋势,我们只专注报道 AI。

本篇来自栏目

解锁订阅模式,获得更多专属优质内容