Google 宣布开源 AI 训练环境 DeepMind Lab
根据 Engadget 的报道,AlphaGo 背后的 Google 人工智能团队 DeepMind 宣布开源其 AI 训练环境 DeepMind Lab,源代码将上传到 Github 上。Google 希望以此增加 AI 能力的开放性,让更多开发者参与 AI 研究。
(图片来自 DeepMind 官网)
实际上,DeepMind 在人工智能领域名声相当大,其研发的 AlphaGo 如今的水平已经几乎打遍天下无敌手了。
昨天,2016 年三星杯世界围棋大赛决赛中,中国棋手柯洁总比分 2:1 逆转卫冕。赛后,据新华社采访,柯洁坦言自己“现在的状态还不能打败‘AlphaGo’,今后需要更加努力。”
AlphaGo 的战绩确实足够耀眼,让这位史上最年轻的三星杯冠军不想直缨其锋芒:
- 2015 年 10 月,它成为第一个无需让子,即可在 19 路棋盘上击败围棋职业棋士的电脑围棋程序;
- 2016 年 3 月,它以 4:1 的比分击败顶尖职业棋手李世乭,成为第一个不借助让子即可击败围棋职业九段棋士的电脑围棋程序;
- 2016 年 7 月 18 日,根据积分,Go Ratings 网站将 AlphaGo 列为世界围棋排名第一,至此,人工狭窄智能又攻下了一片领地。
近 20 年的发展,围棋人工智能从传统人工智能方法,如使用暴力搜索法(穷举法)、Alpha-beta 剪枝(评估后一个策略是否比前一个策略差,差则停止计算该策略后续发展)等,进化到使用蒙地卡罗树状搜索。蒙地卡罗树状搜索分为三部分:
- 走棋网络:给定当前局面,预测/采样下一步的走棋
- 快速走子:适当牺牲走棋质量的条件下,速度提升 1000 倍
- 估值网络:给定当前局面,估计是白胜还是黑胜
这样,既可以结合树状图的长远推断,又可以像人类大脑自发学习进行训练。
通过学习超过 1 亿盘机器棋局和 80 万人类棋局,单机版 AlphaGo 已经能将已有的围棋人工智能甩在身后,而分布式版本的 AlphaGo 则更是在对战其他围棋人工智能的 500 场比赛中获得全胜。
Elon Musk 的 OpenAI 旗下电脑训练场 “Universe” 也开放成为开源资源。
当然,虽然谈及开源,两家公司都表示希望一直保持 AI 代码的开放性,但实际上,这也是一个略带无奈的举措。正如 Engadget 对此的评价,两家公司发展至今,最稀缺的加速推进人工智能开发的东西就是海量数据,这也是为什么两个公司会选择开源了这部分的代码。