被 AlphaGo 击败的李世石,用 8 年重建崩塌的世界
输给 AI,有种感觉是,我整个世界都塌了。
李世石在最近接受《纽约时报》采访时说道。
2016 年,这位曾 14 次获世界冠军的韩国棋士代表人类出战 Google 的 AlphaGo,最终以 1:4 告败。
他当初在接受邀请时,觉得那会是一次「好玩」的经历:
好玩的前提是我觉得会赢。我从未想过自己会输。
那可能是 AI 技术在 ChatGPT 登场前,其中一个最重要的高光时刻。
现在离 ChatGPT 的发布过去了不足两年,我们已看到多个领域被 AI 影响,而生活更多方面似乎也被埋下了改变的伏笔,我们总忍不住想要去推测和畅想未来的 AI。
在这个语境下,比其他行业和领域更早受到 AI 冲击的围棋界,能帮助我们看到一种已经发生的可能性。
击败人类后,更强的 AI 在进一步去「人味」
我没有办法再去享受围棋,所以我就退役了。
和 AlphaGo 对战的三年后,李世石正式宣布退役。
对于 5 岁就开始学围棋的李世石而言,围棋不仅是竞赛,而是一种艺术,一种棋手个性和风格的延伸,但在 AI 时代,它却「沦为」了算法的效率游戏。
在这三年间,其实还发生了另一件事。
2017 年,DeepMind 宣布了新版的 AlphaGo —— AlphaGo Zero。
AlphaGo 诞生自神经网络对人类高手 3000 多万手数的学习和自我练习,但 AlphaGo Zero 却是从一开始就脱离「人味」,训练期间不接触任何人类棋谱,单纯靠自己和自己下棋训练。
只用了三天,AlphaGo Zero 在迎战 AlphaGo 时就已经以 100:0 取胜。
《大西洋月刊》称其为 「不需要从人类身上学习任何东西的 AI」。
在围棋中,有一种手法看起来简单或无关紧要,但长远却能造成致命威胁,有人会说那就像是「幽灵」般。
而 AlphaGo 和 AlphaGo Zero 的棋谱,却难以理解到直接被视为「外星文明投下的一本神秘指南」。
美国职业棋手 Michael Redmond 于 2017 年表示,人类学习围棋其中一个重要的手段是搭建一个故事:「那是我们沟通的方式。它是一件非常人性的事。」
这也许也呼应了李世石的观点,在下棋时,棋手也展现了他们作为人的一部分。
Redmond 补充说,据他自己的观察,人类棋手初见「AI 味」棋路时很可能直接「举手投降」:
AlphaGo 下棋的方式,总让人觉得很「非人性」,面对这样的棋局,我们甚至很难投入其中。
李世石作为其中一位最早经受到冲击的围棋高手,久久不能释怀。
他开始执迷于 AI。
退役后,除了开设自己的围棋学院、出书和推出基于围棋的桌游外,李世石还开始做关于 AI 的演讲:
我算是很早开始面对 AI 的问题,其他人也将会经历。那未必会有开心大团圆结局。
对于他来说,AI 最让人担心的地方在于,它可能会改变人类的价值观:
过去,人们会对创造力、原创性和创新充满敬畏,但自从 AI 出现以来,这些很多都已经消失了。
并不是所有人都同意这个讲法。
人机共创时代
AI 毁灭了围棋圈所有存在的秩序,然后开始重建。
在康奈尔大学研究人工智能的围棋爱好者 Jiuheng He 说道。
在很多围棋学院里,用 AI 来学习围棋已经几乎是所有棋手都要经历的过程。
在香港一家围棋学院里,Ng Chee Man 会为学生提供 iPad 来用 AI 学习围棋。
每次到学生下棋,AI 都会展示出「最佳走法」建议,同时,系统也会记录下学生哪些步下得好,哪些不好。
去年,在《美国国家科学院院刊》上刊登的一篇研究指出,自从 AI 进入围棋圈后,人类棋手的判断能力获得了提升。
早在 2016 年,在 AlphaGo 打败李世石前,曾在不公开测试中对决 AlphaGo 的樊麾也有过类似经历。
虽然落败,但樊麾说 AlphaGo 让以他一种全新的方式去看待围棋,提升他的技巧,让他的世界排名快速跃升。
2023 年的研究则以 1950 年至 2021 年积累的棋谱为基础,包含了 580 万手数的数据。
研究人员发现,在 AlphaGo 击败李世石前,人类棋手的判断质量在 66 年中都保持平稳,基本不变,但在 2016、2017 期间,棋手的判断质量开始爬升。
换言之,人类棋手虽然未必能击败 AI 棋手,但他们的判断能力的确有所提升。
看到人类棋手能如此快速地适应,将这些新走法融入自己的方法中正式让人非常振奋。
这些结果表明,人类将适应这些发现,并在它们基础上大大地提升自身潜力。
DeepMind 首席研究科学家、 AlphaGo 项目负责人 David Silver 对这个研究评论道。
曾被 AlphaGo 于 2017 年击败的柯洁,也曾于 2023 年表示自己除了比赛外,已经很少和真人练习了,并认为 AI 甚至已经成为了围棋创造力的源头:
创造性不是你随便做一件什么不同的事情,创造性必须投入实战并得到检验,现在围棋创新的大部分是 AI 来完成,我们想下一些和以前不一样的棋,大概率会输,因为 AI 通过大量实战,得出和之前不同的思维,这才是创造力。
除此以外,另一位职业棋手的表现也尤其引人关注。
韩国棋手申真谞是首位夺得世界冠军的 00 后棋手,常被棋迷称为「申工智能」,因为他正是通过长时间进行 AI 训练和研究著称。
今年 2 月,申真谞于 25 届农心杯击败中国主将辜梓豪,实现了单赛季六连胜,跨赛季 16 连胜,超越了其前辈李昌镐。今年 3 月,他谈论了自己和 AI 的关系:
我觉得我和 AI 现在是朋友关系。
我和比我更优秀的 AI 一起学习。AI 和人类的思路是完全不同的,AI 通过数学算法解决问题,借鉴 AI 的思路使我受益良多。
现在,中国、韩国、日本的职业选手,都会用 AI 来训练。
「AI 味」启示录
正如在生成式 AI 时代下,一些设计师和作者需要因为作品中包含的所谓「AI 味」而进行繁复的自证,在融入 AI 已久的围棋界也一直在面对「AI 味」衍生出来的各种议题。
在现时围棋比赛中,常常都会配有 AI 推测胜率和 AI 推荐最好的走法。观众在观赛过程中也因此能获得一种「主动性」,拥有多个观赛的角度。
2022 年,中国棋手李轩豪在对决申真谞过程中,很多决策都和 AI 最优判断预测前三符合,因此被队友杨鼎新质疑其有用 AI 作弊之疑。
生于 95 年的李轩豪在用 AI 训练上「朝九晚九,全年无休,确实很用功」,因此棋路有时会被视作有所谓的「机器味」。
对于质疑,中国围棋协会进行了调查,最终认定这一指控没有证据,杨鼎新作出了处罚。
但用 AI 作弊的情况也的确存在。
2020 年,韩国 13 岁的职业棋手金恩持被发现在线上比赛中的落子与 AI 推荐有高达 92% 的重合。经过调查后,最终认定其作弊(且本人也承认了),被罚禁赛一年。
2022 年,中国棋手刘睿智被判定 AI 作弊,是中国首次正式因 AI 作弊而被处罚的职业棋手。和金恩持相比,刘睿智已经懂得规避「AI 味」,只是在一些关键点用了 AI。
为了应对,各国的比赛也是在不断改进反 AI 作弊机制。
与此同时,也有人利用了「AI 味」来击败 AI。
2023 年,美国业余棋手 Kellin Pelrine 击败了围棋 AI KataGo。
KataGo 是现有开源最强围棋 AI 之一,韩国也会用它来训练棋手。
Pelrine 利用了名为 FAR AI 的程序和 KataGo 对决了超过 100 万局,最后 FAR AI 找到了 KataGo 的弱点,并在人机对决中践行且获胜了:
那个策略算不上小儿科,但也不是特别难学。
然后,他也用同样的方法击败了另一个比较厉害的围棋 AI Leela Zero。
策略关键在于要创造一个大的「圈」来围住对手一组棋,然后可以突然把一子下到另一个不相关的角落,去干扰 AI。
Pelrine 说,如果是人类棋手,看到那个圈肯定就知道有问题,但 AI 并不会留意到。
这个弱点看起来有点「取巧」,是不是让 AI 去进行针对性地训练就能打上补丁?
《自然》上周一篇报道援引了今年一篇预印本论文指出,面对专门找 AI 弱点的程序,模型的漏洞并非想象中容易修复。
这次被「针对」的还是 KataGo。研究人员用三种不同的策略来让 KataGo 反击能力更强:
- 让 KataGo 通过自我对弈学习如何应对攻击;
- 迭代训练,用攻击程序攻击 KataGo,把漏洞反馈给 KataGo,让它通过自我对弈或其他方式学习应对,然后再用攻击程序攻击 KataGo,往复循环;
- 从头开始训练一个新的围棋 AI 系统,采用不同的神经网络模型。
虽然这些训练在一定程度上帮助了 KataGo 提高防御能力,但攻击程序依旧能发现漏洞,分别以 91%、81% 和 78% 的胜率击败 KataGo。
这些攻击程序本身不是出色的围棋 AI,人类也能轻松击败。
当然,这里的关键不是去比拼到底是人类厉害还是 AI 厉害。
重点是,对于围棋这个 AI 曾「颠覆」的领域,并且经过那么多年的应用与改进,其 AI 依旧存在很多问题。论文作者 Adam Gleave 说道:
如果我们在像围棋这种单一领域里也没法解决这个问题,那在短期里,想在 ChatGPT 之类模型修复越狱的可能性似乎很小。