视频游戏和棋牌比赛并不能很好地衡量 AI 的智力
AI 已经横扫了棋牌比赛,他们用人无法想象的招数打败成名已久的棋手,重挫锋芒毕露的天才。
就连唯一打败过 AlphaGo 的李世石在退役时也感叹一切已不复当年。「随着 AI 在围棋游戏中的亮相,我已经意识到,即使我通过疯狂的努力成为了第一名,我也并没有位居榜首。」
AI 从某种程度上摧毁了这些成名选手的信心,但这并不能代表它们已经足够聪明。
在 Google 软件工程师 Francois Chollet 看来,AI 赢了比赛的成就并不是一个衡量智力的好标准。就像是你 5 岁的小侄女特别擅长拼乐高,她在乐高的拼接速度上甚至超过了你,但这并不能证明你侄女在其他领域都比你聪明。
在最近发表的论文《论智力的衡量》中,Chollet 提出的新观点是人工智能世界需要重新关注什么是智力,什么不是。Chollet 认为研究人员若想在通用人工智能方面取得进展,他们需要超越视频游戏和棋牌比赛等现在流行的判断标准,去思考那些实际上让人类变得聪明的技能,比如概括和适应能力。
在人工智能领域,有两个不同的智能概念。其中一种智能是指能胜任多任务的能力,而另一种则优先考虑适应性和泛化能力,即人工智能应对新挑战的表现能力。
在最早的 30 年,前者明显更具影响力,即智力是一套静态程序和一个明确的知识库。而人工智能社区中关于概念化智能的讨论则只获得了极少的关注度。
Chollet 认为现在的研究人员应该认识到这一点,所有人只针对一个方向的研究并不是一件好事。在一个尚充满未知的领域,这种态势限制了研究人员发挥的空间。
AI 需要一个更好的智能定义,而非一个静态测试。
在静态测试中,一旦你选择了一个衡量标准,你就会采取任何可能的捷径来「玩弄」它。例如,如果你把下国际象棋作为衡量智力的标准 (我们从上世纪 70 年代开始,一直到 90 年代都以此为标准),你最终会得到一个下国际象棋的系统,仅此而已。
没理由认为它对其他任何事都有好处,这并不能教会你关于人类智能的任何东西。如今在 Dota 或星际争霸等电子游戏中的人工智能也陷入了同样的智力陷阱。
▲ DeepMind 的研究人员观察他们的 AI 在《星际争霸 II》中如何对付人类玩家。
对于我们人而言,一个人技能的精通程度和智力是息息相关的。顶尖的程序员绝不是只会码代码,优秀的作家在艺术其他领域也颇有造诣,我们也会认为擅长围棋的人就是聪明的人。
人类的大脑可以因其智力而在某个特定任务的技能上表现出色,但这不是一种单一的技能。比如从小开始学习围棋的孩子,他们不是只会下棋,他们同时也在学习数学、语言等基础知识,围棋之外可能还有编程、绘画等爱好。这些孩子从零开始学习下棋,但他们不是专门「用来」下棋的,他们可以把这种学习能力引导到许多其他的任务中,学习其他内容,这就是通用性。
人工智能的存在打我了我们原有的概念——擅长下棋的就是聪明的。人类在学习上的情况不适用于机器,人工智能不是拟人化的。我们通用的智力可以用于特定的任务,但擅长特定任务的人不一定拥有通用的智力。一切是不可逆的。
在机器领域,只要您可以对单一任务进行无限的数据采样,花费更多资源进行深度学习。那在单一领域你就可以很出色,人工智能就可以在任意任务中获得任意技能。
但这也不会让你更接近一般智力。
在任何任务中,获得高技能都不是智力的标志。除非这个任务实际上是一个元任务。