• 媒体品牌
    爱范儿
    关注明日产品的数字潮牌
    APPSO
    先进工具,先知先行,AIGC 的灵感指南
    董车会
    造车新时代,明日出行家
    玩物志
    探索城市新生活方式,做你的明日生活指南
  • 知晓云
  • 制糖工厂
    扫描小程序码,了解更多

动物 v.s. AI 奥运会:你会赌一只鸟还是机器人夺冠?

商业

2019-08-01 15:30

本文来自公众号 PingWest 品(ID:wepingwest),作者 Cactus,爱范儿经授权发布。

AI 能解决以前从未见过的任务吗?这场比赛正在测验这种事。

我们不得不面对 AI 的一个事实:如今的人工智能,其实智能的成分很少。在事先明确环境和问题的前提下,基于算法和大数据的深度学习,人工智能系统的确都能有不错的表现。

这就是为什么谷歌 AlphaGo 以 4:1 战胜围棋世界冠军、职业九段棋手李世石;汉森机器人索菲亚能对着你口吐莲花,以「就像活人的 AI」招牌狂言想要毁灭人类。

AI 研究的真实状态其实远远落后于我们所相信的技术神话。虽然大多数研究成果是真实的,但有很多是借助人工智能话题的炒作。

我们对于 AI 的最终梦想,是让机器拥有自主思考能力并非「培训考核」。

检查机器是否真的拥有智能,让机器通过图灵测试就可以,但直到今天图灵测试依然没有被突破,这或许是件好事也是件坏事。如果我们不以更健康的现实主义和怀疑态度对待人工智能,那么这个领域或许永远停留在车辙中。

近期刚拉开序幕的,由英国帝国理工学院和剑桥大学共同组织的 「动物 vs AI 奥运会」是一项有趣的竞赛实验。更有嚼头的是,就像组织者成员之一 Matthew Crosby 所说的那样,这场竞赛对于参与者和创办者都是不可控且极具颠覆的。

动物 v.s. AI奥运会:你会赌一只鸟还是机器人夺冠?

真正的竞赛,最终赛场布置只能「当天见」

较新的 AI「培训课程」正在使用随机生成的环境进行测试和开发,正如这场「动物 vs AI 奥运会」。

竞赛组织已经公布大约 50 项关于动物的智能文献研究,参赛队伍即可根据公开的大量培训环境和对象进行 AI 动物智能体的「大脑」构建。

这是一个泛化的挑战,所以在训练测试中他们必须以不同的方式使用对象,同时也要使对象学会适应环境。挑战者们需要自己进行场景设置和互动,最终提交一个像动物一样进行食物猎取活动的智能体。

「这场比赛的重点是 AI 没见过的任务,所以最终比赛现场什么样,只有当天才知晓。」赛事组织者之一 Matthew Crosby 说。虽然不能对最终比赛进行「泄题」,但是在 50 项关于动物的智能文献研究中潜藏着一些有趣的例子供参赛者构建 AI 智能体的大脑。

动物 v.s. AI奥运会:你会赌一只鸟还是机器人夺冠?

▲模拟动物获得的智能体示例图

例如一个经典的实验,在动物面前倒置一些不透明的杯子,在其中一个杯子下放了一些食物,动物的任务是取回食物。起初每次都把食物放在 A 杯(相当于训练阶段),然而在最终比赛现场,这个食物会被放在 B 杯下。对于有些动物,比如黑猩猩,他们会直接选择 B 杯,但有些动物会选择 A 杯,因为他们通过记忆学习完成这项任务。

再例如一个从伊索寓言中汲取灵感得到的实验:一只乌鸦能学会叼起岩石投入水中,使水位上升到足够。但在实验中,可以设置既有岩石也有软木块的环境,乌鸦要学会选择岩石而不是软木塞投入水中。

「这些测试捕获了人工智能研究中很多被认为相当困难的元素,比如推广知识、转移学习、综合新信息、甚至可能创造性解决问题。参赛者们要面对大量不同环境的训练集,以应对最终未知的竞赛场景。」Matthew Crosby 解释道。

动物 v.s. AI奥运会:你会赌一只鸟还是机器人夺冠?

▲乌鸦在面对水和沙子时能做出正确选择

「10 项关卡」见分晓,AI 想赢不容易

比赛共分为十个等级,测试是否成功取决目标实现程度。对大多数动物来说,能解决的是基础范围,只有少部分动物能解决的是困难且等级高的实验。

「觅食测试」是入门测试。可以考验 AI 智能体获取食物的能力,短时间能获取食物越多则越强。

「偏好测试」,则进一步考核智能体的则优能力。尽管对于不同动物来说会存在方式差异,但几乎所有动物都会用最简单高效的方法获得食物,其中有些动物对最有益的长期行为作出复杂的决定。

「障碍测试」、「弊害测试」、「空间推理测试」、」内部模型测试「,将从智能体的行动、规避风险、导航规划、视觉输入记忆上考研智能体的多项能力。

动物 v.s. AI奥运会:你会赌一只鸟还是机器人夺冠?

▲AI 智能体也要面对和狗一样类似的障碍测试

「泛化测试」,这一级包括一些看起来与之前测试有所不同的环境,但解决方式还是一样的,不挑剔的智能体才有希望通关。

「物体存继性测试」,当一个物体从视野中消失,很多动物都能理解它依然存在的,这是人类认知范围能理解但 AI 不能的,如果不能理解这一特性,很多简单的人机交互就很难实现,开发者如何将这一点编制进 AI 将是竞赛一大亮点。

「高级偏好设置」,意味着智能体通过更复杂的决定获取更高级别的奖赏。

「因果推理测试」作为最终测试,希望看到智能体提前策划并在未实施之前就能预想到结果的能力。这种测试已经在一些动物身上得到验证。

如今这场虚拟奥运会比赛上线,奖金达到 3.2 万美金,比赛最终结果会在 2019 年 12 月公布。到那时我们才会清楚地了解现代人工智能否比乌鸦、狗或黑猩猩更聪明。这段等待的时间能发生什么还是令人无比期待的。

动物 v.s. AI奥运会:你会赌一只鸟还是机器人夺冠?

▲竞赛场地模拟图

这场虚拟奥运是 AI 的一次突破机遇

假设我们看到一条新闻,例如「某某 AI 智能体达到了老鼠的水平」,大多数人可能不为所动甚至嗤之以鼻:达到区区一个老鼠的智能水平算什么。要真算起来,离动物们我还差得很远。

最先进的 AI 可以超过人类成为最好的围棋选手,最好的医生,甚至智力竞赛冠军,但依旧无法与简单的动物竞争,以适应环境中的意外变化。通常 AI 基准测试涉及掌握单个任务,没有自由意志,也没有意识,它们仅仅是遵循智能人员定义的流程的产品,不能自己做决定。

动物 v.s. AI奥运会:你会赌一只鸟还是机器人夺冠?

▲网红机器人 Sophia 是否是人工智能炒作的产物

我们最好的机器学习算法通常只是记忆和运行统计模型,几乎任何自动执行某项操作的计算机程序都被称为 AI。比如在围棋比赛中击败一个大师,机器被学习规则,从对手的视频里「偷师学艺」再「过河拆桥」。

比如深度学习和神经网络在内的机器学习中,人们通过算法以及标记包含大量训练的数据集,不断训练机器直到它可以自己完成任务。再如面部识别软件,从数千张面部照片或视频送入系统,直到它可以更准确的从未标记的样本中检测到面部。

但将以上相同的 AI 系统应用于完全不同的任务时,它们就会变成一个「废物」。这些缺陷对 AI 的研究人员来说并不是秘密,不过这些机器学习系统常常会被吹捧为人工智能最前沿的成果。事实上,他们并没有真的智能。

一只乌鸦会把岩石投入容器中,使水面上升解决口渴问题。狼群必须要在广阔的荒野中学会自食其力。动物们面对的大多数问题并没有明确定义的环境,也没有具体的数据库去跑程序,并有检查纠错总结经验。

动物 v.s. AI奥运会:你会赌一只鸟还是机器人夺冠?

这就是动物和 AI 较量的虚拟奥运会提出的 AI 要实战的两个问题:如何做到强化学习的泛化能力?当前的强化学习算法和动物学习之间有多大的差异?

这场竞赛的 10 级测试,均在不同的动物身上得到测试,AI 智能体想要战胜动物,不仅要完成而且效率成果还更突出。对于泛化能力还未有突出效果的 AI 研究领域来说,想要赢得这场比赛真的不容易。

竞赛组织成员 Matthew Crosby 表示:「虽然我们都希望 AI 能在这场比赛中表现的优秀一点,但就算都失败这也不是一次性竞赛。我们希望用 AI 制造一个像动物的智能体,它总是想方法获得最多的食物,当不易获取食物时,它也应该热衷于探索环境,并在面对多种可能性的环境里做出明智的决定。」在到达人脑之前,AI 不得不先经过动物世界的考验。

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中