OpenAI 地表最强人形机器人发布!每天能打工 20 小时,「终结者」要造出来了?
还记得三月份刷屏全网的 Figure 01 机器人吗?
接入 GPT 后,能说会看还能做家务的它,让不少网友感叹人形机器人的时代将在 AI 大模型的加持下向我们大步走来。
Figure 01 背后的公司也凭借英伟达、OpenAI 等联合投资,一度成为人形机器人赛道上最靓的崽。
暂且忘记第一代的赞誉,就在昨晚,号称「世界上最先进的 AI 硬件」——Figure 02 正式亮相世人。
世界上最先进的 AI 硬件名副其实吗?
让我们先来感受一下 Figure 02 身体素质过硬的躯体。
拥有 16 个自由度的手部,能够灵活自如地转动手指和手腕, Figure 02 起码在卖家秀的官方 demo 里是到位的。
Figure 02 行走间虽有颠簸,但速度也算的上中规中矩,与背景里拿着工厂零部件的同类机器人形成了动静分明的画面。
经过宝马工厂的「集训」,Figure 02 已经不再是那个只会泡咖啡的机器人了,而是成长为熟稔流水线工作的工人。
虽然拿起零部件的速度还有待提升,但胜在一个字——稳。
据创始人 Brett 介绍,从零开始设计的 Figure 02 集成了多项创新技术,在智能交互和物理操作方面上都有了长足的进步。
Figure 02 的头部、前躯干和后躯干各配备六个 RGB 摄像头,能够通过其 AI 驱动的视觉系统来感知和理解物理世界。在官方的描述中,Figure 02「具有超人的视觉」。
得益于与 OpenAI 合作训练的定制 AI 模型,Figure 02 具备与人类进行语音对话的能力,而其搭载的视觉语言模型(VLM),更是让其能够通过摄像头进行语义理解和快速视觉推理。
在电池方面,Figure 02 机器人躯干中内置的 2.25 千瓦时电池组,提供了比前代更持久的续航时间,按照设想,Figure 02 能够每天实现超过 20 小时的有效工作时间。
集成布线设计一直以来都是人形机器人面临的难题。
Figure 02 的集成布线设计着重提高了电力和计算布线的可靠性,还实现了电线的隐藏和紧凑包装设计,并且定制的线缆端子和连接器也进一步提升了耐用性。
类似于飞机的设计,Figure 02 的外骨骼结构设计增强了结构刚度和承受碰撞载荷的能力。
与前代相比,Figure 02 的机载计算和 AI 推理能力提升了两倍,使其能够后自主地执行现实世界中的 AI 任务。
AI 数据引擎是 Figure 02 智能活动的心脏。
它能不断地从云端获取、更新和优化最新的 AI 模型。并且,这些模型在机器人的 GPU 上运行,确保了 Figure 02 在执行任务时的智能性和适应性。
对于 Figure 02 的发布,Brett 兴奋地表示,「Figure 02 为人形机器人在工作场所和家庭中的应用铺平了道路」。并且,其也在 X 上发布了招聘的渠道。
附上招聘官网地址,感兴趣的朋友不妨去试试:https://www.figure.ai/careers
2024 年的当下,除了大模型加持所带来的智商,硬件也是不可或缺的重要一环,这也是今天发布的 Figure 02 的意义所在。
经过宝马工厂长时间的集训后,Figure 02 在硬件方面比起前代有了不少长进,与工厂场景的结合也更得心应手了。
高盛在今年初发布的《人形机器人专题报告》中预测,人形机器人有望在未来十年内迎来爆炸性的增长。
倘若技术再进一步的话,具有接近于人的运动性能的躯体,配合大模型等技术的智能支持,人形机器人走进千家万户的愿景,或许不再是画饼式的憧憬。
回顾历史,早稻田大学的加藤一郎教授历时 5 年时间,才研发出人形机器人的雏形 WABOT-1,而从 Figure AI 入局到当下也不过 2 年时间,在加速发展的当下,谁也看不透 Figure AI 这类人形机器人的潜力。
「具身智能」成新风口,人形机器人真有必要吗?
有的人形机器人在泥里爬,但更多的人形机器人却是在天上飞。
1950 年,图灵在他的论文《Computing Machinery and Intelligence》中首次提出了具身智能的概念,但却没有给出一个明确的定义。
他在论文中展望了人工智能两条可能的发展路径,一条是聚焦抽象计算所需的智能,如下棋;另一条则是为机器人配备最好的传感器,使其可以与人类交流、像婴儿一样地进行学习。
前者为非具身智能,典型案例表现为李世石以 1:4 负于 AlphaGo。
后者往近了说,世界人工智能大会上的 18 台国产人形机器人组成了一道亮丽的风景线,往远了说,在 GTC 2024 发布会上,英伟达掌舵人黄仁勋背后的那排人形机器人也都是具身智能的重要表征。
黄仁勋说,具身智能将引领下一波人工智能浪潮。
他曾预言道,100 年后大街上将到处都是人形机器人,或将成为人类历史上产量最大的机器系统,马斯克在听闻这番观点后,则大胆地认为,它们的普及程度将是汽车的 10 倍。
实际上,得益于大模型的加持,一些实际的落地应用场景已经初现端倪。
以往只会后空翻、跑酷的机器人不再满足于赢得围观者的吆喝声,而是放下了手头上的十八般武艺,不约而同地集体进厂,当起了生产流水线上的打工人。
一个典型应用场景是货物的分拣和码垛。
前有 Agility Robotics 旗下的 Digit 机器人在亚马逊的物流仓库里分拣和搬运货物,后有特斯拉二代 Optimus 机器人给大家表演了一波分拣电池,并且走路的速度也大幅提升了。
正如李飞飞所说,自然界花费了数百万年时间才进化出空间智能,随着空间智能的加速发展,一个催化机器人进化良性循环正在我们面前展开。
借助大模型的泛化能力,这位名为 Digit 的机器人「同事」,已经达到人类 75% 的工作效率,并且拥有高达 97% 的任务完成成功率。
而人形机器人率先「长」在工厂里也并非偶然。
目前 AI 与机器人的结合还处于初级阶段,尚未达到技术融合的临界点。尽管我们见证了一些惊艳的 demo,但却不怎么看到完全跑通的技术方案。
因此,如同婴儿学会走路一样,机器人在掌握基础技能后,才能逐步拓展到更广泛的应用场景,沿着一条符合逻辑的发展轨迹前进。
这与自动驾驶技术的发展轨迹颇为相似,总是先在规范和可控的高速公路环境中进行测试和应用。
在一次访谈中,宇树科技创始人王兴兴在谈及人形机器人的终极形态时指出,人形并非是必然的选择。当前人形机器人的发展更多是为了适应社会共识。
他强调,智能的核心不在于外观形态,而在于其功能。无论在视觉识别还是任务执行方面,智能机器人都应该能够完成甚至超越人类的工作。
在人形机器人的发展还远未成熟之际,轰鸣工厂车间里的工业机器人也提前证明了机器人的未来存在感。其中汽车行业尤为突出。在比亚迪的现代化生产车间里,冲压、焊装等环节都有工业机器人的身影。
甚至一些无人驾驶 L4+ 本身就是特殊的机器人,并且已经率先成为具身智能的最大应用之一。
前一段时间,百度无人驾驶萝卜快跑在湖北武汉的订单量激增,让不少网友感叹中年失业后的生计也岌岌可危。然而割裂的是,用户却对萝卜快跑给予了高度评价。
比起人类司机,情绪稳定的无人驾驶在安全性已经可以说是遥遥领先。
它不会超速、也不会压线,更懂交通法,顶多就是太守规矩,急着上班的武汉市民免不了要吐槽它慢吞吞的行驶速度。
所以你看,实际场景下的机器人本身其实也可以很安全。而且就跟机器人都往人形机器人赛道内卷一样,无人驾驶汽车居然也还是汽车的模样。机器人的外形越来越像人了,但能力好像也越来越碾压人了。