特斯拉 AI DAY 2022:马斯克造出了那个会跳舞的机器人,还透露了他的下一步计划
当我得知特斯拉要在 10 月 1 日举办 AI DAY 时,我是快乐的,这意味着我能够在国庆节当天投身工作,与祖国共奋进。
马斯克同志可能和我一样爱国——
AI DAY 原定于今早 8 点开始,但最终延至 9:15。我想,应该是老马昨晚忙着给祖国母亲庆生,睡过头了。嗯,一定不是因为现场的机器人出了问题。
没错,这次 AI DAY 的主角是机器人,马斯克舞台上表达了自己的看法:
如果未来机器人无所不在,人类经济会发展得更好,人们可以去做体力话,但这不是必须的,我们可以更多地选择脑力劳动。
我也希望,10 年后的国庆节,坐在工位上码字的不是我,而是某个生下来就会工作的人型机器人。
去年的擎天柱,现在怎样了
讲真,去年登场的擎天柱(Optimus),比今天的要灵活多了,它甚至会跳舞。
玩笑归玩笑,去年的擎天柱确实长得更讨喜些。
当时的擎天柱还不叫擎天柱,马斯克简单将其称作 Tesla Bot;现在的擎天柱,我也不太愿意把它叫做擎天柱,因为它看起来好像不太聪明,我觉得,叫威震天可能会更合适。
▲你不要过来啊
我不禁想起了十几年前听过的一首歌,是这样唱的:
判若两人,丢给我去承受
想象中,很不同
想象中一切都和后来不同
虽然长得想象之中不太一样,但这个「威震天」还是能干一点活儿的,比如搬东西:
比如浇花:
再比如,在超级工厂里搬砖:
看起来,这位「威震天」能干的活还真不少,马斯克说,成本下降以后,一台「威震天」大概会卖 2 万美元。所以,要想找个人替我上班,我至少得准备 14 万元人民币……
打扰了,我还是自己来吧。
正当我尝试说服自己接受这个事实时,舞台上突然出现了一位新人,它的颜值要比刚刚那位「威震天」高多了。实际上,「威震天」是今年 2 月造出来的开发平台,下面这位才是擎天柱。
▲从左至右分别是梦中情人版、原相机版、美颜相机版
为这台擎天柱提供能量的不是火种,而一块容量为 2.3kWh 的电池包,它被充分保护,放置在最核心的身体部位,即为图中蓝色的那一块。
马斯克称,擎天柱「非常适合一整天的工作」,它静坐时的功耗约为 100w,快走时为 500w。可能有人会问快走是多快,大概 2 米每秒。
为了确保擎天柱的灵活性,特斯拉为其设计了 28 个关节,每一个关节里都有多套执行器,这些执行器能够在后台分析执行效率,减少无效工作。
擎天柱最灵活的部位,是它的手。
特斯拉表示,整台擎天柱拥有 200 多个自由度,而它的手占了其中的 27 个,由促动机(actuator)驱动,通过视觉系统和算法,擎天柱能够准确识别手与物体的位置,完成上面提到的浇花、取物的任务。
擎天柱重 73kg,全身上下共有 6 种促动机,完全为特斯拉自研,这些促动机就像是人体的肌肉,驱动相应部位。
需要强调的是,虽然这些促动机看起来十分精致小巧,这细胳膊细腿的,不像是能干重活的人,但实际上,一个关节促动机,可以把这么一个大件给吊起来。
▲这不是我奶奶中午出去买的菜,而是实实在在的一架钢琴。
擎天柱身上最宝贵的东西,是它的「大脑」——一块 FSD 芯片。没错,和你的 Model 3 里的是一样的,只不过你的 Model 3 有两块,它只有一块,因此,擎天柱大约拥有 72TOPS 的算力。
为了保护擎天柱的「大脑」,特斯拉也废了不少功夫,毕竟这玩意儿和车不一样,车有四个轮子,它只有两条腿,而且还不太利索。
在这一方面,特斯拉借鉴了他们的造车经验,准备了一套模拟跌倒测试的软件,来帮助他们进行研发。
与汽车上的吸能原理相同,特斯拉也为擎天柱加入了一块吸能区,在其跌倒时,胸前的吸能区能够有效控制损伤范围,防止手臂和头部受损。
对于容易受损的肩部等位置,特斯拉没有选用碳纤维、钛合金这样的高成本原材料,将这一人形机器人的使用成本降到了最低。
不过,防止它摔坏的最好方法,还是让他不要摔跤,好好走路。
从迈出第一步到自如地摆出各种姿势,擎天柱花了 5 个月的时间:
总之,它就像马斯克的一个孩子,无论是走路还是取物,都需要经过一段非常长的学习时间,好在,马斯克的育儿经验应该足够丰富。
摘掉 beta 帽子的 FSD
说了这么久的机器人,FSD 怎么样了。
其实,上面说的不只是机器人,同时也是 FSD。擎天柱采用了与特斯拉汽车相同的 FSD(完全自动驾驶)计算平台,它的所有动作,都是通过 AI 模型的学习得来的。
放在车上也一样。
目前,FSD beta 的用户已经超过了 16 万人,要知道,这个数字在去年只有 2000。在如此庞大的「测试团队」的帮助之下,特斯拉目前已经拥有了超过 14.4 亿帧视频数据。
同时,特斯拉对摒弃了去年近千人的标注团队,对数据标注流程进行了全面优化,训练速度提高了 30%。
此外,特斯拉介绍了一个名为 Occupancy networks 模型的东西,在这一模型中,我们的世界看起来就和 Minecraft 一样。在这样的环境中,即便车辆不能认出障碍物,也会做出避让动作,安全性得到了提高。
同时,车辆还可以识别出道路的坡度,根据实际的道路情况,提前做出加速或减速的动作,提高了乘坐的舒适性。
对于 FSD 的现有能力,特斯拉举了一个例子:
在无保护左转时,为了不让过马路的行人受到惊吓,车辆会找准时机,以较慢,但合适的速度从行人后方通过,同时不会影响从右方驶来的车辆的正常行进。
特斯拉表示,FSD 可以在小于 10 毫秒的时间内,列出超过 7500 万种影响决策的因素,迅速做出最安全的决策。
用特斯拉的话来说,这是「属于车道的语言」。
FSD 的未来,在 Dojo 手中
最后我们来聊聊 Dojo。特斯拉说,Dojo 能将原本数月才能完成的训练,压缩至几周。
这是专门用来进行模型训练的超级计算机,其内部由一个个「训练瓦片」(Training Tile),每个「瓦片」内含 25 块 D1 芯片,这 25 块芯片最终汇聚成 54P 算力和 13.4TB/S 的对分带宽。
这还没完,特斯拉将 6 个「瓦片」和 20 片接口处理器组成一个托盘(Tray),而 Dojo 的一个机柜又由两个托盘组成…… 听起来有点套娃的感觉了是吧。
无论如何,在强大的硬件堆叠之下,一个 Dojo 机柜就能提供 1.1E 的算力、13TB 的高带宽内存,以及 1.3TB 的高速内存。最终,4 台 Dojo 就能提供相当于 72 个 GPU 机架的算力。
更不可思议的是,特斯拉说这玩意儿在 2023 年 Q1 就能量产。
至于最受关注的擎天柱的量产时间,特斯拉并没有明确,马斯克甚至不知道这一人型机器人最后会变成什么样子。
肯定可以进行对话和交谈的,在技术上也会进一步升级,但我们还不知道终极目标会是怎样的。
不过,我们虽然不知道擎天柱最后会变成什么样子,但马斯克还是在 Twitter 上公布了他的下一步:
给擎天柱找一个女朋友。