一年一度特斯拉AI DAY, 开场就王炸!马斯克只用3分钟简短热场,人形机器人擎天柱 (Optimus)直接登台亮相。

打开网易新闻 查看更多图片

不同于去年概念PPT上光滑圆润的外形,今年的擎天柱金属与线缆裸露在外,就像是电影中的终结者。现场这台擎天柱,展示了稳步行走、转体俯身、挥手与台下观众打招呼。

这款机器人的名字来自《变形金刚参数图片)》的主角擎天柱(Optimus),高173cm重73公斤,和一个普通男性重量差不多,采用的感知技术基本都来自特斯拉电动车的技术,比如三颗Autopilot摄像头和自研的芯片!

打开网易新闻 查看更多图片

------》这就是擎天柱的视野

目前这个机器人还没有外壳,我们可以更好地看清它的各个部件,28个电机关节,可以搬运约10kg的货物:

特斯拉花大价钱打造的机器人当然不会仅仅用来搬箱子,马斯克强调,最终他们的目的是大规模生产人形机器人,并且在各种工业、民用场景里投放使用,量级在百万甚至千万级。最终的使命是去替代人类完成危险、重复和无聊的工作,目前希望擎天柱可以实现简单的命令,比如“装灯泡”等等。未来特斯拉还将组装更多机器人并投入到自家工厂中进行测试。

“擎天柱”能够拿起放在桌子上的水壶,然后行走至办公室内的花草种植区,为花草浇水。其中,渲染的图片就是机器人的“视角”,看起来除了色彩差异与人类正常看到的图像内容没有特别大的区别。

打开网易新闻 查看更多图片

在工厂里,机器人能将一个长条状的物体从工作台拿下来,再整齐排放至装有相同物体的盒子中。在机器人视角的渲染图中,它能够用颜色区分开现实世界中的不同物体。如它手持的长条形物体是紫色、工作台是黄色等。

现有的其他类人机器人「缺少大脑」——自行解决问题的能力不足,这是 Optimus 想要解决的问题。在机器人设计原则上,马斯克强调了高可靠性和低成本两点,「们的目标是尽快制造出有用的人形机器人」。它的产量可能达到数百万台,价格会比汽车便宜的多。马斯克认为最终的价格会是两万美元以内。

作为参考,目前 Model 3 的售价是四万美元起。特斯拉表示,机器人工作时的功耗是 500W,类似于台式电脑,重量达到 73 公斤,手运动的自由度有 27 个。它有一个容量为 2.3KWh 的电池组,足以工作一整天,计算设备是一个 Tesla SOC,可进行 WiFi 和 4G 网络连接,各种电源控制系统都被集成到了一个 PCB 中。

整体而言,Optimus 具有破坏性控制、适合量产的结构、集成式结构控制设计、受人类启发的膝关节、基于任务的膝盖需求、以及为高效致动器进行优化的关节,每只手可以提起 20 磅重的物体。

人手能以每秒300度的速度移动,拥有成千上万的触觉传感器。特斯拉机械手的设计灵感就来自于生物学,和人手一样同样使用五个手指来驱动,既可以完成大口径物体抓取,同时也能满足抓取精巧物体的需求。

打开网易新闻 查看更多图片

我们周围世界的工厂被设计为适于人手抓握的,但也会出现很多我们没见过的物体。因此,特斯拉的人形机器人手指有6个执行器和11个自由度,搭载了能够驱动手指并进行感知的传感器。

手的适应机制是非常复杂的,人类可以认识到手在空间中的位置,而这也是其能抓取物体的关键。因此,特斯拉目前也在进行相应测试。

特斯拉表示,很多特斯拉汽车的经验已被应用于构建 Optimus 机器人。

视觉深度学习模型是直接从汽车移植到机器人上的。在室内导航时 GPS 基本不可用,所以需要通过传感器接收更多点位以提高精度,不过测量周围可通行区域的机制也是和汽车自动驾驶通用的。

几位工程师分别介绍了框架设计、关节驱动马达动力,以及机器人导航、行走、配合搬运工作的机制。在不断提升机器人能力的同时,工程师们还在努力降低 Optimus 机器人的功耗和零件数量。

人型机器人在全面投入使用之前还有很长的路要走,不过潜在的作用不言而喻。「我认为人形机器人会从基础上改变人类文明的形式,」马斯克说道。「如果说自动驾驶能够提升半个数量级的经济效率,我认为机器人可以提升两个数量级。」

特斯拉第一代机器人从概念、设计、分析、建立、优化、验证经过了反复验证,对于这一新物种来说,拥有较低的成本和较高的工作效率也正是验证这一产品是否能真正推向市场的关键。

自动驾驶系统 FSD

在AI Day现场篇幅自然不小,核心强调更面向复杂场景将技术做深做精。

比如在没有人行横道的路口左转,对面道路有直行车辆行驶,还得面对拉着孩子横穿马路的行人,如若让车从行人面前快速通过也会给对方带来惊吓,造成更多难以预判的行为。

特斯拉称,他们加入安全与舒适性等维度分析,通过树搜索算法并提供人类示范,让系统能找到「合适」通过的时机和路线,最终,从横穿马路的行人身后通过。

重建物理世界也是自动驾驶的必经之路,工程师展示了 FSD 如何使用从车队收集上来的数据来模拟世界:仅用两周就创建了旧金山城区的模拟模型。特斯拉也能随着时间的发展迅速更新模拟世界。

此外,为支撑种种复杂场景的模型训练,其全栈式开发平台已能做到每8分钟生产一路算法模型,以1.4万个GPU组成阵列提供计算支持,此外他们还使用了Accelerated Video Library,增加了30%训练速度。

在边缘端,他们还进行了轻量化处理,让系统降低延迟,8个摄像头通过神经网络快速实时识别建筑及不同路面场景,更快完成3D场景生成。

值得一提的是,在今年4月奥斯汀超级工厂开业庆祝活动及Q1财报电话会上,马斯克都提及了不带方向盘和踏板的自动驾驶出租车产品,不少人预测他会在今天聊聊RoboTaxi,但在现场特斯拉并未提及。

Dojo 超级计算机

在 2021 年特斯拉人工智能日上,Dojo 超级计算机首次亮相。之后,特斯拉以快速试错的思路克服困难并尽快向前推进。

其中,电压调节模块在 24 个月内更新了 14 个版本。

同时 Dojo 在设计上更加集成。集成解决方案中使用软终端电容器来减轻振动、根据共振进一步调整频率等。

如下为 Dojo 超级计算机系统的全景图,包括 D1 芯片、训练 Tile 和 ExaPOD。

Dojo 系统托盘(System Tray)具备了高速连接、密集集成等特性。

Dojo 接口处理器提供了训练用的高带宽内存、TTPOE、标准 PCIE 主机接口、高带宽 Ingest、高基数 Z 平面连接性等特性。

Dojo 主机接口包括了 Ingest 处理、用户应用程序等。

Dojo Cabinet 动图展示如下:

接下来是 ExaPOD,它达到了 1.1 EFLOP,1.3 TB 的高速 SRAM(静态随机存取存储)和 13 TB 的高带宽 DRAM(动态随机存取存储)。

在软件堆栈部分,从上到下包括了神经网络模块、PyTorch 扩展、JIT 神经网络编译器、LLVM 后端、多主机和多分区管理、Ingest 和共享内存以及底层的 ExaPOD。

在 Dojo 编译器部分,用户可以将它用作一个加速器。

Dojo 团队展示了使用通过 Dojo 运行的 AI 大模型生成「在火星上的 Cybertruck 和 Semi」的图像。

Dojo 可以将通常需要几个月的工作减少到一周。特斯拉最后展示了未来发展的路线图,计划是在 2023 年之前建造第一台 Exapod,从而大幅提高自动打标签的数量,

从人形机器人到超算,特斯拉要做的事,看来是想引领 AI 前沿技术。「未来的 AI 训练需要大量的多模态数据。我们可能拥有全世界最多的数据,和训练模型的能力,我觉得我们可以为 AGI 的研究作出贡献,」马斯克说道。

等了一年之久的“擎天柱”,终于出现在了大众视野中,这也成为特斯拉“AI Day”最受瞩目的环境。不过,其新奇的外观与性能并不是关键,对于人形机器人而言,其真正量产落地才是衡量这一新物种是否真正有价值的关键。

但从其能浇花、搬东西这些更为细致的功能来看,马斯克仍一直坚持着向拟人形态机器人不断进阶,从手部动作、步态调整、控制系统等,依托于特斯拉在汽车领域的强大技术积累,和基础设施及供应链。再加上马斯克在人形机器人领域的野心和他强大的行动力,为这一产业带来了无限憧憬。

马斯克在人形机器人亮相后说:“自动驾驶汽车对世界产生的巨大影响,使得运输生产力提升上至少提高了半个数量级,未来,擎天柱或许会数量级的提升。”

此前曾有爆料称特斯拉“擎天柱”预计2023年实现量产,计划在德州工厂部署数千台人形机器人,最终可能会扩展到全球数百万台。如果特斯拉的人形机器人能最终量产,并真正解决其落地难题,有望促进人形机器人的产业发展向前迈进一大步。