特斯拉 CEO 埃隆・马斯克(Elon Musk)从 2019 年起就在不断为其即推出的神经网络训练计算机 Dojo 预热。

马斯克称,通过大量的视频数据, Dojo 可以帮助人们实现完全依靠视觉的自动驾驶。目前 Dojo 仍在开发中,但特斯拉于当地时间 6 月 22 日公布了一台作为 Dojo 的开发原型版本的全新超级计算机。

打开网易新闻 查看更多图片
图 | 2021 年度计算机视觉和模式识别会议(来源:Tesla)

特斯拉的人工智能主管安德烈・卡帕西(Andrej Karpathy)在 2021 年度计算机视觉和模式识别会议上宣布了该公司的最新超级计算机。该超算可以让特斯拉使用光学摄像机来实现自动驾驶,从而放弃传统的雷达、激光雷达。

卡帕西在自动驾驶研讨会上解释:“若想让计算机以人类的方式对新环境做出反应,需要一个巨大的数据集以及一台强大的巨型超级计算机。” 然后通过数据集训练基于神经网络的自动驾驶技术。围绕着这个目标,特斯拉团队启动了 Dojo 项目。

卡帕西表示,特斯拉的最新一代超级计算机具备 10PB 的 “hot tier” NVME 存储,能以 1.6TB/s 的速度运行。并称:“这台拥有每秒峰值速度 1.8 EFLOPS 的超算可能是世界上第五强大的超算。

他承认,虽然该超算还没有进行 TOP500 超级计算机排名的基准测试。“但如若计算 FLOPS 来排名的话,它确实可以排在第五左右。目前排名第五的是英伟达的 Selene 集群,它拥有非常相似的架构以及 GPU 数量(4480 和我们的 5760 相比少一些)”。

图 | 马斯克在推特上回答网友的疑问(来源:Twitter)

近年。马斯克一直在推崇纯视觉技术的自动驾驶,主要原因在于摄像头的速度比雷达更快。截至今年 5 月,特斯拉在北美的 Model Y 和 Model 3 汽车的高级驾驶辅助系统和自动驾驶均没有使用雷达,而是依靠摄像头和机器学习。

“许多自动驾驶公司使用激光雷达和高清晰度地图,这意味着他们需要非常详细的运营地点地图,包括所有车道及其连接方式、红绿灯等。而我们采取的方法是基于视觉的,主要使用神经网络,理论上可以在地球上任何地方发挥作用,” 卡帕西在他的工作室中介绍。

会上,卡帕西还展示了这台超级计算机如何运用计算机视觉纠正司机的不良行为。在紧急制动场景中,为避免撞到行人,计算机将启动物体检测,在交通控制警告场景中,超算可以捕捉并识别到马路前方的黄灯,并向尚未减速的司机发出警报。

此外,特斯拉还推出了一个叫做 “拯救误踩油门” 的功能。当汽车识别到前方有行人或者 “无路可走” 的时候,超算能够对司机错误踩下的油门做出反应,自动启动刹车功能,由此避免撞到路人或加速冲到河中。

卡帕西说道:“特斯拉的超级计算机以每秒 36 帧的速度收集来自车辆周围的八个摄像头的视频,这提供了关于汽车周围环境的大量信息。”

卡帕西表示,经过多年的研究,他相信可以将纯视觉的自动驾驶这一挑战视为 “监督学习” 的问题来应对。负责测试的工程师发现,特斯拉在人口稀少的地区可以实现零干预,但 “在旧金山等非常拥堵的环境中肯定会遇到更多问题。” 为了让系统良好运转,并减少对高清地图和额外传感器等其他功能设备的需求,它需要在应对人口密集区域的交通问题方面做得更好。

帮助特斯拉人工智能团队实现技术提升的是自动标记技术,该技术可以在特斯拉相机拍摄到的数百万条视频中自动标记如 “道路危险” 等道路标识。大型 AI 数据集通常需要大量手动标记,这非常耗时,若想使神经网络上的监督学习系统正常运行,所需的标记需要非常清晰,所费时间则将更多,自动标识技术则能够大幅度缩短时间。

本次推出的超级计算机是特斯拉的第三台超算,这台超算将被用来训练特斯拉的 Autopilot 及其全自动 驾驶(FSD)AI。 卡帕西表示,这 “需要大量的计算”。

特斯拉目前已凭借这台全新的超级计算机,已对 100 多万个平均 10 秒长的视频标记了 60 亿个物体,所有数据共占据了 1.5PB 的存储空间。这一数字似乎已经很大了,但要让该公司从纯视觉自动驾驶系统变得可靠,还需要更多的时间和数据,以及开发更强大的超级计算机。

卡帕西表示:“我想给我们正在建造和使用的这台超算插上插头。计算机视觉是我们所做事情的主要支柱,也是自动驾驶的基础。”

Dojo 最终版本尚未发布,卡帕西也未透露其进展。马斯克此前表示,特斯拉将向其他公司开放,允许他们使用 Dojo 来训练自己的神经网络。

-End-

参考:

https://techcrunch.com/2021/06/21/tesla-backs-vision-only-approach-to-autonomy-using-powerful-supercomputer/