打开网易新闻 查看更多图片
打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

在角逐自动驾驶的高风险竞赛中,多年来逐渐形成了一道深刻的理念与工程分歧

一方是几乎整个汽车与科技行业,他们推崇名为 ** 传感器融合(sensor fusion)** 的方案 —— 一种 “双保险” 式的思路,将摄像头、雷达与激光雷达(LiDAR)结合,构建出冗余、多层级的环境感知体系。

另一方则只有特斯拉孤身一人,它大胆且极具争议地押注在单一感知模式上 ——纯视觉、基于摄像头的感知方案

特斯拉主动拆除并停用雷达等硬件的决定,曾遭到广泛质疑,但这一举措源于其对人工智能与自然智能本质的、基于第一性原理的坚定信念。想要理解特斯拉为何下此重注,首先必须弄明白:特斯拉究竟否定了什么

1、什么是传感器融合?

传感器融合的概念其实非常简单。它的目标是利用不同类型传感器各自的独特优势,为车辆周围环境构建一个单一、统一且高度鲁棒(稳定可靠)的模型。每种传感器都有其优缺点,理论上,将它们融合在一起可以弥补各自单独使用时的短板。

  • 摄像头能提供最丰富、分辨率最高的数据,像人类一样以色彩和纹理感知世界。它们可以识别路牌文字、区分交通灯颜色,并理解复杂的视觉场景。其主要缺点是:在恶劣天气和低光照条件下性能会下降,且难以精确测量相对速度。

  • 雷达非常擅长测量物体的距离和速度,即使在极端天气下也能正常工作。它能轻松 “看穿” 雨、雾、雪,但缺点在于分辨率较低。无论如何计算,想要在单一方向上达到单个摄像头的分辨率,需要一个 12 英尺 × 12 英尺、成本高达数百万美元的雷达阵列。它能告诉你 “有东西” 以及 “它移动得多快”(前提是物体在运动),但很难判断物体是什么,也难以识别静止物体。

  • 激光雷达(LiDAR)工作原理类似雷达,但使用激光,能生成环境的精确3D 点云地图。它在测距和形状感知上精度极高,可以构建极其精细的三维环境模型。主要缺点是:成本相对较高,且在恶劣天气(尤其是雾、雪、雨)中性能会下降。激光雷达还有一个短板:采集的数据量极大,仅第一步数据处理就需要巨大的算力。

这是行业内成熟的技术方案,Waymo、Cruise 等公司都在采用:将三类传感器的数据融合,打造一套具备内置冗余的感知系统。

2、特斯拉的起点:多传感器方案

对很多人来说,这已是一段被遗忘的历史,但特斯拉并非从一开始就采用纯视觉路线。从推出到 2021 年,早期的 Autopilot 系统同时配备了摄像头前向雷达,雷达由博世等专业汽车传感器厂商提供。

这是一套常规的传感器融合方案:雷达作为主要传感器,用于测量前车距离与速度,从而实现交通感知巡航控制以及早期版本的 FSD Beta 功能。

多年来,这种多传感器方案一直是行业标准。即便特斯拉自研了专属 FSD 芯片,外界仍普遍认为雷达会继续作为核心部件,成为不断发展的视觉系统的安全兜底

然而在 2021 年,特斯拉做出了一次极为激进的转向

打开网易新闻 查看更多图片

3、转折点:特斯拉为何放弃雷达方案

这一转变始于 2021 年夏天,特斯拉宣布将在新款 Model 3 和 Model Y 上移除雷达,全面转向名为 ** 特斯拉视觉(Tesla Vision)** 的纯摄像头系统。

此举源于埃隆・马斯克基于第一性原理的核心理由:传感器数据冲突会带来安全风险—— 这一观点他至今仍在坚持。

激光雷达和雷达会因传感器冲突而降低安全性。如果激光雷达 / 雷达与摄像头的数据不一致,该信谁? 这种传感器信息模糊带来的是风险上升,而非下降。这就是 Waymo 无法在高速公路上行驶的原因。 我们在特斯拉上关闭雷达,就是为了提升安全性。

打开网易新闻 查看更多图片

埃隆・马斯克的观点是,传感器融合会催生一个全新且更危险的问题:传感器冲突

当两种不同的传感器系统给出相互矛盾的信息时,车辆该相信哪一个?哪种传感器才算 “更精准” 或 “更安全”?是由车辆在当下实时判断,还是由工程师提前设定好优先级?传感器信息的模糊性本身就存在风险,因为决策模块可能会因此陷入瘫痪,尤其是在安全优先的场景下。

这并非单纯的理论思辨,特斯拉的完全自动驾驶(FSD)工程师也给出了具体实例。在同一讨论中,特斯拉人工智能工程师蔡允达指出,雷达存在根本性缺陷:它无法正确区分无法产生频率偏移的静止物体、横截面细小的物体,或是雷达反射率低的物体。这正是过去困扰特斯拉的 ** 无故急刹(幽灵刹车)** 问题的根源 —— 车辆可能会把路边静止的天桥或丢弃的铝罐误判为停下的车辆,从而触发不必要的制动。

在特斯拉看来,实现通用化自动驾驶的路径,是攻克视觉感知。人类依靠双眼这两台 “生物摄像头” 和强大的神经网络就能驾驶。他们的核心判断是:如果能让计算机视觉做到完美,那么其他任何传感器往好了说是多余干扰,往坏了说就是危险歧义的来源

4、当下方向:纯视觉路线的愿景

如今,每一辆全新特斯拉都完全依赖特斯拉视觉系统(Tesla Vision),由 8 颗摄像头提供支持。该系统通过复杂的神经网络构建出三维矢量空间的环境模型,车辆据此进行分析与行驶决策。

关于纯视觉路线,还有一段耐人寻味的插曲。特斯拉推出第四代硬件(现称 AI4)时,新款 Model S 和 Model X 都搭载了全新的高清雷达。但为坚定践行纯视觉路线,特斯拉从未在完全自动驾驶(FSD)功能中启用这些雷达。

事实上,FSD 表现最成熟的反而是特斯拉销量最高的车型 Model Y,而非配备额外传感器的车型。尽管特斯拉可能会从这些雷达采集部分数据、验证系统性能,但雷达并未真正纳入 FSD 的感知体系。

打开网易新闻 查看更多图片

5、 二选一的结局:非成即败

特斯拉放弃传感器融合方案,是其自动驾驶路线与行业其他厂商最核心的区别。这是一场孤注一掷、高风险高回报的豪赌,而目前来看,特斯拉明显占据上风。

特斯拉、埃隆・马斯克、阿肖克及特斯拉 AI 团队一致认为:想要打造一套具备类人智能、可规模化、通用型的自动驾驶系统,唯一路径就是彻底攻克视觉感知难题。如果这一判断正确,他们将打造出比竞品那些造价高昂、堆满传感器的车型成本更低、扩展性极强的系统。

如果判断失误,他们最终可能遭遇性能瓶颈,只能回头加装传感器 —— 但到目前为止,这类瓶颈尚未出现任何端倪。

如今,特斯拉已全力押注纯视觉系统,其技术进展与能力毋庸置疑。

(来源:notateslaapp、半导体行业观察)

—— 芯榜 ——

更多精彩内容,点击看: