昨天,激光雷达又火了。
起因是,推特一位名叫“AlphaSense”的网友分享了一则来自自动驾驶汽车专家的会议纪要。
根据这位自动驾驶专家的说法,特斯拉已经设计了自己的激光雷达,并正在与大陆合作,将其为未来汽车开发的雷达技术集成到其系统中。
受此影响,激光雷达龙头禾赛股价大涨36.4%。
且不论这个消息是真是假。但从目前可收集到的信息看,特斯拉拥抱激光雷达,大概率是一个美好的“误会”。
今天就来聊聊,特斯拉为什么不太可能拥抱激光雷达,以及背后的另一个热门话题:自动驾驶走向纯视觉的深度逻辑。
为什么说拥抱激光雷达是个误会?
其实,特斯拉拥抱激光雷达的传言,不是第一次出现了。
今年10月,曾有人拍到,一辆配备了激光雷达装置的特斯拉Model X测试车出现在北加州。
而在今年上半年,美国激光雷达上市公司Luminar更是在第一季度财报中透露,特斯拉已经成为其2024年第一季度最大的客户,收入占比超过10%。
按照财报公布的数据计算,特斯拉购买了超过210万美元的激光雷达。
很多人据此推测,特斯拉并没有完全放弃这一路线,甚至还有计划把激光雷达集成到系统上。
但在乌鸦君看来,这样的判断更多可能是一个误会。理由有三:
一来,在目前的智能驾驶行业,有以激光雷达作为主传感器的路线和以摄像头作为主传感器、舍弃激光雷达的纯视觉路线两种。而特斯拉一直就是纯视觉路线的坚定支持者。
从2015年开始,马斯克就反复强调,激光雷达对于自动驾驶汽车来说毫无意义。12月2日,马斯克再次公开批评激光雷达,称其为“错误的解决方案”,并重申了其一贯的观点:
在复杂的道路驾驶环境中,模拟生物神经网络和眼睛的视觉系统,才是最为有效的方式。
目前还没有证据证明,马斯克会允许把激光雷达装到特斯拉上。因为这无异于打了自己的脸。
二来,采购激光雷达这事,之前特斯拉也干过。
2021年5月,便有媒体曝出特斯拉与Luminar签订了一份使用激光传感器技术进行测试和开发的合同。
当时就有人猜测,激光雷达会被融入特斯拉的自动驾驶系统。但随后特斯拉就否认称,“我们定期对照其他传感器测试自己的技术,以校准我们的系统。”
而回到这次,虽然特斯拉已经成了Luminar第一大客户。但Luminar也并不清楚其采购这些激光雷达是为了什么。公司首席财务官Tom Fennimore曾在财报电话会议上表示:
“这不是特斯拉第一次向我们订购激光雷达,但也不是经常性的,而是断断续续的。他们到底在做什么,我们只能猜测。”
第三,也是最重要的一点,自从特斯拉发布端到端智驾系统后,自动驾驶的技术路线开始全面向纯视觉倾斜。
今年7月,在美国亲测完FSD后,何小鹏明确表示小鹏新车将采用端到端的纯视觉方案。
今年9月,Mobileye发表声明,决定放弃激光雷达的研发。
今年 11 月,奔驰在国内展示了“无图”L2++ 全场景高阶智能驾驶系统,采用的就是不依赖高精地图的纯视觉方案。
股价表现,也能反映投资人对激光雷达的态度。自去年上市以来,禾赛的股价一路走低。在昨天大涨后,禾赛的股价为13.92美元,较上市首日开盘价下跌41.39%。
要知道,禾赛可是激光雷达领域绝对的王者。根据YOLE数据,2023年全球激光雷达市场,禾赛以37%的市场占有率位居首位。在L4自动驾驶领域(包括Robotaxi),禾赛更是以74%的市场份额绝对领先。
有了以上三点,乌鸦君实在很难想象,特斯拉还会去拥抱激光雷达。尤其是端到端技术出现后,激光雷达的逻辑正在受到巨大冲击。
/ 02 /
视觉能力,决定智驾上限
今年1月,特斯拉FSD升级到了基于“端到端”的V12版本。
这个事的意义怎么形容都不为过。因为这改变了行业企业此前模块化智驾方案对规则、对激光雷达感知信息等的依赖,即从传统方案的规则驱动,变成了“端到端”方案的AI驱动、数据驱动。
传统的自动驾驶算法框架是一个模块化的结构,感知、决策、执行三个环节是分开的。
具体来说,当车辆上的摄像头和雷达等感知设备采集到真实世界的数据后,送到感知模块进行语义解析,将关键的信息提取出来后,送到决策模块,与对应的执行策略匹配,最后车辆会执行操作相应的动作。
就拿一张道路的图片来说,计算机需要把图片中的“汽车”、”行人“、”建筑物“或者”交通标识“等对象识别出来,然后再将这些对象之间的对应关系梳理出来,比如”行人在过马路,汽车停在红灯前“。
而如何判断这些事物间的逻辑关系并做出决策,依赖于开发员预先设定的规则和逻辑,比如各种弯道限速、路口限速、红绿灯的限速,甚至还有逼近其他车辆的限速….
但这事难点在于,路上的情况变化莫测,而预先设定的规则是有限的,总有些现实情况无法事先预测到。这就很容易出现问题。比如,当车辆没有识别出某一个特殊的物体,就会直接撞上去。
而端到端就不同了。所谓“端到端”,指将感知到决策的一连串模块,整合成一个大模型。
这个大模型的作用类似于人类大脑。通过这个大脑,就能把传感器收集到的感知信息,转换成车辆方向盘的转动角度、加速踏板的踩踏深度以及制动的力度等具体操作指令,让汽车实现自动驾驶。
这样做的好处在于,不用开发者预先设定规则,AI就像人类司机一样,能够根据自己看的的图像,去理解语义信息,例如辨识行人、车辆、斑马线、交通信号灯等,并理解它们之间的关系。
当然前提条件是,需要有大量的学习素材能够用于训练,据说,特斯拉的FSD V12采用了全球各地数百万特斯拉的车身视频作为训练材料来模仿人类司机的驾驶决策。
当模型对信息处理能力大大加强后,激光雷达的价值就大大下降了。原因很简单,视觉能够提供更多的信息以供解读,而激光雷达只能提供距离和异形障碍物等有限信息。
极越整车产品负责人贾秀江曾表示,一个常规车载量产激光雷达的感知数据量,几乎只有一个800万高清摄像头的160分之一。
这意味着,影响信息采集量的视觉能力将决定自动驾驶系统的上限。提升视觉能力,自然就成了自动驾驶系统后期优化的唯一方向。比如,小鹏汽车推出的AI鹰眼视觉智驾方案,就提升了摄像头的全场景感知能力。
在感知信息能力上的巨大差距,让激光雷达再次陷入了尴尬的境地。而马斯克也再一次取得了背离主流的胜利。
/ 03 /
第一性原理的非主流胜利
在激光雷达与纯视觉的竞争中,马斯克一直站在多数派的对立面。
在相当长时间里,激光雷达都是自动驾驶最主流的解决方案。特斯拉之外的主流车企都在使用或即将启用激光雷达,包括全球电动车冠军比亚迪和乘用车老大丰田。
之前很多人认为,马斯克选择纯视觉路线,是因为激光雷达成本太高。但在乌鸦君看来,马斯克追求第一性原理的思维方式,决定了他不会选择激光雷达这种过渡方案。
所谓的第一性原理,从最基本的物理或逻辑公理出发,不依赖于任何经验或假设,通过逻辑推理来得出结论的方法。
简单来说,就是不受当下条件限制的影响,基于从事物的本质出发,去寻找长期更高效率的解决方案。
这样的思考方式,让马斯克总能取得背离主流路线的胜利。
在火箭制造领域,更主流的方法是通过购买并改造老式火箭入局,而马斯克选择采购二手设备,从零建造火箭。在汽车工程领域,传统车企一旦建成产线就很少变动,特斯拉却会快速改动、升级产线,达到精简工序、降低成本的目的。
回到自动驾驶领域,纯视觉路线同样来自马斯克独特的技术理念。
马斯克很早就判断,人工智能最终将达到人类思维,摄像头就完全可以胜任甚至超越人眼,实现自动驾驶。人开车就主要靠眼睛看,并不需要能精准测距的感知器官。
过去,纯视觉路线最大的问题是,AI技术很难做到复刻人类大脑的思维模式。直到大模型的出现,让马斯克的设想成为现实。
在新能源车和火箭制造领域上,马斯克已经赢过两次。这一次,他大概率又赢了。
文/林白
PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。