文 | 308
编辑 | 经纬
在中国智能驾驶领域竞争体系的排名中,理想汽车打算排在什么样的位置?
答案是:第一名。
在成都车展期间,面对智见 Time 提出的上述问题,理想汽车智能驾驶研发副总裁郎咸朋给出了一个明确的答案,他的原话是:「我们一定希望达到第一的位置,都想争第一,我们肯定是朝着第一去的」。
这意味着,在理想汽车为其智能驾驶设定的目标中,它是要超越国内所有玩家的。
但这并非容易之事。毕竟,在过去很长的一段时间里,理想汽车在智能驾驶的技术进展和落地进度并不算是特别靠前。其中,城市导航辅助驾驶此前在面向全国落地的过程中,无论是在实际技术落地的节奏上,还是在用户认知层面,都形成了一定的排序格局。
眼下,在端到端技术的加持下,理想汽车正试图打破这一格局——而它的武器,却不仅仅是端到端。
在智驾的战场中,走了不少弯路
对于智能驾驶领域的任何一个玩家来说,端到端都不可能是一蹴而就的,也绝不是凭空而来的—— 特斯拉是如此,华为、小鹏也都是如此。
因此, 理想汽车,也并不能例外。
实际上,以 2023 年 4 月正式宣布开启智能驾驶 3.0 时代为起点,理想汽车在智能驾驶的上一个阶段进行了一年多的技术开发和商业落地进程,最终在 OTA 6.0 版本中实现了基于无图 NOA 的全国城市道路都能开——并且为端到端打下了前期基础。
这并不是一个非常容易的过程。
2023 年 4 月,正值上海车展期间,理想汽车发布了「双能战略」,并宣布其智能驾驶进入到 3.0 时代,也就是基于 AD Max 3.0 版本,智能驾驶的落地从高速 NOA 扩展到城市 NOA。
从硬件层面来说,理想汽车的城市 NOA 适用于搭载双 Orin-X 芯片和激光雷达的 AD Max 车型。
在这场发布会上,理想汽车还宣布,理想 AD Max 3.0 的城市 NOA 功能将于二季度开始推送内测用户,到年底将推送至 100 座国内城市。
当时,理想汽车在AD Max 3.0 中给出的技术方案,主要是将静态 BEV 网络、动态 BEV 网络和 Occupancy 网络融合并通过 NeRF 增强后,汇总到预测模型并进行决策和规划。
这是一个典型的分段式算法架构,并不算落后,却很难有效支撑理想城市 NOA 的大规模落地。
于是,到了 2023 年 6 月的理想家庭科技日上,理想汽车又宣布为 AD Max 3.0 引入了NeuralPriorNet(NPN,神经先验网络),并且通过过大量学习人类司机在真实路口应对信号灯变化的行为,训练了TrafficIntentionNet(TIN,信号灯意图模型)。
这两个模型的引入,让理想汽车初步具备将城市 NOA 在特定城市落地的能力,却很难走向泛化,在实际的落地节奏上也面临阻碍。
这期间,理想汽车又在其智驾产品落地落地的节奏中,引入了通勤 NOA 的概念,这很难说是一个完全正确的决策——2023 年 8 月,在成都车展上,理想汽车关于智驾在 100 城落地的宣布口径又从「城市 NOA」调整为「通勤 NOA」,让外界大跌眼镜,也在行业引发争议。
好在,到了 2023 年 12 月,理想汽车在经历了一系列的高强度投入和算法模型重构之后,正式面向用户推送了 OTA 5.0 版本。
在理想汽车的官方话术中,升级到 OTA 5.0 版本之后,全场景智能驾驶将覆盖全国所有高速公路和城市环路,以及 110 个城市的城区道路——到这个阶段,理想汽车才算是完成了城市 NOA 架构的技术验证和初步落地。
需要注意的是,在 OTA 5.0 版本中,理想智能驾驶在底层的算法架构上依旧采用的是模块化的设计,其中包含感知、定位、规划、导航、NPN 等,这一代架构可以支撑理想汽车在全国 100 个城市推送城市 NOA 功能,但却并不足以支持「全国都能开」。
这种情况下,泛化能力更强的无图 NOA,成为了理想汽车的下一步选择。
于是,在很短的时间里,理想汽车又对 AD Max 3.0 下的算法架构进行了重新调整,将整个模型缩减为感知和规划两个模块,同时在架构中去掉了 NPN 和对先验信息的依赖,并最终实现了对算法架构的升级,使得城市 NOA 的落地不依赖于高精地图。
这就是「无图 NOA」。
2024 年 7 月 15 日,理想汽车面向普通用户推动了 OTA 6.0 功能,其中最大的更新点,就是无图 NOA,它不依赖高精地图等先验信息,没有开城限制,也不限城市、乡镇,可以实现在全国范围内可导航的道路都能够开启 NOA。
也就是说,通过无图 NOA 功能,理想汽车终于实现了「全国都能开」。
纵观理想汽车首次发布 AD Max 3.0 到最终实现「全国都能开」的过程,其实很容易发现,在过去一年多的时间里,理想汽车在智能驾驶的落地过程中确实走了一些弯路。但这种弯路其实在在一定程度上给理想汽车积累了不少技术开发和落地方面的经验和教训。
更重要的是,正是由于这些经验和教训,让理想汽车很好地抓住了「端到端」这个可以在智能驾驶领域「换道超车」的难得机遇。
算法之外,算力、数据也是挑战
对于整个自动驾驶行业来说,「端到端」并不是一个新名词。
从全球范围来看,特斯拉是最早在自动驾驶的算法架构中引入端到端方案的玩家;而马斯克本人也在 2023 年 5 月首次对外披露了 FSD v12 版本中端到端的存在,并且在 2023 年 8 月首次进行了 FSD V12 内测版本的对外直播。
此后,国内的一众自动驾驶玩家也纷纷参与到端到端方案的竞赛中去,而这一竞赛在 2024 年随着特斯拉 FSD V12 版本的一步步推送逐渐进入到激烈状态。
而理想汽车毫无疑问也成为重要玩家之一。
2024 年 6 月上旬,理想汽车 CEO 李想在重庆汽车论坛的公开演讲中,首次谈到了理想汽车在端到端自动驾驶方面的重要突破。
他表示,理想汽车在 2023 年 9 月专门成立了一个用于自动驾驶研究的团队;后来,基于《思考,快与慢》这本书的启发,理想汽车寻找到了现有的基于端到端技术的方案。
从技术框架的角度来说,理想汽车的这套端到端方案有三个重要板块:
1、端到端(E2E)模型本身,即系统 1。
根据官方说法,它统合了感知、预测、决策、控制等多个模块,采用的是 One Model 的算法架构,只有一个模型,输入的是传感器,输出的是行驶轨迹——这个架构本身,类似于特斯拉在端到端方案中提到的「Video in & Control out」。
2、VLM(视觉语言模型),即系统 2。
根据理想汽车官方说法,它的整体算法架构是由一个统一的 Transformer 模型组成,输出的信息包括对环境的理解、驾驶决策和驾驶轨迹,并传递给系统 1 控制车辆——本质上,它所扮演的角色,类似于人类的综合信息理解能力。
3、世界模型。
它主要部署在云端,其目的是用来验证系统 1 和系统 2 的能力,其在技术上的主要原理,借鉴了 OpenAI 在今年年初发布的 Sora。
关于世界模型与系统 1 和系统 2 之间的关系,郎咸朋表示:
世界模型对系统 1 和系统 2 来说,最大作用是提供一个训练和测试的场地。原来是这个场地放在真实的世界里面,我们把世界弄到模型。在世界模型里,我们的测试、错题、真题,都在这个世界模型中进行训练。
根据理想汽车官方说法,端到端的这套方案最大的特点在于,它能够通过模型实现数据驱动,从而不依赖于人类手写的规则——也因此具备四个方面的能力:通用障碍物的理解能力,超视距导航能力,道路结构理解能力,拟人的规划能力。
换句话说,与以往方案相比,它在自动驾驶能力方面的上限更高了。
不过,一个新的端到端技术架构,对于整个自动驾驶技术体系的各个方面都提出了不一样的要求。对于理想汽车来说,为了这套端到端+ VLM 架构更好地运行,它也做了大量的准备。
比如说,在数据方面,理想汽车方面告诉智见 Time,One Model 方案的问题在于,它的训练难度非常大,也需要非常优质的训练数据。
实际上,理想汽车在训练端到端的过程中,进行了一定的数据筛选,主要是通过打分的方式选择「老司机」的数据,而在理想汽车的车主中,被标注为「老司机」的数据比例仅为 3%。
在算力方面,这套端到端+VLM 架构主要涉及到两个方面:一个是车端算力,一个云端算力。
在车端算力方面,理想汽车智能驾驶高级算法专家詹锟表示,现在 Orin-X 能够完美适配这套端到端+ VLM 方案的运行——但是随着算力的增加,一旦理想汽车进入到 Thor 阶段,会有一个更大规模数据量训练的端到端大模型,效果会进一步提升。
在云端算力方面,由于模型训练对于云端算力的要求,理想汽车也花了大量的功夫来提升自动驾驶训练的算力;其中在成都车展期间,理想汽车表示其训练算力已经达到了 5.39 EFLOPS,预计到 2024 年年底达到 8 EFLOPS 以上。
不过,在理想汽车智能驾驶研发副总裁郎咸朋的说法中,最终实现自动驾驶需要的训练算力要达到 100 EFLOPS 的量级,折合成投入每年要超过 10 亿美金。
值得强调的是,除了算法架构、数据、算力等问题,理想汽车在端到端+VLM 的技术框架下还要解决方案的评估、测试等一系列问题。
根据理想汽车在 9 月 14 日发布的最新消息,全新一代智能驾驶端到端 + VLM 万人体验团已经正式开启推送,涵盖 MEGA / L9 / L8 / L7 / L6 的 AD Max 车型。而根据官方说法,基于这套架构的方案预计会在今年年底明年年初推送给广大用户。
不仅如此,在 理想汽车「端到端+VLM为」还面向千人用户推送了版本号为 6.2.0(E2E-VLM Beta 4)版智驾系统,并表示这是行业首个「车位到车位」产品落地体验。
可见,理想汽车也已经加入到「车位到车位」的智能驾驶新一轮竞争中去。
理想发力「端到端」的商业逻辑
对于理想汽车来说,它之所以如此花大力气投入到端到端,本质上还是争夺在智能驾驶领域上的头部地位 —— 这固然有着技术开发和用户体验层面的逻辑,但从本质上来说,这其实依旧是一个商业逻辑。
原因很简单,智能驾驶对于用户的购车决策变得越来越重要了。
实际上,从去年开始,华为、小鹏等玩家都在不断推动自动驾驶面向更多用户群体和更广泛的用户场景进行落地;尤其是在下半年,搭载了华为 ADS 2.0 的问界新 M7 一飞冲天,已经让整个行业看到了智能驾驶对于用户的价值。
甚至到目前为止,华为在智能驾驶方面的这一优势依旧在为鸿蒙智行贡献着可观的销量。
而到了今年,尤其是在端到端技术的加持下,智能驾驶对于用户购车决策的权重影响越来越明显。正是从去年四季度就体会到这一点,理想汽车才会如此用力地抓住智能驾驶领域新一轮技术变化——也就是端到端——来赢得用户认可。
根据理想汽车总裁马东辉公布的数据,无图 NOA 从 7 月份开始全量推送以来,用户对智能驾驶的接受度在提升,城市 NOA 的日活跃度和行驶里程都明显增加,甚至翻了几倍。同时,根据朗咸朋的说法,在无图 NOA 全量推送之后,城市 NOA 的日活比例已经高于高速 NOA 的日活比例。
这意味着,用户对于理想汽车智能驾驶的接受度越来越高。
不仅如此,在理想汽车的门店销售中,它对于智能驾驶的加速拥抱,也已经在市场端推动理想汽车智能驾驶车型的销量增长。
对此,马东辉在最新一季的财报电话会议中表示:
从市场端来看,智驾对于销量产生了积极的推动作用。潜在用户来门店试驾 NOA 的比例翻倍增长,并且各个车型的 AD Max 订单占比都在提升,特别是 30 万以上车型,AD Max 的订单占比已经接近 70%。
另外,根据智见 Time独家获得的最新数据:在用户对于理想 L9 的选择中,选择 AD Max 版本的车主达到了 80% 左右。
值得关注的是,从 9 月 10 日开始,理想 L9 试驾车已经开启新一代「端到端 + VLM」智能驾驶零售中心体验——到了 9 月 20 日,理想汽车也宣布,全系车型开启新一代「端到端 + VLM」智能驾驶门店体验。
也就是说,端到端方案,已经成为理想汽车加大力度卖车的一个重要法宝。
实际上,通过对智能驾驶的拥抱,理想汽车正在构建一个「以智能驾驶促进销量增长,以销量增长来推动智能驾驶发展」的商业逻辑。
对此,马东辉也公开表示:
我们认为从端到端 + VLM 开始,智驾研发的门槛已经建立,因为从这一代开始,才是真正使用人工智能的方式去做智驾,而人工智能需要大量的数据和算力,会让具备高阶智驾车辆保有量以及充足研发投入的企业,在智能驾驶方面的优势增加,并且实实在在地促进销量提升,而销量提升又会带来保有量和研发投入的提升,这是一个不断正向滚雪球的过程。
也就是说,以现有的 L 系列产品在用户体验和市场反馈上的良好表现和理想汽车的正向现金流为基础,通过端到端 + VLM 加持下的智能驾驶能力,很好地扮演了理想汽车销量增长催化剂的作用,并且继续带动整个理想汽车走向正循环。
从这个角度看,在 2024 年理想汽车已经放弃推出纯电 SUV 的前提下,它借助端到端带来的机会,在智能驾驶领域的大力投入和大张旗鼓,确实不失为明智的选择。
毕竟,从短期来看,有了端到端的加持,理想汽车为了补足智驾短板后能够更好地卖车;从长期来看,一旦通过端到端实现智能驾驶能力的突破,理想汽车就足以构建智能驾驶方面的长期竞争力,其正面影响是巨大的。
更重要的是,在李想本人的长期目标中,理想汽车要在 2030 年成为一家世界领先的人工智能企业。
因此,智能驾驶是理想汽车势必要拿下的第一个山头。
从理想汽车长期以来的战略选择来看,它在智能驾驶新一轮的大举投入和全力以赴,实际上也是为了在这个汽车智能化的核心领域中,与众多选手一决高下。
这不仅仅是新一轮技术的较量,也是商业能力的较量,更是一场关于占领用户心智的较量。
当然,这也意味着,以端到端和视觉大语言模型等技术的到来为契机,理想汽车试图打破中国智能驾驶产业格局的新一轮战争,已经正式打响。
本文来自微信公众号“智见 Time”