文/飞说智行 周雄飞
没想到,智能驾驶行业的"风水轮流转"会来得如此快。
去年下半年开始,随着特斯拉发布了BEV+Transformer和OCC占用网络等技术,一度成为了车企们追逐的热词。再到今年初,由于受到特斯拉的启发,端到端技术也逐渐成为了整个智驾行业的标配。
但就在最近,一直是"领路人"角色的特斯拉,则反过来向"蔚小理"们学习起来。
因为随着特斯拉向北美车主们释放FSD的V13版本后,行业内外注意到特斯拉官方称该版本FSD能实现"车位到车位"(Park 2 Park)的智驾功能。
需要注意的是,"车位到车位"这一概念最早是由华为提出,很快理想和小鹏等车企将该功能的落地提上了"日程表"。这就意味着,在"车位到车位"的落地上,华为、理想和小鹏走到了特斯拉前面。
智驾功能迭代的同时,行业对于算法的探索也在持续着,以至于从"一段式端到端"和"两段式端到端"两大阵营竞争的1.0时代,发展至VLA(视觉语言动作)模型横空出世的端到端2.0时代。
车企们之所以会在"车位到车位"和端到端智驾算法上展开竞速赛,也是因为这些能力已成为能否进入智驾第一梯队的"分水岭"。但要迈过这一分水岭,除了要追逐技术趋势之外,无疑也对"冰山之下"的算力和数据提出了更高的要求。
由此,"蔚小理"等众多车企品牌们纷纷卷入对算力和数据的"军备竞赛"中,与此同时,腾讯为代表的科技大厂们也在陆续推出智能汽车云相关产品,专为智驾训练提供云端算力。
然而,随着算力和数据规模越来越大,如何获得高质量数据、并且更有效率和低成本的"流动"起来,以便推动算法的快速迭代,成为整个行业需要解决的问题。
对此,腾讯提出了他们的解法。早在2022年,对算力、数据和算法"冰山之下"基础设施长期投入的腾讯,率先行业推出了"车云一体"和数据驱动闭环的概念,并基于此在今年9月推出"车云一体数据闭环"的解决方案,以便来帮助车企和自动驾驶企业们实现"冰山之上"功能和体验的进化。
在腾讯智慧出行副总裁钟学丹看来,随着汽车进入"AI驱动"的时代,数据质量和规模直接影响到了车的智力水平,数据闭环能力成为汽车智能化的核心"增长飞轮"。
英伟达自动驾驶负责人吴新宙也说过相似的观点,按照他认为,数据闭环已经成为实现高阶智驾的"华山一条路",没有一家车企可以绕开。
这就意味着,"冰山之下"的车云一体数据闭环能力,已成为车企和自动驾驶企业们能否在未来"冰山之上"智驾功能和体验的竞赛中取胜的关键。
1、"车位到车位"、VLA相继出现,智驾行业驶入"分水岭"
"试试特斯拉最新的自动驾驶软件吧,它一定会超乎你的想象。"
当特斯拉向它的用户们推送了FSD的V13.2.1版本后,特斯拉CEO埃隆·马斯克如此在X平台上为FSD的最新版本做起了宣传。
他之所以会对FSD新版本如此满意,也是因为相比于之前的版本,V13.2.1版本不仅可以实现从车位里开启智驾的功能,更为关键还能做到更加拟人的"车位到车位"高阶智驾能力。
马斯克会如此高调为FSD V13站台,或许他也知道在"车位到车位"功能的落地上,特斯拉已经慢了一步。
对于"车位到车位"这一概念,由华为最先提出,并在今年8月随享界S9的上市发布了该功能。这之后,小鹏、理想、极氪和小米等一众车企品牌也把"车位到车位"的落地,提上了各自的日程。
比如理想汽车率先在上月底向用户们全量推送了"车位到车位"的智驾能力;华为鸿蒙智行也在近日宣布对于"车位到车位"智驾功能进行全量推送。
在以上两个品牌后面,小米汽车宣布会在本月开启"车位到车位"先锋版推送;极氪则预告会在明年第二季度全量推送"车位到车位"的智驾功能;小鹏在上月也开启了该功能的公测。
相比于车企们之前喊出的"全国都能开"口号,"车位到车位"可以让消费者更加直观的体验到智驾功能带来的便利,比如可以不需要接管通过停车场闸口和收费站(ETC)。
但需要注意的是,截至目前放眼整个智驾行业,只有以上这些车企品牌在"车位到车位"上有所动作,因此该功能也被视为能否进入智驾行业第一梯队的"分水岭"。
由于要实现"车位到车位"的智驾能力,对于车企品牌自身的算法能力提出了更高的要求,因此在算法层面的探索一直在进行着,并且也已出现了明显的"分水岭"。
特斯拉FSD V13版本,图源Electrek
从今年初开始,端到端成为了整个智驾行业追逐的关键技术,以至于演化出"一段式端到端"和"两段式端到端"两大技术阵营。
以华为乾崑ADS 3.0为例,属于典型的"两段式端到端",因为其架构是由对真实世界的感知和识别的GOD感知神经网络,以及感知信息迅速做出决策的PDP决策神经网络两大块构成。
相较于"两段式端到端","一段式端到端"则可以将感知端到端与规控端到端都集成到一个大模型中,使系统能够更高效地处理信息并作出反应,更具效率优势。特斯拉、商汤绝影和黑芝麻智能等玩家被视为是"一段式端到端"架构的代表玩家。
除了在智驾算法结构上推动进化之外,比如理想、华为和Nullmax等企业,也把人类大脑应对驾驶场景的工作模式引入到智驾算法的构建中,被用作算法执行过程中兜底的"安全气囊"。
但很快,一个名为"VLA"的智驾模型横空出世,并很快成为了行业关注的热点。
VLA,即视觉语言动作模型,是一个融合了视觉、语言和动作的多模态大模型范式,由元戎启行在今年9月底率先提出。
该模型可以理解为"端到端+VLM"的融合体,可实现一次性从感知到决策的过程,不用再由"快""慢"系统进行交互和调优,从而提高信息处理、决策的效率,以及增加端到端"黑箱"的解释性。
由于这样的优势,VLA被业内认为是更为先进的算法架构,但除了元戎启行之外,只有理想、奇瑞等极少数车企也宣布会对该架构进行布局和投入。这背后的原因,在业内看来主要是因为布局VLA比VLM(视觉语言模型),对于算力和数据的要求有更高的要求。
从"车位到车位",再到VLA的横空出世,这些都被行业视为智驾行业区分实力的"分水岭",而玩家们想要率先迈过这些"分水岭","冰山之下"算力和数据的能力,已成为决定性因素。
2、升级算力和数据,"冰山之下"能力还不够?
FSD V13版本的升级,到底是如何实现的?
这个问题的答案,或许只有马斯克自己知道。但从FSD V12到V13版本的迭代中,特斯拉也掀起了一场对于算力和数据的行业"军备竞赛"。
按照特斯拉官方发布的FSD V13版本升级信息来看,在训练数据方面,他们用到了大量的模拟仿真生成式数据,让算法来认识和理解真实世界。
数据之外,特斯拉通过建立名为"Cortex"(大脑皮层)的超算集群,用以支持FSD和Optimus的算法训练。
端到端+VLM与VLA两大架构对比,图源元戎启行
根据最新的消息,该超算集群已包含十万颗英伟达H100和H200芯片,按照一颗H100 FP64/FP32的60 TFlops算力来估算,Cortex可实现100 EFLOPS左右的算力能力,已成为世界范围内排在前列的超算集群。
随着特斯拉的带头,智能出行行业中越来越多玩家也加入到这场算力和数据的"军备竞赛"中。
据理想汽车介绍,截至上月月中的算力已达到6.83 EFLOPS,预计在今年年底达到10 EFLOPS。无独有偶,小鹏和华为也都计划在明年把自身的算力提升至10 EFLOPS以上。
数据方面,除了通过量产车采集回收数据之外,据飞说智行了解,目前绝大多数头部车企和自动驾驶企业均通过建立"世界模型",来生成海量的仿真数据供算法进行训练,这点上与特斯拉如出一辙。
车企们卷起来的同时,以腾讯为代表的科技公司们在算力和数据的升级上也不甘示弱。
根据公开数据,依托分布式云原生的调度能力,腾讯云智算平台目前可提供16 EFLOPS的浮点算力,处于行业领先位置。同为大厂的阿里巴巴和中国电信,目前的算力规模分别为15 EFLOPS和14 EFLOPS。
腾讯、华为、阿里也先后设立了专为智能驾驶服务的云专区,足以证明云厂商对智驾行业的重视。
特斯拉Cortex超算集群,图源Electrek
就以上来看,车企和自动驾驶企业们对于数据和算力的升级,一直在持续着。但与此同时,行业中越来越多人认为,仅做到这些想要在未来的智驾行业中取得优势,还远远不够。
主要是因为全球汽车工业正经历着时代的变迁。
2010年之前,被视为"硬件构建汽车"的时代,随着2016年特斯拉开启了"硬件预埋+软件付费"的商业模式,向它的用户们卖起软件服务。在英伟达创始人兼CEO黄仁勋等大佬看来,彼时汽车工业正式进入"软件定义汽车"的时代。
再到这两年,随着以大算力、大数据、大模型为主要代表的人工智能又开始和汽车融合,在中国电动汽车百人会副理事长兼秘书长张永伟看来,以人工智能为驱动的智能汽车时代已经到来。
对此,Caresoft Global合伙人杨继峰曾在一次公开演讲中提到:"从整车角度上,车端架构和云端架构进一步统一后,接下来的竞争是数据挖掘、数据的有效利用以及整个技术栈对数据的理解,以及如何在大规模的基础设施上平衡整个计算效率。"
换句话说,就是需要获得高质量、大规模的数据,再配合高算力,来训练和迭代算法能力,建立"冰山之下"车端和云端之间的数据闭环能力,来让这"三大件"的能力更有效率和更低成本的运转起来。
3、车云一体数据闭环能力,如何为智驾行业"减负增效"?
车云一体数据闭环能力,本质上是要让数据在车端和云端之间"流动"起来。
简言之,就是建立一个横跨车端和云端的体系化闭环,车端收集的数据上传到云端,在云端集中和快速的对这些数据进行标注处理和用于算法的训练。
完成这些后,云端再把训练好的算法模型数据发回车端,进行OTA部署及更新,如此车端和云端进行协同互补,推动完成了智驾技术的迭代与进化。
在这样的行业需求下,以腾讯为代表的科技大厂们,已经开始为智驾行业"减负"和"增效"。
就拿获取高质量数据这一环节为例。目前在端到端算法和BEV真值训练上,车企们对于高质量数据的需求越来越高,实际上相当于做4D标注了,非常耗时耗钱。
对此,腾讯基于原始的采集数据,通过预处理加工过程,形成资料类的数据产品,可以直接用来做真值训练。对于车企们来说,直接采购这些数据,相比从0开始采集加工数据,可以大幅提升他们的智驾研发效率和降低成本。
要获得高质量数据,数据挖掘也是不可忽视的环节。基于腾讯云向量数据库的检索式数据挖掘能力,最高支持千亿级向量规模和500万QPS(每秒查询率)峰值能力。车企们就可以用图片、文字信息进行精确检索,从而在海量的数据中快速地把所需数据搜索出来。
好比现在车企要从1000亿张图片数据中寻找一张卡车运输共享单车的图片,腾讯云向量数据库最高可以并发支持500万个类似请求进行搜索,就能秒级找到这条记录,从而利用其训练算法。
谈到智驾,地图数据也是至关重要的资源。但对于高精地图来说,鲜度低、成本高一直都是行业有目共睹的短板,由此才让许多车企喊出了要用"轻地图"或者"无图"来实现高阶智驾的口号。
但在腾讯智慧出行副总裁刘澍泉看来,即便是目前车企们都在卷的"车位到车位"智驾功能,从本质上看依然是从A点到B点的行驶过程,因此还是需要地图数据的支持,就比如复杂路口识别和不规则掉头等场景。
对此,腾讯也提出了他们的解决方案——通过融合标准地图(SD Map)、辅助驾驶地图(ADAS Map)、高精地图(HD Map) 等不同精度等级的地图数据,打造出了智驾云图、轻高精地图等产品形式。
其中,智驾云图的特点就是将地图数据全面云化,更新更快、更灵活。由此可以实现最快分钟级、结合车端感知、交通信息和环境信息进行在线更新,再从云端向车端实时下放数据。
这就是说,当车企的端到端智驾跑到一个不熟悉的路段和场景时,也能基于动图的动态数据做出更优的决策。
腾讯车云一体数据闭环
另外,针对车企想要在智驾算法和功能上打造差异性的需求,腾讯不是交给车企一份离线的地图,而是做成一种常态化的数据服务。
当车企有不同需求时,就能在合规的前提下进行定制地图数据,加速算法的训练。这样既降低了车企们定制的成本,同时也避免了云图数据与车企们适配的难度。
最后,随着智能汽车行业的发展,数据安全一直都是车企们头上悬着的"达摩克利斯之剑"。
面对这一行业难题,腾讯专为智驾行业开设了华东、华北两地的自动驾驶云专区,这个云专区的全栈数据与公有云物理上隔离,但是保持了和公有云同源、同架构,并且专门针对自动驾驶相关数据安全要求,开发了一个端到端和全程合规的数据训练闭环服务。
翻译一下,就能帮助车企和自动驾驶企业在数据处理、筛选、标准乃至之后的训练与储存上提供自动化的合规的保护,从而大幅提升这些企业的算法研发效率。
基于腾讯在车云一体数据闭环能力上的长期布局,目前获得了行业的广泛欢迎。目前腾讯已与蔚来、奔驰、长安、博世等100家车企与出行科技公司展开合作。
在飞说智行看来,智能驾驶行业除了在算法功能和体验上比拼之外,还要打好"冰山之下"的基础设施能力,才能真正推动智驾"爱用"时代的到来,同时也能助力我国在全球智能驾驶竞逐赛中获得更大的胜算。