打开网易新闻 查看更多图片

2024年12月20日,由科技出行产业智库与创新服务平台亿欧汽车主办的GTM2024第七届科技出行大会暨科技出行产业创新榜发布会在上海漕河泾万丽酒店正式举办。

本次活动主题为“开启AIEV元年”,由亿欧汽车倾力打造,意在产业创新的坐标系中,积极推动以AI数字智能为代表的新质生产力与汽⻋工业与出行产业加速融合,促进深度融合人工智能技术的新一代AI出行终端AI EV加速到来。

亿欧汽车基于对智能电动汽车与科技出行产业的长期洞察与研判,此次大会将围绕AI与EV两大产业生态,聚焦具身智能、大模型、端到端自动驾驶、固态电池、车规级芯片、新能源商用车、超级补能、车路云一体化等细分话题,并携手汽车出行产业上下游代表企业、机构、跨界科技公司等共话行业发展图景,见证即将到来的AI应用的群星闪耀时刻。

在本届大会上,小鹏汽车自动驾驶中心产品高级总监袁婷婷发表了题为《胆大心细,端到端重塑智能驾驶》的主题演讲,在小鹏汽车自动驾驶中心产品高级总监袁婷婷看来,端到端不是自动驾驶的结束,而是比赛的开始。只有强化云端强化训练,车端大模型的能力上限才能大幅提高,这也将带领智能驾驶走向L4终局。

打开网易新闻 查看更多图片

以下为分享实录,供行业人士参考:

大家好,非常高兴在这样的一个岁末时光来跟大家在一起聊聊汽车,聊聊新的一年和过去一年。我相信在过去这一年所有做新能源汽车和自动驾驶的同学们都觉得非常的兴奋,因为一方面我们看到了中国新能源汽车特别强的势能,无论是国内卷出新高度,还是出海卷出新高度。

另外一个就是小鹏汽车的智驾,从2024年初到2024年末,这一年时间里面发生了一个跨越式的进步,而这一步非常重要,这一步就是端到端。所以今天非常高兴借亿欧汽车这个场合,跟大家分享一下小鹏汽车如何通过端到端重塑自动驾驶。

第一个关键词就是胆大心细,胆大就是该抢的抢,心细就是该让的让。

小鹏P7+在北京、上海、深圳、广州这几个我们用户密集的区域,智能驾驶都做得非常好,在更多的陌生场景,我们的智驾也表现的相当出色。

通过视频可以看到,不论是在隧道的大光差场景下,县城、乡村的窄路场景中,还是浏阳河九道湾这种当地著名的弯道,不论是白天还是夜间,小鹏的智能驾驶都能顺利通过。

而且大家可能注意到了,我们在避让前车过程的中,如果大家看SR的话,发现小鹏的车从来没有把速度降到0。因为在人驾驶的时候也不会把速度停到0,所以我们会踩一脚刹车缓缓降速,然后再起速。

在刚才穿过的九道弯里面可以看到,在村里面过一个非常窄的路,如果对向来车或是三车会合的时候我们怎么样做的情况。这里非常有意思的点是,我们也是第一次来到浏阳河,一到就开,而且刚好那天晚上是浏阳河的烟花大会。

在刚才的视频中,大家看到了胆大心细,就是从我们的视频里面看到,胆大体现在,哪怕非常窄的路,小鹏汽车的智能驾驶都表现得非常自信和果断。心细就是面向有行人、小狗和三车交互的时候有让人安心感避让动作。

P7+对小鹏来说非常特别,它是首款去掉激光雷达的车。大家很好奇,去掉激光雷达的车跟有激光雷达的车可以达到一样的效果吗?结果是所有用户体验和我们自己的实测来看,我们P7+和我们MAX版本是达到同样的效果的。

今年也是小鹏汽车的十周年,小鹏汽车的十年也是中国智驾的十年。在我们刚开始做这件事情的时候,我们的智能驾驶这四个字在用户购车因素中能排在TOP10已经很不错了。而十年后的今天我们发现,用户买车调研的首选择要素已经变成智能驾驶。我们想过这一天会来临,但是没有想到这一天来的这么快,而且中国的用户购车的心智也发生了重要的质变。

打开网易新闻 查看更多图片

小鹏汽车现在已经能够做到在内地的所有城市,无论是大城市,还是小县城或农村的小路上都能够开。

我们涉及到了环岛、掉头、窄路等等环境,我们希望能够做到只要有路就能开,只要能开就能好开的智驾产品。当然,下一步就是全球化。所以,未来我们希望小鹏汽车的产品全球都能开,全球都好开。

在2021年7月的小鹏汽车微博上曾经发过一个用VPA(记忆泊车)拼接城市辅助驾驶的车位到车位解决方案,当时我们发了从小鹏汽车的公司总部出发,到广州的四季酒店的车位到车位视频。三年前,小鹏汽车已经做到了车位到车位。那它和今天要量产推给用户的车位到车位有什么区别呢?

大家从这个视频里面可以看到,首先,我们在道路上的能力实现了飞速的提升。我们在今年年初的那套软件和现在的这套软件不是线形的进步,而是跨越式的进步。

第二个部分就是我们用一套软件重写了整个车位到车位。原来我们看到的VPA+城市辅助驾驶+VPA的方式就是行业主流的方式,它不得不面临三段式的拼凑和中间的断点问题,主要体现就是园区内泊车的逻辑、路上行车的逻辑,然后后面又是泊车的逻辑,当相互之间切换的时候,比如出闸机的时候,会非常的不顺畅不舒服。

但是我们怎么做的呢?我们基于端到端的大模型重写和实现了车位到车位。

第二个就是我们轻雷达的方案,把激光雷达去掉以后用更强的视觉能力来实现。

第三个就是通勤路线是无感生成的,也就是说,在通勤路线上,我们不需要走一段走路、按以下保存,更不需要在单独保存某个路段。这种操作比较复杂,给用户的体验也不好。

端到端方案让我们实现A车位到B车位一套软件打通地库、闸机、园区内部路和城市道路。

接下来聊一聊端到端,刚才主持人介绍的时候也有聊到端到端,这是今年一个非常火的词语。大家都经常来问到一个问题说什么是端到端?甚至有用户网上说,端到端是不是就从A端到B端,只要A点到B点是不是就是端到端?显然不是。

端到端是一个技术用语,指我们从规则时代走向AI时代能够过程中极致的减少信息的损耗,能够极致的模仿人类行为的基础架构。

小鹏汽车大家可以看到,我们做了非常多的第一次:

2020年,我们推出了业内首个融合视觉感知的自动泊车,我们第一次把豪华的科技配置——自动泊车打入到15万区;

2022年,我们首个落地了城市内到智能导航辅助驾驶,开启了城区高阶智驾进程;

2023年,我们发布了BEV+Transformer架构,音符了大模型感知;紧接着上线无高清地图到XNGP能力,不断迭代,直到现在“全多都好开、全国都好用”的XNGP版本。这里面我们走过非常多的弯路,交过很多的额外的学费,踏过很多坑。直到今年5月,我们真正意义上的量产上车了端到端大模型。

大家可以看到,传统的规则时代是怎么做的,传统规则时代是先从激光雷达到摄像头,收集非常多的数据,先做融合,然后做预测规划,然后到下一步的控制。每一阶段都有很大的信息损耗。因为只要有人类行为的介入就有漏斗,有漏斗就有信息损耗。

人类大脑里面并没有一个叫做感知、规划、预测和控制的体系,我们大脑就这么一个,就在头上,它其实本质上就是我看到什么,我手和脚就直接有动作了。所以我们现在三网合一就是我们端到端,把我们XNet、XBrian XPlanner融合在一起。

我相信不仅仅我们自己走的很好,这个行业正在发生翻天覆地的变化,因为没有人能打败趋势。这个趋势是1990年的计算机网络、2000年的互联网,2010年的移动互联网,2014新能源、云服务以及今天的AI大模型。

大家看到很多GPT大模型的突破,同时对于新能源汽车行业来讲,AI大模型也会给这个行业带来翻天覆地的变化。小鹏汽车一直以智驾为核心对于AI做非常巨大的重点投入。

小鹏汽车的端到端的四部曲。首先,实现轻地图全国都好开,哪怕在浏阳,在任何一个中国城市,哪怕西藏、拉萨任何地方都可以开小鹏的智驾。

其次,在轻地图的基础上实现车位到车位,我们也是首个在中国实现无图情况下、去激光雷达的纯视觉智驾。

第一种做法就是在部分模块,比如感知模块或是规划模块里面把AI介入进去,这是很常见的做法;第二种快速实现车端的端到端,这也是很常见的做法,因为车端的小模型更容易快速见效。第三种,就是小鹏所选择的云端大模型蒸馏到车端模型的方式,也是更长期主义更高上限的选择。

但是我们认为,端到端不是一个结束,只是一个开始,真正的竞赛在云端。云端你就会有算力的竞争,也要看你能够喂给大模型多少数据使这个大模型运转出来。所以我们2025年有10ELOPS的云端算力,现在已经达到了2000万Clips的训练量。现在我们已经率先达到了更加超量级超规模级的数据规模。

我们判断真正竞争是在云端大模型这一块。我们会在云端训一个相当于车端参数量80倍的模型,通过云端蒸馏的方式给车端。

车端模型它就像一个小学生,跟着课本学习也可以考很好的成绩。云端模型则像一个老师,一个拿着诺贝尔奖的非常优秀的老师,而且能够获得全世界最好最先进的知识。在这样一个非常优秀的老师的指导下,这个小学生当然比自己学习学得更快更好。这就是我刚才提的我们希望能够不断提升上限,这个上限一定在云端,在云端会有更大的算力,在云端有更大的网络模型,在云端也会有更强的竞争。所以我们会不断的提升我们的上限,在云端进行强化训练。

这是我们的云端数据飞轮,大家看到,通过纯视觉的方案使有效视觉感知信息量提升了8倍,我们对这个环境的理解和预测能力大幅度提升。而现在端到端版本是两天迭代一次,所以我们版本的演进速度非常快。体验上用户给我们很好的体验,相邻OTA版本的用户里程渗透率达到28%。

这一切进步刚刚起步,我们非常惊喜的看到这个进步的趋势。在过去的十年的起起伏伏里,做自动驾驶的人都怀疑过,在有生之年会不会看不到自动驾驶实现的那一天。然而,今天在端到端的带领下,云端的强烈竞争下,我们看到了这一天必将实现。所以在过去十您是中国新能源汽车的十年,在未来的十年,是中国智能化的十年,期待未来的十年里面跟在座的各位一起携手,把中国智能化十年做好,也让中国的智能化推向全球。谢谢大家。