“认识你自己,凡事勿过度。”这是3000年前被镌刻在古希腊德尔斐神庙阿波罗神殿门前的三句箴言中的前两条。
这两句古老的箴言,对于当下百年未有之大变局的汽车行业也是如此。虽然自动驾驶、大模型、车路云一体化等新技术和新商业模式层出不穷,为汽车行业打开了更大想象空间。但每项技术都有局限,我们要认清技术的边界,在“能”和“不能”之间找到最优解。
迎来“AI定义汽车”拐点
在外观、三电、智能座舱领域竞逐多年后,深度智能化是众多汽车企业锚定的下一个目标。
1925年,一辆遥控汽车在纽约展出,让人们看到了即将到来的无人驾驶汽车。据《纽约时报》报道,这辆被命名为“美国奇迹”的车,在数千名围观者注视下于百老汇大街上巡游,然而它先是在第六十二街失控,又在哥伦布环岛失控,最后这辆想要成为“奇迹”的汽车撞上了另一辆车。
100年后,2024年的北京车展,以大模型为代表的AI技术为汽车深度智能化打开了关键突破口,其发展速度远超业界预估。按照行业原本预计,大模型的规模化上车或有两年左右的缓冲期,而北京车展开幕前后,车企已经迫不及待地将大模型量产上车,这表明当下的汽车行业,正从“软件定义汽车”急速迈向“AI定义汽车”的新拐点。
作为单车智能的代表性技术,自马斯克首秀基于端到端的FSD以来,无论是车企还是自动驾驶技术公司对端到端的自动驾驶解决方案表现出了极大热情,英伟达CEO黄仁勋将其称之为“自动驾驶革命性的进步”。
去年4月,华为常务董事、终端BG CEO、智能汽车解决方案BU CEO余承东曾表示,今天的智能电动汽车跟10多年前的智能手机时代惊人相似,我们正走向智能电动网联汽车时代,2025年或将出现分水岭,有可能形成大的逆转,相当于手机行业2013年的大逆转。
最艰难的1%长尾问题
至于端到端神经网络模型能否成为那道分水岭尚不得而知,但可以肯定的是,任何技术都无法做到万无一失,我们要做的是最大化降低技术应用过程中的潜在风险,确保技术的可用性、可靠性和稳定性。
自动驾驶最重要的是保证安全性,即使技术上可以解决99%的道路场景问题,都不能实现真正的无人,剩下的那1%才是难点所在,也就是所谓的“长尾问题”。
这一问题的难点在于,技术很难穷尽所有可能发生的场景和案例,我们很难定义问题的全集是什么。如果连问题都定义不全的时候,就无法有效提出解决方案,更不能有效预估完成它的效果和成本。
从技术角度看,目前国内自动驾驶系统基本都是采用传统分治法,将自动驾驶任务切分为感知、预测、规划三个独立的模型,再进行系统集成来完成整个自动驾驶任务。
分治法的优点在于将复杂的自动驾驶任务拆解为大量相对简单的子任务,大幅度降低了系统开发难度。这样构成的系统具备很好的可解释性,可以针对每个模块的输入输出进行白盒分析,一旦发生事故,可以深入分析,找到具体的问题点。
但是弊端在于需要编写的代码量巨大,系统设计时引入了太多的人为先验经验,导致自动驾驶能力上限比较低,系统的泛化性比较差,对于没有见过的场景往往无法处理。
在学术界,端到端并不是一个新鲜的概念,已经有诸多相关论文和研究。但是直到去年,在带高阶辅助驾驶功能的量产车大规模落地后,有了海量数据和海量算力加持,这才取得了突破性进展。
端到端模型将感知、预测、规划三个模型融为一体,无需冗长的代码来制定规则,而是通过用海量数据去训练系统,让机器拥有自主学习、思考和分析的能力,能更好地处理复杂的驾驶任务。
由于任务更少、避免了大量重复处理,端到端自动驾驶可以提高计算效率,并且可以通过不断扩展数据来提升系统的能力上限。
至于弊端,端到端的“缺乏可解释性”是客观存在的缺点。就像人类解释不清楚宇宙从何而来、到底有多大,我们也无法准确解释大模型做出一个行为的动机,这就给未来问题分析、算法调优等工作带来难度,人们不知道应该从哪个方向加以优化改进。
其次,“需要海量的高质量数据”也是一个较高的门槛。曾就职于OpenAI的计算机科学家Andrej Karpathy在一次访谈中表示,特斯拉自动驾驶部门将3/4的精力用在采集、清洗、分类、标注高质量的数据上面,只有1/4的工作用于算法探索和模型创建,这种精力分配,足以说明数据在特斯拉自动驾驶技术栈中的地位。尤其是端到端这种完全数据驱动的大模型,数据的规模和质量比参数量更能决定模型本身的表现。
就目前特斯拉自动驾驶表现而言,行业并没有从实践上证明端到端100%确定是一个值得追随的技术路线。
正如前文提到的,端到端的可解释性差,其所需的数据规模、算力规模也远远超出国内企业的承受能力,因此笃定端到端路线会超过分模块方案还为时尚早。
此外,法律和道德是一个绕不过去的挑战。在许多情况下,自动驾驶汽车的决策可能会与现有的交通规则和道德规范相冲突。例如,当遇到紧急情况时,自动驾驶汽车可能需要做出决策,比如选择撞到行人还是撞到其他车辆,这种决策在法律和道德上都是非常敏感的。由于自动驾驶技术涉及到许多法律责任和义务,比如数据的隐私和使用、车辆的责任和保险等等,这些问题都需要制定全新的法律和政策来解决。
自动驾驶的“隐形翅膀”
在道路基础设施无法满足自动驾驶需求的前提下,单车智能无疑是实现自动驾驶的最佳方案,谷歌旗下的Waymo、坚持纯视觉流的特斯拉,以及国内绝大多数自动驾驶企业,都是这一模式的拥趸者。
但这对一个企业的科技实力提出了很高要求。客观地说,中国在单车智能技术方面与美国之间存在一定差距。对于中国任何一个车企和自动驾驶技术公司而言,有谁敢说自己的自动驾驶方案会比特斯拉FSD还要好呢?
与其苦苦相争,不如另辟蹊径。相比海外基础设施建设和升级步伐缓慢,中国作为“基建狂魔”可以发挥在基础设施领域的优势实现变道,而“车路云一体化”就是其中最大的机会,也是最适合中国国情的路径。
从模式上看,车路云一体化跳出了单车智能的局限,用“半个司机在车上,半个司机在路上”的融合方式,将目光投向更广阔的路端和云端。借助路侧多传感器的超视距感知、路侧边缘计算与云端中央计算相结合的完备算力体系,实现对车、路、云的全域数据协同与智能调度,为自动驾驶的可靠性和安全性增添了一份保障。
在大模型训练方面,车路云一体化架构为自动驾驶技术开辟了新的路径。与传统依赖车辆单独采集数据的方式相比,车路云一体化系统能够收集到更庞大的数据量与更丰富的数据类型,不仅大幅拓宽了训练数据的广度与深度,还显著加速了自动驾驶模型的学习效率与精确度,为实现更高水平的自动驾驶奠定坚实基础。
通过车路云一体化,自动驾驶车辆的传感器不再是唯一的眼睛,通过遮蔽或关闭这些传感器,车辆完全可以依赖路侧基站构建的实时数字孪生系统,将实时路况和环境数据源源不断地传输给车辆,指引其顺利完成自动驾驶任务。从这个角度看,车路云一体化就像一双“隐形的翅膀”,守护着自动驾驶汽车行驶的必经之路。
不过,车路云一体化的规模化落地并非易事,这是一项跨部门、跨专业、跨行业,集技术、产业、政策法规、工程建设、商业运营等要素于一体的“系统性工程”,需要结合国情,从顶层设计到落地实施开展统筹谋划,既要探索单车智能与车路云一体化融合的自动驾驶技术方案,也要谋划科学合理、成本可控的车路通信设施建设方案。
根据公安部最新数据,2023年底中国公路总里程达544.1万公里,其中高速公路18.4万公里,位居世界第一。截至目前,我国已有超过3500公里公路完成智能化升级改造。相比全国庞大的公路里程基数,公路智能化升级改造空间巨大。
在车路云一体化推进过程中,政府成为主要推动者。最近,北京市公共资源交易服务平台正式发布《北京市车路云一体化新型基础设施建设项目(初步设计、施工图设计)招标公告》。根据招标公告,该项目投资规模达99.39亿元,共选取2324平方公里范围约6050个道路路口开展建设,以及除上述道路路口外本项目双智专网网络中心的建设和改造。
之后,6月3日,福州智能网联车路云一体化启动区示范建设审批类项目公示,成为继北京之后第二座在车路云协同方面有大动作的城市。6月4日,鄂尔多斯市新能源智能网联汽车“车路云一体化”应用示范项目已成功获得备案。此外,长春、杭州等多地也已积极申报智能网联汽车“车路云一体化”应用试点。
无独有偶,美国参议院于5月提出AI政策路线图,建议每年至少拨款320亿美元,用于推动跨政府部门的AI研发、支持基础科学研究,并对AI在先进制造、智慧城市和交通系统、合成化学及生物等广泛领域的应用提供支持。
可见,一场围绕AI而展开的大国博弈已进入关键时刻,智慧城市、智慧交通、智能网联汽车作为AI应用的重要领域,不仅重塑人们未来的生活方式,更成为国家竞争力的重要体现。
据中金公司预测,2020年至2025年将成为中国向高阶自动驾驶跨越的关键时期,到2030年前后,有望实现城郊及城市道路的高度自动驾驶,2035年后有望实现完全自动驾驶。
事物的发展总是波浪式前进,螺旋式上升的,自动驾驶概莫能外。未来,以大模型为代表的生成式AI和车路云一体化将为自动驾驶打开更大想象空间,承载着人们对美好生活的向往奔向远方。