芯事情报局消息,小鹏汽车已正式启动下一代智驾芯片的研发工作,预计新一代芯片的算力将突破2000 TOPS。
英伟达索尔缩水,吹出2000落地仅700坑了队友
虽然小鹏在这一代车企自研芯片中第一批落地,但其当前的技术路径在很大程度上受到了对标产品——英伟达Thor芯片表现不及预期的影响。
Thor在初期规划时曾宣称算力高达2000 TOPS,但实际落地时缩水严重。目前单芯片算力仅为700 TOPS,且为稀疏算力;若折算为稠密算力,实际数值仅有350 TOPS。
此外,标称1000 TOPS的高配版本由于存在热功耗处理难题,车端布置复杂,导致目前主流车企只能采用700 TOPS的降频版。这种高开低走的局面,限制了基于此标准研发的国产自研芯片的性能。
现有芯片带不动了,大模型上车卡在喉咙口
除了基础算力的落差,现有的硬件架构在大模型运行效率上也显得捉襟见肘。以理想汽车为例,其在车端部署了一个8×0.4B的模型,即便量化到FP4精度,也仅能勉强实现10Hz的运行速度。这意味着系统延迟至少达到100毫秒,且每次仅能输出7个token。也就是说,当前700 TOPS级别的算力已无法满足下一代2B(20亿)参数以上端到端大模型在车端的流畅部署。
小鹏当前的图灵芯片设计在内存带宽方面也略显保守。其采用的256bit LPDDR5X内存控制器,理论最高内存带宽仅为273GB/s。作为对比,特斯拉HW4.0的内存带宽已达到448GB/s,两者在数据吞吐能力上存在客观差距。
小鹏不再“挤牙膏”,率先打响算力核战
面对日益严峻的算力与带宽瓶颈,作为最早启动下一代芯片研发的车企之一,小鹏将新一代芯片的算力目标锁定在超过2000 TOPS,这一规划对标特斯拉尚未发布的AI5芯片。
业界预计,小鹏的下一代芯片不仅将在算力上实现大幅提升,还将大幅优化内存带宽设计,以解决当前大模型上车面临的数据传输与计算效率难题,为未来更高级别的自动驾驶功能预留充足的硬件冗余。

