看到一个很有意思的猜想“2050年,AI被广泛应用在人们的生活中;2100年,AI已经可以模仿人的思维,看起来和真人无疑;2900年,人工智脑诞生,AI拥有自主意识,人类控制地球所有资源,反重力交通工具诞生,人类进入一级文明;4000年,人类在人工智脑的帮助下掌握太阳系资源,进入二级文明;5000年,由于人类寿命有限,迟迟无法突破太阳系,探索银河系,人工智脑融合所有人类意识,超脑诞生,并在之后的岁月创造了人工虫洞,向银河系进发……”

打开网易新闻 查看更多图片

天马行空,但又并非不可能,毕竟AI已经成为年度最热风口,涌现出了OpenAI、谷歌Gemini、百度文心一言、阿里通义千问等AI大模型,有了资本的青睐,想不发展都难!这与车有什么关系呢?太有关系了,越来越多的AI大模型开始装车,新时代即将到来。

什么是AI大模型?

AI大模型是指使用深度学习技术构建的规模庞大的神经网络模型,这些模型具有数以亿计的参数,能够对大量的数据进行训练,从而在各种任务和领域中展现出强大的语言理解、生成和推理能力。

打开网易新闻 查看更多图片

这些大模型通常基于Transformer架构,该架构使用自注意力机制(self-attention)来处理序列数据,例如文本或语音。自注意力机制使模型能够在处理输入序列时关注序列中的不同部分,并建立上下文之间的关联。

1.BERT,这是一种基于Transformer的双向编码表示模型;2. GPT,这是一种基于Transformer的生成式预训练模型;3. T5,这是一种基于Transformer的文本到文本转换模型。

构建和训练这些大模型需要大量的计算资源和数据,因此通常由大型研究机构或公司进行开发和维护。

“计算、数据”,你知道为什么AI大模型都往车上“挤”了吧!一是汽车的算力强,量产车最高都超过1000TOPS了;二是传感器多,能够接收各种各样的数据,一辆车的传感器要几百个,一部手机才20多个。

汽车是在不断行进当中,道路变量、两侧建筑物变量、行人变量甚至是天气变量都会产生大量的数据,而AI大模型就是不断接收数据,进行“计算”,才有可能越来越聪明。

看到这里,一些聪明的小伙伴已然发现,AI大模型目前可以用在两个方向,一是辅助驾驶,目标是实现无人驾驶;二是智能座舱,目标是无障碍交流。

这里我们不讨论AI大模型是怎么运行?神经网络具体的神经节点是什么,有哪些作用?这些太过复杂,我们普通消费者不好理解,本文只讲它搭载在车上能够带来哪些变化?

有哪些车搭载了?

打开网易新闻 查看更多图片

有哪些车搭载了AI大模型呢?最引人关注的当然是理想了,最近OTA 5.0正式引入了AI的概念,具体表现在智驾以及智能座舱上。

理想AD 智能驾驶算法从原先的多个小模型和人工规则为主的模块化算法架构,提升为以大模型为主的端到端算法架构。

AD Pro 3.0 整合了 BEV 大模型、MPC 模型预测控制以及时空联合规划等重要能力;AD Max 3.0 则在此基础上更进一步,新增了 Occupancy 占用网络算法。

BEV大模型可以通过多个摄像头捕捉到图像来生成车辆周围的环境信息,然后将这些信息转换为平面图,以便自动驾驶系统进行处理和分析。

MPC的主要优点是可以优化当前时隙,同时考虑到未来的时隙(预测未来发生的事件)。

Occupancy占用网络算法是一种基于深度学习的三维重建和场景理解方法,具有很强的表示学习能力和泛化能力。

这些东西组合起来之后,就是一个可以“自己分析,并做出决策的系统”。理想L系车型(Max版)能够自如处理,复杂匝道自主进出、拥堵路段自主变道、自主通过城区人车混行路段等复杂场景。

听到这里是不是觉得莫名的熟悉,毕竟华为、小鹏等等企业早就能实现相关的功能,技术原理也差不多,也就是说早已有很多车企用上了AI大模型。

打开网易新闻 查看更多图片

只不过由于没有肉眼可观的载体(比如屏幕),让用户去感知,所以AI的概念并不明显。于是乎,聊天机器人登场了,当然这是最显浅的解释,专业名词还是XXGPT。

理想搭载的是自研的Mind GPT模态认知大模型,根据官方的说法,理想内部团队重新构建了 Mind GPT 原始基座模型,赋予了 Mind GPT“理解、生成、感知、记忆以及推理”等多种能力。

Mind GPT 能够准确识别出快速、复杂的功能指令,并对应创建出匹配车主需求的“快捷指令”;Mind GPT还能作诗、作词,甚至生成绘画;OTA 5.0之后,理想车机还带上了浏览器功能,用户的娱乐途径更丰富。

从目前的功能来看,理想的Mind GPT和其他GPT相比并没太大的差别。不过,还记得前面提到的“构建和训练这些大模型需要大量的计算资源和数据”吗?与微软、谷歌这些巨头,甚至是与百度、阿里相比,理想的资源或许还有一些弱。

省时省力的方法是直接接入某个大模型,比如奔驰主要是通过与微软合作,使用Azure OpenAI 服务将 ChatGPT 集成到车机中,借助Azure OpenAI Service 中的 ChatGPT 预览版,开发人员能够将定制化 AI 体验直接集成至自己的应用程序当中。

值得一提的是,奔驰这项服务是收费的,采用月度订阅的方式。

除此之外,马斯克AI公司 xAI 研发的第一款大模型产品Grok AI也正式发布,除了与社交平台(原 Twitter)进行联动以外,马斯克还保留了Grok AI上车特斯拉的可能性。

国内的车型,除了理想之外,星纪元ES搭载了科大讯飞的星火大模型;极越01将搭载百度的文心一言;智界S7搭载了华为盘古大模型;智己LS6将搭载阿里的通义千问……

可以预见的是,AI大模型将会是新的“亮点”配置,会有越来越多车型搭载,随着技术的发展,将有可能引发行业革命。

存在的局限

还记得开头的猜想吗?AI是随着时间的推移而逐步完善的,现在装车的AI也仅仅是初级阶段,很多功能或许并不能让我们满意。

还是借用理想的例子,语音控制比之前更加好用了,但还是有一些语音指令是它识别不了的,说白了目前的AI还处于模仿人类的阶段,甚至模仿得还有点拙劣。

所以现阶段,AI还是需要大量的数据进行训练,才最终达到“类人”,甚至超越人类的思维,至于这个时间多久,谁也不知道。

目前AI大模型还存在着一些问题:计算资源有限,部分车企自研的底层可能很快遇到瓶颈;

在智驾层面,数据的获取和标注可能是一个难题,尤其是对于一些罕见场景和复杂情况的数据;

隐私层面,车载环境对安全和隐私保护的要求非常高,因此需要建立完善的安全和隐私保护机制,对模型数据和用户隐私进行充分的保护。

尽管AI大模型尚未完善,但是它在智驾、人机交互等方面确实带来了更好的体验,我相信随着训练的深入,汽车越来越聪明并不是虚妄,让我们一起期待AI引领汽车变革!