近日,腾讯新闻科技主笔张小珺与理想汽车CEO李想有一场对话。
在3个小时的对谈中,二人探讨了理想汽车在人工智能领域的战略布局和未来愿景。李想分享了他对人工智能技术与产品观的深刻见解,以及理想汽车如何从一家新能源电动车企业转型为全球领先的人工智能企业。
在这次独家访谈中,李想不仅讨论了理想汽车的技术创新,还涉及了智能驾驶的发展、市场竞争策略,以及对个人助手市场的展望。他预测,随着人工智能技术的不断进步,汽车将从交通工具进化为空间机器人,而理想汽车将在这个过程中扮演关键角色。
这段对话为我们揭开了理想汽车在智能化浪潮中的雄心与挑战,以及李想对人工智能时代操作系统和编程语言的深刻理解。文章很长,但值得一读。以下,Enjoy:
主笔作者 | 张小珺
编辑 | 石丁
出品 | 腾讯新闻《潜望》
2024年12月,我与理想汽车CEO李想有一场对话。此时,他们决定车机助手理想同学推出手机版App,并于此前做了基座大模型,两者相加约等于Kimi。
这意味着,人们认知中的新能源电动车企业,宣告要进入与字节豆包、月之暗面Kimi、腾讯元宝、百度文心一言等个人助手之战。这场原本已然红海的“基座大模型+个人超级助手”商战,竞争烈度更大了。
很多人脑海中,个人超级助手与智能驾驶是截然不同的两件事——产品不同,底层架构无法打通。李想不这么认为。在他看来,OpenAI定义的第三阶段(智能体)与自动驾驶定义的第四阶段(自动驾驶)会在相近时间点交汇,并合并到统一架构上。
各异的企业将汇入同一片赛场,因为“基座模型是人工智能时代的操作系统+编程语言”,“基座模型所构建出的人工智能超级产品,会是新一代入口——它会在所有设备之上,在所有服务之上”;如今这些企业都在争夺“AGI L3和自动驾驶L4的门票”,这会是双边的iPhone 4时刻。
全球看,对于人工智能的探讨正从技术认知转向产品构想。对话中,这位非技术背景、被认为在产品上有天赋的创始人,复原了这两年他关于人工智能完整的技术与产品观。同时,他也首度谈了谈MEGA失利、苹果放弃造车、雷军造车成功、理想会做机器人吗、怎么管理00后等各种话题。
文章比较长,大家可以参考目录:
● 第一节:谈人工智能
1. 我绝对不止做一棵树了
2. 大家再不承认,我也不知道怎么形容了
3. 基座模型是操作系统+编程语言
4. L4就是智能体
5. 终极产品想象是硅基家人
6. 人工智能表达的是能力,不是功能
7. 李想有理想吗?
● 第二节:谈智能驾驶
1. 三年我们能推出把方向盘摘掉的产品
2. 我们相比特斯拉又不缺胳膊少腿
3. L4实现,买车的人会更多
4. 我们100%会做机器人,但不是现在
● 第三节:谈汽车之战
1. 复盘MEGA失利
2. 今天做的所有事是为了拿L4门票
3. 对雷军说,小米车要想成功,你必须all in
4. 2030年,我们有概率做一辆超级跑车
5. 我从来没有司机
● 第四节:消失的李想
1. 典型的李想的一天
2. AI是知识、认知和能力平权
3. 我人生最大改变是,对自己好
4. 从对事不对人,到先对人再做事
5. 只要所有的中国企业不放弃
以下是与李想的对话(为方便阅读,作者做了一些文本优化)。
第一节
谈人工智能
01
我绝对不止做一棵树了
张小珺:别人都在做纯电,你在做增程;现在很多人开始转增程,你怎么又不想造车、要去做人工智能企业了?
李想:造车肯定是要造的,但是呢,大家经常讲:电动化是上半场,智能化是下半场。我认为智能化讲的不是传统软件智能,而是真正的人工智能。这是造车往下延续的必经之路。汽车将从工业时代的交通工具,进化成为人工智能时代的空间机器人。
张小珺:我看了一下你第一次对内说,“2030年要做一个全球领先的人工智能企业”,是在2023年1月,此时ChatGPT刚好诞生两个月。你这是跟风吗?
李想:不是跟风。
我们每年春季战略发布起源于上一年9月份,在北京雁栖湖开的每年一度内部战略会。2022年9月,我们已经确定,要把人工智能包含自动驾驶作为真正重要的方向,这是未来竞争关键。
2023年初发布战略时,我们做了根本性变化,把人工智能从隐藏战略变成开放的阳谋战略。这样,才能吸引足够多人才。OpenAI发挥了非常大作用,把一个全新的人工智能时代打开了。所以,我们对人工智能内心所有的想法、所有的期盼,不用再藏着了,应该拿出来正面讲。
张小珺:你对AI感兴趣可以追溯到什么时候?
李想:追溯到这一次创业开始,我脑子里看到很重要的事:如何用全新技术改变物理世界发生的一切?
我在做汽车之家,在线上,我们成了全球最大汽车网站。但是,汽车之家有很多遗憾——比如我们做的汽车电商类业务,一直没有成功,我们想改造整个物理世界,包括一辆车从制造、仓储、库存、物流到体验。我们会发现,除了在线上多花一份钱,并没有对物理世界产生有效改造。所以,我做理想汽车很重要的一点是,必须借助最新技术,对物理世界进行改造。
张小珺:你是想做一家人工智能企业,还是想通过人工智能赋能电动车?
李想:怎么来讲呢?汽车是物理世界人工智能最大的应用。
如果看清楚这一点,我们应该是一家人工智能企业。团队总问我,我们logo后边写“理想”还是“理想汽车”?我们讲“理想汽车”是为了方便跟外界沟通和宣传,但logo从来没把“汽车”加上去。
张小珺:但你也可以说,你要做的是一个人工智能技术驱动的电动车企业,或者一个拥有人工智能技术的自动驾驶企业,为什么一定要是人工智能企业?本质区别是什么?
李想:Emm,其实,做汽车之家,有我一生中最大的遗憾。汽车之家是我第二次创业。
第一次创业,我的泡泡网赶上了PC互联网时代,那时我还不懂什么是创业,刚高中毕业就开始做这么一个网站,错失了很多好的机会。
但在做汽车之家,我非常看中汽车这样一个新兴行业。我们当时做过分析,中国一年只能卖200-300万辆车,到今天一年卖接近3000万辆车。但同时,汽车之家发展成功一个重要因素是,我们率先做了移动互联网的应用和业务。我们做了几乎全世界最早的Web网站、Windows Mobile版、iOS版和安卓版。我们非常好地抓住了移动互联网窗口。很长一段时间,你看身边朋友,尤其男同胞,抱着汽车之家看车、买车是他们生活重要的一部分。
但是,到2013年汽车之家IPO后,到2015年我决定离开汽车之家,有一个非常大的遗憾。2009年,汽车网站的竞争就结束了,后面几年过得挺轻松的。我还有更多能量,团队还有更多能量。我们在移动互联网时代选了一个非常垂直的领域。虽然你做得很好,但某种程度,你可能为了一棵树,错过了一个森林——这是我最大的遗憾。
所以呢,再选择第三次创业,很重要一点是:我要选择一个森林,我要做那个森林里最大的。无论多么难,无论需要我经历什么样的困难,我绝对不止做一棵树了。
张小珺:你是觉得把它叫人工智能企业,是一个更大的故事、更大的梦想?
李想:不是更大的故事,如果你看我们到底在做什么,你就会相信。我们一年100亿研发投入,有接近一半投在人工智能。我们是全世界第一个做基座模型(的车企);端到端和VLM,从最开始论文,到技术研究,到最后研发和产品交付,也是全世界最早做出来的。
我们不仅仅在做智能驾驶,还有理想同学、智能商业和智能工业团队。
(作者注:理想的AI产品包括两个C端产品,即智能驾驶和理想同学;两个B端产品,即智能商业和智能工业。)
只是人工智能,如果是原来的规则算法、知识图谱,大家觉着没什么希望。手机上有Siri,使用比例非常低。虽然大家相信人工智能,但技术是错配的。它用了并不是真正符合人工智能的方式。但这都是进展。我们可能吃到第8个包子吃饱了,但前面每个包子都有价值。正是由于一层一层递进,才出现今天人工智能相对繁荣的景象。
张小珺:我还是不能相信你从创办理想的第一天就想好要做一家AI公司。你确定当时这么想吗?刚创业就觉得人工智能时代要来了?
李想:我觉得是一种感觉。我们从最开始也没有把它当成传统汽车做。为什么理想ONE只有一个车型?是因为我把它本身看成一个数据和软件的集成。
张小珺:乔布斯说“如果硬件是产品的大脑和肌肉,软件就是灵魂”,你表达的也是这个意思?
李想:当然是了。我最开始创业,投资人经常问我一个特别有意思的话题:凭什么是你?为什么你能做出来?那时我们还没有产品出来呢。我当时讲了一个最重要的观点。我说:我会比传统汽车企业更懂怎么做互联网和大型软件,我会比互联网和大型软件公司更了解怎么制造一辆车。
张小珺:有人去年问了一些理想员工,你相信理想是一家人工智能企业吗?他们都说不相信。既然你都不能让你雇的人相信,怎么让更多的人相信?怎么让大众相信?
李想:当技术变更的时候,不相信是很正常的。我们做增程的时候,如果你去问我们员工,这辆车成功率有多少?销量有多少?当时我们员工填最多的是,一个月能卖1500辆。大部分员工认为一个月只能卖几百辆。因为大家并没有体验过新技术,没有看到这个技术能带来的价值。
这可能真的是创业者和大部分人的很大不同:你会相信那些看着不是那么明白、不是那么清晰的事。
张小珺:所以,AI对于理想意味着什么?
李想:意味着未来的全部。
02
大家再不承认,我也不知道怎么形容了
张小珺:你第一次用ChatGPT是什么时候?感受是怎么样的?
李想:发布的时候,我们就去用了。怎么来形容呢?——最大感觉是,人工智能应该有的样子就是这样子的。到今天为止,我跟身边很多人的判断不一样。
我认为OpenAI是个非常、非常了不起的公司,甚至它了不起来的程度,超过了当年谷歌之于互联网了不起的程度。
张小珺:为什么这么说?OpenAI未来会长成什么样?会超越谷歌吗?
李想:我觉得基本是确定性的。
我看一家公司不会单独从技术看。第一,我会看这家公司对行业标准的定义,很多时候大家忽视这是最重要的,谷歌当年在搜索上定义了很多行业标准。第二,我会看它的研究工作做得怎么样。第三,我会看它的技术研发工作做得怎么样。第四是产品化。第五是商业化能力。商业化能力分阶段,今天是不是它一定要获取多少收入?其实没那么重要。
但OpenAI做了当年谷歌做的最重要的事。很多人忽视谷歌当年的成功,是源于施密特(谷歌前CEO Eric Schmidt)加入后在商业上的巨大成功,就是谷歌当年拿下AOL首页。百度当时很重要的成功也是收购了hao123,作为重要入口。如果当时,美国超过50%的人上网首页是谷歌,谷歌搜索就是排他性竞争。
今天,OpenAI同样很厉害,拿下了两个超级巨头:一个叫微软,一个叫苹果。这非常了不起。这五个维度综合看,它是一个遥遥领先的人工智能企业。
张小珺:在你看来,OpenAI一定会成为下一个入口吗?
李想:我就拿数据看吧,OpenAI在这些人工智能的聊天产品里,如果看全球,基本占了80%份额。最新数据一个月有36亿访问量,离最近的是Gemini,应该是2亿到3亿——这个,如果大家再不承认,我也不知道该怎么形容了。
张小珺:如果让你做OpenAI的CEO,你会比Sam Altman做得更好吗?
李想:不会。我觉得Sam Altman做得非常成功,非常成功。
张小珺:如果你是OpenAI的CEO,你现在会做什么?
李想:最大一个挑战是,今天还是OpenAI定义的AGI L1阶段:聊天机器人。L2阶段是他们最近在推广宣传的,包括12天直播,是推理者阶段。大家相信2025年最重要的是,跑在头部的企业能某种程度实现L3阶段:Agent(智能体)。
作者注:OpenAI定义了人工智能5个阶段: L1:聊天机器人/Chatbots,AI具备基本对话和交互能力,能与用户进行流畅的对话; L2:推理者/Reasoners,AI将能解决类似人类博士水平的复杂问题,展现强大推理和问题解决能力; L3:智能体/Agents,AI能独立采取行动,不仅能思考,还可以在没有人类持续监督的情况下执行任务; L4:创新者/Innovators,AI能协助发明创造,推动科技进步,具备创造性和创新能力; L5:组织者/Organizations,AI将能执行整个人类组织的工作,展现出高度的自主性和策略性。)
现在,OpenAI非常好地讲明白,并按照这个定义做了,聊天机器人最好的产品体验。
张小珺:是OpenAI定义的L1阶段。
李想:对。L2阶段不是普通人使用,Pro卖到200美金,要么是to B在用,要么是大的C、专业用户在用。
到了L3阶段,到了Agent阶段,才是真正iPhone4时刻。普通老百姓都能用了,而且它能独立、持续地完成任务,不用靠密集提示词的方式。这时产品应该是个什么交互?这是所有头部企业都应该认真思考的。
张小珺:Agent会在三年内实现吗?
李想:美国可能更早一些。中国的能力足够的Agent,应该在三年之内实现。
03
基座模型是操作系统+语言
张小珺:我们来谈谈你们的两款AI产品,一个是理想同学,它是一个个人助手;一个是智能汽车。
我知道,理想同学以前是一个车机的个人助手,但它现在要走出车门,进入手机变成一个App,未来还会上更多终端。这意味着,你们一个电动车企业要进入通用个人助手这场红海战役了,要去跟豆包、Kimi、ChatGPT竞争了,是这样吗?
李想:如果我们是纯硬件公司,可以符合你说的定义。苹果不是一家只卖Mac的公司,才有了后面的可能性。但这个可能性不是iPhone出来后发生的,是在Mac变成透明壳那一刻就在发生。华为也不只是运营商企业,后面的一切是它从运营商做到相对稳定阶段,就开始产生的。小米不只是一家手机企业,它有IoT,有自己的生态,甚至也有汽车。
今天这些企业,不能以一个硬件来定义它到底是什么企业。这个硬件是它的支柱业务,是起点。今天每一家企业都应该是一家人工智能企业。
如果我们相信人工智能,人工智能最关键是什么?如果在智能手机时代,最重要的是操作系统、应用商店和云服务。最开始大家做触屏手机,其实中国,我印象有非常多家触屏手机,甚至很多品牌也都一年卖几千万台。但到了操作系统、应用商店、云服务竞争的智能手机时代,这些企业要有庞大的大型软件能力,因为很多时候硬件能力,供应商就能解决。
我们之所以做硬件,是为了更好控制这个硬件体系以及性能再高一点点。但大型软件不一样,不是所有人能做操作系统,不是所有人能做大型云服务,这就变成了更大挑战。
回到人工智能也一样,今天你能看到几百家电动车企业,是因为中国有非常完善供应链,但是我问:这几百个企业,未来有哪些企业能做基座模型?
张小珺:你认为,基座模型是一个分水岭?
李想:当然是了。
张小珺:现在谁做了?
李想:至少我们做了。至少我们一直在做基座模型,无论多么难,非常坚定。
我认为,基座模型是人工智能时代的操作系统+编程语言——你就知道它有多么重要了。
基座模型所构建出的人工智能超级产品,会是新一代入口——它会在所有设备之上,在所有服务之上。
张小珺:把理想同学+Mind GPT加起来,约等于Kimi,可以这么通俗理解?
李想:可以这么形容。
张小珺:理想同学从车机进入手机,这是一个战略级决定还是你们只是想试试看?
李想:没那么复杂。站得很远看,一个有效大模型产品,尤其你在掌握基座的前提下,会在所有设备、所有服务之上,这是我相信的一点,否则它不是人工智能。它发展到智能体,能自主使用所有设备、服务。
站在近处看,我们很多用户、孩子,一上来接触的人工智能就是理想同学。很自然,我为什么不把这个东西也同样放在他们日常使用的设备上?很多用户的孩子在使用完车内理想同学后,拿着手机也喊理想同学。这是真实需求场景。
我们可不可以先把100多万用户以及家庭,这300到500万人,让他们用上一个非常好的,在车上、在手机上、在电脑上、后边可能出现在眼镜上,体验一致的人工智能产品?这是必须要做的。
张小珺:理想同学会存在收集用户数据、用户隐私的问题吗?
李想:不会。当你真正预训练、后训练,你会发现跟原来互联网不一样。我们并不需要这些东西。比如,预训练更多是从公开数据集收集。
如果未来让用户使用得更好,会建立记忆系统,但记忆系统会把用户的记忆转成token。它既不是比特,也不是传统文字或声音记载。大家完全不用担心。
大家今天如果担心人工智能的隐私问题,还是对于人工智能技术本身不够了解。
张小珺:对话类个人助手已经非常红海,你怎么看在这片红海市场中的战争?
李想:今天是非常初期阶段。如果讲第一个明确阶段,还是人人可用的to C智能体出现(也就是OpenAI定义的L3阶段)。今天在尝试中。
张小珺:今天是尝试去拿那张船票?
李想:对。今天大家做的所有事情,是为了拿AGI的L3和自动驾驶的L4的门票。
04
L4就是智能体
张小珺:在我脑子里,理想同学作为个人助手和汽车的智能驾驶是两件事——这是两个产品,支持他们的是两种技术架构——为什么给我感觉,在你脑子里,它们是一件事?
李想:由于这两个领域同时都做,我们看到一个更有意思、让我们更坚定去做的机会。
今天我们做的理想同学和自动驾驶,按行业标准是分割开的,处于早期阶段:
我们在做的Mind GPT(理想自研大模型),大家叫LLM、大语言模型,其实它叫语言智能。
我们在做的自动驾驶,李飞飞定义叫空间智能,我们内部叫行为智能。
只有你真正去这个领域大规模做,才知道这两个有一天一定会连在一起。
如果一个人只有语言智能,他足够聪明,但不能行动。如果一个人只有行为智能和空间智能,他像一个普通工种。一个人什么呢?是这几个结合。
我们认为,基座模型到一定时刻,一定会变成VLA(Vision-Language-Action Model,一种结合了视觉、语言和动作的多模态模型)。因为语言模型也要看三维世界,也要通过语言、认知理解三维世界。三维世界不只有图片,或者用Diffusion、生成的方式就可以。因为它并不能还原真实物理世界,需要向量。
自动驾驶也一样,它真正变得更强,走向L4,是它要有极强认知能力。当这些东西发生变化,它能够有效理解这个世界,而不只是端到端背后的那些压缩记忆。这是我们看到的一个变化。
所以,我对团队的一个要求:至少在中国范围内,未来几年必须保证大语言模型的基座模型是行业前三。你需要什么样的训练算力,我们愿意投资。要真正跟头部企业去PK,去竞争,把能力构建起来。而不只是在汽车行业里比一比。
对于我们最开始做的端到端+VLM(智能驾驶的架构),还包含下一代研究工作,我们如何在空间智能里保证在中国是最领先、第一的地位?这非常之重要。
但我相信这个时间点会非常相似——就是,空间智能实现L4,语言智能实现Agent的时候——一个大概率是,这两个会变成一个模型。
张小珺:就是VLA模型?
李想:就是Vision、Language和Action(视觉、语言和行动),它跟人一样。变成一个更大的模型能力。
其实L4就是智能体。智能体,你必须得很好地理解物理世界。
张小珺:智能驾驶能怎么帮助大语言模型?
李想:智能驾驶所获得的数据可以为语言模型或者下一步基座模型,构建三维向量空间的能力。
举个例子,我们在VLM使用中也会遇到一些问题,今天VLM是从大语言模型基础上做出来的。虽然做VLM这些基座模型,它也会喂几亿甚至几十亿张图片,但这些图片是二维的,在三维向量空间里,比如我们去做自动驾驶,它可以通过这个画面看到:哦,哪里是公交车道?公交车道提示是什么?什么是潮汐车道?甚至能认出交警,这个交警在干什么?但它并不知道具体位置。
是因为端到端的基座和VLM基座是两个不同基座,它俩只能互动,不能通过端到端确定位置。这也是我们看到说:哎,最终,它应该像人类一样,一套大脑系统既能处理语言,也能处理图像,并且处理图像的时候,人是具备三维向量空间的能力,能调用自己的行动。
接下来也能看到我们的一些论文。我们如何用三维向量空间,包括用高斯球方式,给语言模型具备三维向量空间的能力。
张小珺:它最终会合并统一到Mind GPT基座模型上?
李想:到时候是不是叫Mind GPT,不一定。
但我们肯定会往语言模型放三维向量token,现在已经开始尝试,做预训练。
05
终级产品想象是硅基家人
张小珺:很多人说你是超级产品经理,能不能从产品的角度讲讲,随着人工智能的能力从L1到L5(按照OpenAI定义标准)演进,你对产品是如何构想的?今天我们看到的还是一个非常基础的对话App,以后呢?
李想:产品是把用户需求和你背后所有能力进行结合。好的产品经理是,我对需求了解得足够清楚,且我对能力了解清楚——这两个交集越大,产品价值越高;交集越小,产品价值越低;或者浪费越多,内耗就越多。
今天哪怕我在公司想推动人工智能,最重要的是,让大家对很多东西的理解变容易。对于实现AGI到最终阶段,我经常用三种方式描述:
第一阶段叫“增强我的能力”。增强我的能力意味什么?意味着它是我的一个辅助,但最后决策权在我这。我可以拿Midjourney画一幅画,但最后还要拿Photoshop修改一下才能出版。我也可以拿理想同学生成一篇文章,但这个文章不会直接发到公众号,还要进行文字整理。包括L3智能驾驶,我们叫“有监督智能驾驶”,还需要我在车上监督,我来进行最后兜底。这里边核心是,第一个阶段能力还不够。
张小珺:所以在这个阶段负责任的是人。
李想:对。但如果你能特别好地使用人工智能这方面能力,它确实让我变得更方便、效率更高。随着它能力的提升,也随着人类对它信任,到第二个阶段,就是智能体所描述的阶段。
第二阶段叫“成为我的助手”。我只要给它发任务,甚至可以发连续任务,它就可以独立完成,并对结果承担责任。
比如,我可以跟一辆L4的车讲,你要去帮我接孩子,我不需要坐在车上,它就可以到学校帮我接孩子,并进行面部识别,打开门让孩子上车,然后再完成下个任务,送孩子学游泳、学乐高。它也可以帮我做上周工作总结,并发给我所有减一层管理者。这是第二个阶段。
这个阶段比较好的状况是,它会变成大规模应用,是真正的iPhone4阶段。
而汽车企业只有实现了L4(按自动驾驶行业标准),才是真正的iPhone4阶段,今天还不是。
作者注:国际汽车工程师协会定义自动驾驶4个阶段: L1级别/辅助驾驶:系统能持续执行车辆横向或纵向运动控制中的一个方面,如自适应巡航控制和车道保持辅助; L2级别/部分自动驾驶:系统能同时控制车辆的横向和纵向运动,但驾驶员必须始终监控驾驶环境并准备接管; L3级别/自动驾驶:在特定条件下,系统可完成所有的驾驶操作,但驾驶员需要在系统请求时接管; L4级别/高度自动驾:在定义操作区域内,系统可完全独立操作,即使遇到复杂或紧急情况也无需人类介入。)
张小珺:今天汽车企业是什么阶段?
李想:如果实现L3(按自动驾驶行业标准),更像黑莓阶段。方向盘在上边,就跟键盘在上边一个道理。
第三阶段是我想的终极阶段。因为我们要“创造移动的家,创造幸福的家”,我在内部叫“硅基家人”。
我不需要再给它任何指示,也不需要分配任务,它就是家庭成员,甚至是家庭重要的组织者。它不但了解我,还了解我的孩子,了解我身边的朋友,甚至比我还了解。它更多记录下的是事实,我很多时候记录的是一种感觉和一些被压缩的记忆。这时它会主动干很多事,可以自主帮我把家管理好。
我作为一个人很重要的是记忆。我的记忆就是我的模型,它也在不停训练,变得更强。很重要的一点,我的记忆会被它得以延续,可能我的肉体不存在了,但我的记忆会变成它的一部分。我的后代想了解我很容易,只要跟它聊就像跟我聊,没区别。
张小珺:那你也没有隐私了啊。
李想:我是它的一部分了。
如果按照OpenAI定义,到AGI,它本身是组织者。它不是只有能力,必须有智慧——它会是人类优质智慧的汇集之河,不只是人类知识和能力的汇集之河。
张小珺:在产品形态上,“硅基家人”是你脑海中构想的最终产品吗?
李想:对。我最兴奋的是,我和我们团队能在有生之年实现第三阶段,我希望是通过我们的手实现。
不过,哪怕最终由于各种遗憾,没有通过我们的手实现,我也希望看到有最顶尖的企业,把这个阶段在我们有生之年实现了。
张小珺:如果你的最终目的是“硅基家人”,那它不适合叫“理想同学”这个名字,会改名吗?
李想:很快大家能看到我们允许每个人创造自己的理想同学。
但如果它不是家人阶段,不要强努着给它一个家人阶段的名字。
06
人工智能表达的是能力,不是功能
张小珺:这类(对话类)产品已经高度同质化,你们的优势是什么?
李想:今天还不能讲同质化,真正大规模to C的关键节点,是在智能体实现的阶段。今天大家都有机会。
作为理想汽车,分三个维度讲:
1. 相比一般创业公司,我们有100万家庭用户的基础,有启动量。
2. 在大语言模型产品和基座方面,我们是跟随者,但跟随要有目标。我们从10名开外怎么先进入第五,从第五怎么进入第三。这也是我们后边要设定目标,以及和最好、最优秀的选手进行对比的有效工作方式,并按照这样的目标有效投入。
3. 在空间方面,包括端到端,今天大家听到各种各样做机器人、具身智能的公司讲“系统一”、“系统二”,大家可以回头看一看这些论文,最早是我们自动驾驶研究团队做的。所以,在空间智能或行为智能方面,我们对自己的要求是必须保持第一。
张小珺:你刚才说产品就是要技术能力匹配产品需求,你今天是对产品需求认知更深,还是对技术能力认知更深?
李想:我觉得不太一样了。大模型到来以前的阶段,我们通过编程甚至规则算法做硬件——本质上我们提供的东西叫“功能”,并且这个“功能”有“体验”。比如这是冰箱,它是功能,冰箱放在不同地方,体验是不一样的。
所以,这时候企业很重要的竞争是,你提供什么样的“功能”,以及这个“功能”带来的“体验”,再加上“品牌”。无论你是互联网产品,还是硬件产品,或者智能硬件产品,你又提供软件功能,又提供硬件功能——这是这个时代的竞争。
“功能”比较好理解,“功能”最主要获取方式来自“体验”。无论是你通过买不同产品获得体验,还是在供应商那看到新东西,或者自己研发,可以通过体验判断功能价值。只要你愿意做,获得功能和体验没那么难。
愿意做小白鼠很重要。我们为什么率先出理想汽车iOS的App,是因为我从iPhone1开始没有短信,要通过贴东西才能用SIM卡。那时很多人嘲笑,李想你小白鼠,为什么要用这些东西?
可能大家不知道,我是中国第一辆雪佛兰Volt这个通用的增程电动车的使用者。很贵,那时40多万买了一辆车。大家会觉得我是小白鼠,但小白鼠一个好处是,能获得优先选择权。我就会比所有没体验过Volt的人,更了解增程到底什么样,还有那些做的不成功的增程,为什么不成功。它的小电瓶和大电池没有连接在一起。你只有体验,能获得这样的一个认知。所以我说这是“功能的时代”。
但到了人工智能时代不一样——人工智能时代是“能力的时代”。
所以,从人工智能开始,这些头部人工智能企业必须搞研究。研究工作并不是技术本身,还有包含比如它跟人类记忆的关系,这样才能对技术方向有效判断。必须得搞研究,再搞技术研发,再产品化。前两个步骤如果做不好,直接产品化,根本不行。
有点像杨植麟(月之暗面创始人兼CEO)讲的那句话:“屎上雕花”。
张小珺:所以,AI时代企业竞争的维度变了?
李想:对,变了。
张小珺:不可能一家公司不做技术研究,只做产品?
李想:当然取决于你想成为什么样的AI公司。如果你想做AI细分里边再细分的小应用,没问题。但如果你想做AI助手,想做基座模型,想做L4自动驾驶,就不一样了。你必须得搞技术研究工作,跑不掉的。
张小珺:你怎么看杨植麟说的“模型即应用”?也就是,好的产品是在模型能力提升过程中“沿途下蛋”。你认可他的这种产品观吗?
李想:当然认可了。大家最开始说:哎,OpenAI去做聊天工具,所以我们可以做搜索!但你今天看,OpenAI也在做搜索,OpenAI也会进入一个个细分领域。
原来讲是“功能”,今天是“能力”。能力有了,任何能力所能解决的问题都能实现。
07
李想有理想吗?
张小珺:很多人认知你,觉得你是一个非常实用主义的人。大家在追求做电车的时候,你还在做增程,为什么你今天对人工智能技术这么激进?——李想有理想吗?
李想:我觉得不是有理想、没理想的问题。
是……(停顿3秒)……我第一次创业,泡泡网做的并不成功,起了个大早赶了个晚集。我后来真正明白一点,就是中国古人讲“天时、地利、人和”,非常之重要,而且这三个有清晰顺序。
排第一的是“天时”。商业社会什么是“天时”?“天时”就是技术,是我们对技术有效使用。
作为创业者,如果我做一辆燃油车,还做了10挡变速箱,我仍然卖不到奔驰、宝马任何一个品牌在中国1/10的销量。但我如果做增程车,并赋予了非常好的软件体验和部分的人工智能体验,我就可以在很短时间追上奔驰、宝马、奥迪的销量,甚至在可见的未来一两年,超越他们。这是重要技术变革点。
人类跟我们相关最重要的技术变革:一是能源,二是信息。
“天时、地利、人和”。第一重要是技术。第二重要是“地利”,在哪创业。你如果不在中国和美国,想做人工智能,太难了。因为你不是主流语种,你没有足够庞大的市场,你没有足够多的人才和这方面的投入,包括人才是否经历了上一个时代能力的积淀。第三才是“人和”,要面对什么样的用户,构建什么样的组织。
技术第一重要。进入汽车行业,很多人说,巨头们都那么厉害,几十年没有真正大厂出现,为什么觉得你有戏?——还是我说的,我比汽车厂商更知道怎么做大型软件,比互联网公司更了解汽车,因为做了10年汽车之家。
进入这行后,我们发现真的跟想的方向一致。拿汽车行业举例,这是我相信的东西:
时代演进方向:BT——IT——DT——AI。
奔驰虽然发明了汽车,但真正汽车行业进入老百姓家是福特开始。福特跟其他作坊型汽车厂一个根本差异在于,建立了流水线和生产线。它用了几分之一的价钱,就可以让普通美国老百姓拥有福特T型车。这时,它干了一件事,是把生产一辆车流程化了。我们内部把流程的简称叫BT,是流程。这是第一阶段。后来丰田又把流程发挥更加极致。美国到70年代还成立了流程协会,流程协会也诞生了后边大量软件公司。
到第二个阶段什么?是IT出现,就是软件,而且是以控制为目的的软件出现。我们在建常州第一个工厂时,还没有精力自己写这个工厂软件,我们当时就选择是SAP还是Oracle的工厂软件?当时我就问顾问公司:SAP和Oracle有什么不同?他讲,SAP呢,比较反人性,比较死,什么都不能改,但好处是,所有人不要指望从这边任何一个流程绕过去;Oracle有比较好灵活定制的能力。
我一个做互联网公司出身的,肯定觉得Oracle好。当时又问了一句:如果从汽车行业最佳实践看,是什么样的?他说,至少在中国大部分用Oracle的,最后也都切回SAP。
哦,我当时就明白了——这些软件能力和我们互联网公司构建的软件能力不一样,最主要目的是控制。包含银行上IT系统,包括制造体系、销售体系上软件系统,都是为了控制。之前流程靠人来盯着,靠纸来记。今天跑在软件里。所以,汽车上万个零部件可以标准化生产出来,甚至汽车跑在路上的质量比手机还要好,是BT和IT发挥了巨大作用。
到第三阶段非常有意思。这个时代描述最好的是,从IT时代进入到DT时代,DT指Data Technology(数据技术)。
我们做互联网公司,我做汽车之家,所有网站服务用户的软件是自己写的,所有面向客户的软件是自己写的,包括所有数据分析、流量分析的软件都是自己写的。这是中国成规模的互联网公司必须要有的能力,因为你每个月要服务上亿访问者。我们当时写这些系统后,会发现跟IT有很大不同。
所有数据必须满足三个条件:
第一,它必须是面向一个客户提供闭环服务。传统公司喜欢叫“端到端”,互联网公司叫“闭环”。包括他从进入一个店,到把这个车买走,这是一个“端到端”。
第二,我要获得原子级数据,而不是控制点的数据。
它能反映出所有的起因、过程和结果,反映任何一个客户在这里发生业务的全貌。
●第三,如果是面向一个用户,它是一个端到端或闭环,大概率会跨业务,甚至跨公司。比如支付环节到了腾讯或阿里。第三个重要点是,要把财务放进去。你获取用户的过程是成本,你变现的过程是收入。只有把财务放进去,才能避免每个专业只看自己一亩三分地。他有看全貌的能力,就有使用整体数据的能力。
所以,数据产生以后,带来三个特别好的结果:
第一个结果是,我们最开始做理想汽车,很多人跟我们推荐一些老专家。我们当时把专家招进来,我还是互联网思维说:你能不能把你知道的know-how写出来?发现他写不出来。
这个模型在他脑子里,但他写不出来,只有遇到问题帮你诊断才能解决问题。当时并不知道怎么使用老专家。
当我们有了DT以后,当我们写大型软件能获得完整数据,意味着什么?只要是高成功率、低成本地完成了一个业务,它就是个“最佳实践”,就是藏在老专家脑子里。哪怕我们遇到了问题,这个问题怎么被有效解决,也是“最佳实践”——所以,这些经验、知识,从老专家的脑子里变到我们系统里。这是一个巨大收益。
这给我们带来非常大一个好处。我们常州第二个厂房,产能不够的时候,生产L7、L8这两个产品。我们这个工厂,从开始生产到产能爬满,只用了15天。我们团队有来自传统汽车厂商的人,他们说如果在原来的企业,需要6到12个月。相当于我们可以把“最佳实践”有效复制。
这也是我们敢于开直营店的原因。开一家店很难,很多店从0开始要养很长时间。但我们店里人员是集中来北京或常州培训。我们只要一个店选址没问题,它从开始营业到最后达到一个月超过100辆,大概是3到6个月。会比正常一家新店启动速度快得多,甚至比你找加盟速度还要快。
这是第一大好处:把所有“最佳实践”沉淀在数据系统里。
第二,它产生什么好处呢?就跟我们原来做汽车之家一样,虽说我们了解用户,但了解用户并不是跟用户聊,而是认真去看用户的访问行为——他为什么走了?为什么来?他从不同渠道来了以后,是什么轨迹?他最后出现问题走的时候,那就是真因,我们怎么让他顺畅地浏览下去?
比如他看一个帖子页面,10张图片就翻一个页,翻着翻着没意思就走了,因为翻着太累。当我们把一个页面变成50张图一页,他就非常有耐心一直往下看。
我们用这种方式,一方面驱动我们怎么获取用户,让用户停留时间更长,让用户一直留存下来;另一方面驱动我们的收入,甚至包括收入怎么定价,都是拿数据决定。
所以汽车之家,我们涨价,虽然广告客户会抱怨,但也没什么可说的。因为我们完全能通过数据评估,他一个店,我们到底给他带来多少收入、多少利润。
另一点,很多时候是对人的训练。它比较像什么呢?像强化学习(RL,Reinforcement Learning),因为它是给每个使用者一个有效反馈机制。
看我们的销售团队,他们是一个月卖二三十辆车的王牌销售?还是卖十辆、卖几辆的?影响因素排在最靠前的,是他对信息、数据和工具的使用,而不是她是不是个美女,或者是内向还是外向。
第三是最重要的一点,数据里的“最佳实践”是人工智能后训练的全部。
很多基座模型在解决一些通用能力很好,但进入专业的时候发现,完全没有能力。这些数据不可能放在互联网公开,都是企业独有,而且是头部企业才懂得怎么去获得。
本身你得是卖智能车最好的企业,才能做自动驾驶的训练,否则你过去连传感器都没有,这些数据都没获得。
同样,用户这些驾驶数据,我们肯定也按模型看。驾驶效率最高的,和安全性最高的进行权重,这3%的人,他们的clips(数据样本)怎么放入模型里训练?就形成了端到端模型。
张小珺:听起来,预训练Scaling Law(规模效应)到达瓶颈,进入后训练Scaling Law,对你们是好事?
李想:是好事,到了物理世界对我们也是好事。
张小珺:你没有回答我刚才的问题,你觉得李想是个实用主义的人吗?李想有理想吗?
李想:(思考2秒…)实现硅基家人那一刻我真的相信,而且无比坚定,就连我都可以被它去延续。
这算不算有理想?
张小珺:所以,你信仰的是AGI的硅基家人,不是AGI?
李想:任何技术一定要赋予一个意义。增程是技术,但城市用电、长途发电,是它的意义。这是根本。
第二节
谈智能驾驶
01
三年我们能推出把方向盘摘掉的产品
张小珺:刚才聊的是理想同学,接下来我们聊聊你们的另一个产品:智能驾驶。
你现在开车百分之多少会用辅助驾驶?
李想:大概80%吧。
张小珺:剩下的20%是因为你们技术不够吗?
李想:最主要是我赶时间。
张小珺:什么时候可以100%使用自动驾驶?
李想:我自己的目标是三年。三年我们就能推出把方向盘摘掉的产品。
张小珺:什么时候能看到理想第一个为自动驾驶L4定义的车?现在已经在定义了吗?
李想:给我三年时间吧。它需要技术和产品到位,需要环境和政策到位,也需要消费者对人工智能信任到位。
张小珺:你既然说AI这么重要,在你创业之初就已经决定要做,为什么你们开始智驾是同行里最晚的?
李想:我是连续创业者,最大好处是知道企业发展节奏。从你没有钱,从0到1,先解决什么问题。当你有了收入,从1到10要做什么。这是我跟新进入创业者一个根本性不同。
理想汽车早期融资能力最差,融的钱最少。那么多钱情况下,第一个步骤是想着如何把产品做好。我们获得了市场认可,有了自己的收入,也包含2020年和2021年分别在美国和香港IPO,有了更多钱。
从2020年初开始,我们就开始做技术的平台化。就像智能驾驶平台,大家看到的AD Max、AD Pro,座舱平台SS,也开始做整车域控制器XCU。我们在研发有了很大进步。过去传统供应商我们不再需要,我们自己成为了这几个关键零部件、车内控制器的一级供应商。再往后,也包含我们做模型,做电机的碳化硅。
它是一个创业公司往上成长,在你资源有限和资源增长以后,分别去投资什么的演进。
张小珺:听说你们之前被供应商欺负的很惨,他们铁了心觉得你们做不出来。
李想:我们经常发出一个邮件,尤其疫情期间,两周以后才有人回复。我们没办法,决定要自己做自动驾驶所有研发,从域控制器开始做。
02
我们相比特斯拉又不缺胳膊少腿
张小珺:在自动驾驶上,你们做了两个相对激进的决策:第一是用只有一个模型的端到端,其他中国车企可能还在用两个模型;第二是你们是第一个取消角毫米波雷达的中国车企,走了以纯视觉为主的技术路线。这两个决策当时是怎么做的?是你拍的板吗?
李想:我经常跟团队说:我们相比特斯拉又不缺胳膊少腿,为什么它能做的你做不到?
我们为什么还保留前面的毫米波雷达,以及前面的激光雷达?毫米波雷达和激光雷达和做端到端关系不大,因为端到端是纯视觉的。包含我们的交互,大家再看到我们下个大版本更新,可以看到端到端、VLM(视觉语言模型)怎么工作。
很多人不太理解,你为什么要保留激光雷达?是不是因为你技术不好?不是。中国和美国不一样。如果你经常在中国夜路开车,你会看到,有尾灯坏了的大货车,甚至大货车直接停在主路,也有不那么标准的半夜道路施工。一个前面的激光雷达,是为了安全。
我们在使用端到端,包括通过Transformer做BEV架构,至少今天的摄像头在深夜没有光线下看到的距离只有100米出头,但是,激光雷达在任何没有光线的情况下可以看到200米,这就帮助我们实现130公里时速的AEB(自动紧急制动系统)。我们是面向家庭的车,每个人生命安全非常重要。这是我们继续保留激光雷达根本原因所在,后面的车型会持续保留——激光雷达相当于“安全带”,帮车主解决重大事故。
我相信如果马斯克在中国,在深夜,在不同高速开过车,他也会选择把前面一颗激光雷达保留下来。因为特斯拉对于安全同样重视,只是他要在这个环境看到。
激光雷达和视觉的配合,在安全上有两个作用:一方面,最容易出的事故是钻到大车底下,产生追尾。尤其光线不好,甚至没有光线的情况下,如果可以做到,能减少90%以上重大伤亡事故。
甚至我们研发AES(自动紧急避让),哪怕他超速,刹不住我怎么躲避?包括AES的两段式,就是第一次躲避以后遇到问题怎么做第二次躲避,都是为了让车辆变得足够安全。我们想办法消除90%以上,甚至最终目标是消除所有重大伤亡事故。刮蹭还会有,但重大伤亡事故我们尽可能解决掉。
另一方面,是对于其他交通参与者的安全。他可能踩的是滑板车,骑的是单板车,也可能喝醉了坐在路上,更好的传感器对安全有巨大帮助。
张小珺:刚才说到那两个你相对激进的决定,为什么其他中国车企没有马上这么做?
李想:可能跟我们有一些比较好的外脑有关,像王兴、陆奇博士,给我们带来很多启发。
比如,用规则算法,用解决corner case(极端情况)的方法能不能解决自动驾驶?解决不了。他不一定帮你解决,但他会给你一些视角。我说服郎博(理想汽车智能驾驶研发副总裁郎咸朋)很重要的一点:你们经常解决了一个corner case,又出现三个corner case,因为你是基于这个场景解决这个corner case,场景一变化,又出现新的corner case——你们一辈子都在解决corner case!解决不完!
一次战略会,陆奇博士给我们讲,你们应该思考一下人是怎么工作的。这对我们帮助很大。
我说服郎博,是拿我爱人举例。我爱人也是正常驾校学开车,拿到驾本。但她最开始开车经常刮蹭。我给她买了一辆宝马X6,她开起来刮蹭,觉得车是不是太大?因为X6接近5米长。我又给她换了4米2、4米3的高尔夫GTI,还是刮蹭。你坐在车里说,你不要刮蹭、不要刮蹭,还是会蹭。她会蹭别的车,进小区会蹭门。
怎么解决?当时,我想了一个特别有意思的方式,因为我家有X6、X5M,我就说,你应该去学一学宝马驾驶培训学校,学初级班就可以,一天时间。宝马驾驶学校的初级班是什么?很重要的是解决你的能力问题,并不是解决corner case。
一天下来只学两件事:你开车应该看哪里,教你怎么踩刹车。我老婆后面基本跟刮蹭告别了,开车开得非常之好。但她只学了一天,学的是能力。
端到端最后体现出来的是能力,而不是去解决功能、解决corner case。
张小珺:在你看来,端到端是自动驾驶的终极手段吗?
李想:端到端只能解决L3,肯定解决不了L4。(笑)
张小珺:L4需要VLA?
李想:对,L4必须使用VLA。
端到端+VLM可以解决L3,比如实现500公里到1000公里一次接管,让你在车上相对轻松。但它想L4,泛化能力是远远不够的。
03
L4实现,买车的人会更多
张小珺:你们会像马斯克一样做Robotaxi吗?
李想:我不想做,我们的使命是“创造移动的家,创造幸福的家”。
“移动的家”终极是L4,而“幸福的家”是硅基家人。
张小珺:会不会Robotaxi到来以后,就没人开车了?
李想:今天租房比买房便宜得多。你拿出存款利息,就可以租到很好的房子,钱都在你手里。但我们仍然买房。
我们为什么要买房、要构建家?我们需要高质量陪伴。我们需要为家人创造稳定、安全、舒适的环境。车也这样,实现L4自动驾驶,家庭用车更便宜、成本更低。我相信,愿意拥有一辆车的人会更多。
可能五年、十年后大家重新看,到底Robotaxi是未来主流,还是更多人拥有一辆自动驾驶的车,它使用率很高,能为家人、朋友享用?可能未来几年是分水岭。我相信,当一个空间变得更好、效率更高、体验更好,我更应该拥有这个空间。
张小珺:你怎么看特斯拉和Waymo的路线之争?做L4的派系(如Waymo)会说,你们L2辅助驾驶做得越好,就离L4自动驾驶越远。
李想:L2等于规则算法,也有拿规则算法直接做L4的,但在限定场景。L3实现来自端到端。很多过去做L4的公司,也一定在做端到端,在端到端上再做一些迭代和创新。但我相信真正具备广泛性、通用性、而不是特定区域的L4,一定是VLA。
我相信,Waymo、特斯拉最后也会变成VLA。所有想通往L4的企业可能都是VLA,或者比VLA更好的方式。大家不会拒绝这件事的,就跟大家今天都用Transformer,都用大语言模型一样。
张小珺:这两类公司的商业模式呢?
李想:特斯拉和我们比较好的一点是,在没有达到L4之前,只要能力提升,就会带来卖车的商业优势。比如我的MPI接管率从50公里到500公里,而如果别人只有200公里,我的车就会好卖很多。不是非得到L4那一刻才产生商业模式。
在人工智能领域,经济反馈模型对汽车企业比较友好。虽然汽车本身在内卷,但这个反馈方式挺友好——你能力的提升,会直接带来变现和竞争力。
Waymo做得也很好,在努力商业化,在旧金山打车占比越来越高。都是一帮足够聪明的人,不用为他们担心。(笑)
04
我们100%会做机器人,但不是现在
张小珺:很多人在问,理想会做机器人吗,特别是人形机器人?既然你要创造硅基家人。
李想:概率是100%,但节奏不是现在。
我们如果连L4级别自动驾驶汽车,都解决不了,怎么去解决更复杂的?
车是无接触机器人,包括道路提示、参与者都是标准化的,每个人都受交通规则的训练,这已经是最简单的人工智能机器人。如果车没法实现,其他人工智能机器人非常有限。
张小珺:对于机器人,你们会自己做还是会投资?
李想:如果世界上有做得好的,我们会合作。如果没有,就会自己做。
理想同学,可不可以在手机上使用?可以啊,手机厂商做得非常好了,不需要我再去做手机。理想同学可不可以接电脑?那也很好啊,整个浏览器模式是标准化的,你还可以把理想同学做成浏览器插件,让浏览器体验变得更好,都是公开的。你可以在Chrome上做,可以在Safari上做。
别人做得很好了,我们就不会再做一个相同的硬件。但核心是,如果我们看到一个特别重要的事情,没有人去解决这个硬件,我们就必须得去——因为好的硬件是软件的必要条件。(笑)
第三节
谈汽车之战
01
复盘MEGA失利
张小珺:你说你从来不认为电动车是创业的终点,但你现在电动车这场仗还没打赢啊。
李想:是的。
张小珺:你怎么看待MEGA的失利?
李想:(思考3秒…)嗯,我觉得分两个阶段:第一阶段是看到一些更表面或者眼前能解决的问题;后面,我们看到的是当时一些选择带来不可改变的东西。
先说一些小问题,比如我们错判了MEGA市场规模。
我们认为MEGA可以在50万以上乘用车里去吃。L9发挥了这样的作用,既能抢轿车,又能抢MPV,还能抢SUV。但MEGA出来,我们发现,这个判断有问题。因为MEGA太长了,有5米3,用户群相对窄一些。
我们确实抢了很多豪华MPV用户,但普遍都是长期MPV使用者买MEGA,非常满意。但并没有从太多其他轿车、SUV人群抢到属于MEGA的用户。因为他们自己开的时候,更愿意开SUV和轿车,这个尺寸停车更方便,倒不是因为造型。
这意味我们只能在50万MPV里抢市场。50万以上MPV,一个月是4000辆,我们今天做到1000辆,25%市场份额,可能还会再大。但哪怕我们吃掉50%,也就是一个月2000辆市场份额。
第二个问题是我们对纯电的理解还是不够,尤其对充电桩怎么建。
我们开始认为,只要在高速建充电桩就可以了,不需要在城市建。但我们忽视了一个问题,车主的交际圈,比如他在二线城市居住,他去一线城市交际,除了路上要充电,这些城市也要能充到电。他的时间很值钱,他不愿意跟网约车司机挤在那里,等一个多小时充电。我们充电桩建的数量远远不够。
问题是机会。充电桩流程体验也非常差,早期,MEGA关于充电站的NPS(净推荐值)只有30多分。我们一直优化,开足够多站点,优化每个细节,包括站位,包括软件做得顺畅。
我认识非常多北京MEGA车主,家里有多辆车,过去去阿那亚、北京周边开燃油车,今天他们开MEGA。也因为我们对充电的理解和充电体系的建设,包括充电从App上如何给大家构建安全感,也包括我们除了自建,还把大量、高质量充电桩认证以后加入这个体系,用户只需要花积分就可以使用。作为高端纯电车体验,我们应该是非常领先了。
如果再往外站出来看,很重要的是,我们经历了一个重要阶段。
我最开始创办这家公司,招的最多的人是创造好产品,以这样的人为主。包括刘杰(理想汽车产品线总裁)啊、范皓宇(理想汽车产品部高级副总裁)啊,这些最优秀管理人才是这么锻炼出来的。所以我们做了理想ONE,并把L系列做得非常成功,L9各方面都是天花板。
L9在2022年9月出来,这些天花板是因为我们从2019年就开始构建平台化能力,并且从2020年开始坚定投资,这么多年把这些东西做出来了,才出来L9这样的产品。包括从全世界招募设计团队,最开始设计团队都是中国人,后来有了Ben(理想汽车高级设计总监Benjamin Baum)这些顶级设计师加入,把能力提升。所以,L9出来是一个震撼世界的产品,L8、L7、L6也享受到这个好处。
相当于,我们有收入开始从2020年,大概用了三年多就做到一年超过1000亿收入。但是,L9出来,我们遇到一个很大问题:运营能力完全跟不上。当时运营能力还是我当年做汽车之家那几十亿、接近100亿规模的运营能力,并没有大几百亿甚至上千亿的运营能力。
我举例,我们招了很多大公司同事来了以后,他们说这件事怎么做?有没有什么流程?我应该怎么入手?这些人后来都变成我们流程的建设者了。但他给我讲——咱们公司原来在管这些业务运营的时候怎么管?就是:哎,要想到达那个地方怎么走?瞄准方式就是:你记住,前面第四棵树左转,遇到一个井盖右转。
哦,他讲完我就知道了,我们要想把运营体系支撑一个千亿规模,我要建立体系。我们虽然很多同事在千亿收入公司工作过,但没有建立过这个体系,没有修过路。我得先把路修好,车才能跑顺,而不能靠大家背井盖、背树,那这个公司没法运作了。
这相当于革命。如果我让从外面招的优秀的人做,他们成“戊戌变法”了。(笑)最好的方式是什么?让过去这些做产品、做业务最优秀的人来主导变革——去修研发领域的路,修销售领域的路,修管理领域的路。所以这段时间,我们把最重要的人才,范皓宇、刘杰……都调去提升运营能力了。
我们产品创造领域缺少了一些大将军。虽然后来长出来一些将军,但当时那些将军是最强的一帮将军。
张小珺:不是还有你吗?
李想:对我一个很大挑战是,我在开L9产品定义会、产品评审会的时候,我身边是刘杰、范皓宇、汤靖(理想汽车第一产品线总裁)。是公司的VP,对吧?但我们做MEGA遇到一个问题。我开评审会的时候是总监,是高级经理。他们没有经历过为什么成功的阶段——少数人经历过,多数人没有经历过。
现阶段,我们用了两年,把千亿体系能力构建起来了。我们回头看,这个课是必须得补。同时,像皓宇、郎博、刘杰这样的,他慢慢同时具备两个能力了——一是,怎么构建产品、创造价值的能力,把屋顶拉得越来越高;二是,他知道怎么运营好的能力。
按任正非讲的是,这些合格的管理者同时要具备两个能力:一个是建黑土地的能力,一个是打粮食的能力,或者他知道怎么跟别人协作这个能力。这是我们过去用两年所做的重要变化。补这个能力不后悔,但多少它对现阶段产品的能力,有一定耽误。MEGA并不是所有方面都是天花板,但L9是。
重要挑战是,当我们出SUV系列,我们推出的产品是不是这个价位、这个级别方方面面的天花板?——这是很公平的,对所有企业是一样的挑战。
张小珺:MEGA有过让你彻夜难眠的时候吗?
李想:(思考3秒…)没有,我睡眠挺好的。我们意识到这个问题,我又重新把刘杰、皓宇、汤靖这些做产品能力最强的人角色进行了调整,重新成立了产品线,让这些人主导产品。
让这些可以跟李想一吵架,能吵一个月、两个月——跟我吵得特别开心(笑),但是结果特别好的——这帮人,来真正变成大将军,主导我们后面的产品。
张小珺:他们跟你因为什么吵架?为什么会吵一个月、两个月?
李想:什么都会吵。很多东西需要时间验证。但是,汤靖啊、张骁(理想汽车第二产品线总裁)啊,李昕旸(理想汽车第三产品线总裁)啊,从历史而言,吵架总是能赢我。(笑)
张小珺:他们因为什么和你吵过两个月?
李想:比如针对L7、L8,是否应该用一个车型做五座版和六座版?我们在过去几个月就吵过。我认为用一个车型提供五座版、六座版就可以,把上下车做好。但做出来以后,不是我们满意的,还得两个车型,因为上下车也不是最好的,造型也不是最好的。我们不想做任何一个错误的产品。又分成两个。
但我当时坚持要做一个,最后我妥协了,做两个。我妥协是因为他们真的对,验证出来体验不一样。我们不能做凑活的产品。
张小珺:一般大家普遍畏惧沟通、畏惧冲突,作为CEO其实是喜欢高管和自己吵架,是吗?
李想:我挺喜欢这种感觉的。特别像乔布斯讲的那个故事——他认识一个邻居,一个大爷拿着一堆普通石头放到一个机器里,几天以后拿出来,都是漂亮的球。
真正顶级团队在做产品,做研究,做创造的时候,就应该是这样。
我喜欢看到大家在吵架。
02
今天做的所有事,是为了拿L4的门票
张小珺:纯电这场仗,接下来准备怎么打?
李想:没什么绝招。在这个价位,用户最在意的一些价值,你是不是天花板?就这么件事。
它是综合之战,你的技术到产品,产品到商业的一个完整作战体系。
张小珺:电动车这场仗什么时候能分出胜负手?现在中国汽车仍然非常内卷。
李想:电动化和智能化是两场仗。电动化相当于没有资源企业的一张门票。
三星到了智能手机还是拿到了门票。虽然它是传统手机厂商,之前也跟诺基亚时代竞争,但它一直手里拿着这张门票。它的手机也经历了从传统功能机到触屏机再到智能机的阶段。
也有别的领域非常强的人,到进入那一刻竞争的时候,他有门票。只是它的门票不是硬件本身,是已经掌握了另外一个能力的门票。比如它有操作系统的能力,有大型软件的能力——苹果,它就可以过来拿这张门票;谷歌可以过来拿这张进入决赛的门票。
电动车本身,L4会分出来真正的胜负。我们今天在做的所有事是为了L4拿门票,因为L4所需要花的钱、所需要拥有的能力、所需要的数据量是今天不具备的。今天大家要靠这个东西去拿L4的门票。
张小珺:拿L4的门票先决条件是什么?
李想:第一,足够多的车跑在路上。
张小珺:多少车?
李想:(思考4秒…)得500万辆以上。
第二,要掌握VLA这个基座模型的能力。
第三,要足够多的钱,招募最顶级的人才,拥有足够算力。
张小珺:当都满足了这些条件,且做到足够卓越,能做出一家像苹果这样的公司吗?
李想:一定会的。
张小珺:所以,你认为这场仗什么时候能打赢?
李想:并不存在打赢不打赢。汽车企业发展那么多年,跟传统汽车厂的竞争结束了,又有很多外来者。是不是有一天苹果说,我应该做汽车了?我读苹果流传出来的内容,当时乔纳森(Jony Ive,曾任苹果首席设计师兼资深副总裁)说了很重要的一点:苹果没必要设计一个带方向盘的车。这是我印象最深的一句话。如果没有方向盘了,苹果会不会也进入这一项领域?
最开始大家看到,新势力、特斯拉,跟传统汽车的竞争。后来华为进来了。后来小米又进来了。(笑)大家又发现这个竞争发生了新的变化——这就是世界的精彩和丰富之处。
张小珺:为什么苹果现阶段放弃造车?
李想:有两个挑战:第一个挑战是如果做汽车,苹果组织模式必须发生变化。因为汽车比手机更复杂,这是真实存在的。但是,由于苹果过去公司的治理模式,太完美了。这个时候要产生变化,如果没有特别明确、清晰的愿景,或者强大的吸引力,很难说服苹果内部的人改变现在组织和工作方式。
苹果决定放弃造车的时候,特斯拉也几千亿美金市值,而苹果是两万亿美金。组织内会说,我们一个两万亿市值的公司为什么要学一个几千亿的,甚至它的估值是被高估的?它享受了那么高市盈率。这对于最成功、成功到完美的公司,是巨大挑战。
第二个问题是,人工智能对苹果也有一定的延期。你可以从苹果价值观看到,它对隐私格外在意。如果你做规则算法、知识图谱,这些data就是隐私。如果你做到了大模型阶段,它变成token,跟隐私什么关系都没有了。相反,它是解决隐私最好的方式。
这些厉害的企业都是一帮足够聪明的人。当他看明白,当他去拥抱AI,可能比大家想象的进步速度快得多。
03
我对雷军说,小米要想成功,你必须all in
张小珺:那你怎么看待小米做出来了呢?
李想:雷军做硬件的能力非常强,这没什么可质疑。他不只是做车做好了,电视机、空调做得也非常好,各个东西做得都非常好。这是他本身的优势,而且他带着发烧友的心态做。我们作为一个家庭用户不会在意的东西,在小米SU7做出来,又会吸引一个非常大的人群去喜欢那些功能。比如两秒多的加速。
张小珺:他在做车的过程中,你有给过他什么建议吗?
李想:我给过他一个特别重要的建议。他经常会找我聊一下,有时候电话,有时候让我去他们公司,而且一聊时间很长。他经常跟我聊,我对特斯拉的看法、对比亚迪的看法、对华为的看法,我会如实跟他讲。有一次他聊完,他说我(对这三家看法)跟他是比较接近的。我说:是啊,这三家都非常顶级的企业啊。
他最后问了个问题:如果我们做汽车,你给我一个建议,只要一个,是什么?
我说:小米车要想成功,你必须all in——没有什么其他的,只要做到这一点,小米汽车就会成功。
我们跟小米关系也不错,MEGA遇到问题,他们团队还来帮我们。我们对恶性公关没有经验,小米常年遇到这样的问题,都在帮我们。包括我们MEGA后面,L6很艰难,雷军来帮我们站台。
(突然眼眶泛红…)我们都非常感激,帮了我们非常非常多。
04
2030年,我们有概率做一辆超级跑车
张小珺:对了,你为什么买法拉利?它又不AI,又不自动驾驶。
李想:体验对我来说很重要。体验就像我做预训练的一部分。
大家今天之所以看到L9是面向家庭最好的六座产品,很重要是我长期是宝马X7、奔驰GLX和特斯拉Model X的用户,这些体验不可替代。
买法拉利一个重要原因是,身边很多朋友,包含股东,对理想汽车提出了下一阶段的挑战:品牌如何做升级?在品牌层面,我向很多人拜访、学习。这包含汽车行业做得最好的品牌——我最喜欢的,一个是宝马,一个是法拉利。法拉利我还没体验过。只有通过体验,才能变成我的认知和能力。
张小珺:300万买训练大模型用的卡不好吗?
李想:这不冲突。做好了功能和体验,做好了能力和训练,以及更好的品牌,给用户提供更高陪伴和情绪价值,都不冲突。
张小珺:理想同学会上法拉利吗?
李想:如果我没买法拉利之前,我会说永远不会上法拉利。但买了以后,这是一个可能性。我能想象当实现L4,大家都会把车做成方盒子。那一刻,各种各样的方盒子出现,里面有非常好的空间。但是,谁来满足乐趣?如果能有一辆想自动驾驶就自动驾驶、想自己开就自己开,但又非常好的人工智能的车,为什么不可以?科幻电影里有这样的体现。
就跟穿鞋一样,穿运动鞋最舒服,为什么女生还要穿高跟鞋?是因为一定有它的价值存在。
我今天一个想法是,可能到2030年,我们甚至有50%概率会做一辆非常有趣的超级跑车,但它一定是人工智能的。
张小珺:在你看来,法拉利这样的车企应该拥抱AI吗?
李想:可能跟很多人想象的不...