打开网易新闻 查看更多图片

制图:Midjouney-晓睿

图文作者:举大名耳

编辑:杨晓鹤

2024年,注定是生成式AI大放异彩的一年,但对苹果来说,同样也是个多事之秋。

前段时间,在苹果举行的新品发布会上,苹果推出了iPad系列最轻最薄的新款iPad Pro,并在其中搭载了性能堪称变态的M4芯片。

根据苹果公布的参数,M4的CPU为4大核+6小核,采用了3nm制程,算力达到了38 TFLOPS(每秒38万亿次)。

然而,激进的堆料,仍旧没能缓解苹果在AI时代的焦虑。

打开网易新闻 查看更多图片

发布会之后,苹果股价仅在周二(5月7日)收涨了0.38%,这不温不火的股价,也反应出市场对这种一味“卷硬件”的策略,已经不太感冒了。

毕竟,在用户看来,当今的手机、平板,其实性能早已过剩,自己为什么要为那实际上用不到的“高性能”支付昂贵的溢价?

也正因如此,从去年以来,苹果的整体Mac销量和iPad销量下滑了40%。

更大的危险信号是,iPhone在今年国内市场第一季度的排名中,首次跌出了前五。

根据市场调研机构TechInsights发布的最新数据,2024年一季度,中国智能手机出货量为6330万台,同比增长1%。在头部厂商排名中,苹果以13.7%的市场份额跌出了前五名,加入“others”(其他)行列。

打开网易新闻 查看更多图片

在竞争对手微软和谷歌,早已推出各自的AI工具和平台的情况下,越来越多的人已经看出来,手机这类个人终端的下一场革命,就是当下的生成式AI。

根据Gartner的预测,到2024年底,生成式AI智能手机的全球出货量,预计将达到2.95亿台,占基础和高级智能手机出货量的22%

但不幸的是,在这个本该大有可为的新天地,苹果却拉胯了,至今没有自己的大模型。

打开网易新闻 查看更多图片

AI手机正在迎来”ipone时刻“

在当下的生成式AI竞争中,苹果的步伐显得格外迟缓与被动。

当微软与谷歌等巨头纷纷亮剑,推出自家的大模型,甚至连国内的荣耀和OPPO等手机厂商,也先后揭晓了其专署的手机大模型(“魔法大模型”、AndesGPT)之时,苹果仍旧迟迟未能推出自主研发的生成式AI产品。

同时,早已显得滞后的Siri,在如今AI浪潮的冲击下,表现也越发不尽人意。就连前苹果工程师John Burkey也曾尖锐批评Siri的性能,称其“笨拙”。

实际上,自库克时代以来,很多人都已经感受到,现在的苹果已经不是乔布斯时代那个追求创新,产品为王的苹果了。

一个重要的区别,就是现在的苹果,少了从前那种颠覆性的创新和突破——例如最近OpenAI发布会上最新的GPT-4o展现出的强大AI能力。

在5月14日的发布会上,OpenAI最新的旗舰大模型GPT-4o,不仅能力横跨了听、看、说等能力,并且交互过程丝滑流畅毫无延迟,可以在平均320毫秒的时间内响应音频输入,与真人对话的反应速度几乎一样了。

AI鲸选社

,赞18

更牛逼的是,在整个演示中,GPT-4o还进行了多项需要实时交互的任务。

例如用摄像头和用户实时视频聊天,或是通过摄像头观看用户写在纸上的数学题,并进行解答,又或者在用户敲代码的时候,观看屏幕上的代码,给出评价和建议等内容。

所有这些体验,都像真人一样顺滑,自然,毫无延迟。

打开网易新闻 查看更多图片

这种炸裂的功能,直接把Siri这种只能进行机械式语音交互的AI,甩到不知道多少条街开外了。

同样地,在一天后谷歌举行的I/O开发者大会上,为了与GPT-4o进行对标,谷歌的Gemini 1.5 Pro,也展示了类似逆天的功能。

在演示中,召唤Gemini之后,测试者打开了摄像头,边走边提出问题,例如:“当你看到会发出声音的东西时,告诉我”。

结果,当镜头扫过一个扬声器时,Gemini果然回答道:“我看到一个扬声器,它可能会发声。”

打开网易新闻 查看更多图片

就如同当年乔布斯在初代iPhone引入多点触控屏幕,促进了移动互联网时代的到来一样。

这种毫无门槛的,更人性化的交互方式,必定会在手机端引发AI应用的革命,从而引领AI走入千家万户。

毫不夸张地说,如果将来手机AI真的有一个“iPhone时刻”,那么构成这个“时刻”的关键要素之一,正是这样实时性的,充满人性和情感的语音交互AI。

打开网易新闻 查看更多图片

不过,正如初代iPhone的奇迹是由多个技术要素构成的一样,除了语音交互外,AI时代的“iPhone时刻”,也同样需要更多的要素来构成。

这些潜在的要素,也可以被称为“技术合力”。苹果的技术合力能打出AI重拳吗?

打开网易新闻 查看更多图片

苹果AI实力到底几何

就现阶段来看,构成手机AI“iPhone时刻”的主要技术条件,至少可归纳为三点核心要素:端侧芯片、模型压缩技术,以及AI语音交互技术。

其中,端侧芯片作为硬件基础,不仅决定了手机能运行多大参数的大模型,而且还直接影响到数据处理的速度与效率;

而模型压缩技术,则是在手机上实现高性能AI的关键,它决定了将大模型缩小并塞进手机的同时,模型是否还能保持先进、复杂的推理能力;

打开网易新闻 查看更多图片

至于AI语音交互技术,则是构建流畅用户界面与人机沟通体验的关键,它让手机AI能够准确理解并响应用户的语音指令。

在端侧芯片方面,虽然苹果在发布会上宣称M4各种强大,但是从M3的数据以及相对M3的提升来看,虽然拥有16个NPU,但在AI算力/生产力关键参考的Token生成速度上,M4大概率只有26-29/秒左右。

打开网易新闻 查看更多图片

与竞品相比,苹果的M4芯片AI算力(38TOPS)只能算一般。

在AI方面,高通骁龙8Gen3的峰值算力达45TOPS,英特尔面向AI PC的酷睿Ultra处理器AI算力也可达34TOPS,而天玑9300搭载的vivo X100 可运行 100 亿参数大模型,算力达到 33TOPS。

由此可见,在群雄并起的AI时代,苹果在硬件方面,并未像研发初代iPhone时那样,占据绝对的优势(例如当时的多点触控)。

虽然苹果M系列芯片还有统一内存的巨大优势,但是由此带来的本地模型运行慢,也无法多线程的劣势面前,苹果的AI芯片可谓让开发者又爱又恨。

而在第二大技术要素,即模型压缩技术方面,苹果则显示出了明显的滞后。

模型压缩技术,相当于是当年构成“iPhone时刻”的iOS系统,在这一技术领域,尽管苹果发布了数篇关于手机大模型的论文,如《LLM in a flash: Efficient Large Language Model Inference with Limited Memory》,总体上看,虽然这些论文的思路,都是在想方设法将模型压缩,同时保持其强大性能,但迄今为止,苹果仍未推出任何具体的大模型产品。

打开网易新闻 查看更多图片

而在这个领域,走在最前面的,往往是一些专注于大模型技术的AI企业,例如国内的一些AI企业

某智能公司的开源MiniCPM-V 2.0模型,不仅以2B的参数量,超越了多个较大的模型,如Mistral-7B,甚至在某些方面,还能与Llama2-13B和Falcon-40B等参数是自己几十倍的模型相媲美。

打开网易新闻 查看更多图片

最后,从语音交互方面来看,早已显得滞后、笨拙的Siri,在如今OpenAI、谷歌等先进的AI技术面前,根本没有任何招架之力。

尤其是5月14日的OpenAI发布会上,ChatGPT展现了最新的语音功能后,所有人都感觉到,这种具有语气和情感,能够像人类彼此交流时那样允许插话、情绪饱满的AI语音系统,已经对上一代语音AI(如Siri)形成了肉眼可见的碾压。

打开网易新闻 查看更多图片

由于苹果在AI方面的拉胯,同时眼看着今年的WWDC(苹果全球开发者大会)越来越近,感受到压力的苹果,不得不与OpenAI和谷歌进行深入谈判,计划引入ChatGPT技术来对Siri进行一次重大的“大脑”升级。

打开网易新闻 查看更多图片

破碎的城墙

长期以来,苹果之所以能在科技舞台上傲视群雄,核心在于其独特的软硬件垂直整合的封闭生态系统。这一系统确保了从iPhone到Mac的每款产品,都能让用户享受到一个更加纯净、稳定的体验。

然而,随着AI时代的到来,苹果愈发难以在新的技术角力中,占据所有有利要素。

也正因如此,原本封闭的IOS系统,如今也不得不对OpenAI等巨头进行开放,而这样的局面,实质上已经表明,苹果原本固若金汤的城墙,今天已经被部分地“攻破”了。

打开网易新闻 查看更多图片

不过,这样的窘境,也不能全怪库克,说他不思进取。其实,这跟苹果自身的业务性质也有一定关系。

咱们得明白,苹果一直以来玩得转的是啥?是那种能跟它的自身硬件进行契合的传统AI。

啥叫传统AI呢?简单讲,就是那些专注于特定任务,比如人脸识别、语音助手、拍照优化这些,这些技术侧重于利用算法优化硬件性能,提升用户体验,恰好与苹果擅长的软硬件一体化设计哲学不谋而合。

比如iPhone上的Face ID,看一眼屏幕就能解锁,又例如Apple Watch通过心率监测、血氧检测等功能,结合AI算法分析,为用户提供健康预警和健身建议等功能,这些都是传统AI在苹果设备上的体现。

打开网易新闻 查看更多图片

苹果这种高度依赖于硬件销售与服务结合的商业模式,决定了生成式AI必然会与其存在一定的错位。

因为ChatGPT这样的AI,本质上是一种更“独立”的系统,而不是手机、平板这类硬件的附庸。在脱离硬件的情况下,其依赖云端算力,也照样可以进行推理。

照这样来看,苹果在生成式AI时代的没落,难道是一种必然了吗?

其实也不完全见得。

如果乔布斯仍旧掌舵苹果,以其对用户体验的偏执追求,至少不会容忍Siri糟糕的体验那么长时间,苹果在语音AI上的表现,也许不会像今天那么惨。

同时,乔布斯不仅理解用户当前的需求,并且还能够凭借对市场和技术的洞察力,预见用户未来可能的需求。

打开网易新闻 查看更多图片

例如,在1980年代,乔布斯就预见到了图形用户界面(GUI)将取代传统的命令行界面。并将GUI应用于苹果的Lisa和Macintosh电脑上,成为了个人电脑行业的重要里程碑。

同样地,在2000年代初期,当手机市场还主要由功能手机主导时,他就预见到了智能手机的巨大潜力,并推出了iPhone。

到了2010年代,其更是前瞻性地预见到了人们对于便携式、长续航的移动计算设备的需求,并推出了iPad,由此迅速开启了平板电脑市场。

打开网易新闻 查看更多图片

销售见长的库克,很明显已经意识到苹果的问题,也在最近发布了端侧UI模型Ferret-UI,他能理解屏幕上的内容,还能识别和操作具体的UI元素。

很多人猜测,苹果的意图是手机端用自己的大模型处理简单任务(短信处理/iPhone 通知),云端用其他家大模型处理复杂任务(生成图像/电子邮件回复)。

这一权宜之计,对于苹果来说,也是没办法中的最好办法,一向闭源的iOS也不得不半推半就,接受了“灵魂”植入。毕竟三星Galaxy S24依靠与Google大模型的合作,手机销量增长了两位数。自己销量下滑态势止不住,此消彼长下的黄昏很难熬。

停止造车后,AIl In AI 的苹果,也没有勇气全力打造一款媲美ChatGPT的大模型,只能说时代正在缓缓碾过巨头的尸体。