2023 年以来,华为率先将大模型接入手机,使得手机可以执行文本生成、知识查找、资料总结、智能编排、模糊/复杂意图理解等复杂任务。之后,包括小米、荣耀、vivo、OPPO 和三星都迅速跟进,选择在智能手机产品上增加各种 AI 功能,以此来提升产品的竞争力。直到 2024 年 6 月,苹果才对外披露了Apple Intelligence 的更新计划。

按照计划,苹果试图用生成式 AI 技术彻底改造 Siri 虚拟助手,新系统将首次允许 Siri 控制应用程序内的所有功能。Siri的这一变化,需要使用大语言模型进行 iOS 的系统底层改造。苹果据报正与腾讯、字节跳动讨论将其人工智能(AI)整合在于中国内地销售的 iPhone 之中,但后续进展有待观察和确认。此外第一财经获悉,苹果还在与智谱进行谈判,除了百度,目前与苹果接触的 AI 大模型公司增加至至少 3 家。

打开网易新闻 查看更多图片

大模型升级:全方位看一下,豆包大模型的优化

2024 年 12 月 18 日火山引擎 FORCE 原动力大会上,火山引擎展示了其全新升级的豆包大模型家族,包含豆包视觉理解模型、豆包 3D 生成模型,以及全面更新的豆包通用模型 pro、音乐模型、文生图模型等,为企业提供多模态大模型能力。豆包大模型于 12 月实现日均 tokens 使用量超过 4 万亿,较 5 月发布时期增长超过 33 倍,稳居行业领先地位。

视觉理解模型重磅发布。视觉理解模型具备以下三种能力:

更强的内容识别能力,可识别出图像中的物体类别、形状等基本要素以及理解物体之间的关系、空间布局以及场景的整体含义;更强的理解和推理能力,能根据所识别的文字和图像信息进行复杂的逻辑计算;更细腻的视觉描述能力,可以基于图像信息,更细腻地描述图像呈现的内容以及多种文体创作。

视觉理解模型:理解和推理能力,大幅度提升

以上能力极大拓展了大模型的场景边界,在金融、医疗、建筑、地理、体育、物流等诸多行业有着广阔应用前景。除此之外,视觉理解的输入价格为每千 tokens0.003 元,比行业平均价格降低 85%,相当于 1 元钱可以处理 284 张 720P 的图片,具备高性价比优势,视觉理解模型正式走进厘时代。同时火山引擎还将提供更高的初始流量,RPM 达到 15000 次,TPM 达到 120万,让企业和开发者用好视觉理解模型,找到更多创新场景。

算力:什么是算力?如何去理解算力?

算力的字面意思,大家都懂,就是计算能力,是通过对信息数据进行处理,实现目标结果输出的计算能力。云计算和数据中心之所以会出现,是因为信息化和数字化的不断深入,引发了整个社会强烈的算力需求。通常,我们将算力分为两大类,分别是通用算力和专用算力。FPGA,是可编程集成电路。它可以通过硬件编程来改变内部芯片的逻辑结构,但软件是深度定制的,执行专门任务。ASIC,是专用集成电路。顾名思义,它是为专业用途而定制的芯片,其绝大部分软件算法都固化于硅片。

人工智能:应用端不断更新,算力要求进一步提高

上周恒源云 13 核+128G 算力紧张。具体来看,显卡配置为A100-40G 中,腾讯云 16 核+96G 价格为 28.64 元/时,阿里云12 核+94GiB 价格为 31.58 元/时;显卡配置为 A100-80G 中,恒源云 13 核+128G 算力紧张;阿里云 16 核+125GiB 价格为34.74 元/时;显卡配置为 A800-80G 中,恒源云 16+256G 价格为 9.00 元/时。

投资分析:

大模型或从快速扩张迈入淘汰赛阶段,字节明年有望迎来爆款应用。今年以来,视觉理解模型在 GPT-4o、Google的 ProjectAstra,以及 iPhone16 和一众旗舰机型上都加速落地,同时,苹果一旦增加 AI 功能对于国产大模型和算力也是增量的需求,我们持续看好 AI 软硬件机会。

择时关注:人工智能、算力、大模型等

风险警示:

市场有风险,投资需谨慎。上海汇正财经顾问有限公司是证监会批准的证券投资咨询公司, 组织机构代码统一信用码为91310107MA1G0KQW5N,本公司是具有证券投资咨询资格证书,是合法的证券咨询平台。本文仅为投资者教育使用,不构成任何投资建议,投资者据此操作,风险自担。力求本文所涉信息准确可靠,但并不对其准确性、完整性和及时性做出任何保证,对投资者据此进行投资所造成的一切损失不承担任何责任。