港股研究社讯,4月23日下午,人工智能领军企业商汤科技在上海举行的技术开放日上,发布了其最新的“日日新SenseNova”5.0多模态大模型系列。

该产品采用了混合专家(MoE)架构,并支持高达10T Tokens的中英文训练数据与推理合成数据,数量达到数千亿Tokens。其推理时上下文窗口可有效达到200K左右,综合能力全面对标GPT-4 Turbo。

打开网易新闻 查看更多图片

商汤科技董事长兼CEO徐立表示,这是行业内首个覆盖“云、端、边”的全栈大模型产品矩阵,能够满足不同规模场景的应用需求,并加速生成式AI技术向产业的全面落地。公司将基于其大模型的研发成果,不断探索KRE三层架构(知识-推理-执行)的能力边界,以推动技术的持续突破。

董事长兼CEO徐立指出,商汤科技在尺度定律(Scaling Law)的指导下,致力于推进大模型的研发,并将2024年视为端侧大模型爆发的关键年份。他认为,未来大模型的发展将依赖于资源投入、软硬件基础设施以及对性能提升的需求,这将导致只有少数几家企业能够从事大模型的研发,避免形成“百模”或“千模大战”的局面。

财报显示,商汤基于生成式AI的收入在2023年达到了12亿元人民币,同比增长200%。同时,公司的大模型基础设施SenseCore总算力规模翻倍增长至12000 petaFLOPS,运营GPU数量达到了4.5万张。其中,国产算力2000P,完成了58款国产芯片的适配和应用。此外,生成式 AI 业务中超过70%的客户在过去12个月内是商汤的新客户,剩下30%的存量客户的客单价也录得约50%的增速。截至3月,订单金额超过千万人民币的客户数已达到数十家,日日新赋能C端的调用量实现近120倍的增长。

据悉,商汤科技将愿景和战略目标转型为“将AGI作为核心战略目标,以期在未来几年内实现AGI技术的重大突破”。基于此变革,公司建立并执行AI for All的发展目标,将重点放在打造通用能力的多模态大模型以及垂直行业、更具专长的专业大模型上,从根本上降低大模型的下游应用成本和门槛。