大模型新皇Claude 3将入驻Amazon Bedrock，公有云成AI创新加速器

2024年3月4日，Anthropic发布旗下最新一代大模型Claude 3系列，引发行业热议。

在推理、数学、编码、多语言理解和视觉方面，Claude 3在多个基准测试上树立了新的标准，性能超越了包括GPT4在内的其他模型，被认为是通用大模型新皇。

与此同时，亚马逊云科技宣布，Claude 3系列将入驻其生成式AI托管服务Amazon Bedrock。亚马逊云科技的客户将可以通过Amazon Bedrock访问Claude 3系列的三个模型——Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku。

Claude 3对于通用大模型发展带来哪些改变？对于更多想要用好大模型的企业，什么是更好的使用通用大模型的方式？以下是笔者的一些观察。

图片来自AI生成

冲破一家独大，Claude3成通用大模型新“卷王”

此次推出的Claude3共有三个模型，性能和价格由低到高为：Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus，也被形象概括为中杯、大杯、超大杯。

其中，Claude 3 Haiku 主打快速紧凑，即时的响应能力。Claude 3 Sonnet 在智能和速度之间取得了理想的平衡，特别适合企业用例。Claude 3 Opus具有深度推理、高级数学和编码能力，在高度复杂的任务上具有领先性能。

Claude 3的领先之处体现在基准性能、视觉能力、复杂开放性问题处理能力等。

基准性能方面，Claude 3在多项AI系统常用评估标准，包括本科级别专业知识（MMLU）、研究生级别专家推理（GPQA）、基础数学（GSM8K），均取得领先业界LLM的性能。

Claude 3的三个模型均具备视觉功能，可以理解不同格式的结构化和非结构化数据，包括图像、图表、图表等。比如，官方演示视频中，Claude 3 Opus可以在几分钟内分析全球经济、未来美国GDP走势等。

对于下图这样的复杂开放式问题， Claude3能够理解物体的外观及其与数学等概念的联系。

此外，Claude3的三个模型都将至少支持200K token的上下文窗口。在200K token的「大海捞针」（NIAH）测试中，Claude 3 Opus准确率超过99%。Claude 3 Haiku 能够3秒读完10k token论文。

笔者认为，目前大模型发展呈现两条不同的路径：

一条路径，围绕如何练好大模型。像OpenAI、Anthropic、Google这样的科技巨头，有能力和资源在通用基础大模型赛道竞争。通用基础大模型的赛道相对同质化，各家都在追求更高更快更强，即更强大更全面的性能。

而且通用大模型的竞争态势一直是动态变化的，任何一家的领先都是暂时的，榜单随时可能被刷新和超越。在这种态势下，任何一家独大，强者恒强未必对行业、对生态更好。

从这个意义上，Claude3能够打破OpenAI长期领先的优势，加速通用大模型卷出更高的智能水平。

另一条路径，围绕如何用好大模型。如何用大模型的能力解决不同行业不同场景下的专业问题，才是绝大多数企业最关注的。在这条路径上，云计算正发挥着举足轻重的价值。

云计算，使用基础大模型的必经之路

目前，AI大模型已经成为云计算厂商的第二增长曲线，全球头部云计算厂商都将AI大模型作为下一个十年发展的必争之地。

如果我们回到企业需求的视角，企业使用基础大模型至少有以下几个核心诉求：

首先，数据安全与合规

数据安全合规是企业使用大模型的首要考量，包括数据泄露风险、数据滥用风险、模型安全漏洞等等。比如，很多企业担心客户信息、商业秘密和个人身份信息等敏感数据泄露。这些都对提供大模型能力的公有云厂商提出了更高的要求。

在如何保障大模型安全使用方面，亚马逊云科技率先做出了很多探索。比如，Amazon Bedrock 处理的任何客户内容都会被加密，并静态存储在客户使用的亚马逊云科技区域中。客户可以使用Amazon PrivateLink建立从Amazon Virtual Private Cloud（VPC）到Amazon Bedrock的私有连接，而无需将VPC暴露给互联网流量。用户输入和模型输出不会与任何模型提供商共享。Amazon Bedrock还提供全面的监控和日志记录功能。

图片来自摄图网

其次，丰富的基础模型选择

没有任何一款大模型可以满足所有需求。

企业在使用大模型时，一定是博采众长，多款并用的。笔者观察到，很多企业在开发垂直领域的企业服务大模型时，底层都接入了不止一个头部大模型。

在头部云厂商中，以亚马逊云科技为例，丰富的基础模型选择也是其在大模型赛道的差异化优势。目前，Amazon Bedrock平台的大模型提供商扩充至7家，包括AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazon和Mistral AI。

“回顾2021年，当 Anthropic第一次开始在亚马逊云科技上构建时，没有人能想到Claude系列模型会带来多大的变革。自Amazon Bedrock于 2023年9月28日全面上线以来的短短几个月内，已有超过10,000名客户使用它，其中许多客户正在使用Claude。”亚马逊云科技数据和AI副总裁Swami Sivasubramanian博士表示。

目前，已经有不少头部企业在云上使用Claude创建生成式AI应用。比如，全球领先的生物制药公司辉瑞正通过Amazon Bedrock使用Claude模型，加速创新癌症治疗方案的研发。通过运用生成式AI技术，辉瑞能够大幅缩短收集相关数据和科学内容所需的时间，进而利用这些内容分析趋势、制定肿瘤学目标并进行验证，从而提高成功概率。

第三，易用的AI平台和工具集

云计算厂商并非仅仅提供AI大模型的底层基础设施和基础模型接口，更关键是提供系统化的AI平台和工具集，帮助企业更好使用大模型进行创新。

比如，Amazon Bedrock推出了丰富的AI功能，包括帮助客户识别、比较模型的模型评估功能、简化生成式AI应用构建并利用专有数据提供定制化响应的知识库功能、模型调优功能、能执行多步骤业务指令的代理功能、实现负责任AI的Guardrails安全功能等。

Claude3的出现，让生成式AI领域再度风起云涌。Claude3不仅刷新了基础大模型的性能，也打破了长期以来通用大模型领域一家独大的市场格局。

同时，亚马逊云科技与Anthropic的强强联合，不仅能让更多企业在云上便捷使用更新更强大的通用大模型，也代表了企业首选在公有云上使用大模型能力和生成式AI的发展趋势。

大模型新皇Claude 3将入驻Amazon Bedrock，公有云成AI创新加速器

冲破一家独大，Claude3成通用大模型新“卷王”

云计算，使用基础大模型的必经之路

AI被连续否定30次：ChatGPT越改越错，Claude坚持自我、已读不回

亚马逊云科技: 全栈联动的大规模创新才能满足客户需求

两个AI关小黑屋：Llama3.1把Claude Opus聊自闭了

超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,编程能力暴增近31％

字节大模型同传智能体，一出手就是媲美人类的同声传译水平

「数字孪生」东京上线！Jim Fan：具身智能零样本迁移现实世界，共享「蜂群思维」

8岁小孩哥上手用AI制作游戏，全程2小时，引来50多万人围观

全世界跑得最快的人形机器人，还能跳科目三都知道波士顿动力的机器人会空翻，那你知道中国品牌宇树科技有

国内开店卷不动，换上AI出海试试

让ChatGPT不敢开口的名字！神秘bug引马斯克围观

肌肉骨骼居然和人类一样。外网爆火的克隆机器人，灵活性超高，胸腔里还复刻了人类的心脏瓣膜，宛如《西部世

搭载ChatGPT的《星际穿越》机器人爆火，马斯克：想要！ ChatGPT复刻版《星际穿越》机器人T

字节AI版小李子一开口：黄风岭，八百里

全球最远1.4米！国产宇树创人形机器人跳远纪录，外网惊叹碾压特斯拉

人形机器人狂奔！山地、草地、公路无障碍，原速演示全程高能

网友一个定积分的WIFI密码，测出了AI数学之王。Grok超强数学思维碾压ChatGPT，引马斯克点

波士顿动力新机器人后空翻视频炸圈！扮作圣诞老人，动作干净丝滑

国产机器狗驮成年小伙遛弯视频爆火，新通勤工具有了

技术的百度：一场未完待续的冒险

摒弃人工标注，AutoAlign方法基于大模型让知识图谱对齐全自动化

大模型新皇Claude 3将入驻Amazon Bedrock，公有云成AI创新加速器

冲破一家独大，Claude3成通用大模型新“卷王”

云计算，使用基础大模型的必经之路

AI被连续否定30次：ChatGPT越改越错，Claude坚持自我、已读不回

亚马逊云科技: 全栈联动的大规模创新才能满足客户需求

两个AI关小黑屋：Llama3.1把Claude Opus聊自闭了

超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,编程能力暴增近31％

字节大模型同传智能体，一出手就是媲美人类的同声传译水平

「数字孪生」东京上线！Jim Fan：具身智能零样本迁移现实世界，共享「蜂群思维」

8岁小孩哥上手用AI制作游戏，全程2小时，引来50多万人围观

全世界跑得最快的人形机器人，还能跳科目三 都知道波士顿动力的机器人会空翻，那你知道中国品牌宇树科技有

国内开店卷不动，换上AI出海试试

让ChatGPT不敢开口的名字！神秘bug引马斯克围观

肌肉骨骼居然和人类一样。外网爆火的克隆机器人，灵活性超高，胸腔里还复刻了人类的心脏瓣膜，宛如《西部世

搭载ChatGPT的《星际穿越》机器人爆火，马斯克：想要！ ChatGPT复刻版《星际穿越》机器人T

字节AI版小李子一开口：黄风岭，八百里

全球最远1.4米！国产宇树创人形机器人跳远纪录，外网惊叹碾压特斯拉

人形机器人狂奔！山地、草地、公路无障碍，原速演示全程高能

网友一个定积分的WIFI密码，测出了AI数学之王。Grok超强数学思维碾压ChatGPT，引马斯克点

波士顿动力新机器人后空翻视频炸圈！扮作圣诞老人，动作干净丝滑

国产机器狗驮成年小伙遛弯视频爆火，新通勤工具有了

技术的百度：一场未完待续的冒险

摒弃人工标注，AutoAlign方法基于大模型让知识图谱对齐全自动化

全世界跑得最快的人形机器人，还能跳科目三都知道波士顿动力的机器人会空翻，那你知道中国品牌宇树科技有