究竟是什么样的大模型,居然让吴恩达博士如此兴高采烈?

打开网易新闻 查看更多图片

吴恩达收过最好的生日礼物

作为全球人工智能和机器学习领域国际上最权威的学者之一,吴恩达(Andrew Ng)博士在全球科技圈可以说是家喻户晓。

在人工智能和机器学习领域深耕多年的吴恩达博士,曾经是Google Google Brain(深度学习)项目的创始负责人,曾经担任过百度首席科学家兼副总裁,后来又成立了AI Fund投资基金,投身于AI创业项目的投资与管理。

2024年4月12日,亚马逊发布公告称,欢迎吴恩达博士加入亚马逊董事会,该任命自2024年4月9日起生效。

就在吴恩达博士正式成为亚马逊董事会成员之后,美国当地时间4月18日,Meta发布了其最新的开源大模型Llama 3,将数据和规模提升到了新的高度。

作为坚定的AI开源倡导者,吴恩达得知这一消息后兴奋地表示:“Meta在我生日这天发布的Llama 3大模型,是自己收到过最好的生日礼物!感谢Meta!”

Llama 3加入亚马逊云科技“豪华套餐”

Meta此次发布的开源大模型Llama 3,包括了Llama 3 8B和Llama 3 70B两款大模型,其中8B版本适合在消费级GPU上高效部署和开发;70B版本则专为大规模AI应用设计。每个版本都包括基础和指令调优两种形式。

作为迄今为止最强大的Llama模型,Llama 3使用的训练数据集是Llama 2数据量的7倍,其中包括了4倍数量的代码。同时Llama 3支持8000个上下文长度,这个数字是Llama 2容量的两倍。在Meta公布的AI基准测试中,Llama 3 70B的表现甚至超越了谷歌的Gemini Pro1.5以及Anthropic的Claude 3 Sonnet。如此惊艳的性能表现,足以让任何对开源大模型的疑虑都烟消云散。

Llama 3大模型发布之后,亚马逊云科技就在第一时间表示,客户已经可以通过亚马逊云科技的Amazon SageMaker JumpStart使用这两款模型。

伴随着Meta Llama 3的加入,亚马逊云科技目前提供的“大模型豪华套餐”,已经包括了通过Amazon Bedrock提供的来自AI21 Labs, Amazon, Anthropic, Cohere, Meta, Mistral AI和Stability AI的领先大模型,以及通过Amazon SageMaker JumpStart提供的包括Meta Llama 3在内的各种大模型,可谓盛况空前。

打开网易新闻 查看更多图片

部署Llama 3大模型带来的收益

不论是AI开发者还是用户,一定都非常迫切地想要知道如何通过亚马逊云科技旗下的Amazon SageMaker JumpStart,来发现部署Llama 3并运行推理。

作为亚马逊云科技专门构建的机器学习中心,Amazon SageMaker JumpStart能够提供预训练的模型、内置算法和预构建的解决方案,帮助客户快速开始机器学习项目。通过Amazon SageMaker JumpStart部署Llama 3,客户能够获得诸多的收益:

1、降低部署所需的时间:在SageMaker JumpStart登录页面中,用户能够通过以模型提供商命名的不同中心轻松发现各种模型,也可以通过搜索快速定位找到自己需要部署的模型,并通过简单的设置即可轻松部署。

2、提供灵活的部署路径,用户能够用自己惯用的部署方式来进行:通过SageMaker Studio UI和SageMaker Python SDK中的SageMaker JumpStart访问基础模型。

3、丰富的功能支持来加速开发:客户能够利用SageMaker Pipelines、SageMaker Debugger或容器日志等功能,来提升模型性能和并实施MLOps控制

4、安全的隔离环境:上述方式部署的模型将始终处在亚马逊云科技的安全环境下,由客户的VPC控制,以确保数据安全。

亚马逊云科技推动AI技术普惠

凭借在生成式AI与大模型领域的诸多创新与实践,亚马逊云科技很早就认识到,没有一个模型可以适用于所有的场景,这也是其一直都在不断充实和丰富大模型“豪华套餐”的根本原因。如今Llama 3大模型的发布,意味着广大用户在大模型上又有了更加多样化的选择。

在2023年11月底的re:Invent 2023主题演讲中,亚马逊云科技首席执行官Adam Selipsky就曾经表示:“事情发展得如此之快,在这种环境中,适应能力是您可以拥有的最有价值的能力。不会有一个统治一切的模型,也肯定不会有一家公司能提供所有人使用的模型。”

Adam Selipsky指出,用户在选择最优技术的同时,还应该有多个模型提供者的选项,以考察谁不仅技术过硬,还能作为自己商业上可依赖的伙伴。在亚马逊云科技的整个历史中,一直都在强调这种选择的需要,这也是亚马逊云科技在谈论生成式AI战略时明确阐述的方法,让构建和调用一系列基础模型变得像API调用一样简单。

“我们在亚马逊云科技中构建的,不仅仅是一个引人注目的应用程序或基础模型。这些服务在堆栈的所有三个层次上构成了一套基础服务,从而实现下一个划时代的人工智能阶段普惠化,并将为内外部构建者赋能,以转变我们所知道的几乎每一个客户体验,或是创造全新的客户体验。我们乐观地认为,这种改变世界的人工智能大部分将建立在亚马逊云科技上。”亚马逊首席执行官安迪·贾西(Andy Jassy)表示。