12月4日,云计算产业盛会2024亚马逊云科技re:Invent大会进入第三日,亚马逊云科技数据与人工智能部门副总裁Swami Sivasubramanian的开场白是:“颠覆已成为常态,而快速创新是当下必备要素。”
作为创造者、思考者及技术的探索者,当我们回望历史长河,不难发现,人类始终怀揣着超越自然、突破极限的深切渴望,在前人智慧的基石上不断攀登新的高峰。终有一日,我们迎来了那决定性的一刻——每一份微小的进步汇聚成河,共同铸就了超越各部分简单叠加的伟大成就。而今,我们又站在新的历史转折点:海量数据集与强大计算能力的云端融合,为人工智能的蓬勃发展铺设了完美的舞台。借助生成式人工智能的东风,新型工具与用户界面正以惊人的速度被广泛应用,不仅极大地提升了工作效率,更为我们每一个人解锁了前所未有的创造力潜能。
下一代Amazon SageMaker:一站式数据处理和机器学习平台
Swami表示,随着数据分析与AI的深度融合,客户需要以日益紧密相连的方式运用数据——从对历史数据的深入分析,到机器学习模型的训练,再到生成式人工智能应用的开发,需要一个统一的入口,这是Amazon SageMaker品牌全新升级的初衷。面对下一代Amazon SageMaker,亚马逊云科技将客户所需的快速SQL分析、PB级大数据处理、数据探索和集成、模型开发和培训以及生成人工智能(AI)所需的功能整合到一个集成平台中,可以一站式解决生成式AI全生命周期问题。
从现在开始,原有的Amazon SageMaker变更为Amazon SageMaker AI。自去年以来,Amazon SageMaker已经拥有140多项新功能,以帮助客户更快、更高效地构建模型。
在re:Invent大会期间,Amazon SageMaker推出了三大更新,包括:Amazon SageMaker HyperPod flexible训练计划、Amazon SageMaker HyperPod任务治理及亚马逊云科技合作伙伴开发的AI应用在Amazon SageMake可用。
1)Amazon SageMaker HyperPod flexible训练计划
基于这一更新,可以极大地缩短预训练时间。想象一下,训练一个大型语言模型需30天,且加速器实例紧俏。您得费时跨区搜罗容量,还得管理分散的实例、保存恢复检查点及迁移数据。若计算需求和时间框架不明确,整个过程极为繁琐,这也是Amazon SageMaker HyperPod flexible training plans推出的根本原因。基于最新更新,用户可轻松制定训练计划,自动预留容量,一站式完成集群设置和作业创建,大幅节省时间。
Amazon SageMaker HyperPod依托EC2,依据用户的时间安排与预算限制,规划最优训练方案。以上述案例为例,Amazon SageMaker HyperPod将清晰展示加速模型训练所需的时间段与可用区域,凭借高效的检查点保存与恢复系统,自动应对所有实例中断情况,确保训练任务在全球范围顺畅无阻,全程无需人工介入,这一服务无疑将成为改变生成式AI游戏规则的关键。
2)Amazon SageMaker HyperPod任务治理
企业可以灵活设置模型任务,更好地分配计算资源。在实际工作中,客户面临的另一个挑战是如何高效地管理多个团队和项目的计算资源,多个推理项目、多个训练项目以及微调和实验项目同时运行,所有这些项目都在争夺相同的计算资源。针对这种情况,亚马逊云科技为了消除手动调整的繁重工作,提高计算分配的速度和利用率,建立了实时分析和建议引擎,开发了一种动态分配计算资源的解决方案,这一能力帮助企业在项目开发中将计算的利用率提高到90%以上。
这是Amazon SageMaker HyperPod task governance发布的主要目的,通过自动化很多关键任务的优先级排序和管理,帮助用户最大化提升计算资源的利用率,成本降低可达40%。通过高性能任务治理,可以轻松地设定优先级,包括从推理到微调、训练等多种模型任务。亚马逊云科技数据和AI副总裁Rahul Pathak表示,新功能将动态分配工作负载,使客户能够在特定时间(例如:数据科学家和AI工程师睡觉时)执行任务,为大型集群工作负载赋能。
3)亚马逊云科技合作伙伴开发的AI应用在Amazon SageMake可用
为了打造一站式平台,Amazon SageMaker将很多第三方合作伙伴的工具放入进来。该平台囊括了用户希望使用的第三方常用的AI apps,包括comet、deepchecks、fiddler以及LAKERA。现在,客户可以利用Amazon SageMaker的强大AI功能来构建和训练他们的机器学习模型,并通过他们常用的第三方应用程序在这里轻松使用。
值得一提的是,这些第三方应用程序涵盖了企业用例中的各种任务,如跟踪和管理训练实验、评估模型的通话质量、监控模型在生产中的性能以及保护企业AI广告免受安全威胁等,这也是众多客户更愿意选择Amazon SageMaker来训练和部署他们的基础模型的原因。
Amazon Bedrock:选择权利大于一切
Amazon Bedrock的特色是“模界卷王”。自2023年4月推出以来,Amazon Bedrock已成为亚马逊云科技在生成式AI领域的一项重要工具集合。它为用户提供了一个全面且强大的平台,使用户能够利用自己的预训练基础模型Amazon Titan,以及来自AI21 Labs、Anthropic、Stability AI等第三方公司的高性能模型,这些选项几乎可以完成任何任务,从而构建出各种创新的生成式AI应用程序。
而在周二,Amazon Bedrock还推出了Nova系列模型,包括Nova Micro、Nova Lite、Nova Pro、Nova Premier、Nova Canvas和Amazon Nova Reel。这些模型覆盖了从轻量级到专业级的各种需求,为用户提供了更加灵活多样的选择。
大会现场,三大模型强势登陆Amazon Bedrock,包括专为软件开发设计的代码生成工具poolside、最新的文本转图像大模型Stable Diffusion 3.5以及视频生成模型Luma Al。
以poolside为例,poolside Assistant的强大之处在于其自然语言理解和代码生成能力。开发者只需通过简单的自然语言描述需求,poolside Assistant就能快速生成高质量、可运行的代码片段。这种“所见即所得”的开发方式,大大降低了开发门槛,使得即使是编程经验不丰富的开发者也能轻松上手,快速实现自己的创意。
通过其Malibu和Pointe模型,poolside为开发者提供了一个强大的工具集,涵盖了从代码生成到测试、文档编写等多个关键环节,极大地提升了开发效率和代码质量。
亚马逊云科技作为首家提供poolside Assistant访问权限的云提供商,通过庞大用户基础和丰富的云服务资源,也为poolside的推广和应用提供了广阔的舞台。
此外,Bedrock Marketplace也正式上线,目前已有100多个模型可供选择。这一能力的建立,进一步丰富了Amazon Bedrock的生态系统,使用户能够更加方便地找到适合自己的模型,并与其他开发者分享自己的成果。
尽管模型选择很重要,但这只是构建推理的第一步。开发人员要花费大量时间去评估模型以满足他们的需求,尤其是成本和延迟等因素,需要平衡取舍。
对此,亚马逊云科技推出了新功能,其中包括Amazon Bedrock中的模型蒸馏、自动推理检查、多Agents协作三大全新功能。以新模型蒸馏功能为例,可以轻松地将特定知识从更大、更准确的模型转移到更小、更高效的模型中,提速高达500%,成本降低75%。简单来说,借助模型蒸馏,客户只需为给定的使用案例选择最佳模型,并从同一模型系列中选择较小的模型,即可以适当的成本提供其应用程序所需的延迟。在客户提供样本提示后,Amazon Bedrock将完成所有工作来生成响应并微调较小的模型,如果需要,它甚至可以创建更多样本数据以完成蒸馏过程。这为客户提供了具有大型模型的相关知识和准确性的模型,但较小模型的速度和成本较低,使其成为生产使用案例(如实时聊天交互)的理想选择。
在会上亚马逊云科技还发布了Amazon Bedrock prompt caching、Amazon Bedrock Data Automation(BDA)等多项新功能。AI提示可能是重复性的,Amazon Bedrock prompt caching可以帮助客户节省重复提交相同提示的成本,通过自动缓存重复提示,可以为客户降低90%的成本,还可以减少85%的延迟。Amazon BDA功能它允许Amazon Bedrock Knowledge Base 在其 GenAI 应用程序中支持文档、图像等非结构化数据,使开发人员更容易构建智能文档处理、媒体分析和其他以多模态数据为中心的自动化解决方案。
Amazon Bedrock Knowledge Bases还新增了对结构化(多模态)数据的支持,以及对GraphRAG的支持,更有助于提高模型输出质量和减少幻觉。
Amazon Q:加快生成式AI的商业化落地
Amazon Q,作为亚马逊云科技专门为企业打造的生成式人工智能赋能的助手,能够帮助用户快速开始使用生成式人工智能,从开发人员到数据分析师再到业务用户,提高整个团队的生产力。它由Bedrock提供支持,具有强大的基础模型和代理能力,可帮助用户以明确的目的和方向解决复杂的问题。
Amazon Q 由 Amazon Q Developer、Amazon Q Business、Amazon Q Apps 三部分组成,本次核心更新主要体现在Amazon Q Developer上。
Amazon Q Developer覆盖了软件开发的每一个关键环节,从代码生成、输入处理、功能开发,到测试编写、文档创建,全程助力。它不仅能够加速传统应用程序的转型升级,还能大幅简化开发流程,高效调试运营中的各类事件。
虽然Amazon Q Developer去年才推出,但已经取得令人瞩目的成绩,在SWE Bench的权威验证排行榜上独占鳌头。面对这一业界公认的高难度编码挑战基准测试中,Amazon Q Developer展现出了惊人的实力,成功解决了54.8%的开发难题。与七个月前我们首次关注排行榜时相比,其解决问题的能力实现了翻倍式的增长,进一步彰显了其不断攀升的技术实力与卓越性能。
此次Amazon Q Developer的更新重点是大规模工作负载的简化,比如对于希望摆脱 Windows .NET、VMware 和大型机的客户和合作伙伴来说,新功能推出将改变游戏规则,让用户从耗费人力的任务,例如分析、规划、代码生成和测试中解放出来,从而为客户节省时间和金钱,全面释放业务价值。
另外,Amazon Q Busine的更新表现在与Amazon QuickSight的数据打通上,软件开发商可将Amazon Q集成于应用中,目前Asana、Zoom、PagerDuty等公司现已添加Q插件。
结语:
亚马逊云科技将数据分析与AI深度融合的这一系列举措,不仅让我们看到了技术前沿的各种颠覆式创新,更深刻地揭示了这一融合如何以前所未有的力量重塑商业模式,驱动业务开发的新一轮飞跃。Amazon SageMaker的一站式平台升级、Amazon Bedrock的多元化模型选择与强大功能拓展,以及Amazon Q在加速生成式AI商业化落地方面的卓越表现,共同编织了一幅数据与AI协同并进、共创未来的宏伟蓝图。正如Swami Sivasubramanian所言,颠覆已成为时代的常态,而亚马逊云科技正以前瞻性的视野和强大的技术实力,引领我们迈向一个更加智能、高效、创新的未来。
*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。
点击了解Amazon SageMaker Studio
https://aws.amazon.com/cn/sagemaker-ai/studio/?sc_ichannel=external&trk=a1f80fc7-85af-4b66-a312-f9c10d7ceff8