6月14日,华为云华东(芜湖)数据中心正式开服!

打开网易新闻 查看更多图片

该数据中心位于芜湖数据中心集群,总规划占地6000亩,按照Uptime Tier3、国标A级标准设计。

打开网易新闻 查看更多图片

华为云的这个“开服”,意义重大!

首先,看地理位置的特殊性

芜湖数据中心集群是全国十大数据中心集群之一和国家“东数西算”重大战略工程,属于“东数西算”8大枢纽节点之一。

而华为云“芜湖”节点则是该集群首个开服的智算中心,“先发”优势明显。

打开网易新闻 查看更多图片

芜湖开服后,三大核心枢纽乌兰察布、贵安、芜湖构成铁三角,覆盖全国所有核心算力集群。

至此,华为云全国存算网云核心枢纽布局,成了!

全国AI算力一张网,通过即开即用的昇腾AI云服务,覆盖全国的“用数”地区。

打开网易新闻 查看更多图片

尤其是以长三角为核心的中东部地区的算力高需求区,华为云芜湖智算中心可提供更低时延的算力,助力长三角AI产业发展。

打开网易新闻 查看更多图片

第二,看技术先进性

华为云(芜湖)数据中心包含了诸多技术亮点:

❶采用了多元算力对等池化架构:

通过分布式QingTian架构实现CPU、NPU、GPU、内存等各种资源统一抽象、池化,提升算力规模。不仅支持资源横向扩展,更支持纵向扩展,还可以任意组合。

打开网易新闻 查看更多图片

通俗点讲:就是算力规模更大,同时资源的切分和调度更智能,网络更快。让用户更快捷、方便地训练各种尺寸规模的模型。

❷云化昇腾AI算力:

基于华为云昇腾AI云服务,提供云化智算能力,弹性调度、训推一体,即开即用。

打开网易新闻 查看更多图片

❸安全可信

等保4+,保障全生命周期数据安全。

打开网易新闻 查看更多图片

❹闪电交付,全生命周期高可用设计

全球首创了机房产品化交付模式,3个月可交付数据中心机房,3个月交付AI全液冷集群。

打开网易新闻 查看更多图片

❺绿色低碳

液冷年均PUE1.1,机柜电力利用率超过90%,而业界均值仅为60%。

打开网易新闻 查看更多图片

第三,算力的尽头是上云

“芜湖”开服,展示了华为云数据中心建设上的多重软硬实力。

而这背后,华为云更核心的目标,是通过全国AI算力一张网,解决智能时代的业界共性大难题:算力荒

打开网易新闻 查看更多图片

过去一年来,圈里人喊得最多就是:缺算力,尤其缺优质算力!

不得不说,现在大模型“太能吃了”。

打开网易新闻 查看更多图片

虽然各地也风起云涌,建起了不少“智算中心”,但这种相对独立的本地化“算力烟囱”,并不能很好的缓解算力荒问题。

本地化智算中心建设周期长、成本高,更大的问题是弹性不够,按需服务能力差,“近水解不了远渴”。

打开网易新闻 查看更多图片

所以,云化算力是解决算力荒的出路。

但是,云化算力也有缺陷,比如时延、交付的便利性、平台易用性。

打开网易新闻 查看更多图片

所以,要想用云化算力解决算力荒,就必须先解决这几个瓶颈,拿出更优的方案。

而这个云化算力的“更优解”,就是「华为云昇腾AI云服务」。

打开网易新闻 查看更多图片

借这次芜湖“开服”之机,华为云昇腾AI云服务的能力,也得到了进一步的加强。

第四,“昇腾”,云化算力的更优解

华为云昇腾 AI 云服务:包括了云化算力、AI 开发生产线 ModelArts 和 AI 开发者生态 AI Gallery。

三大组件就是要突破常规云化算力的瓶颈,提供低延迟、高可用、高易用的智算服务。

算力使用模式层面,支持各种规模和场景的大模型训推算力需求。

打开网易新闻 查看更多图片

算力管理层面,通过AI开发生产线ModelArts,提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,大幅提升易用性。

打开网易新闻 查看更多图片

同时,支持多样化算力部署模式:既可以利用端侧已部署的算力,端云协同;也可以云端远程推理,以云助端。

打开网易新闻 查看更多图片

昇腾AI云服务除了支持华为全场景AI框架昇思MindSpore外,还支持Pytorch、Tensorflow等主流AI框架

框架中90%的算子,都可以通过华为端到端的迁移工具平滑迁移到昇腾平台。

打开网易新闻 查看更多图片

此外,云化算力的优质交付,避不开优秀的算网存等配套系统来保障。

在昇腾AI云服务的背后,还有分布式QingTian架构、全球存算网KooVerse、AI原生存储、盘古大模型这些协同作战的“小伙伴”。

比如新升级的分布式QingTian架构,实现多元算力对等互联,突破算力边界。

打开网易新闻 查看更多图片

所有这些合力,把华为云昇腾AI云服务,打造成百模千态首选底座、“6A级算力沃土”。

1A、故障恢复快

Fault recovery Acceleration

云上集群故障可以做到1分钟发现、 5 分钟诊断,10 分钟恢复,最大化保障训练任务的连续性。

打开网易新闻 查看更多图片

2A、资源获取快

Access Acceleration

模型训练可一键接入贵安、乌兰察布、芜湖、中国香港4大AI算力中心,支撑万亿参数大模型、百P数据训练。

打开网易新闻 查看更多图片

3A、模型迁移快

Migration Acceleration

昇腾AI云服务支持业界各类框架、加速库及三方社区生态,可快速、无损实现模型和应用的迁移适配,并提供端到端昇腾迁移工具链,自动化迁移工作可从4周缩减至2周。

打开网易新闻 查看更多图片

4A、就近服务延时优

Latency Advantage

想要低延迟,除了网络质量好,就近接入也很重要。

华为云核心枢纽铁三角建成后,就近覆盖周边需求,构成10ms时延圈,训推延迟低至2ms

打开网易新闻 查看更多图片

5A、云上性能优

Yield Advantage

华为云通过持续的算子优化、显存优化、通讯优化,持续提升集群性能,多卡集群损耗小,线性度>90%,远高于本地“草台班子”集群。

打开网易新闻 查看更多图片

6A、云上推理投资优

Investment Advantage

训练是短期行为,但推理具备长期性和不确定性,峰谷特征明显。

通过昇腾AI云服务的弹性扩缩容,资源按需付费,让不确定的推理资产投资变得可控,成本控制更优。

打开网易新闻 查看更多图片

想象一下,当你准备开启大模型训推之旅的时候,有个“六边形算力战士”一路相伴,是不是心里就有底了呢?

打开网易新闻 查看更多图片

如此,除了极致的高性价比智算产品和服务,华为云还在不断完善智算生态。

这包括华为云AI Gallery一站式AI社区服务平台,D-Plan AI生态伙伴计划等等。

打开网易新闻 查看更多图片

芜湖新节点开服,全国存算网云核心枢纽布局完成,华为云昇腾AI云服务也迎来了大升级:辐射力更强,交付更便捷,功能更完善。

算力的尽头是上云,华为云带来云化算力的更优解,彻底告别算力荒!