ChatGPT以刷新人类史上APP传播速度历史的姿态席卷全球,业外人惊叹于其智力,而业内人士则惊叹于其算力。

打开网易新闻 查看更多图片

近日,OpenAI宣布了付费订阅版ChatGPT Plus,每月收费20美元。收费的原因很简单,ChatGPT高速增长的成本让OpenAI吃不消了而ChatGPT成本的主要支出方向就是算力。ChatGPT对算力的消耗可以分为三个主要场景:

一是模型预训练。ChatGPT之所以聪明,是通过反复模型训练而来的,据了解,GPT-3.5模型包含超过1746亿个参数,训练一次ChatGPT所需算力高达3640 PFlop/s-day的算力。(即假如每秒计算一千万亿次,也需要计算3640天。)

二是模型迭代。ChatGPT模型并不是静态的,而是需要不断进行模型调优,以确保模型处于最佳应用状态,而模型迭代同样需要庞大算力支持。

三是用户交互。全球用户都在“调戏”ChatGPT,在这背后,与用户交互带来的数据处理需求同样庞大算力支持。

有媒体测算过,ChatGPT单月运营所需算力约 4874.4PFlop/s-day,全年则需要58.5EFlop。怎么理解这个算力规模呢?如果使用算力500P的常规数据中心来支撑ChatGPT的运行,至少需要10个这样的数据中心。

更关键的是,这只是当前状态,准确来说是1月份时的状态,随着在全世界范围内的火爆,当前算力需求应该翻倍了。据OpenAI测算,自2012年以来,全球头部AI模型训练算力需求3-4个月翻一番,每年头部训练模型所需算力增长幅度高达10倍。

当前,ChatGPT是依托在微软 Azure之上的,事实上,也只有像Azure这样的全球领先的云服务商巨头才能供给如此之大、增长如此之快的算力需求。

谈到这里,我们可以下一个基本判定:拥有越丰富的算力资源,就能够训练出越优秀的AI模型,就将拥有越强大的智力。

未来大国之争的本质其实就是智力之争,而智力之争的前提则是算力之争。

数字经济时代,算力就是最底层的驱动器,叠加AI浪潮,海量计算将成为新常态。无人驾驶、智慧城市、智能交通、智慧金融、仿生科技、生命医学、气候预测以及农业精细化等,都离不开超大算力。

那算力从何而来呢?两个途径:

一是通过超高性能芯片提供强悍的算力。比如,微软用以支撑ChatGPT的算力基础设施至少使用了上万张英伟达GPU A100显卡算力集群。但是,当前美国政府禁止英伟达对中国市场销售顶尖GPU A100芯片,中国云厂商目前只能获取限制算力的版本。中国要在短时间内在超高性能芯片上取得突破,从当前看来,很难。

二是通过云计算实现算力的规模聚集和灵活调用,提升算力供给效率。这条路对中国而言更有现实意义,国家启动“东数西算”工程,目的也正在于此,通过构建全国一体化的新型算力网络,优化数据中心建设布局,将东部算力需求有序引导到西部,利用西部的资源优势,为数字中国的发展提供低成本的优质算力。

从当前看,基于强大的算力支撑,美国云厂商正把竞争焦点带进了云计算的下个阶段:AI计算。美国各大云厂商都在大规模部署AI算力。中国如果不能跟上这一步,未来在国家智力的对决上将难以匹敌。

打开网易新闻 查看更多图片

所以说,为国建云,已经到了刻不容缓的地步。

而为国建云从逻辑上可以分为两个层面,一是提升计算能力,二是提升资源能力。

国内业界也在围绕这两条路径在努力,比如,在提升计算能力方面,阿里云打造的张北超级智算中心,以先进的技术架构,将衡量算力效率的核心指标“千卡并行计算效率”,从传统架构的40%提升至90%,可将算力资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。

而在提升资源能力方面,中国移动动云在全国范围内构建“N+31+X”分布式算力资源池,覆盖全国主要中心城市,全面匹配“东数西算”八大枢纽战略布局,建成3000+边缘节点,形成超大规模且遍布全网的云边协同资源。近日,中国移动算网布局再升级,在内蒙建成了首个5G超高清互动视频算力中心,这是移动云节点规模最大的GPU异构算力资源池,将满足大数据量转发、人工智能、图像渲染等场景的低时延与高带宽需求。

结语

在当下的大国竞争中,算力是至关重要的战略资源。算力之强弱,将直接深度影响新技术的研发,影响全社会的创新能力和智力水平,影响社会变革进程,进而影响国家实力。在当前的时刻,为国建云,有着现实且迫切的意义。