据报道,日本电信巨头软银集团将在未来两年投资1500亿日元(9.6亿美元)升级其计算设施,该计划包括大量采购英伟达GPU。除了采用GPU来驱动其内部的大型语言模型(LLM),软银还将为需要超算服务的企业客户提供访问权限。

打开网易新闻 查看更多图片

这笔投资将使软银去年在计算基础设施投入的200亿日元(1.3亿美元)相形见绌,据日经新闻报道,这是日本公司中规模最大的此类投资。

GenAI的发展和应用并没有放缓的迹象,软银因此希望开发日语版GenAI满足用户需求。

软银在去年3月成立了一个新部门,负责开发LLM和提供GenAI服务。该部门随后于去年8月作为软银的一家子公司SB Intuitions成立。

SB Intuitions在去年10月完成了其计算平台的部署,并正在开发其首个国产LLM,该项目将在今年推出,拥有3500亿个参数。这将使其功能比OpenAI拥有1750亿个参数的GPT-3更强大,但远低于据称有100万亿个参数的GPT-4。

令人关注的是,OpenAI在本月早些时候表示在东京开设了一个新的办事处,并开始向日本企业提供日语版GPT-4的早期服务。软银因此面临着加快提供可行替代方案的压力。

软银的AI计算平台运行在英伟达的硬件上,特别是采用2000多个英伟达Tensor Core GPU构建的Nvidia DGX SuperPOD AI超级计算机。鉴于这两家公司的良好合作,软银有理由在其AI超级计算扩张计划中选择英伟达。

此外,法国电信集团伊利亚特集团(Iliad) 在去年9月展示了一台SuperPOD,该公司声称这是欧洲最强大的AI超级计算机。但正在致力抢占GenAI硬件市场份额的英伟达推出了性能更强的AI超级计算机。

去年5月,英伟达将Grace GPU与Hopper GPU结合在一起创建了Grace Hopper芯片,这是一条专门为GenAI设计的芯片。英伟达即将推出的DGX GH200超级计算机将使用256个Grace Hopper,并将计划向那些希望自己构建LLM的公司销售。

虽然目前还没有Grace Hopper定价的消息,但肯定会贵得令人瞠目。然而,考虑到目前竞争激烈的GenAI市场,像软银这样的公司可能会认为在AI方面加大投资将会物有所值。