耗电量相当核反应堆运行15分钟，英伟达开源的StyleGAN3果然残暴

机器之心报道

编辑：杜伟

整个项目在 NVIDIA V100 内部集群上消耗了 92 个 GPU year 和 225 兆瓦时的电力，英伟达的 StyleGAN3 果然「壕气冲天」。

今年 7 月，英伟达 StyleGAN 团队在 NeurIPS 2021 论文《 Alias-Free Generative Adversarial Networks 》中推出了 Alias-Free GAN，也即 StyleGAN3。

论文地址：https://arxiv.org/pdf/2106.12423.pdf

我们知道，典型的 GAN 具有分层卷积性质，但它们的合成过程过度依赖于绝对像素坐标。这就导致图像细节会粘连在坐标上，而不在描述对象的表面。因此，英伟达的研究者探究导致生成器网络中出现混叠的 careless 信号处理的根本原因。通过将网络中所有信号解读为连续性，他们进行了普遍适用的、小的架构变化，保证多余信息不会参与分层合成过程，并由此得到了 StyleGAN3。

与 StyleGAN2 相比，StyleGAN3 获得了类似的 FID，但内部表征存在显著差异，并在亚像素尺度上实现了真正的图像平移和旋转不变性，从而大幅度提升生成图像的质量。研究者在论文中表示，StyleGAN3 为更适用于视频和动画的生成模型铺平了道路。

我们从以下两个 Demo 可以看出 StyleGAN3 和 StyleGAN2 的效果差异，StyleGAN3 在头发、胡须、笑容等的转换、移动方面更加地流畅、平滑。

当时，StyleGAN3 没有开源代码。近日，英伟达终于上传了 StyleGAN3 的官方 PyTorch 实现。短短一天时间，GitHub 获星 1.4k。

GitHub地址：https://github.com/NVlabs/stylegan3
项目主页：https://nvlabs.github.io/stylegan3/

不过，英伟达的 StyleGAN3 项目消耗了令人难以想象的资源和电力。研究者在论文中表示，整个项目在 NVIDIA V100 内部集群上消耗了 92 个 GPU year（即单个 GPU 一年的计算）和 225 兆瓦时（Mwh）的电力。

对此，有网友评论称，「225 兆瓦时的电力相当于整个核反应堆运行大约 15 分钟，果然「残暴」啊！」

英伟达StyleGAN3 的开源也让用户的「脑洞」大开，推特上一位大神 @RiversHaveWings「玩出了花」。

StyleGAN3 新特性

StyleGAN3 库是 StyleGAN2-ADA 官方 PyTorch 实现的更新版，具有以下几个新特性：

Alias-free 生成器架构和训练配置（stylegan3-t 和 stylegan3-r）；
提供交互式可视化（visualizer.py）、频谱分析（avg_spectra.py）和视频生成（gen_video.py）的工具；
同变性度量（eqt50k_int、 eqt50k_frac 和 eqr50k）；
其他改进：减少内存使用、训练速度略升以及 bug 修复。

就兼容性来说，StyleGAN3 兼容使用 stylegan2-ada 和 stylegan2-ada-pytorch 创建的旧的网络 pickles，支持 ADA 和迁移学习等旧的 StyleGAN2 训练配置，并提升了与英伟达 Ampere GPU 和更新版本 PyTorch、CuDNN 等的兼容性。

安装要求

安装 StyleGAN3 时需要满足以下一些要求：

支持 Linux 和 Windows 系统，但从性能和兼容性两方面考虑，建议使用 Linux 系统；
1 到 8 块至少 12G 内存的高端英伟达 GPU。团队已经使用 Tesla V100 和 A100 GPU 完成了所有测试和开发；
64-bit Python 3.8 和 PyTorch 1.9.0（或更新版本）；
CUDA 工具包 11.1 或更新版本；
用户可以使用 Miniconda3，通过以下命令创建 StyleGAN3 Python 环境：conda env create -f environment.yml
和 conda activate stylegan3；
对于 Docker 用户，确保自己正确安装英伟达 Container Runtime (https://docs.docker.com/config/containers/resource_constraints/#gpu)，并使用提供 Dockerfile 创建具有所需库依赖的映像。

交互式可视化工具

StyleGAN3 库包含一个交互式模型可视化工具，可用于探索训练模型的各种特性。工具启动前需要运行以下代码

可视化界面如下所示：

StyleGAN3 的更多细节详见 GitHub 项目。

参考链接：https://www.reddit.com/r/MachineLearning/comments/q6ark8/r_stylegan3_aliasfree_generative_adversarial/

耗电量相当核反应堆运行15分钟，英伟达开源的StyleGAN3果然残暴

5月9日俄乌最新：纪念日的超大规模袭击

随州花2.7亿元建公墓，强制居民购买？

郑州今年的杨柳飞絮咋这么多官方回应

米切尔29+7+8骑士1-1凯尔特人塔图姆25+7+6

嫦娥六号总设计师在直播说：没有找到美国阿波罗号登陆的那个盆地

乌军前总司令扎卢日内被解除现役

捷克批评西方在乌克兰问题上糊涂：你们看不出现在和二战前多像吗

紧急提醒：太毒了！广东最近密集出现有人碰后发烧

上海一家32楼业主拆掉承重 3墙1柱1梁全没了

急哭！上海一家三口均患智力残疾，唯一的房子被亲人骗走...这要逼到绝路？

荷兰警方推土机拆除位于阿姆斯特丹的哈马斯支持者营地，该硬就硬

每公斤高达160元！第一波上市浙江老板：不够卖

众生相！新疆喜极而泣队长比4手势目标夺冠王世龙快哭了被喊下课

民政部：全国低收入人口动态监测平台监测对象超8千万人

创维汽车创始人称其车能“缓解高血压”，医学专家：有夸大宣传之嫌

游客四川峨眉山阎王坡遇见一群骡子背重物爬坡有一匹边走边吐血

勒沃库森连追2球+绝平！总比分4-2淘汰罗马携49场不败进欧联决赛

信阳一小学多名学生在校就餐后呕吐腹泻送医官方通报

南京“史诗级”晚霞，疯狂心动！

深圳王婆说媒现场遇冷无人光顾天选打工人眼里只有工作没有爱情

耗电量相当核反应堆运行15分钟，英伟达开源的StyleGAN3果然残暴

5月9日俄乌最新：纪念日的超大规模袭击

随州花2.7亿元建公墓，强制居民购买？

郑州今年的杨柳飞絮咋这么多 官方回应

米切尔29+7+8骑士1-1凯尔特人 塔图姆25+7+6

嫦娥六号总设计师在直播说：没有找到美国阿波罗号登陆的那个盆地

乌军前总司令扎卢日内被解除现役

捷克批评西方在乌克兰问题上糊涂：你们看不出现在和二战前多像吗

紧急提醒：太毒了！广东最近密集出现 有人碰后发烧

上海一家32楼业主拆掉承重 3墙1柱1梁全没了

急哭！上海一家三口均患智力残疾，唯一的房子被亲人骗走...这要逼到绝路？

荷兰警方推土机拆除位于阿姆斯特丹的哈马斯支持者营地，该硬就硬

每公斤高达160元！第一波上市 浙江老板：不够卖

众生相！新疆喜极而泣队长比4手势目标夺冠 王世龙快哭了被喊下课

民政部：全国低收入人口动态监测平台监测对象超8千万人

创维汽车创始人称其车能“缓解高血压”，医学专家：有夸大宣传之嫌

游客四川峨眉山阎王坡遇见 一群骡子背重物爬坡有一匹边走边吐血

勒沃库森连追2球+绝平！总比分4-2淘汰罗马 携49场不败进欧联决赛

信阳一小学多名学生在校就餐后呕吐腹泻送医 官方通报

南京“史诗级”晚霞，疯狂心动！

深圳王婆说媒现场遇冷无人光顾 天选打工人眼里只有工作没有爱情

郑州今年的杨柳飞絮咋这么多官方回应

米切尔29+7+8骑士1-1凯尔特人塔图姆25+7+6

紧急提醒：太毒了！广东最近密集出现有人碰后发烧

每公斤高达160元！第一波上市浙江老板：不够卖

众生相！新疆喜极而泣队长比4手势目标夺冠王世龙快哭了被喊下课

游客四川峨眉山阎王坡遇见一群骡子背重物爬坡有一匹边走边吐血

勒沃库森连追2球+绝平！总比分4-2淘汰罗马携49场不败进欧联决赛

信阳一小学多名学生在校就餐后呕吐腹泻送医官方通报

深圳王婆说媒现场遇冷无人光顾天选打工人眼里只有工作没有爱情