PyTorch小技巧：使用Hook可视化网络层激活（各层输出）

这篇文章将演示如何可视化PyTorch激活层。可视化激活，即模型内各层的输出，对于理解深度神经网络如何处理视觉信息至关重要，这有助于诊断模型行为并激发改进。

我们先安装必要的库:

pip install torch torchvision matplotlib

加载CIFAR-10数据集并可视化一些图像。这有助于理解模型处理的输入。

import torchvision
import torchvision.transforms as transforms
import matplotlib.pyplot as plt
# Transformations for the images
transform = transforms.Compose([
transforms.Resize(256),
transforms.CenterCrop(224),
transforms.ToTensor(),
transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])
# Load CIFAR-10 dataset
trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=4, shuffle=True)
# Function to show images
def imshow(img):
img = img.numpy().transpose((1, 2, 0))
mean = np.array([0.485, 0.456, 0.406])
std = np.array([0.229, 0.224, 0.225])
img = std * img + mean # unnormalize
plt.imshow(img)
plt.show()
# Get some images
dataiter = iter(trainloader)
images, labels = next(dataiter)
# Display images
imshow(torchvision.utils.make_grid(images))

看着很模糊的原因是我们使用的CIFAR-10图像32x32的，很小。因为对于小图像，处理速度很快，所以CIFAR-10称为研究的首选。

然后我们加载一个预训练的ResNet模型，并在特定的层上设置钩子函数，以在向前传递期间捕获激活。

import torch
from torchvision.models import resnet18
# Load pretrained ResNet18
model = resnet18(pretrained=True)
model.eval() # Set the model to evaluation mode
# Hook setup
activations = {}
def get_activation(name):
def hook(model, input, output):
activations[name] = output.detach()
return hook
# Register hooks
model.layer1[0].conv1.register_forward_hook(get_activation('layer1_0_conv1'))
model.layer4[0].conv1.register_forward_hook(get_activation('layer4_0_conv1'))

这样，在通过模型处理图像时就能捕获到激活。

# Run the model
with torch.no_grad():
output = model(images)

通过上面钩子函数我们获得了激活下面就可以进行可视化

# Visualization function for activations
def plot_activations(layer, num_cols=4, num_activations=16):
num_kernels = layer.shape[1]
fig, axes = plt.subplots(nrows=(num_activations + num_cols - 1) // num_cols, ncols=num_cols, figsize=(12, 12))
for i, ax in enumerate(axes.flat):
if i < num_kernels:
ax.imshow(layer[0, i].cpu().numpy(), cmap='twilight')
ax.axis('off')
plt.tight_layout()
plt.show()
# Display a subset of activations
plot_activations(activations['layer1_0_conv1'], num_cols=4, num_activations=16)

结果如下：

plot_activations(activations['layer4_0_conv1'], num_cols=4, num_activations=16)

PyTorch的钩子函数（hooks）是一种非常有用的特性，它们允许你在训练的前向传播和反向传播过程中插入自定义操作。这对于调试、修改梯度或者理解网络的内部运作非常有帮助。

利用 PyTorch 钩子函数来可视化网络中的激活是一种很好的方式，尤其是想要理解不同层如何响应不同输入的情况下。在这个过程中，我们可以捕捉到网络各层的输出，并将其可视化以获得直观的理解。

可视化激活有助于理解卷积神经网络中的各个层如何响应输入图像中的不同特征。通过可视化不同的层，可以评估早期层是否捕获边缘和纹理等基本特征，而较深的层是否捕获更复杂的特征。这些知识对于诊断问题、调整层架构和改进整体模型性能是非常宝贵的。

https://avoid.overfit.cn/post/c63b9b1130fe425ea5b7d0bedf209b2e

PyTorch小技巧：使用Hook可视化网络层激活（各层输出）

如何从头开始编写LoRA代码，这有一份教程

长文本杀不死RAG:SQL+向量驱动大模型和大数据新范式,MyScale开源

比LoRA还快50%！一张3090超越全参调优，UIUC联合LMFlow提出LISA

大语言模型权重、激活的全方位低bit可微量化，已集成进商用APP

Mac专属大模型框架来了！两行代码部署，能聊本地数据，支持中文

GPT-4V学会用键鼠上网，人类眼睁睁看着它发帖玩游戏

从零手搓MoE大模型，大神级教程来了

PyTorch团队重写「分割一切」模型，比原始实现快8倍

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

4月30日报道，老挝移民赢得美国13亿美元彩票大奖，46岁抗癌8年，笑称不知如何能有时间把钱花完

中企纷纷赴俄律师：相关诉讼90%是中企败诉注意风险

剑桥团队开源：首个预训练通用多模态后期交互知识检索器

可以互相交谈的人工智能来了

“离谱的AI扩图”火了！张张那叫一个出其不意

曾经卖7000元的顶配商务本，现在成了闲鱼上最火的洋垃圾

GPT-4 更强的标志，原来藏在了 logo 里

2024春晚，互联网大厂怎么不“打架”了？

字节“开盒”OpenAI所有大模型，揭秘GPT-3到GPT-4进化路径

被蔡斌要求体测，朱婷摊牌发声，官宣决定，赖亚文遗憾，郎平支持

字节工作两年后，更讨厌阿里人了

PyTorch小技巧：使用Hook可视化网络层激活（各层输出）

如何从头开始编写LoRA代码，这有一份教程

长文本杀不死RAG:SQL+向量驱动大模型和大数据新范式,MyScale开源

比LoRA还快50%！一张3090超越全参调优，UIUC联合LMFlow提出LISA

大语言模型权重、激活的全方位低bit可微量化，已集成进商用APP

Mac专属大模型框架来了！两行代码部署，能聊本地数据，支持中文

GPT-4V学会用键鼠上网，人类眼睁睁看着它发帖玩游戏

从零手搓MoE大模型，大神级教程来了

PyTorch团队重写「分割一切」模型，比原始实现快8倍

全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

4月30日报道，老挝移民赢得美国13亿美元彩票大奖，46岁抗癌8年，笑称不知如何能有时间把钱花完

中企纷纷赴俄 律师：相关诉讼90%是中企败诉 注意风险

剑桥团队开源：首个预训练通用多模态后期交互知识检索器

可以互相交谈的人工智能来了

“离谱的AI扩图”火了！张张那叫一个出其不意

曾经卖7000元的顶配商务本，现在成了闲鱼上最火的洋垃圾

GPT-4 更强的标志，原来藏在了 logo 里

2024春晚，互联网大厂怎么不“打架”了？

字节“开盒”OpenAI所有大模型，揭秘GPT-3到GPT-4进化路径

被蔡斌要求体测，朱婷摊牌发声，官宣决定，赖亚文遗憾，郎平支持

字节工作两年后，更讨厌阿里人了

中企纷纷赴俄律师：相关诉讼90%是中企败诉注意风险