如何在PyTorch中定义特定数量的卷积核/过滤器?

6
在PyTorch网站上,他们在教程中提供了如下模型:
class BasicCNN(nn.Module):
    def __init__(self):
        super(BasicCNN, self).__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = x.permute(0, 3, 1, 2)
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

这个模型有多少个内核/滤波器?是两个 - 比如conv1和conv2。我如何通过指定它们的数量轻松创建许多过滤器?例如100个滤波器。谢谢!

输入和输出通道是 nn.Conv2d 的参数。它们有效地确定通过网络流动的过滤器数量和数据体积的维度。在此处阅读更多信息:https://pytorch.org/docs/master/generated/torch.nn.Conv2d.html 我还创建了一个在 3D RGB 图像上实现 2D 卷积的实现,您可以使用它来进行一些试验并获得一些直觉。https://dev59.com/SloU5IYBdhLWcg3wzZE1#62678843 - Gal_M
1个回答

13

您的问题有点含糊,但让我尝试回答一下。

通常,在卷积层中,我们将过滤器的数量设置为out_channels的数量。但这并不是直接的。让我们基于您提供的示例进行讨论。

卷积层参数是什么?

model = BasicCNN()
for name, params in model.named_parameters():
    if 'conv' in name:
        print(name, params.size())

输出:

conv1.weight torch.Size([6, 3, 5, 5])
conv1.bias torch.Size([6])
conv2.weight torch.Size([16, 6, 5, 5])
conv2.bias torch.Size([16])

说明

让我们考虑上述模型中的conv1层。我们可以说,这里有6个形状为5 x 5的过滤器,因为我们选择了2D卷积。由于输入通道的数量为3,所以总共有6 x 3 = 18个卷积核。

在这里,该模型的输入是3D图像。您可以将其视为具有形状W x H并且图像有3个通道(RGB)的图像。因此,我们可以将表示图像的3D张量馈送给此模型。


现在回到您的问题,“如何通过指定它们的数量轻松创建许多过滤器?例如100个过滤器。”如果您只想每个输入通道使用100个过滤器,则只需在conv1中设置100而不是6。这通常是计算机视觉中人们会做的事情!

但是您肯定可以根据自己的需要修改体系结构并确定最佳设置。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接