为什么Tensorflow目标检测禁用Faster R-CNN的正则化？

Question

8

在Tensorflow目标检测示例配置文件中，所有Faster R-CNN配置文件都禁用了正则化项，如下所示：

regularizer {
    l2_regularizer {
      weight: 0.0
    }
  }

我认为这不太合理，很可能会出现过度拟合的情况。对于这样的设置有什么解释吗？谢谢。

- Brandon

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- DaveB · Accepted Answer

在这个数据集上，应用强正则化（如maxout或dropout）可以获得最佳结果。在这篇论文中，我们没有使用maxout/dropout，而是通过深度和窄的结构设计来简单地施加正则化，以避免分散对优化困难的关注。但是，与更强的正则化相结合可能会改善结果，我们将在未来研究它。

我认为作者所指的正则化直接应用于RESNET架构中的批量归一化层，这些层夹在每个卷积层和每个激活层之间。虽然作者没有提到L2正则化的使用，但他们关于maxout和dropout的陈述应该适用。BN层具有正则化网络的效果，而不需要施加显式惩罚，因此不需要L2正则化。

话虽如此，如果您想尝试更强的正则化，也可以选择使用L2正则化。