83得票4回答
实例归一化 vs 批量归一化

我理解批量标准化通过将激活转向单位高斯分布来帮助更快地训练,从而解决消失梯度问题。在训练时,批量标准化以不同的方式应用(使用每个批次的平均值/方差),而在测试时则使用已确定的运行平均值/方差。 另一方面,实例标准化作为对比标准化,如本文https://arxiv.org/abs/1607.0...

80得票2回答
Variable的backward()方法中的参数retain_graph是什么意思?

我正在学习PyTorch神经风格迁移教程,但是我对retain_variable(已弃用,现在称为retain_graph)的使用感到困惑。代码示例如下: class ContentLoss(nn.Module): def __init__(self, target, weight...

68得票7回答
将Keras模型转换为C++

我正在使用Keras(与Theano一起)训练我的CNN模型。 有谁知道如何在我的C ++应用程序中使用它吗? 有人尝试过类似的事情吗? 我想编写一些Python代码,以生成具有网络功能的C ++代码 - 对此有什么建议吗? 我在这里找到了一个类似的问题如何在C ++中使用Tensorflo...

68得票5回答
Conv1D中形状的维度

我尝试使用一个卷积神经网络层来构建模型,但是遇到了一些问题。 实际上,编译器告诉我: ValueError: 检查模型输入时出错:预计 conv1d_1_input 具有3个维度,但得到的数组形状为 (569, 30) 这是我的代码:import numpy from keras.mode...

67得票4回答
2-D卷积作为矩阵乘法

我知道,在一维情况下,向量a与b的卷积可以通过conv(a, b)或者是对应的Toeplitz矩阵T_a和b的乘积来计算。 但是这个方法可以扩展到二维吗? 如果给定a = [5 1 3; 1 1 2; 2 1 3]和b=[4 3; 1 2],是否可以将a转换为Toeplitz矩阵,并像在一...

65得票8回答
数值错误:形状(无,1)和(无,2)不兼容。

我正在训练一个面部表情(愤怒 vs 快乐)模型。最后一个密集层的输出以前是1,但是当我预测一张图片时,它的输出总是1,准确率为64%。所以我改成了有2个输出的2。但现在我得到了这个错误:Epoch 1/15 ------------------------------------------...

63得票6回答
Keras ValueError: 输入0与层conv2d_1不兼容:期望ndim = 4,但发现ndim = 5。

我已经检查了所有解决方案,但仍然面临着相同的错误。我的训练图像形状是(26721, 32, 32, 1),我相信它是四维的,但我不知道为什么错误显示它是五维的。 model = Sequential() model.add(Convolution2D(16, 5, 5, border_mo...

59得票9回答
如何在TensorFlow中调试NaN值?

我正在运行TensorFlow,我的代码中出现了一个NaN值。我想知道是什么导致了这个问题,但我不知道该如何解决。在“普通”的过程式程序中,我通常会在操作执行之前写一个print语句以便找到问题所在。但在TensorFlow中,我无法这样做,因为我首先需要声明(或定义)图形,所以在图形定义中添...

59得票2回答
卷积神经网络 - 图像调整大小与填充(保持宽高比还是不保持?)

通常人们在训练卷积神经网络时,会将任何图像简单调整为正方形(例如resnet采用224x224的正方形图像),但我认为那样看起来很丑,尤其是当宽高比不为1时。 实际上,这可能会改变正确答案。例如,专家给出扭曲图像的标签可能与原始图像不同。 因此,现在我将图像调整为保持原始宽高比的224x160...

52得票2回答
在Keras中多次调用“fit”的含义是什么?

我一直在处理数百GB的图像,为此我创建了一个训练函数,它会将这些图像分块成4GB的大小,并对每个块调用fit。我担心我只是在最后一块上进行训练而不是整个数据集。实际上,我的伪代码看起来像这样:DS = lazy_load_400GB_Dataset() for section in DS: ...