99得票10回答
有人在加载Keras保存的模型时遇到了“AttributeError: 'str' object has no attribute 'decode'”错误吗?

训练完成后,我使用了Keras整个模型和仅权重的保存方法 model.save_weights(MODEL_WEIGHTS) and model.save(MODEL_NAME) 模型和权重已成功保存,没有错误。我可以使用model.load_weights轻松地成功加载权重,但当我尝试...

98得票4回答
如何在Keras中堆叠多个LSTM?

我正在使用深度学习库Keras并尝试堆叠多个LSTM,但没有成功。下面是我的代码:model = Sequential() model.add(LSTM(100,input_shape =(time_steps,vector_size))) model.add(LSTM(100)) 上述代码在...

97得票5回答
在卷积层中计算输出大小

如何计算卷积层的输出尺寸? 例如,我有一个2D卷积层,它接受一个3x128x128的输入,并具有5x5大小的40个过滤器。

96得票10回答
如何在TensorFlow中添加正则化?

我发现在很多使用TensorFlow实现的神经网络代码中,正则化项通常是通过手动向损失值添加一个额外的项来实现的。 我的问题是: 是否有比手动实现更优雅或者推荐的正则化方法? 我还发现get_variable有一个参数regularizer。它应该如何使用?根据我的观察,如果我们传入一个...

94得票2回答
当图像大小不同时,如何格式化图像数据以进行训练/预测?

我正在尝试训练一个分类图像的模型。问题在于,这些图像的大小不同。我应该如何格式化我的图像或模型架构?

91得票3回答
当批量大小改变时,学习率应该如何调整?

当我增加或减少SGD中使用的小批量(batch)大小时,是否应该改变学习率?如果是这样,那么如何修改? 作为参考,我曾与某人讨论过,当批量大小增加时,学习率应该降低一定程度。 我的理解是,当我增加批量大小时,计算出的平均梯度将会更加平滑,因此我要么保持相同的学习率,要么增加它。 此外,如...

91得票1回答
PyTorch数据加载器中的“工作人数参数”实际上是如何工作的?

如果num_workers是2,那么它会将2批次放入RAM并发送其中1个到GPU,还是会将3批次放入RAM然后发送其中1个到GPU? 当工作进程数大于CPU核心数时,实际上会发生什么?我尝试过,一切正常,但它是如何工作的?(我认为我可以选择的最大工作进程数就是核心数)。 如果我将num_wo...

90得票2回答
如何在任何给定时刻改变优化器的学习率(无学习率调度)?

在PyTorch中,是否可以在训练过程中动态地改变优化器的学习率(而不是事先定义一个学习率调度)? 假设我有一个优化器: optim = torch.optim.SGD(model.parameters(), lr=0.01) 现在由于我在训练过程中进行了一些测试,我意识到我的学习率太...

90得票4回答
卷积神经网络中的批量归一化

我是卷积神经网络的新手,只知道特征图和卷积在图像上提取特征的想法。我希望了解有关在CNN中应用批归一化的详细信息。 我阅读了这篇论文https://arxiv.org/pdf/1502.03167v3.pdf,并且能够理解BN算法应用于数据,但最后他们提到在应用到CNN时需要进行轻微修改: ...

89得票3回答
Keras中损失函数和指标的区别是什么?

我不清楚在Keras中损失函数(loss function)和指标(metrics)之间的区别。文档对我没有帮助。