得票数最多 'deep-learning' 问题 - 第3页

关联标签

156得票22回答

如何在PyTorch中避免“CUDA内存不足”错误

我认为这是一个对于GPU内存较低的PyTorch用户来说非常普遍的信息： RuntimeError: CUDA out of memory. Tried to allocate X MiB (GPU X; X GiB total capacity; X GiB already allocat...

pythondeep-learningpytorchobject-detectionlow-memory

136得票4回答

如何解压pkl文件？

我有一个来自MNIST数据集的pkl文件，其中包含手写数字图像。我想要查看这些数字图像中的每一个，因此我需要解压缩pkl文件，但我不知道该怎么做。有没有一种方法可以解压/解包pkl文件？

pythonpickledeep-learningmnist

129得票13回答

使用ImageDataGenerator时，Keras会将训练集和测试集进行拆分。

我有一个包含图像子文件夹（根据标签）的单个目录。我想在使用Keras中的ImageDataGenerator时将这些数据分割为训练集和测试集。虽然keras中的model.fit()有一个validation_split参数用于指定分割，但我在model.fit_generator()中找不到...

pythontensorflowkerasdeep-learningtrain-test-split

125得票6回答

神经网络训练中出现NaN的常见原因

我注意到在训练过程中经常出现NAN。通常情况下，这似乎是由内积/全连接或卷积层的权重爆炸引起的。这是由于梯度计算爆炸造成的吗？还是因为权重初始化（如果是这样，为什么会产生这种影响）？还是可能由于输入数据的性质引起的？总体问题很简单：NAN在训练期间出现的最常见原因是什么？其次，有哪...

machine-learningneural-networkdeep-learningcaffegradient-descent

123得票8回答

如何将自定义数据集分成训练集和测试集？

import pandas as pd import numpy as np import cv2 from torch.utils.data.dataset import Dataset class CustomDatasetFromCSV(Dataset): def __init...

pythondeep-learningpytorch

123得票9回答

如何修复RuntimeError "Expected object of scalar type Float but got scalar type Double for argument"?

我试图通过PyTorch训练分类器。但是，当我将训练数据提供给模型进行训练时遇到了问题。y_pred = model(X_trainTensor)出现以下错误: 运行时错误: 对于参数＃4'mat1'，期望标量类型为Float，但得到的标量类型为Double 这是我的代码的关键部分...

pythonneural-networkdeep-learningclassificationpytorch

118得票10回答

Keras：如何保存历史训练属性（history object）的训练记录？

在Keras中，我们可以将model.fit的输出返回到一个历史记录中，如下所示： history = model.fit(X_train, y_train, batch_size=batch_size, ...

pythonmachine-learningneural-networkdeep-learningkeras

117得票8回答

如何在TensorFlow中应用梯度裁剪？

考虑这个示例代码。我想知道如何在可能出现梯度爆炸的RNN上应用梯度裁剪。 tf.clip_by_value(t, clip_value_min, clip_value_max, name=None) 这是一个示例，可以用于哪里？在RNN的定义中应该如何引入它？ lstm_c...

pythontensorflowmachine-learningkerasdeep-learning

117得票2回答

早停止应该使用哪些参数？

我正在使用Keras为我的项目训练神经网络。Keras提供了早停函数。请问有哪些参数需要注意，以避免在使用早停时过拟合神经网络？

pythonkerasdeep-learningconv-neural-network

116得票2回答

Keras中的TimeDistributed层的作用是什么？

我试图理解Keras中TimeDistributed包装器的作用。我知道TimeDistributed“将层应用于输入的每个时间片段”。但是我进行了一些实验，得到了我无法理解的结果。简而言之，在与LSTM层相关时，TimeDistributed和仅使用Dense层产生相同的结果。m...

pythonmachine-learningkerasneural-networkdeep-learning