156得票22回答
如何在PyTorch中避免“CUDA内存不足”错误

我认为这是一个对于GPU内存较低的PyTorch用户来说非常普遍的信息: RuntimeError: CUDA out of memory. Tried to allocate X MiB (GPU X; X GiB total capacity; X GiB already allocat...

136得票4回答
如何解压pkl文件?

我有一个来自MNIST数据集的pkl文件,其中包含手写数字图像。 我想要查看这些数字图像中的每一个,因此我需要解压缩pkl文件,但我不知道该怎么做。 有没有一种方法可以解压/解包pkl文件?

129得票13回答
使用ImageDataGenerator时,Keras会将训练集和测试集进行拆分。

我有一个包含图像子文件夹(根据标签)的单个目录。我想在使用Keras中的ImageDataGenerator时将这些数据分割为训练集和测试集。虽然keras中的model.fit()有一个validation_split参数用于指定分割,但我在model.fit_generator()中找不到...

125得票6回答
神经网络训练中出现NaN的常见原因

我注意到在训练过程中经常出现NAN。 通常情况下,这似乎是由内积/全连接或卷积层的权重爆炸引起的。 这是由于梯度计算爆炸造成的吗?还是因为权重初始化(如果是这样,为什么会产生这种影响)?还是可能由于输入数据的性质引起的? 总体问题很简单:NAN在训练期间出现的最常见原因是什么?其次,有哪...

123得票8回答
如何将自定义数据集分成训练集和测试集?

import pandas as pd import numpy as np import cv2 from torch.utils.data.dataset import Dataset class CustomDatasetFromCSV(Dataset): def __init...

123得票9回答
如何修复RuntimeError "Expected object of scalar type Float but got scalar type Double for argument"?

我试图通过PyTorch训练分类器。但是,当我将训练数据提供给模型进行训练时遇到了问题。y_pred = model(X_trainTensor)出现以下错误: 运行时错误: 对于参数#4'mat1',期望标量类型为Float,但得到的标量类型为Double 这是我的代码的关键部分...

118得票10回答
Keras:如何保存历史训练属性(history object)的训练记录?

在Keras中,我们可以将model.fit的输出返回到一个历史记录中,如下所示: history = model.fit(X_train, y_train, batch_size=batch_size, ...

117得票8回答
如何在TensorFlow中应用梯度裁剪?

考虑这个示例代码。 我想知道如何在可能出现梯度爆炸的RNN上应用梯度裁剪。 tf.clip_by_value(t, clip_value_min, clip_value_max, name=None) 这是一个示例,可以用于哪里?在RNN的定义中应该如何引入它? lstm_c...

117得票2回答
早停止应该使用哪些参数?

我正在使用Keras为我的项目训练神经网络。Keras提供了早停函数。请问有哪些参数需要注意,以避免在使用早停时过拟合神经网络?

116得票2回答
Keras中的TimeDistributed层的作用是什么?

我试图理解Keras中TimeDistributed包装器的作用。 我知道TimeDistributed“将层应用于输入的每个时间片段”。 但是我进行了一些实验,得到了我无法理解的结果。 简而言之,在与LSTM层相关时,TimeDistributed和仅使用Dense层产生相同的结果。m...