547得票19回答
如何检查PyTorch是否使用GPU?

我该如何检查PyTorch是否正在使用GPU?nvidia-smi命令可以检测GPU活动,但我想直接从Python脚本内部进行检查。

380得票10回答
如何在PyTorch中保存训练好的模型?

我该如何在PyTorch中保存已训练的模型? 我已经阅读到: torch.save()/torch.load() 用于保存/加载可序列化对象。 model.state_dict()/model.load_state_dict() 用于保存/加载模型状态。

338得票7回答
为什么我们需要在PyTorch中调用zero_grad()函数?

在训练期间为什么需要调用zero_grad()?| zero_grad(self) | Sets gradients of all model parameters to zero.

337得票9回答
PyTorch中的.view()是什么意思?

.view() 方法对一个张量 x 做什么?负数值代表什么意思?x = x.view(-1, 16 * 5 * 5)

325得票11回答
如何在PyTorch中打印模型概述?

在 PyTorch 中如何像 Keras 的 model.summary() 一样打印模型的概要信息:Model Summary: _________________________________________________________________________________...

262得票10回答
如何在PyTorch中初始化权重?

如何通过He或Xavier初始化来初始化网络的权重和偏置?

259得票4回答
在PyTorch中,model.eval()是什么意思?

何时应该使用.eval()?我知道这个函数可以让我“评估模型”。但我如何在训练时将其关闭? 下面是一个使用.eval()的示例代码。

230得票5回答
PyTorch中reshape和view有什么区别?

在numpy中,我们使用ndarray.reshape()来重新整形一个数组。 我注意到在pytorch中,人们使用torch.view(...)来完成相同的功能,但同时也存在一个torch.reshape(...)。 因此,我想知道它们之间的区别以及何时应该使用它们中的任意一个?

214得票6回答
model.train()在PyTorch中的作用是将模型设置为训练模式。

在nn.Module中是否调用forward()? 我认为当我们调用模型时,forward方法正在被使用。 那我们为什么需要指定train()呢?

209得票8回答