16得票7回答
无法在Google Colab上导入pytorch_lightning。

我已经完成了以下内容:!pip install pytorch_lightning -qqq import pytorch_lightning 但是出现以下错误:ImportError Traceback (most recent c...

14得票1回答
PyTorch Lightning在validation_epoch_end中将张量移动到正确的设备

我希望在LightningModule的validation_epoch_end方法中创建一个新的张量。根据官方文档(第48页),应避免直接使用.cuda()或.to(device)调用: 没有 .cuda() 或 .to() 的调用... Lightning 会为您执行这些操作。 并且我...

14得票1回答
运行时错误:给定 groups=1,权重大小为 [32, 3, 16, 16, 16],预期输入 [100, 16, 16, 16, 3] 应具有 3 个通道,但实际得到了 16 个通道。

运行时错误:给定groups=1,[32, 3, 16, 16, 16]大小的权重,预期输入[100, 16, 16, 16, 3]应该是3个通道,但实际上却有16个通道 我认为这是问题所在的代码部分。 def __init__(self): super(Lightning...

10得票5回答
Pytorch Lightning在分布式数据并行模式下会复制主脚本。

当我在ddp模式(2个GPU)下启动我的主要脚本时,Pytorch Lightning会复制在主要脚本中执行的所有内容,例如打印或其他逻辑。我需要一些扩展训练逻辑,我希望自己处理。例如,在Trainer.fit()之后执行某些操作(仅一次!)。但是由于主要脚本的复制,这并不按照我想象的方式工作...

9得票4回答
Pytorch Lightning 模型的输出预测

这是一个可能非常简单的问题。我刚刚开始使用PyTorch Lightning,无法弄清楚如何在训练后接收模型的输出。 我对y_train和y_test的预测都很感兴趣,希望以某种形式的数组(PyTorch张量或NumPy数组)返回,以便使用不同的脚本将其与标签一起绘制。 dataset =...

8得票4回答
如何在树莓派3中安装pytorch_lightning.metrics模块

我试图执行一个带有pytorch、lightning和torchvision模块的python文件。但是,在我下载并成功安装了pi3上的pytorch whl文件之后,我一直遇到同样的错误。 错误信息如下: ModuleNotFoundError: No module named 'pyt...

8得票2回答
PyTorch Lightning 训练控制台输出异常。

在 Jupyter Notebook 中训练 PyTorch Lightning 模型时,控制台日志输出显得不太自然: Epoch 0: 100%|█████████▉| 2315/2318 [02:05<00:00, 18.41it/s, loss=1.69, v_num=26, a...

8得票2回答
如何从PyTorch Lightning的记录器中按每个epoch提取损失和准确率?

我想提取所有的数据来制作图表,而不是使用TensorBoard。我的理解是所有包含损失和准确率的日志都存储在一个指定的目录中,因为TensorBoard会绘制折线图。 %reload_ext tensorboard %tensorboard --logdir lightning_logs/ ...

8得票3回答
如何在pytorch-lightning中使用TensorBoard记录器输出混淆矩阵?

官方文档 只是说明了: >>> from pytorch_lightning.metrics import ConfusionMatrix >>> target = torch.tensor([1, 1, 0, 0]) >>> preds...

8得票1回答
使用Pytorch Lightning DDP时记录信息的正确方法

我想知道在使用DDP时记录指标的正确方法。我注意到,如果我想在validation_epoch_end内部打印一些内容,则在使用2个GPU时会打印两次。我原本希望validation_epoch_end仅在rank 0上被调用,并接收来自所有GPU的输出,但现在我不确定这是否正确。因此,我有几...