我正在尝试实现一篇有关语义分割的论文,但我对如何将分割网络生成的预测图上采样以匹配输入图像大小感到困惑。
例如,我使用Resnet101的一个变体作为分割网络(与论文中使用的相同)。使用这个网络结构,大小为321x321的输入(同样在论文中使用)会产生一个最终的预测地图,大小为41x41xC(其中C是类别数)。因为我需要进行像素级别的预测,所以我需要将其上采样到321x321xC。Pytorch提供了将输出大小上采样到预测地图大小的函数。因此,在这里我不能直接使用该方法。
因为这一步骤涉及到每一个语义分割网络,所以我确定应该有一种标准的实现方式。
我会非常感谢任何指导。提前致谢。
例如,我使用Resnet101的一个变体作为分割网络(与论文中使用的相同)。使用这个网络结构,大小为321x321的输入(同样在论文中使用)会产生一个最终的预测地图,大小为41x41xC(其中C是类别数)。因为我需要进行像素级别的预测,所以我需要将其上采样到321x321xC。Pytorch提供了将输出大小上采样到预测地图大小的函数。因此,在这里我不能直接使用该方法。
因为这一步骤涉及到每一个语义分割网络,所以我确定应该有一种标准的实现方式。
我会非常感谢任何指导。提前致谢。