图像分割中的不平衡是什么？

Question

13

我知道在图像分类问题中如猫与狗分类的不平衡问题，如果猫的图像太多而狗的图像太少，但我不知道如何解决分割问题中的不平衡问题。

例如，我的任务是从卫星图像中遮蔽云层，将问题转化为两个分割类别，一个是云，另一个是背景。数据集有5800个大小为256x256的4带16位图像。架构是Segnet，损失函数是二元交叉熵。

有两种情况假设：

1.所有样本的一半被云完全覆盖，另一半没有云。

2.在每张图像中，有一半被云覆盖，一半没有。

所以，我想情况2是平衡的，但情况1呢？

实际上，在源卫星图像中这两种情况都是不可能的，因为云层相对于背景总是很小的，但是由于它们的大尺寸，如果从源图像中裁剪出图像样本，就会产生一些新情况。

因此，样本始终包含三种类型的图像：

1.完全被云层覆盖（5800个样本中的254个）。

2.没有任何云层（5800个样本中的1241个）。

3.一些区域被云层覆盖，一些区域没有（5800个样本中的4305个，但我不知道云的百分比，在某些样本中可能很高，在其他样本中可能很少）。

我的问题是：这些样本是否不平衡，我该怎么做？

谢谢。

- spider

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Shai · Accepted Answer

通常，在分割任务中，如果每个图像中属于每个类/段的像素数量大致相同（您问题中的情况2），则认为样本“平衡”。在大多数情况下，样本永远不会平衡，就像您的示例一样。

当存在一个支配样本的片段/类时，模型可能会更容易地输出所有像素属于支配类/段。尽管这种常数预测并不具有信息性，但仍然可以产生高精度和小损失。

如何检测此类错误结果？您可以使“准确性”层输出不仅是整体准确性，还包括每个类别的准确性。如果您的模型被“锁定”在单个类上，则所有其他类的每类准确率将非常低。

您可以使用“InfogainLoss”层赋予其他类别的错误更多权重，以抵消主导类别的影响。