图像分割中的不平衡是什么?

13
我知道在图像分类问题中如猫与狗分类的不平衡问题,如果猫的图像太多而狗的图像太少,但我不知道如何解决分割问题中的不平衡问题。
例如,我的任务是从卫星图像中遮蔽云层,将问题转化为两个分割类别,一个是云,另一个是背景。数据集有5800个大小为256x256的4带16位图像。架构是Segnet,损失函数是二元交叉熵。
有两种情况假设:
1.所有样本的一半被云完全覆盖,另一半没有云。
2.在每张图像中,有一半被云覆盖,一半没有。
所以,我想情况2是平衡的,但情况1呢?
实际上,在源卫星图像中这两种情况都是不可能的,因为云层相对于背景总是很小的,但是由于它们的大尺寸,如果从源图像中裁剪出图像样本,就会产生一些新情况。
因此,样本始终包含三种类型的图像:
1.完全被云层覆盖(5800个样本中的254个)。
2.没有任何云层(5800个样本中的1241个)。
3.一些区域被云层覆盖,一些区域没有(5800个样本中的4305个,但我不知道云的百分比,在某些样本中可能很高,在其他样本中可能很少)。
我的问题是:这些样本是否不平衡,我该怎么做?
谢谢。
1个回答

7
通常,在分割任务中,如果每个图像中属于每个类/段的像素数量大致相同(您问题中的情况2),则认为样本“平衡”。在大多数情况下,样本永远不会平衡,就像您的示例一样。
当存在一个支配样本的片段/类时,模型可能会更容易地输出所有像素属于支配类/段。尽管这种常数预测并不具有信息性,但仍然可以产生高精度和小损失。
如何检测此类错误结果?您可以使“准确性”层输出不仅是整体准确性,还包括每个类别的准确性。如果您的模型被“锁定”在单个类上,则所有其他类的每类准确率将非常低。
您可以使用“InfogainLoss”层赋予其他类别的错误更多权重,以抵消主导类别的影响。

1
感谢您的纠正和回复。我会尝试在caffe中使用“InfogainLoss”层。 - spider
谁知道如何在Keras中像Caffe一样输出每个类别的准确率? - spider

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接