我知道在图像分类问题中如猫与狗分类的不平衡问题,如果猫的图像太多而狗的图像太少,但我不知道如何解决分割问题中的不平衡问题。
例如,我的任务是从卫星图像中遮蔽云层,将问题转化为两个分割类别,一个是云,另一个是背景。数据集有5800个大小为256x256的4带16位图像。架构是Segnet,损失函数是二元交叉熵。
有两种情况假设:
1.所有样本的一半被云完全覆盖,另一半没有云。
2.在每张图像中,有一半被云覆盖,一半没有。
所以,我想情况2是平衡的,但情况1呢?
实际上,在源卫星图像中这两种情况都是不可能的,因为云层相对于背景总是很小的,但是由于它们的大尺寸,如果从源图像中裁剪出图像样本,就会产生一些新情况。
因此,样本始终包含三种类型的图像:
1.完全被云层覆盖(5800个样本中的254个)。
2.没有任何云层(5800个样本中的1241个)。
3.一些区域被云层覆盖,一些区域没有(5800个样本中的4305个,但我不知道云的百分比,在某些样本中可能很高,在其他样本中可能很少)。
我的问题是:这些样本是否不平衡,我该怎么做?
谢谢。
例如,我的任务是从卫星图像中遮蔽云层,将问题转化为两个分割类别,一个是云,另一个是背景。数据集有5800个大小为256x256的4带16位图像。架构是Segnet,损失函数是二元交叉熵。
有两种情况假设:
1.所有样本的一半被云完全覆盖,另一半没有云。
2.在每张图像中,有一半被云覆盖,一半没有。
所以,我想情况2是平衡的,但情况1呢?
实际上,在源卫星图像中这两种情况都是不可能的,因为云层相对于背景总是很小的,但是由于它们的大尺寸,如果从源图像中裁剪出图像样本,就会产生一些新情况。
因此,样本始终包含三种类型的图像:
1.完全被云层覆盖(5800个样本中的254个)。
2.没有任何云层(5800个样本中的1241个)。
3.一些区域被云层覆盖,一些区域没有(5800个样本中的4305个,但我不知道云的百分比,在某些样本中可能很高,在其他样本中可能很少)。
我的问题是:这些样本是否不平衡,我该怎么做?
谢谢。