如何为图像分割注释地面真实值?

11
我试图训练一个执行图像分割的CNN模型,但如果我有多个图像样本,如何创建ground truth令我感到困惑?
图像分割可以将输入图像中的每个像素分类到预定义的类别中,例如汽车、建筑、人或其他任何类别。
有没有工具或一些好的想法来为图像分割创建ground truth呢?
谢谢!
8个回答

3

对于语义分割,图像的每个像素都应该被标记。有以下三种方法来解决这个任务:

  1. 基于矢量 - 多边形、折线

  2. 基于像素 - 画笔、橡皮擦

  3. 人工智能工具

Supervisely中,可以使用工具执行1、2、3。

SmartTool usage example

下面有两个视频,比较了多边形和AI动力工具:车辆分割食品分割
关于 Supervisely 的注释功能的更多详细信息可以在这里 找到

3

有一个工具让我想到了,那就是MIT的LabelMe工具箱:这个工具箱主要用于浏览数据集中现有的标记图像,但它也有一个选项可以注释新图像。

还有一个GitHub存储库供你参考COCO用户界面,可能会很有用。


如何将每个像素标记为对象类别?之后我们是否有一个数组,其中包含每个像素的类别。 - Shamane Siriwardhana
@ShamaneSiriwardhana 通常会得到一个与原始图像大小相同的索引图像。 - Shai
假设我有一张图片中的三个对象。那么我该如何进行注释?你能帮我吗? - Shamane Siriwardhana
1
现在阅读此内容的人请注意,LabelMe似乎相当古老,托管FAQ/讨论的留言板将于2021年12月11日关闭。https://www.quicktopic.com/37/H/E4xRZ7fZZhh - ComputerScientist

2
尝试使用https://www.labelbox.io/。这是他们的图像分割模板的样子...

enter image description here

很多代码是开源的,他们有一个托管服务来管理端到端的标注。

1

完成图像分割的注释后,我可以将注释导出为coco格式吗?目前我只能看到为掩模创建的.png文件,而不是json文件。 - Rohit Gavval

1

我创建了一个名为COCO Annotator的开源工具:它提供了其他工具无法实现的功能:

  • 直接导出COCO格式
  • 对象分割
  • 有用的API端点来分析数据
  • 导入已在COCO格式下注释的数据集
  • 将断开连接的对象注释为单个实例
  • 同时使用任意数量的标签对图像段进行标记
  • 允许为每个实例或对象添加自定义元数据
  • 魔法棒/选择工具
  • 使用Google图像生成数据集
  • 用户认证系统

0

ITK-SNAP是专为医学图像分割而设计的。它易于学习,但功能强大。你可以试试。


0

整个过程如下:

  1. 将数据加载到工具中
  2. 绘制形状。例如使用多边形工具或其他形状工具
  3. 导出点并直接用于训练,或将其转换为密集像素掩码。

注释过程详细信息

一般来说,矢量基础工具更加准确。例如,左侧是4个多边形点,右侧是一个画笔。 enter image description here

令人反感的是,追踪点甚至可以更快。例如,在这里,我只需将鼠标移动到轮廓上,就会记录下来: enter image description here

但实际上它被存储为点: enter image description here

使用其他形状

例如,您可以使用椭圆或圆形来创建分割掩模。实际上没有手动创建多边形的要求。

enter image description here

enter image description here

自动边框

想要实现像素覆盖率达到100%的主要概念之一是自动边框。基本上,它只是意味着对象的边缘相交得很好。例如,在Diffgram中,您可以选择两个点,它将创建一个匹配的边框。

这里有一个例子: enter image description here

最后还有许多其他概念,如预标记、复制到下一个、跟踪等。

工具

Diffgram的分割标注软件是图像和视频注释的绝佳工具选择。它采用开放式内核,您可以在您的Kubernetes集群上运行它。


-1

您可以在整个数据集上使用平均化和归一化技术,以创建您的基准,并标记不同的结构。为此,您可以考虑创建所谓的“模板”。请确保最初所有数据都是共同注册的。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接