目标识别、检测和分类有何不同?有什么区别?

5

我不确定这是否是正确的StackExchange论坛来提问这个问题,请告诉我如果不是。

我正在开发一个应用程序,给定一个包含绘画的输入图像,它能够告诉您这幅画的标题。类似的情况是:给定一个包含建筑物的输入图像,返回结果是建筑物的名称。

这是什么样的应用程序?乍一看,我会说像“图像分类”。我不是计算机视觉方面的专家,但我一直认为“图像分类”是指“给我一张图片,告诉我这张图片里包含了什么”。

另一方面,对象检测的定义似乎更相关于识别类的对象(例如建筑物),而不是类本身的实例(例如长城):

对象检测是与计算机视觉和图像处理相关的计算机技术,用于在数字图像和视频中检测某个类的语义对象的实例(例如人、建筑物或汽车)。

关于对象识别:

对象识别是感知对象的物理属性(如形状、颜色和纹理)并将语义属性应用于它(如将对象标识为苹果)的能力。

我真的不知道如何对我的应用程序进行分类。你觉得呢?

2个回答

5
简单解释一下:你正在走进森林,天很黑。突然间,你看到了一个与背景(纯黑)不同的东西。这就被称为检测。
1) 有东西出现,与背景不同,所以你进行了检测。
2) 现在它越来越近,你发现它是一只动物。啊...现在你已经分类/识别了。它也可能是个人。
3) 现在它甚至更靠近了,你发现它是只鹿。所以,现在你已经识别出来了。
因此,顺序是“检测 -> 识别/分类 -> 识别”。
“识别是最后的壳层,你可以通过身份证记住它,上面有你的脸(已识别),并分类为(人类)。

1
在我看来,这些解释真的很糟糕,几乎没有澄清任何需要澄清的问题。事实上,目标检测目前(在许多深度学习论文中)被用作目标定位+目标分类的同义词。 - nbro
@nbro 没错。此外,目标识别现在被视为计算机视觉中的一个学科,因此是一个更广泛的术语,它包括提取图像中相关特征和模式的不同技术/算法,以实现所需的目标:分类、定位、匹配、分割等。 - Omar AlSuwaidi

0

目标检测:检测图像中的物体。它不会提供有关物体是什么的信息。换句话说,目标检测的输出是包含物体的边界框的x、y、宽度和高度。

对象分类:告诉你物体是什么,例如猫、狗、汽车等。换句话说,在分类或识别中,输出将是一个类别标签。

我正在开发一个应用程序,给定一幅包含绘画的输入图像,它能够告诉你这幅画的标题。类似的情况是:给定一幅包含建筑物的输入图像,返回的结果是建筑物的名称。

对于您的问题,更适合的是“草图分类”。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接