目标检测和目标分类有什么区别?

15

这两个任务都是卷积神经网络的流行应用。然而,我不理解它们之间的区别。根据Caffe教程中的一篇文章,似乎目标检测任务更加困难。

目标检测是指确定图像中物体的位置,还是揭示图像中有多少个物体...?


我投票关闭此问题,因为它在这里是不相关的,应该在人工智能堆栈交换等网站上提问。 - nbro
4个回答

10

区别在于,如果你需要定义一张图片的类别,那么它与物体分类任务相关。如果你需要在图片上定义一个对象的坐标,则属于物体检测任务。

要了解卷积神经网络在物体检测方面的实际应用,您可以阅读此文章:http://rnd.azoft.com/convolutional-neural-networks-object-detection/


目标识别在这里的应用是什么? - Rohan Saxena

6
检测是识别的过程,分类是根据先前定义的类别或类型对对象进行分类。虽然两者都基于对象的可辨识属性,但分类可以根据问题域而采取任意界限,与检测无关。

看起来目标检测的任务更难。

无论哪一个更难取决于所研究的特定属性、误差范围、准确率等。例如,如果检测比分类有更严格的容差,则可能被认为是更困难的。但在交替进行检测和分类的迭代应用中,哪个更难可能并不那么容易确定。

目标检测是否定义了对象在图像中的位置,或者揭示了图片中对象的数量...?

从技术上讲,检测应该是明确的,可能是布尔值T或F。所有其他属性,如位置、数量和所有其他属性都输入到分类中。这并不是说这些属性与检测无关,而是一旦检测到,任务现在变成了分类。精确的界限或转换发生的位置取决于具体的应用程序。

明确的检测一开始也是我所考虑的,直到我看到这个Caffe网站上的第四张幻灯片,这就让我感到困惑了。 - Ren
而且,这个网站 似乎也表明,分类是导致明确的 T 或 F 的原因。 - Ren
请阅读您提供的链接中的下一张幻灯片,以进一步澄清。分类可以是真/假,但也可以包括许多类别。分类过程可以分配任何一个或没有这些众多类别中的任何一个。 - Emacs User

6
对象分类 - 给定一张图像,将其分类为某些类别,如苹果、公共汽车、森林等。
对象检测 - 给定一张图像,查找是否存在一个路径(或坐标),该路径中包含所需的类别?例如- 给定一张图像,预测其中是否存在类似橙子、卡车、狮子等的类别。

通常的问题涉及到这两种技术。首先您需要对给定的图像进行对象检测,并取出所需的路径。然后应用分类来预测其类别(这两者可以合并成同一个步骤)。

1

目标检测回答了一个问题:“是否检测到了目标?”(是/否)。任何不是二元的都属于目标分类或目标识别(例如,人脸识别而非人脸分类)。在图像中,“识别”这个术语通常更合适,因为总会存在一些不确定性,并且“识别”反映了在图像目标检测中发现的具体问题。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接