这两个任务都是卷积神经网络的流行应用。然而,我不理解它们之间的区别。根据Caffe教程中的一篇文章,似乎目标检测任务更加困难。
目标检测是指确定图像中物体的位置,还是揭示图像中有多少个物体...?
这两个任务都是卷积神经网络的流行应用。然而,我不理解它们之间的区别。根据Caffe教程中的一篇文章,似乎目标检测任务更加困难。
目标检测是指确定图像中物体的位置,还是揭示图像中有多少个物体...?
区别在于,如果你需要定义一张图片的类别,那么它与物体分类任务相关。如果你需要在图片上定义一个对象的坐标,则属于物体检测任务。
要了解卷积神经网络在物体检测方面的实际应用,您可以阅读此文章:http://rnd.azoft.com/convolutional-neural-networks-object-detection/
无论哪一个更难取决于所研究的特定属性、误差范围、准确率等。例如,如果检测比分类有更严格的容差,则可能被认为是更困难的。但在交替进行检测和分类的迭代应用中,哪个更难可能并不那么容易确定。看起来目标检测的任务更难。
从技术上讲,检测应该是明确的,可能是布尔值T或F。所有其他属性,如位置、数量和所有其他属性都输入到分类中。这并不是说这些属性与检测无关,而是一旦检测到,任务现在变成了分类。精确的界限或转换发生的位置取决于具体的应用程序。目标检测是否定义了对象在图像中的位置,或者揭示了图片中对象的数量...?
目标检测回答了一个问题:“是否检测到了目标?”(是/否)。任何不是二元的都属于目标分类或目标识别(例如,人脸识别而非人脸分类)。在图像中,“识别”这个术语通常更合适,因为总会存在一些不确定性,并且“识别”反映了在图像目标检测中发现的具体问题。