我不确定这是否是正确的StackExchange论坛来提问这个问题,请告诉我如果不是。
我正在开发一个应用程序,给定一个包含绘画的输入图像,它能够告诉您这幅画的标题。类似的情况是:给定一个包含建筑物的输入图像,返回结果是建筑物的名称。
这是什么样的应用程序?乍一看,我会说像“图像分类”。我不是计算机视觉方面的专家,但我一直认为“图像分类”是指“给我一张图片,告诉我这张图片里包含了什么”。
另一方面,对象检测的定义似乎更相关于识别类的对象(例如建筑物),而不是类本身的实例(例如长城):
对象检测是与计算机视觉和图像处理相关的计算机技术,用于在数字图像和视频中检测某个类的语义对象的实例(例如人、建筑物或汽车)。
关于对象识别:
对象识别是感知对象的物理属性(如形状、颜色和纹理)并将语义属性应用于它(如将对象标识为苹果)的能力。
我真的不知道如何对我的应用程序进行分类。你觉得呢?