我正在尝试找到一种可接受复杂度的高效方法,以便于:
总结如下:
编辑--有关数据集的更多信息
每个数据集包含80K张共享相同概念(例如T恤、手表、鞋子)、大小、方向(其中90%)和背景(其中95%)的产品图片。
除产品本身外,每个数据集中的所有图片看起来几乎相同。为了使事情更清晰一些,让我们只考虑“手表数据集”:该数据集中的所有图片看起来几乎完全相同。
- 检测图像中的对象,以便于将其与周围环境隔离开来
- 将该对象分割为其子部分并对其进行标记,以便于可以随意获取它们
总结如下:
- 我应该关注哪种方法?为什么?
- 我应该使用OpenCV处理这种东西,还是有其他“更好”的选择?
编辑--有关数据集的更多信息
每个数据集包含80K张共享相同概念(例如T恤、手表、鞋子)、大小、方向(其中90%)和背景(其中95%)的产品图片。
除产品本身外,每个数据集中的所有图片看起来几乎相同。为了使事情更清晰一些,让我们只考虑“手表数据集”:该数据集中的所有图片看起来几乎完全相同。
我想提取手表的表带和表盘(除了手表本身)。问题在于有许多不同的手表款式和形状。从迄今为止所读的内容来看,我认为我需要一个模板算法,允许弯曲和拉伸,以便能够匹配不同样式的表带和表盘。
与其创建三个不同的模板(表带上部、表带下部、表盘),创建一个模板并将其分割成3个部分是合理的。这样,我就足够自信,每个部分都按照预期检测到了,例如,表盘不会被检测到在表带下部。
在我遇到的所有算法/方法中,主动形状|外观模型似乎是最有前途的。不幸的是,我还没有找到一个像样的实现,并且我不太自信这是最好的方法,因此不能自己编写。
如果有人能指出我应该真正寻找什么(算法/启发式/库等),我将不胜感激。如果您认为我的描述有点模糊,请随时要求更详细的说明。