有没有最近在图像中进行标志识别的学术研究?如果您对这个特定主题熟悉,请回答这个问题(我可以自己在谷歌上搜索“标志识别”,非常感谢)。 任何了解计算机视觉并进行过物体识别工作的人都可以发表评论。
更新:请参考算法方面(什么方法适合,领域内的论文,它是否应该适用(并已经测试)于实际数据,效率方面的考虑),而不是技术方面(使用的编程语言或者是否使用OpenCV等)... 图像索引和基于内容的图像检索方面的研究也可能有所帮助。
有没有最近在图像中进行标志识别的学术研究?如果您对这个特定主题熟悉,请回答这个问题(我可以自己在谷歌上搜索“标志识别”,非常感谢)。 任何了解计算机视觉并进行过物体识别工作的人都可以发表评论。
更新:请参考算法方面(什么方法适合,领域内的论文,它是否应该适用(并已经测试)于实际数据,效率方面的考虑),而不是技术方面(使用的编程语言或者是否使用OpenCV等)... 图像索引和基于内容的图像检索方面的研究也可能有所帮助。
您可以尝试使用SIFT等本地特征:
http://en.wikipedia.org/wiki/Scale-invariant_feature_transform这应该有效,因为标志形状通常是固定的,因此提取的特征应匹配良好。
工作流程如下:
检测角点(例如Harris角检测器)- 对于Nike标志,它们是两个尖端。
计算描述符(如SIFT-128D整数向量)
在训练阶段记住它们;在匹配阶段,为训练期间获得的数据库中的每个特征找到最近邻居。最后,你有一组匹配项(其中一些可能是错误的)。
使用RANSAC清除错误的匹配项。因此,您将获得描述从理想标志图像到您发现标志的图像的变换的矩阵。根据设置,您可以允许不同类型的转换(仅平移;平移和旋转;仿射变换)。
Szeliski的书有一个有关本地特征的章节。
http://research.microsoft.com/en-us/um/people/szeliski/Book/P.S.
我假设您想在照片中查找标志,例如查找所有百事广告牌,因此它们可能会失真。如果您需要在屏幕上找到电视频道标志(以便它不旋转和缩放),则可以更轻松地完成(模式匹配或其他方式)。
传统SIFT不考虑颜色信息。由于标志通常具有恒定的颜色(尽管确切的颜色取决于光线和相机),因此您可能需要考虑一些颜色信息。
我们在实际图像中进行了logo检测/识别。同时,我们创建了一个数据集FlickrLogos-32并将其公开发布,包括数据、标准答案和评估脚本。
在我们的工作中,我们将logo识别视为检索问题,以简化多类别识别,并使这些系统易于扩展到许多(例如数千个)logo类别。
最近,我们开发了一种被称为Bundle min-Hashing的捆绑技术,它将多个局部特征的空间配置聚合成高度独特的特征束。该捆绑表示既可以用于检索又可以用于识别。请参见以下用于logo检测的示例热度图:
工作内容:在体育视频数据库中进行商标匹配和检索
获取论文PDF:http://scholar.google.it/scholar?cluster=9926471658203167449&hl=en&as_sdt=2000
我们使用SIFT作为商标和图像描述符,并使用标准化的阈值匹配来计算模型和图片之间的距离。在我们最新的工作中,我们能够通过创建评估在同一商标的不同版本中存在的SIFT点的相关性来创建元模型,从而大大减少计算量。
总的来说,与照片相比,处理视频更加困难,因为当前使用的电视标准的视觉质量非常低。
马可