如何检测一张照片是否为海报(非真实)?

6
我有一些来自音乐家网站的.jpeg图片,这些图片由即将举行的演出海报和乐队照片(乐队在现实生活中的照片)组成。
以下是一个海报示例: enter image description here 我对现代技术或算法不是很熟悉(如果存在的话),但这是我认为可能会寻找的内容:
- 图像中的文本通常会透露出海报的信息。 - 也许真实照片(即非海报)遵循不同的颜色分布? - 海报可能不太可能有人脸,但这是一个相当弱的断言。
是否有任何分类算法可以检测图像是否为海报?
1个回答

11
你的问题非常广泛。 "海报"或"照片"并不是一个明确定义的对象。什么是海报?在现实生活中,海报通常是照片、照片组合或经过一些修正的照片。
如果我们缩小到你问题的第一部分提到的内容 - 乐队照片 vs 即将举行的演出海报,那么答案可能是肯定的(尽管我从没见过有人这样做)。因为你正在寻找一个二元分类器,我建议使用一些机器学习模型(朴素贝叶斯应该足够,但如果你想使用更复杂的特征,可以尝试SVM、ELM或一些随机森林/决策树),并将其应用于编码为包含以下向量的数据中:
二进制特征:
- 图像上是否有文字?- 你需要外部文本检测算法。 - 图像上是否有数字?- 活动应该有日期 - 图像上是否有日期? - 图像上是否有脸?
使用朴素贝叶斯将建立条件概率P(poster|there is a word)P(poster|there is a number)等,这不仅会给你一个分类器,还会提供一些有关你的特征有多重要的见解(概率接近0.5是一个建议,表明特定特征是无用的)。
我不会使用直方图等,因为可能的照片范围非常广泛,照片风格等也各不相同,除非你愿意创建真正庞大的训练集。
如果这还不够,你可以将这些特征改为更复杂的特征,并使用比朴素贝叶斯更强大的分类器。

如果所有的尝试都失败了,你还可以尝试在原始图像上训练一些现代模型,比如深度信念网络。这将需要强大的计算能力,但对于科学界来说,结果非常有价值。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接