什么是以编程方式检测色情图片的最佳方法?

120
Akismet在检测垃圾评论方面表现出色。但是如今,评论并不是唯一的垃圾形式。如果我想要像Akismet这样的东西自动检测社交网络网站上的色情图片,该怎么办?该网站允许用户上传他们的照片、头像等。
已经有一些基于图像的搜索引擎和面部识别技术可用,因此我认为这并不是什么高深技术,应该可以做到。然而,我对它的工作原理以及如果我想从头开始开发它应该怎么做一无所知。
我该如何开始?
是否有任何开源项目正在进行中?

82
我认为这听起来比火箭科学还要难!我们已经有很多火箭,但据我所知,没有这样的“色情检测器” :) - GaZ
4
LOL。现在已经有人脸识别技术了,但是还没有生殖和乳房识别技术。真不幸。 - Jon Limjap
11
色情内容是与地域相关的问题。此外,我确信有许多图片并没有显示生殖器或裸体,但在某些地方仍然被认为是相当露骨的。(再次强调-在某些地方)。听起来需要一个高级人工智能来完成,而不是简单的算法。 - Noam Gal
2
我刚刚偶然发现了这个实用工具,让我想起了这个帖子。不知道它是否有效?http://proofpronto.com/porn-detection-stick-by-paraben.html - Martin Smith
1
@jm666,如果这个问题对你来说很严重,并且你认为这个领域的技术水平在过去两年里有所提高,那么为什么不在被引用的重复问题上设置赏金呢?这样你就可以吸引一些关注,也许会得到一些答案。 - Michael Petrotta
显示剩余4条评论
25个回答

0

这并不是什么高深的科学,现在已经不是了。它非常类似于人脸识别。我认为处理它最简单的方法是使用机器学习。由于我们正在处理图像,因此我可以指向神经网络,因为这些似乎更适合图像。您需要训练数据。您可以在互联网上找到大量的训练数据,但必须将图像裁剪到要检测的特定部分。当然,您必须将问题分解为要检测的不同身体部位,并为每个部位创建训练数据,这就是事情变得有趣的地方。

正如上面有人所说,它不能100%完成。这样的算法会失败。实际精度将由您的训练数据、神经网络的结构以及您选择如何聚类训练数据(阴茎、阴道、乳房等及其组合)来确定。无论如何,我非常有信心可以以高精度实现明确的色情图像。


0

0

查看文件名和任何属性。这里的信息远远不足以检测到甚至20%的淫秽图片,但是一个简单的关键词黑名单至少可以检测到带有描述性标签或元数据的图片。花费20分钟编码来获得20%的成功率并不是一个坏交易,特别是作为一个预筛选,可以至少捕捉一些简单的图片,然后将其余的传递给审核员进行判断。

另一个有用的技巧当然是相反的,维护一个白名单的图像来源,允许它们在没有审核或检查的情况下上传。如果大多数图像来自已知的安全上传者或来源,您可以盲目地接受它们。


0

您可以在互联网上找到许多关于这个主题的白皮书


-1

以现今的知识水平,你不可能百分之百地做到这一点(我会说也许只有1-5%是可行的)。你只需检查图像名称中是否包含与性相关的词语,就能获得比那1-5%更好的结果 :)

@SO Troll: 太对了。


-1,这提供了评论,但没有给出实质性的解决方案。 - Brad Koch

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接