已经有一些基于图像的搜索引擎和面部识别技术可用,因此我认为这并不是什么高深技术,应该可以做到。然而,我对它的工作原理以及如果我想从头开始开发它应该怎么做一无所知。
我该如何开始?
是否有任何开源项目正在进行中?
添加一个有攻击性的链接并存储冒犯图片的md5(或其他哈希)以便将来可以自动标记。
如果有人拥有一个大型的公共图像md5数据库,同时运行具有描述性标签的webservice,那将是多么酷啊!很多色情内容都不是原创作品(因为现在拥有它的人可能没有制作它),而且流行的图像往往会漂浮到不同的地方,所以这真的可以产生巨大的影响。
在我看来,主要的障碍是定义“色情图片”。如果您能轻松定义它,那么您可能可以编写一些有效的程序。但即使是人类也无法就什么是色情达成一致。应用程序如何知道呢?用户审核可能是最好的选择。
这个看起来很有希望。基本上,它们通过识别人脸进行校准,检测皮肤并确定“皮肤路径”(即测量皮肤像素与面部皮肤像素/皮肤像素的比例)。它的性能表现还不错。 http://www.prip.tuwien.ac.at/people/julian/skin-detection
BrightCloud Web Service API非常适合这个需求。它是一个REST API,用于执行类似于此类的网站查询。它包含一个非常大且准确的网络过滤数据库,其中一个类别“成人”已经识别出超过1000万个色情网站!
我听说过一些使用非常简单但相当有效的算法的工具。该算法计算了与某些预定义的“肤色”颜色接近的像素的相对数量。如果该数量高于某个预定义值,则认为图像是色情/色情内容。当然,该算法会对特写面部照片和许多其他事物产生误报结果。
由于您正在撰写社交网络相关内容,因此会有很多具有高度皮肤颜色的“正常”照片,因此您不应使用此算法来拒绝所有具有积极结果的图片。但是,您可以使用它为管理员提供一些帮助,例如标记这些图片具有更高的优先级,因此如果管理员想要检查某些新图片是否包含色情内容,他可以从这些图片开始。
检测色情图片仍然是一个非常理论的人工智能任务。
通过添加一个按钮/链接“报告垃圾邮件/滥用”来收集集体力量和人类智慧。或者雇用几个管理员来完成这项工作。
P.S. 真的很惊讶有多少人问问题,假设软件和算法是万能的,甚至没有考虑他们想要的东西是否可以实现。他们是那些对硬件、低级编程和所有“魔法背后”的理解一无所知的新型程序员的代表吗?
P.S. #2. 我还记得定期会发生这样的情况,即人们自己无法确定一张图片是色情还是艺术,这时候就会被送上法庭。即使法院做出了裁决,也有一半的人认为这个决定是错误的。最近发生的最愚蠢的情况是,由于一张CD封面图片中出现了裸露,一篇维基百科页面在英国被禁止访问。
我能想到的两个选项(虽然都不是程序上检测色情内容):