我们遇到的问题是,当用户上传一张图片时,显然需要对其进行验证,以确保它对网站是安全的(没有色情或露骨的图片)。然而我的客户不想手动接受每个被上传的图片,因为这会耗费时间并导致用户的图片不能立即在线上。
我使用PHP编写我的代码。如果需要,我可以更改为ASP.net或C#。有没有任何方法可以做到这一点?
2019更新
自2013年以来,许多事情都发生了变化,其中最重要的是机器学习。现在有许多库和API可用于程序检测成人内容:
Google Cloud Vision API使用Google用于安全搜索的相同模型。
NSFWJS使用TensorFlow.js,声称可以达到~90%的准确率,并在MIT许可下开源。
Yahoo有一个名为Open NSFW的解决方案,在BSD 2条款许可下发布。
2013回答
有一个名为nude.js的JavaScript库用于此,尽管我从未使用过它。 这里是它的使用演示。
还有PORNsweeper。
另一种选择是使用类似于Amazon Mechanical Turk的东西外包审核工作。 这是一种群体外包平台,它“使计算机程序协调使用人类智能来执行计算机无法执行的任务”。 因此,您基本上会为每个审核项目支付少量费用,并外包实际的人员来审核内容。
我想到的唯一其他解决方案是使图像由用户审核,其中用户可以标记需要审核的不当帖子/图片,如果没有人想手动审核它们,则可以在一定数量的标记后将其删除。
以下是有关该主题的一些其他有趣链接:
<?php
$url = 'http://server.com/image.png';
$data = json_decode(file_get_contents('http://api.rest7.com/v1/detect_nudity.php?url=' . $url));
if (@$data->success !== 1)
{
die('Failed');
}
echo 'Contains nudity? ' . $data->nudity . '<br>';
echo 'Nudity percentage: ' . $data->nudity_percentage . '<br>';
如果您正在寻找基于API的解决方案,您可能需要查看Sightengine.com。
这是一种自动化解决方案,可检测图像和视频中的成人内容、暴力、名人等。
以下是使用SDK的PHP示例:
<?php
$client = new SightengineClient('YourApplicationID', 'YourAPIKey');
$output = $client>check('nudity')>image('https://sightengine.com/assets/img/examples/example2.jpg');
{
"status": "success",
"request": {
"id": "req_VjyxevVQYXQZ1HMbnwtn",
"timestamp": 1471762434.0244,
"operations": 1
},
"nudity": {
"raw": 0.000757,
"partial": 0.000763,
"safe": 0.999243
},
"media": {
"id": "med_KWmB2GQZ29N4MVpVdq5K",
"uri": "https://sightengine.com/assets/img/examples/example2.jpg"
}
}
查看文档以了解更多细节:https://sightengine.com/docs/#nudity-detection
(免责声明:我在那里工作)有一个免费的API可以检测成人内容(色情、裸露、不适宜工作场所)。
https://market.mashape.com/purelabs/sensitive-image-detection
我们已经在生产环境中使用它了,我认为它目前表现得非常好。但是有一些误检测,似乎他们更喜欢将图像标记为不安全,如果他们不确定。
微软Azure有一个非常酷的API叫做计算机视觉,您可以免费使用它(通过UI或编程方式),并且有大量文档,包括PHP文档。
它具有一些惊人准确(有时幽默)的结果。
除了检测成人和“色情”材料外,它还可以阅读文本,猜测您的年龄,识别主要颜色等等。
您可以在azure.microsoft.com上尝试它。
“色情”图像的示例输出:
FEATURE NAME: VALUE:
Description { "tags": [ "person", "man", "young", "woman", "holding",
"surfing", "board", "hair", "laying", "boy", "standing",
"water", "cutting", "white", "beach", "people", "bed" ],
"captions": [ { "text": "a man and a woman taking a selfie",
"confidence": 0.133149087 } ] }
Tags [ { "name": "person", "confidence": 0.9997446 },
{ "name": "man", "confidence": 0.9587285 },
{ "name": "wall", "confidence": 0.9546831 },
{ "name": "swimsuit", "confidence": 0.499717563 } ]
Image format "Jpeg"
Image dimensions 1328 x 2000
Clip art type 0
Line drawing type 0
Black and white false
Adult content true
Adult score 0.9845981
Racy true
Racy score 0.964191854
Categories [ { "name": "people_baby", "score": 0.4921875 } ]
Faces [ { "age": 37, "gender": "Female",
"faceRectangle": { "top": 317, "left": 1554,
"width": 232, "height": 232 } } ]
Dominant color background "Brown"
Dominant color foreground "Black"
Accent Color #0D8CBE
这完全取决于您所需的准确度水平,简单的肤色检测(如nude.js)可能会在大样本集上获得60-80%的准确度,如果需要更高的准确度,比如90-95%,则需要一些具有不断演化模型的专业计算机视觉系统。对于后者,您可以查看http://clarifai.com或https://scanii.com(我正在从事该领域)。