如何使用Python Imaging Library(PIL)识别非照片或“无趣”图像

6

我有数千张图片,需要筛选出不是照片或者“无趣”的图片。

例如,“无趣”的图片可能是单色的,或者大部分都是一种颜色,或者只是一个简单的图标/标志。

解决方案不必完美,只需足够好以删除最不有趣的图片。

到目前为止,我最好的想法是随机抽样像素,然后……对它们进行处理。


1
我认为最简单的方法是检查图像直方图。 - Tarantula
我对图像处理一窍不通 - 直方图有什么用? - Danphe
1个回答

2
Danphe已经超越了我。这是我计算图像熵的方法:
import Image
from math import log

def get_histogram_dispersion(histogram):
    log2 = lambda x:log(x)/log(2)

    total = len(histogram)
    counts = {}
    for item in histogram:
        counts.setdefault(item,0)
        counts[item]+=1

    ent = 0
    for i in counts:
        p = float(counts[i])/total
        ent-=p*log2(p)
    return -ent*log2(1/ent)


im = Image.open('test.png')
h = im.histogram()
print get_histogram_dispersion(h)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接