我正在编写一个脚本,以查找并删除大量图像库中的重复图像。目前,我正在进行两次过滤,首先查找相同大小的文件,然后对文件的10240字节片段进行sha256处理,以获取具有相同大小的文件的指纹(代码在这里)。
它运行良好,但我猜测jpeg格式中可能已经内置了校验和,我可以使用它们来代替sha256。是否有人知道是否存在校验和或其他可用作校验和/指纹的组件?如果是这样,是否有一种有效的方法来访问它们?
它运行良好,但我猜测jpeg格式中可能已经内置了校验和,我可以使用它们来代替sha256。是否有人知道是否存在校验和或其他可用作校验和/指纹的组件?如果是这样,是否有一种有效的方法来访问它们?