缩小 MNIST 图像规模

Question

缩小 MNIST 图像规模

javaandroidimage-processingbitmapmnist

3

我正在尝试解决Android设备上的MNIST分类问题。我已经有了一个训练好的模型，现在我想能够识别照片上的单个数字。

拍摄照片后，在将图像传递给模型之前，我会进行一些预处理。以下是原始图像的示例：

然后，我将其变为黑白色，使其开始看起来像这样：

请不要关注尺寸上的变化-它们是由于我截取屏幕造成的，在应用程序中，两个图像仍具有相同的大小。

将其转换为黑白色后，我提取数字的斑点，将其缩小到20*20（保持纵横比），然后添加填充以使其适合MNIST 28*28的大小。最终结果如下：

请注意，我将图像放大以显示问题。问题是：缩小后会丢失很多有用的信息，有时整个数字的边缘都会消失。有没有办法避免这种情况？也许我可以在缩小之前使白线变粗？

附注：我使用Catalano框架进行图像处理。

编辑：应用答案中建议的滤镜后，这是我的结果：

- Lingviston

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Hayk · Accepted Answer

我不确定你提到的框架，但是有一个可以帮助你的事情，就是在进行MNIST样式的归一化之前，在原始图像上使用一些形态学操作。具体来说，可以按以下方式进行腐蚀（我记录了Python中的方法，你使用的框架应该有类似的模拟，因为这些操作非常标准）。

import numpy as np
import cv2

xx = cv2.imread('6.jpg') # your original image of 6
kernel = np.ones((20,20), np.uint8)
erosion = cv2.erode(xx, kernel, iterations = 2)

cv2.imwrite('6A.jpg',erosion) # this will be used as a replacement for the original image

这将会生成类似这样的图片。然后，如果您对新图像进行二值化（例如用灰度强度150进行阈值处理），并进行缩放后再填充，您应该会得到这样一个更具鲁棒性的图片。

另外请注意，在将图片提供给任何分类器之前，您需要在最后一步将其居中（相对于其质心）。

MNIST标准下的最终结果如下所示

（物理尺寸为28x28）。