如何对手写数字进行分割

Question

3

我正在解决手写数字识别的问题。基本上，我们需要识别文件中的某些字段，如金额、帐号、手机号等。

手写数字识别可以分为两个步骤：

对于步骤2，我们可以使用一些预训练的MNIST模型，但问题是如何分割数字。我尝试了OpenCV轮廓，但它只有在数字之间用空白像素分离时才有用，即当数字彼此不接触时，但经常用户写连续连接的数字。

有人可以针对这个任务提出一些基于深度学习或非深度学习的方法吗？

示例图片

- Atinesh

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- curse · Accepted Answer

针对基于深度学习的方法，您可以使用Mask RCNN。这是一种非常强大的方法，可用于检测、定位和分割。该算法足够强大，即使类别之间非常接近，也能识别出不同的类别。

它将在数字周围生成边界框并对其进行分类。

请查看此存储库，因为我的解释可能无法充分表达相同的意思。

它还包含一些示例供您学习。唯一可能会减慢您速度的是，您需要标注您的图像。但是，使用迁移学习，您可以减少实际用于训练的数据量。

以下是其他相关链接：

当然，关于上述主题的更好文章肯定有很多，但这些是我使用过的。希望其他人也会向您推荐它们。