Tesseract选项和图像预处理

Question

3

亲爱的社区
我正在尝试进行一些OCR。
我已经对图像进行了很多预处理（校正、裁剪...）
现在，我自己可以轻松读取数字
但我无法让tesseract给我一个有意义的结果。

点击上面的链接查看我正在尝试OCR的图像

我是否还需要更多的预处理？
或者我调用tesseract的方法不正确？

我尝试过没有任何选项，或者使用以下选项：

config = ('--psm 13 -c tessedit_char_whitelist=0123456789')

编辑：

有趣的是，我尝试了多种方法：

所以这对我来说是非常初步的。我可能更喜欢使用Tesseract，以避免支付大笔费用。当我的项目更加先进时，我会看看我能做什么。

但我渴望听到您关于图像预处理的建议！！ :-)

所以如果你有建议，请告诉我。

祝好！

- Antoine Driot

发布的图片是原始的还是经过预处理的？如果是经过预处理的，请发布原始图片。 - undefined

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Ramesh Kamath · Accepted Answer

你可以为tesseract提供三个重要的参数，分别是 -l、--oem 和 --psm。

获取选项的方法如下:

像这样使用这些选项 config = ("-l eng --oem 1 --psm 7")。