Tesseract选项和图像预处理

3

我尝试OCR的图像

编辑:如要求,这是原始图像

亲爱的社区
我正在尝试进行一些OCR。
我已经对图像进行了很多预处理(校正、裁剪...)
现在,我自己可以轻松读取数字
但我无法让tesseract给我一个有意义的结果。

点击上面的链接查看我正在尝试OCR的图像

我是否还需要更多的预处理?
或者我调用tesseract的方法不正确?

我尝试过没有任何选项,或者使用以下选项:

config = ('--psm 13 -c tessedit_char_whitelist=0123456789')

编辑:

有趣的是,我尝试了多种方法:

  • 在Windows上使用Tesseract 5,没有任何输出'eT'(但可能是配置不良)
  • 在Windows上使用Phyton Jupyter Notebook的Google API => 'UO0 1124'或类似的东西,不太记得了
  • 在buntu上使用Tesseract 4和配置=('-l eng --oem 1 --psm 13'):'WU000 244m'
  • 在Ubuntu上使用Python Jpyter Notebook的Google API => 'U000241\n'

所以这对我来说是非常初步的。 我可能更喜欢使用Tesseract,以避免支付大笔费用。 当我的项目更加先进时,我会看看我能做什么。

但我渴望听到您关于图像预处理的建议!! :-)

所以如果你有建议,请告诉我。

祝好!


发布的图片是原始的还是经过预处理的?如果是经过预处理的,请发布原始图片。 - undefined
1个回答

11
你可以为tesseract提供三个重要的参数,分别是 -l--oem--psm
  • -l 标志控制输入文本的语言。

  • --oem 参数或OCR引擎模式控制Tesseract使用的算法类型。

  • --psm 控制Tesseract使用的自动页面分割模式。

获取选项的方法如下:

像这样使用这些选项 config = ("-l eng --oem 1 --psm 7")


tesseract --help-oemtesseract --help-psm。太棒了!对于任何想要阅读更多内容的人,请访问 https://pyimagesearch.com/2021/11/15/tesseract-page-segmentation-modes-psms-explained-how-to-improve-your-ocr-accuracy/。 - undefined

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接