Tesseract无法识别阿拉伯字符。

3

我正在开发一款应用程序,使用Tesseract API识别车牌号码,但车牌上有阿拉伯字符。

是否有人有想法如何处理这个问题?

这是一个车牌的示例

2个回答


1

首先,您需要对图像进行预处理和裁剪车牌周围的区域。然后只需执行二值化以获得更好的OCR体验。

Tesseract不识别Tashkeel。但是,对于字符,请使用以下行来检测阿拉伯字符和英文文本。此外,请记住选择适当的页面分割模式。

pytesseract.image_to_string(image,lang='eng+ara')

您可能还需要使用以下命令来查看可进行的配置以改进它。

tesseract --print-parameters

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接