Tesseract无法识别阿拉伯字符。

javaocrtesseracttess4jarabic-support

3

3

我正在开发一款应用程序，使用Tesseract API识别车牌号码，但车牌上有阿拉伯字符。

是否有人有想法如何处理这个问题？

这是一个车牌的示例

- Sami Fakhfakh

2个回答

1

1

有一个专门用于阿拉伯字符的Tesseract模块可供使用：https://linuxac.org/forum/%D8%A8%D8%B1%D8%A7%D9%85%D8%AC-%D9%88%D8%AA%D8%B7%D8%A8%D9%8A%D9%82%D8%A7%D8%AA-%D8%B3%D8%B7%D8%AD-%D8%A7%D9%84%D9%85%D9%83%D8%AA%D8%A8/%D8%A8%D8%B1%D8%A7%D9%85%D8%AC-%D8%A7%D9%84%D8%AA%D8%AD%D8%B1%D9%8A%D8%B1-%D8%A7%D9%84%D9%85%D9%83%D8%AA%D8%A8%D9%8A-%D9%88%D8%A7%D9%84%D9%86%D8%B4%D8%B1-%D8%A7%D9%84%D8%B7%D8%A8%D8%A7%D8%B9%D9%8A/57245-tesseract-%D8%A7%D9%84%D8%A7%D9%86-%D9%8A%D8%AF%D8%B9%D9%85-%D8%A7%D9%84%D8%B9%D8%B1%D8%A8%D9%8A%D8%A9

- medMghari

1

1

首先，您需要对图像进行预处理和裁剪车牌周围的区域。然后只需执行二值化以获得更好的OCR体验。

Tesseract不识别Tashkeel。但是，对于字符，请使用以下行来检测阿拉伯字符和英文文本。此外，请记住选择适当的页面分割模式。

pytesseract.image_to_string(image,lang='eng+ara')

您可能还需要使用以下命令来查看可进行的配置以改进它。

tesseract --print-parameters

- Esraa Abdelmaksoud

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接