我正在寻找一款OCR库或任何示例,可以使用它从图像中读取阿拉伯字母。我搜索了很多,但没有找到什么...请帮忙,谢谢。
我正在寻找一款OCR库或任何示例,可以使用它从图像中读取阿拉伯字母。我搜索了很多,但没有找到什么...请帮忙,谢谢。
TesseractOCR 是目前可能是最好的开源OCR引擎,非常灵活,可以识别很多内容。它允许使用自定义数据进行训练,所以只要你愿意付出努力(即创建训练集),就可以识别任何语言。
有由Tesseract提供的工具(带有图形用户界面),可以帮助创建数据集,您可以指定字符的边界框和相应的转录。
编辑:从另一篇文章中(上面链接的文章)注意到版本3.01已经创建了阿拉伯语的训练集。 您只需要插入阿拉伯数据,问题就解决了 :)