阿拉伯语开源OCR

6

我正在寻找一款OCR库或任何示例,可以使用它从图像中读取阿拉伯字母。我搜索了很多,但没有找到什么...请帮忙,谢谢。


https://dev59.com/nW445IYBdhLWcg3wytIUhttp://stackoverflow.com/questions/6825712/need-anopensource-of-arabic-ocr-either-in-java-or-in-dotnet - 1.01pm
2个回答

7

TesseractOCR 是目前可能是最好的开源OCR引擎,非常灵活,可以识别很多内容。它允许使用自定义数据进行训练,所以只要你愿意付出努力(即创建训练集),就可以识别任何语言。

由Tesseract提供的工具(带有图形用户界面),可以帮助创建数据集,您可以指定字符的边界框和相应的转录。

编辑:从另一篇文章中(上面链接的文章)注意到版本3.01已经创建了阿拉伯语的训练集。 您只需要插入阿拉伯数据,问题就解决了 :)


1

这是一个封闭的库..我需要一个开源的来完成它。 - Ramah
1
也许你应该在你的问题中提到这一点。 寻找一个好的开源OCR将会非常困难,尤其是对于阿拉伯语。 - Michael K

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接