Tesseract或其他OCR库

7
我正在寻找如何在C++中使用(和训练)Tesseract的解释/API文档/示例,但是在谷歌Tesseract页面上没有找到有用的信息,也没有在网络上找到任何有用的内容。
如果您有任何有用的资源或经验,那将不胜感激,因为我不知道该如何开始使用它。
附注:
1. 我愿意听取其他库的建议。
2. 仅限免费库。
2个回答

4
我有一些使用Tesseract的经验... 简单地谷歌搜索“训练Tesseract”会显示这个页面: http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract 在这个页面上,你必须选择你想要训练的Tesseract版本。 虽然3是最新版本,但它还很新,因此人们仍在解决任何问题 - 我仍在使用2.4版本。无论如何,你将看到训练特定“语言”(或应该称为“字体”或“字符集”)的大约9个步骤。你也可以只使用现有的“eng”语言 - 但这取决于你的应用程序。例如,在我的应用程序中,我必须进行文档分析并选择一个特定区域,并想要对一个13个字符数字字符串进行OCR - 我需要高精度 - 我不希望它读取“5”作为“S”和“0”作为“O”等等,因此创建一个特定的我的特定字体集的“语言”,其中只包含字符0..9,是合乎逻辑的,而你可能不在意是否获得额外的“噪音”。

0

Tesseract Ocr是一个用于检测光学字符的开源库。如果您使用Visual Studio,则只需包含库文件即可。如果您使用Qt Creator,则需要构建库以在QT上工作。您需要使用CMakelist或Cmake Gui来构建库。 您可以访问链接Opencv Ocr build for Qt 5.4 mingw


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接