OCR和文档审查

7
我正在使用Tesseract进行字母识别项目,目前识别效果相当不错。图像处理部分使用了OpenCv库。
这些字母是手写的。但是,当我用它来识别字母“O”和数字“0”时,会出现一些问题。这些字母在数据区域中用作输入名称的字段。因此,名称中不能有任何数字。当我们使用数据字段系统作为出生日期时,它只包含数字。因此,我愿意对识别系统进行限制,说相应的数据字段只有数字或字母。
而且,我愿意通过可能的单词检查已识别的字母,以便提高数据的准确性。我愿意使用openCv库完成此任务。但是我不知道哪些库可以帮助完成此任务以及这些库的功能是什么。所以请有经验的人帮助我。谢谢。
敬礼,
Thilanka.
1个回答

3
我从未使用过Tesseract。然而,在常见问题解答中提到:

如何只识别数字?

TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");

假设您可以使用FAQ条目的模式来设置它,使其只适当地识别字母或数字。

如果您已经尝试过此方法,请提供更多详细信息,说明为什么它无法正常工作?


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接