OCR和文档审查

Question

7

我正在使用Tesseract进行字母识别项目，目前识别效果相当不错。图像处理部分使用了OpenCv库。

这些字母是手写的。但是，当我用它来识别字母“O”和数字“0”时，会出现一些问题。这些字母在数据区域中用作输入名称的字段。因此，名称中不能有任何数字。当我们使用数据字段系统作为出生日期时，它只包含数字。因此，我愿意对识别系统进行限制，说相应的数据字段只有数字或字母。

而且，我愿意通过可能的单词检查已识别的字母，以便提高数据的准确性。我愿意使用openCv库完成此任务。但是我不知道哪些库可以帮助完成此任务以及这些库的功能是什么。所以请有经验的人帮助我。谢谢。

敬礼，

Thilanka.

- Thilanka

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Nick Fortescue · Accepted Answer

我从未使用过Tesseract。然而，在常见问题解答中提到：

如何只识别数字？

TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");

假设您可以使用FAQ条目的模式来设置它，使其只适当地识别字母或数字。

如果您已经尝试过此方法，请提供更多详细信息，说明为什么它无法正常工作？