安卓Tesseract OCR 7段数码管识别

6
我一直在使用tesseract实现Android OCR工具,只能OCR数字。到目前为止,对于普通的数字字体,它的准确率相当高。但是,当涉及到7段数字(LCD上的数字)时,准确率非常低。
我尝试过裁剪图像、白名单0到9以及一些图像处理等方法,但都无济于事。有没有什么想法可以提高准确性?或者训练特定的7段数字给tesseract的一些技巧肯定会帮助我很多。
提前感谢。

我认为如果不重新训练,就无法获得良好的结果。如果有一个公开可用的7段数字的traineddata文件那就太好了,但是当我查找时没有找到。 - rmtheis
@laurie7:你找到训练Tesseract的好例子了吗? - Terril Thomas
这个命令是用来干什么的?tesseract img.png out -psm 7 digits - yunas
如果您在识别前进行一些预分类,这将有助于提高Tesseract的置信度。例如(3、8和9)属于同一类别,因此(2、7)取决于所考虑的字体.... 您还可以使用tesseract-box-editor来编辑框文件并重新校准分段的斑点。 - Y.AL
有兴趣看看这个项目:http://www.unix-ag.uni-kl.de/~auerswal/ssocr/ - Y.AL
显示剩余2条评论
1个回答

2

你能告诉我如何训练Tesseract只识别数字吗? - malaguna
我使用了名为“lets go digital”的字体生成了一些图像,使用Gimp添加了一些噪声,使用jTessBoxEditor生成框数据并使用此工具进行训练。阅读tesseractocr FAQ以获取更多详细信息。我还分享了训练源。 - art

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接