.NET C#中的简单OCR问题

4
我正在进行一些OCR和屏幕抓取工作。 我最终得到了许多看起来像这样的文件。
只需要在这些文件上使用C#进行一些非常基本的OCR。 我一直在尝试不同的库(Tessnet2,Puma,MODI)并且一直在尝试解决很多不同的问题,甚至无法从C#中运行它们。
对于这么简单的东西,你们有什么建议吗?
谢谢!

Tessnet2应该是最好的之一。你遇到了什么问题?它们完全不能工作还是你无法正确处理它们? - Alastair Pitts
好的,Tessnet2已经可以工作了,之前缺少语言文件。不幸的是,它似乎是垃圾,尤其对于这么简单的东西来说。 - Luke Belbina
简单是在看的人眼中,而且既然你不是做OCR的那个人..... - Blindy
你能让它工作了吗? - Andrew Cash
2个回答

1

OCR程序并不适用于读取低分辨率的屏幕截图。即使是一些最好的商业OCR引擎也难以读取屏幕截图。

Tesseract需要良好清晰的图像,即使在正常情况下也需要这样才能得到合理的结果。您可能会得到糟糕的结果,原因可能有几个。如果您发布一些示例图像和输出结果,那么我们可能更能够解释结果。问题包括彩色背景、文本区域错误、小字符、伪影等。

显然,如果您使用要读取的字体对Tesseract进行训练,它将获得更好的结果。


-1

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接