.NET C#中的简单OCR问题

Question

4

我正在进行一些OCR和屏幕抓取工作。我最终得到了许多看起来像这样的文件。

只需要在这些文件上使用C#进行一些非常基本的OCR。我一直在尝试不同的库（Tessnet2，Puma，MODI）并且一直在尝试解决很多不同的问题，甚至无法从C#中运行它们。

对于这么简单的东西，你们有什么建议吗？

谢谢！

- Luke Belbina

Tessnet2应该是最好的之一。你遇到了什么问题？它们完全不能工作还是你无法正确处理它们？ - Alastair Pitts

好的，Tessnet2已经可以工作了，之前缺少语言文件。不幸的是，它似乎是垃圾，尤其对于这么简单的东西来说。 - Luke Belbina

简单是在看的人眼中，而且既然你不是做OCR的那个人..... - Blindy

你能让它工作了吗？ - Andrew Cash

2个回答

-1

有一个基于Web的OCR API供您尝试，这是一个C#示例，演示如何使用它：http://snipt.org/lOgh/（您需要先在http://www.wisetrend.com/wisetrend_ocr_cloud.shtml注册API密钥-查找“免费注册”按钮）。

声明：WiseTrend是我公司的客户。

- Eugene Osovetsky

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Andrew Cash · Accepted Answer

OCR程序并不适用于读取低分辨率的屏幕截图。即使是一些最好的商业OCR引擎也难以读取屏幕截图。

Tesseract需要良好清晰的图像，即使在正常情况下也需要这样才能得到合理的结果。您可能会得到糟糕的结果，原因可能有几个。如果您发布一些示例图像和输出结果，那么我们可能更能够解释结果。问题包括彩色背景、文本区域错误、小字符、伪影等。

显然，如果您使用要读取的字体对Tesseract进行训练，它将获得更好的结果。