使用PHP识别可识别数字

Question

3

我正在尝试从一张图片中提取1-99范围内的数字。我已经尝试了使用PHP的几种OCR方法，但最终我的脚本会失败，因为数字偶尔会向左或向右旋转5％。这使得图片无法被识别。

现在我已经安装了Ocropus http://code.google.com/p/ocropus/ 作为测试。不幸的是，这并不能每次都给我正确的数字。这让我想到我的图片还没有被优化到足够好。

有没有人有一些关于如何优化数字可读性的建议/想法？我也很感激有关如何从图片中找到数字的想法。

- Kristian

2个回答

-1

在您的解决方案中使用外部（基于Web的）API是否可接受？如果是，请考虑使用http://www.wisetrend.com/wisetrend_ocr_cloud.shtml（一种用于OCR的REST API）。

它可以自动纠正图像旋转；尝试调整http://www.wisetrend.com/WiseTREND_Online_OCR_API_v2.0.htm中描述的Deskew和AnalysisMode参数。

（此外，在使用API时，请确保输入图像头中正确设置了图像分辨率-这可能会对识别质量产生重大影响）。

- Eugene Osovetsky

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Andrew Cash · Accepted Answer

看起来Tesseract / Ocropus在倾斜方面有些混淆，可能是同一行上多个倾斜的数字让Tesseract或Ocropus感到困惑。

您是否将整个图像作为数字网格传递？您是否尝试将每个框（数字）单独作为单独的图像发送到OCR引擎？您可能会发现结果更好。

您是否尝试过其他OCR引擎？您是否需要它是开源的？

我通过一个更便宜的商业OCR引擎运行了该图像，并正确识别了所有数字。因此，另一个选择是快速使用C＃或C ++代码包装商业OCR引擎并进行接口交互以提供改进的结果。