14得票2回答
使用PHP读取图像中的文本

我正在尝试从这个图像中读取文本: 我想读取价格,例如"EUR42721.92" 我尝试了这些库: 如何使用PHP OCR类创建PHP验证码解码器:识别图像中的文本和对象 - PHP Classes phpOCR:用PHP编写的光学字符识别器 但它们不起作用。 我该如何读取文本?

28得票5回答
如何在小型C++项目中使用Tesseract OCR(或任何其他免费OCR)?

我调查后得知,唯一可靠的免费OCR选项是Tesseract或CuneiForm。 然而,Tesseract文档很糟糕,只给你一堆Visual Studio代码(对于我来说是在Windows上),然后你就需要自己在他们的API海洋中摸索。你只能使用编译后的exe文件来处理tiff图像。 我期...

14得票1回答
Tesseract的自定义词典

我目前正在使用Tesseract OCR在Android上开发一个项目。希望通过添加词典来微调用户获取的结果。根据 tesseract OCR wiki 的说明,最好的方法是: 用与之相同格式的UTF8文本文件替换tessdata/eng.user-words中的单词列表,每行一个单词。 ...

33得票8回答
有没有一个OCR库可以输出图像中找到的单词的坐标?

我的经验是,OCR库通常只会输出图像中找到的文本,而不会输出文本的位置信息。是否存在一种OCR库,可以同时输出在图像中发现的单词以及这些单词被发现的坐标(x、y、width、height)?

16得票1回答
处理一张表格图像以从中获取数据

我有这张桌子的图片(如下所示)。我正在尝试获取与表格图像中的第一行类似的表格数据:rows[0] = [x,x, , , , ,x, ,x,x, ,x, ,x, , , , ,x, , , ,x,x,x, ,x, ,x, , , , ] 我需要x的数量以及空格的数量,还会有其他类似于这个表格的...

37得票9回答
OCR的理想字体是什么?

有没有人有使用不同字体进行OCR的经验?我生成一个ID,然后尝试用tesseract进行扫描。目前我只是尝试使用不同的字体,但这似乎相当低效。我已经尝试了OCR*字体系列和其他各种字体,如Arial和Georgia。tesseract往往会对OCR*字体感到困惑。 是否有专门为tessera...

47得票2回答
使用Python和OpenCV检测图像中的文本区域

我想使用Python 2.7和OpenCV 2.4.9来检测图像中的文本区域,并在其周围绘制一个矩形区域,就像下面示例图片中所示。 由于我是图像处理方面的新手,因此任何有关如何完成此任务的想法都将受到赞赏。

9得票1回答
Tesseract OCR:解析表格单元格

我正在使用Tesseract-OCR v4.0.0(alpha?)从cmd中提取下面表格的png图片中的文本: 我希望Tesseract-OCR在进入下一个单元格之前解析当前单元格中的内容。我不想进入'行'中的下一个单词。 期望结果: . . . John Smith 07 March...

9得票3回答
如何在Visual Studio 2010项目中实现Tesseract运行

我在Visual Studio 2010中有一个C++项目,希望使用OCR。我看到了很多Tesseract的“教程”,但不幸的是,我只是浪费了时间并感到头疼。 在我的项目中,我有一张储存在Mat中的图片。解决我的问题的一种方法是将这个Mat保存为一张图片(例如image.jpg),然后像这样...

10得票1回答
iPhone SDK的名片识别器或OCR库

我想开发一个用于iPhone的名片识别或OCR库(开源)。 我看到了关于www.code.google.com/p/tesseract-ocr/ 的参考资料,但我不知道该如何使用它。我还下载了zip文件http://tesseract-ocr.googlecode.com/files/tes...