8得票3回答
如何减小tesseract生成的PDF大小?

我的(web)应用程序的设置如下:我会获取用户上传的PDF文件,对它们运行OCR并显示OCRed PDF。由于所有东西都在线上,因此尽可能将生成的PDF文件大小最小化是降低用户加载和等待时间的关键。 我从用户那里接收的文件是sample.pdf(我创建了一个带有原始文件和我在此处生成的文件的存...

8得票1回答
安卓OCR tesseract:如何使用Pixa对象的数据显示边界框

我目前正在研究Android上的OCR。因此,我编写了一个带有相机预览的小应用程序,现在我正在使用onPreviewFrame方法向Tessearact工具(tess-two)提供图像。现在我想在我的相机预览中显示OCR的边界矩形。TessBaseAPI提供了返回字符/单词边界框的方法。返回对...

13得票1回答
简单的OCR应用程序使用安卓相机

可能重复: android OCR? 我想要开发一个应用程序,利用相机实现OCR扫描,并从纸张上检测文本内容并将其转换成普通文本。这是一个简单的程序。我该如何做呢?有没有最简单的方法?

8得票1回答
使用pytesseract能否从图片的特定部分提取文字?

我在一张图片中有一个边界框(矩形坐标),想要提取该坐标内的文本。我该如何使用 pytesseract 来提取该坐标内的文本? 我尝试使用 OpenCV 将图像部分复制到其他 numpy 数组中,例如: cropped_image = image[y1:y2][x1:x2] 我尝试了py...

25得票5回答
如何在tesseract中保留文档结构

我正在使用tesseract OCR从图像中提取文本。保留文档的结构对我非常重要。目前,tesseract不会保留结构,它实际上会改变文本的顺序。我的输入是下面的图像。 我得到的输出如下:Someto the left Someto the left Some in the middl...

72得票11回答
如何从图像中识别车辆牌照/号码牌(ANPR)?

我有一个网站,允许用户上传汽车图片,并希望设置隐私过滤器来检测车辆上的车牌并对其进行模糊处理。 模糊处理不是问题,但是否有库或组件(最好是开源的)可以帮助在照片中找到车牌? 注意事项: 我知道没有什么是完美的,这种类型的图像识别会提供错误的正面和负面结果。 我知道我们可以要求用户选择要...

13得票4回答
Python OpenCV斜率校正用于OCR

目前我正在从标签上读取文字的OCR项目中工作(见下面的示例图像)。我遇到了图像倾斜的问题,需要帮助解决图像倾斜的问题,使文本水平而不是倾斜。目前我使用的方法尝试从给定范围内得分不同的角度(包括下面的代码),但这种方法不一致,有时会过度校正图像倾斜或干脆无法识别倾斜并进行校正。值得注意的是,在进...

8得票7回答
优化的OCR黑白像素算法

我正在编写一个简单的OCR解决方案,用于有限字符集。也就是说,我知道字母表中所有26个字母的确切外观方式。我使用C#语言,并能轻松确定给定像素应该被视为黑色还是白色。 我正在为每个字符生成一个黑/白像素矩阵。例如,大写字母I可能如下所示: 01110 00100 00100 00100 0...

47得票2回答
使用Python和OpenCV检测图像中的文本区域

我想使用Python 2.7和OpenCV 2.4.9来检测图像中的文本区域,并在其周围绘制一个矩形区域,就像下面示例图片中所示。 由于我是图像处理方面的新手,因此任何有关如何完成此任务的想法都将受到赞赏。

7得票2回答
为什么无法使用PIL和pytesseract获取字符串?

这是一个简单的Python 3光学字符识别(OCR)程序,用于获取字符串。我已经上传了目标gif文件,请下载并将其保存为/tmp/target.gif。 try: from PIL import Image except ImportError: import Image...