427得票3回答
OpenCV-Python中的简单数字识别OCR

我正在尝试在OpenCV-Python (cv2)中实现“数字识别OCR”。这只是为了学习目的。我想学习OpenCV中的KNearest和SVM功能。 我有每个数字100个样本(即图像)。我想用它们来进行训练。 OpenCV示例中附带了一个名为letter_recog.py的示例。但我仍然...

201得票15回答
图像处理提高 Tesseract OCR 准确性

我一直在使用tesseract将文档转换为文本。文档的质量差异很大,我正在寻找改善结果的图像处理技巧。我注意到高度像素化的文本(例如由传真机生成的文本)特别难以处理,因为字符的所有不规则棱角会混淆形状识别算法。 哪种图像处理技术会提高准确性?我一直在使用高斯模糊来平滑像素化的图像,并看到了一...

175得票14回答
reCaptcha已经被破解/黑客攻击/OCR识别/击败/破坏了吗?

有哪些编程方法被用来攻破reCAPTCHA? 我对看到证据并且可能演示特别是通过完全自动化、无需人类干预的方法使reCAPTCHA过时很感兴趣。 需要澄清的是,我不要介绍利用人类以任何方式作弊的reCAPTCHA解决方案,包括填写CAPCHA的团队、寻找色情内容或使用机械土耳其等。 我也...

166得票5回答
Java OCR实现

我主要是出于好奇,想知道是否有纯Java实现的OCR。我很好奇它在Java中的表现如何,而且OCR总体上也让我很感兴趣,所以我很想看看它在我彻底理解的语言中是如何实现的。当然,这需要实现是开源的,但即使是专有解决方案,我仍然对其性能很感兴趣,因为我至少可以检查一下。 我已经看过一些可以在Ja...

149得票6回答
有没有适用于Android的免费OCR库?

我正在寻找一个能在Android上运行的Java OCR,然而Asprise似乎不是一个跨平台的OCR。是否有任何开源/免费的Java OCR可用于Android应用程序开发?

129得票21回答
Tesseract 运行错误

我在Linux上运行tesseract-ocr引擎时遇到了问题。我已经下载了RUS语言数据并将其放置到tessdata目录(/usr/local/share/tessdata)中。当我尝试使用命令tesseract blob.jpg out -l rus运行tesseract时,它显示一个错误...

100得票4回答
我该如何选择 Tesseract 和 OpenCV?

我最近发现了Tesseract和OpenCV。看起来Tesseract是一个完整的OCR引擎,而OpenCV可以用作创建OCR应用/服务的框架。 我尝试在我的一些图像上使用Tesseract,它的准确性似乎还不错。后来,我发现了一个非常简单的教程,介绍如何使用Python使用OpenCV进行...

89得票7回答
限制字符的tesseract正在寻找什么?

是否可以限制 tesseract 查找的字符集(例如仅查找字母 a-z)?这将大大提高我的识别结果。

75得票1回答
如何让索引服务和MODI生成OCR全文检索?

我已经配置了索引服务来索引我的文件,其中包括保存为高分辨率 TIFF 文件的扫描图像。我还安装了MS Office 2003+并正确配置了MS Office文档成像(MODI),因此我可以对图像执行 OCR ,甚至将 OCR 的文本嵌入TIFF中。 索引服务能够索引和查找那些手动进行OCR并使...

72得票11回答
如何从图像中识别车辆牌照/号码牌(ANPR)?

我有一个网站,允许用户上传汽车图片,并希望设置隐私过滤器来检测车辆上的车牌并对其进行模糊处理。 模糊处理不是问题,但是否有库或组件(最好是开源的)可以帮助在照片中找到车牌? 注意事项: 我知道没有什么是完美的,这种类型的图像识别会提供错误的正面和负面结果。 我知道我们可以要求用户选择要...