166得票5回答
Java OCR实现

我主要是出于好奇,想知道是否有纯Java实现的OCR。我很好奇它在Java中的表现如何,而且OCR总体上也让我很感兴趣,所以我很想看看它在我彻底理解的语言中是如何实现的。当然,这需要实现是开源的,但即使是专有解决方案,我仍然对其性能很感兴趣,因为我至少可以检查一下。 我已经看过一些可以在Ja...

149得票6回答
有没有适用于Android的免费OCR库?

我正在寻找一个能在Android上运行的Java OCR,然而Asprise似乎不是一个跨平台的OCR。是否有任何开源/免费的Java OCR可用于Android应用程序开发?

11得票3回答
如何制作光学字符识别程序?

我想制作一个程序,可以将图片作为输入并输出文本。现在我知道可以使用神经网络将单个字符的图像转换为该字符。困难的部分是:给定一个带有文本的图像,如何在每个单独字符周围生成所有的矩形框?我可以使用哪种方法来完成它呢?

8得票7回答
使用.NET进行图像OCR处理

我正在尝试使用MODI来识别Windows程序。对于通过Win32互操作程序程序获取的截图,它可以正常工作,例如: public string SaveScreenShotToFile() { RECT rc; GetWindowRect(_hWnd, out rc); ...

13得票1回答
通过使用pytesseract和PIL提高文本识别的准确性

我正在尝试从图像中提取文本。由于图像的质量和大小不好,它会给出不准确的结果。我尝试了一些使用PIL的增强和其他方法,但这只会使图像的质量变得更糟。 有人能建议一些图像增强技术以获得更好的结果。以下是一些图像示例:

53得票7回答
使用pytesseract OCR从图像中识别文本

我需要使用Pytesseract从这张图片中提取文字: 代码如下:from PIL import Image, ImageEnhance, ImageFilter import pytesseract path = 'pic.gif' img = Image.open(path) img =...

7得票1回答
OCR的图像预处理 - Tessaract

显然,这张图片很难检测,因为它清晰度低且不是真实的单词。然而,使用这段代码,我检测不到任何相似之处: import pytesseract from PIL import Image, ImageEnhance, ImageFilter image_name = 'NedNoodleAr...

30得票2回答
除了Tesseract之外,还有哪些OCR选项可用?

我稍微使用了一下Tesseract,但它的结果还有很多需要改进的地方。我目前正在检测非常小的图像(35x15,没有边框,但尝试添加了一个带有imagemagick的边框也没有OCR优势);它们的字符从2个到5个不等,并且是相当可靠的字体,但是字符变化足以使简单使用图像大小校验和等方法无法起作用...

7得票1回答
如何使用pytesseract进行训练数据的应用?

使用这个工具 http://trainyourtesseract.com/,我希望能够在pytesseract中使用新字体。该工具给我提供了一个名为*.traineddata的文件。 现在我正在使用这个简单的脚本: try: import Image except ImportEr...

25得票5回答
如何在tesseract中保留文档结构

我正在使用tesseract OCR从图像中提取文本。保留文档的结构对我非常重要。目前,tesseract不会保留结构,它实际上会改变文本的顺序。我的输入是下面的图像。 我得到的输出如下:Someto the left Someto the left Some in the middl...