201得票15回答
图像处理提高 Tesseract OCR 准确性

我一直在使用tesseract将文档转换为文本。文档的质量差异很大,我正在寻找改善结果的图像处理技巧。我注意到高度像素化的文本(例如由传真机生成的文本)特别难以处理,因为字符的所有不规则棱角会混淆形状识别算法。 哪种图像处理技术会提高准确性?我一直在使用高斯模糊来平滑像素化的图像,并看到了一...

182得票32回答
Pytesseract: "TesseractNotFound 错误:tesseract未安装或未在您的路径中",我该如何解决?

我正在尝试在Python中运行一个基本且非常简单的代码。from PIL import Image import pytesseract im = Image.open("sample1.jpg") text = pytesseract.image_to_string(im, lang =...

129得票21回答
Tesseract 运行错误

我在Linux上运行tesseract-ocr引擎时遇到了问题。我已经下载了RUS语言数据并将其放置到tessdata目录(/usr/local/share/tessdata)中。当我尝试使用命令tesseract blob.jpg out -l rus运行tesseract时,它显示一个错误...

100得票4回答
我该如何选择 Tesseract 和 OpenCV?

我最近发现了Tesseract和OpenCV。看起来Tesseract是一个完整的OCR引擎,而OpenCV可以用作创建OCR应用/服务的框架。 我尝试在我的一些图像上使用Tesseract,它的准确性似乎还不错。后来,我发现了一个非常简单的教程,介绍如何使用Python使用OpenCV进行...

93得票26回答
如何解决TesseractNotFoundError错误?

我正在尝试在Python中使用pytesseract,但总是遇到以下错误: raise TesseractNotFoundError() pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed ...

89得票7回答
限制字符的tesseract正在寻找什么?

是否可以限制 tesseract 查找的字符集(例如仅查找字母 a-z)?这将大大提高我的识别结果。

71得票1回答
安卓中最佳的OCR(光学字符识别)示例是什么?

我希望能够找到一个在安卓系统中运行OCR的示例,我已经做了一些研究,并找到了一个在安卓系统中实现OCR的示例。 https://github.com/rmtheis/tess-two 在这个网站上有三个项目文件... eyes-two tess-two tess-two-test 我...

71得票4回答
Pytesseract OCR 多配置选项

我在使用pytesseract时遇到了一些问题。我需要配置Tesseract,使其能够识别单个数字,同时也只能接受数字,因为数字零经常与字母'O'混淆。 像这样:target = pytesseract.image_to_string(im,config='-psm 7',config='o...

71得票10回答
如何让Tesseract只识别数字,即使它们与字母混在一起?

我想使用tesseract只识别数字,但是问题在于我的图像中有数字和字母的混合,并且当我使用SetVariable("tessedit_char_whitelist", "0123456789")时,tesseract返回错误的数字。 我能否设置阈值值以便tesseract忽略相似度较低的符号...

62得票8回答
使用Python-tesseract获取识别单词的边界框

我正在使用python-tesseract从图片中提取文字。这是tesseract的Python封装,tesseract是一种OCR代码。 我正在使用以下代码获取单词:import tesseract api = tesseract.TessBaseAPI() api.Init(".","...