Tesseract 运行错误

129

我在Linux上运行tesseract-ocr引擎时遇到了问题。我已经下载了RUS语言数据并将其放置到tessdata目录(/usr/local/share/tessdata)中。当我尝试使用命令tesseract blob.jpg out -l rus运行tesseract时,它显示一个错误:

Error opening data file /usr/local/share/tessdata/eng.traineddata

Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.

Failed loading language eng
Tesseract couldn't load any languages!

Could not initialize tesseract.

根据编译指南,我使用export TESSDATA_PREFIX='/usr/local/share/'来指向我的tessdata目录。 也许我应该编辑一些配置文件?Tesseract尝试加载'eng'数据文件而不是'rus'。

Screenshot: http://i.stack.imgur.com/I0Guc.png

21个回答

0

**如果您使用的是Windows操作系统,请将TesseractOCR添加到系统变量中。例如:

  1. 找到Tesseract在C驱动器中安装的路径(在我的情况下为r"C:\Program Files\Tesseract-OCR\tesseract.exe")**
  2. 确保您拥有所需的文件,即tessdata,tessdata,如果没有,则从https://github.com/tesseract-ocr/tessdata https://github.com/tesseract-ocr/langdata下载(至少包括您要转换的语言)
  3. 将其粘贴到主目录中,在我的情况下为C:\Program Files\Tesseract-OCR
  4. 将该目录的路径添加到系统环境变量中 具体步骤如下:
    在开始菜单中搜索“环境变量” 进入环境变量 点击系统环境变量中的路径(而不是用户环境变量) 将TesseractOCR的路径粘贴进去

就这样...


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接