Tesseract OCR、Python和Windows XP

3
大家晚上好,
我正在尝试使用一个tesseract(OCR)Python包装器,可以在此处找到第一个示例:https://code.google.com/p/python-tesseract/wiki/CodeSnippets 我在Windows XP机器上使用Python27,一切都是32位的。
我已经安装了所有依赖项,这些依赖项可以在以下指南中找到:http://opencvpython.blogspot.com/2012/05/install-opencv-in-windows-for-python.html 我检查了环境变量:TESSDATA_PREFIX = C:\Program Files\Tesseract-OCR\tessdata\
最后,我尝试在cmd.exe中执行脚本:"python.exe 119.py"(119.py是CodeSnippets中的第一个示例,当然使用不同的图像),但我收到以下错误:
C:\Python27>python.exe 119.py Error opening data file C:\Program Files\Tesseract-OCR\tessdatatessdata/eng.trai neddata Please make sure the TESSDATA_PREFIX environment variable is set to the parent d irectory of your "tessdata" directory. Failed loading language 'eng' Tesseract couldn't load any languages!
现在,我唯一注意到的问题是在eng.traineddata之前自动添加的斜杠(/)而不是反斜杠(\)。 我希望这是唯一需要修复的问题,但我不知道该如何解决,这就是为什么我来到这里的原因... :)
所以,有经验的程序员,二进制神,请帮帮我。 提前感谢您。 :)
附言:
我需要在Windows机器上使用此项目,因此将其切换到Linux不是一个简单的选择。 :(

错误消息告诉您不要将tessdata目录包含在路径中,并显示一个带有“tessdatatessdata”的路径 - 显然它再次附加了路径。尝试从路径中删除它。 - tdelaney
天啊,我这么疲惫不堪... 好吧,是的,显然是这样... 现在我只是一直在执行后得到Python崩溃,但是我会得到一些输出(虽然是错误的)... 感谢您的输入,真不敢相信我会这么粗心... -.- - cab00t
我该如何在评论中给你点赞? :)) - cab00t
1个回答

0

我遇到了同样的错误,但在使用这个命令在cmd中设置后,它被接受了。

set TESSDATA_PREFIX=C:/Program Files (x86)/Tesseract-OCR/tessdata

你需要使用正斜杠,即使Windows也接受反斜杠。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接