使用Pytesser时出现错误:**[WinError 2] 系统找不到指定的文件**。

6
我在使用pytesser进行OCR时遇到了这个错误:[WinError 2] The system cannot find the file specified。以下是我的代码片段。
from PIL import Image
from pytesseract import *
image = Image.open('pranav.jpg')
print (image_to_string(image))****

否则,当我使用PIL改变图像大小时,就不会出现这个错误。

1
你能更新完整的回溯吗? - Anand S Kumar
6个回答

11
您无需编辑任何 pytesseract 文件。您可以在代码中声明 Tesseract 安装路径,如下所示:
import pytesseract
pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'

PermissionError: [WinError 5] 拒绝访问 - Exind

4
我遇到了相同的错误。你需要从这里安装tesseract: https://code.google.com/p/tesseract-ocr/downloads/detail?name=tesseract-ocr-setup-3.02.02.exe& 然后你需要编辑pytesseract.py文件。 在我的情况下,该文件位于以下文件夹中:
C:\ Users \ USERNAME \ AppData \ Roaming \ Python34 \ site-packages \ pytesseract \ pytesseract.py
查找以下行(对我来说是第60行):
# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'tesseract'

将其更改为 pytesseract.exe 的位置,即我的情况下该行如下:

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'c:\\Program Files (x86)\\Tesseract-OCR\\tesseract'

现在你的代码应该可以正常工作了。

0

将 tesseract_cmd、pytesseract.pytesseract.tesseract_cmd、TESSDATA_PREFIX 和 tessdata_dir_config 设置如下:

from PIL import Image
import pytesseract
tesseract_cmd = 'D:\\Softwares\\Tesseract-OCR\\tesseract'
pytesseract.pytesseract.tesseract_cmd = 'D:\\Softwares\\Tesseract-OCR\\tesseract'
TESSDATA_PREFIX= 'D:\Softwares\Tesseract-OCR'
tessdata_dir_config = '--tessdata-dir "D:\\Softwares\\Tesseract-OCR\\tessdata"'
print(pytesseract.image_to_string( Image.open('D:\\ImageProcessing\\f2.jpg'), lang='eng', config=tessdata_dir_config))

0
将Tesseract路径添加到环境变量中。
至少这是我解决问题的方式。

0
  1. 您可以从这里下载tesseract: https://github.com/UB-Mannheim/tesseract/wiki

    最新的安装程序可以在这里下载:tesseract-ocr-setup-3.05.01.exe和tesseract-ocr-setup-4.0.0-alpha.20180109.exe(实验性)。还有一些旧版本可供选择。

  2. 编辑您的pytesseract.py文件 例如:C:\Users\USER\Anaconda3\Lib\site-packages\pytesseract.py

    如果Tesseract不在您的路径中或命名不同,请更改此处 tesseract_cmd = 'c:\Program Files (x86)\Tesseract-OCR\tesseract'

  3. 在导入pytesseract之后,在您的代码中添加以下语句

    pytesseract.pytesseract.tesseract_cmd = 'c:\Program Files (x86)\Tesseract-OCR\tesseract'


0

为了完全消除错误,请按照以下步骤进行:

  1. 下载tesseract(32位|64位)
  2. 在您的系统中安装相同版本并记下路径。
  3. 创建一个环境变量{tesseract =“安装路径/tesseract.exe”}
  4. 重新启动内核
  5. 使用以下代码:
import pytesseract

pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/ tesseract.exe'

from PIL import Image
value=Image.open("C://Profile_tess.png")

text = pytesseract.image_to_string(value)    
print("text present in images:",text)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接