Python: 在Windows 7上安装Tesseract

6
我的目标是在Windows 7机器上使用Python 2.7中的Tesseract进行OCR,但在安装过程中遇到问题。我尝试按照这里的指示进行操作,但“tesseract-core-yyyymmdd.exe”和“tesseract-langs-yyyymmdd.exe”的链接已经不存在了,我找不到这些.exe文件的其他来源。到目前为止,我已经完成了以下步骤:
  1. 从官方Tesseract-OCR页面安装Tesseract。
  2. 通过pip包安装"wand"、"PIL"和"pyocr"。
现在,如果我在Python中执行以下命令: from wand.image import Image from PIL import Image as PI import pyocr import pyocr.builders import io 这些包都可以成功加载,但是pyocr.get_available_tools() 返回一个空列表。我确信这与上述缺失的安装.exe文件有关。我在哪里可以找到它们?是否还有其他我可能遗漏的东西?
4个回答

4

我刚试了一下安装pytesseract,它可以正常工作!我已经在Windows 10和Python 2.7上安装了它。

你需要做的只有以下几步:

  1. http://aka.ms/vcpython27下载并安装Visual basic C++(公共安装步骤)
  2. 通过此链接https://pypi.python.org/pypi/pytesseract从Python下载Tesseract

  3. 解压缩文件

  4. 进入包含解压缩文件的目录

  5. 运行此命令“ python setup.py install”

  6. (附加)为了测试是否已安装,进入Python Shell并运行此命令“ import pytesseract”

希望这能帮到你!请注意,pytesseract是基于Google OCR的,它的工作方式类似于Tesseract。


1
我已经尝试了所有方法,但只有在从 https://github.com/madmaze/pytesseract 直接下载和安装后才能正常工作。 - Udhay Prakash

3

步骤 [1] 安装 tesseract,请访问以下链接:

https://github.com/UB-Mannheim/tesseract/wiki

最新的安装程序可以从这里下载:例如,tesseract-ocr-setup-3.05.02-20180621.exe、tesseract-ocr-w32-setup-v4.0.0-beta.1.20180608.exe、tesseract-ocr-w64-setup-v4.0.0-beta.1.20180608.exe (64 位)

步骤 [2] 从以下链接下载适用于 Python 2.7 的 Microsoft Visual C++ 编译器:https://download.microsoft.com/download/7/9/6/796EF2E4-801B-4FC4-AB28-B59FBF6D907B/VCForPython27.msi

步骤 [3] 使用 pip 安装 pytesseract 来绑定 tesseract

pip install pytesseract

步骤 [4] 此外,您可以在Python中安装图像处理库,例如pillow

pip install pillow

问候!你完成了!:)


1

PIP 是 Python 库的包管理器。

  1. 打开 cmd 运行 pip search "pytesseract",您可以查看最新版本
  2. 运行 pip install pytesseract 获取最新版本或者运行 pip install pytesseract==0.3.0 获取指定版本。
  3. 在 Windows 的 python cmd 中运行 import pytesseract ,确保安装成功。

0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接