在CentOS 6上安装Tesseract-OCR

12

我正在尝试在我的服务器上安装Tesseract-OCR,但是当我安装所有我认为是正确的仓库时,尝试安装它时却提示找不到这个软件包。

我尝试添加rpmforge,但没有成功。有没有人曾经做过或熟悉如何添加和搜索仓库的想法呢?

6个回答

12

我使用了这些说明,在Centos上工作正常

在Centos中从源代码安装Tesseract OCR库

下载Leptonica和Tesseract源码:

$ wget http://www.leptonica.org/source/leptonica-1.69.tar.gz
$ wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz

配置、编译、安装库:

 $ tar xzvf leptonica-1.69.tar.gz      
 $ cd leptonica-1.69      
 $ ./configure
 $ make
 $ sudo make install

 $ tar xzf tesseract-ocr-3.02.02.tar.gz
 $ cd tesseract-3.01
 $ ./autogen.sh
 $ ./configure
 $ make
 $ sudo make install
 $ sudo ldconfig

下载语言(英语)并将其复制到tessdata文件夹中:

下载语言(英文版),然后将其复制到tessdata文件夹即可:

$ wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz       
$ tar xzf tesseract-ocr-3.02.eng.tar.gz       
$ sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata

并且享受它 ;)


在RedHat Linux中获取此内容 ./configure $ make $ sudo make install 配置:警告:您应该使用--build,--host,--target 配置:警告:无效的主机类型:$ 配置:警告:您应该使用--build,--host,--target 配置:警告:您应该使用--build,--host,--target 配置:警告:无效的主机类型:$ 检查构建系统类型...无效的配置'$':未识别的机器'$' 配置:错误:/bin/sh config/config.sub $ 失败 - Aadam
提供的链接 https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz 和 http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz 已经失效。 - Adarsh Tiwari
您可以使用以下页面获取Tesseract版本的链接:https://github.com/tesseract-ocr/tesseract/releases - Maksym Ganenko
1
只是一项附加操作,请在以下网址查找更新后的二进制文件 --http://www.leptonica.org/download.html/ leptonica-1.76.0.tar.gz https://github.com/tesseract-ocr/tesseract/releases/ tesseract-4.0.0-beta.3.tar.gz - Anu

6

我建议从这里的rpm安装尝试:http://pkgs.org/download/tesseract

还有一些依赖项:libpng-devel、libjpeg-devel、libtiff-devel、zlib和leptonica。最后两个也可以在RPM网站上找到。


5

4
这对我很有效:
/usr/bin/yum --enablerepo epel-testing install tesseract.x86_64 tesseract-langpack-fra.noarch

tesseract不在epel仓库中,而是在epel-testing仓库中,该仓库默认未激活。


3

从源代码中安装Tesseract OCR库(截至2018年7月14日更新)

下载Leptonica和Tesseract的源代码:

$ wget http://www.leptonica.com/source/leptonica-1.76.0.tar.gz

$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.02.tar.gz

配置、编译、安装Leptonica:

$ tar xzvf leptonica-1.76.0.tar.gz
$ cd leptonica-1.76.0
$ ./configure & make & sudo make install

配置、编译、安装Tesseract:

$ tar xzf tesseract-ocr-3.02.02.tar.gz
$ cd tesseract-ocr
$ ./autogen.sh & ./configure & make & sudo make install & sudo ldconfig

下载语言文件: 我正在下载英文语言文件(eng.traineddata)这里。您可以在此处查看完整的语言文件列表,并根据需要进行下载。 https://github.com/tesseract-ocr/tesseract/wiki/Data-Files#data-files-for-version-302 下载语言(英语)并将其复制到tessdata文件夹中:
$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.eng.tar.gz
$ tar xzf tesseract-ocr-3.02.eng.tar.gz
$ sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata

现在,您已经安装并准备好使用Tesseract OCR!示例:
$tesseract /path/to/input/test.jpg /path/to/output/abc.txt -l eng

Enjoy!!!


我运行了所有的命令,但在完成后我运行了tesseract版本(tesseract -v),它显示bash:tesseract:找不到命令 @Neeraj Kumar - mayur panchal
你成功完成了所有这些步骤且没有出现任何错误吗:
  1. tar xzf tesseract-ocr-3.02.02.tar.gz
  2. cd tesseract-ocr
  3. ./autogen.sh & ./configure & make & sudo make install & sudo ldconfig
- Neeraj Kumar

1

输入图像描述

yum install --nogpgcheck tesseract

安装完成后,输入以下命令进行测试: tesseract --version


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接