在Linux上运行tesseract OCR处理.jpg文件时出现错误

4

我成功地在我的Amazon EC2实例上安装了tesseract,按照这个指南。对于TIFF图像它能正常工作,但是当我尝试在JPG图像上运行时,出现以下错误:

Tesseract Open Source OCR Engine v3.02.02 with Leptonica
Error in pixReadStreamJpeg: function not present
Error in pixReadStream: jpeg: no pix returned
Error in pixRead: pix not read
Unsupported image type.

我需要安装/做些什么?
请问还有哪些必要的安装或操作?
2个回答

4

我也遇到了同样的问题。这是由于您的Leptonica安装可能存在问题。尝试重新安装Leptonica:

$tar -xvf leptonica-xx.tar.gz
$cd leptonica folder
$./configure
$make
$sudo make install    

完成后,您可以通过以下方式检查所有库是否已正确安装:

$tesseract -v

然后它会显示已安装的4个库:
tesseract 3.02.02
leptonica-1.71
libjpeg 6b : libpng 1.2.49 : libtiff 3.9.4 : zlib 1.2.3

祝福 :)


2

我遇到了同样的问题,我需要手动安装所有的图像库,然后重新安装leptonica。

首先安装这个。

sudo apt-get install libjpeg-dev libpng-dev libtiff4-dev

然后重新安装leptonica

./configure && make && sudo make install

在CentOS 6.7上,即使安装了libpng-devel,重新安装leptonica后,tesseract -v仍然缺少libpng支持。 - Marco Marsala
我需要重新编译Tesseract。 - Marco Marsala

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接