Tesseract tsv输出无法正常工作。

3

我正在尝试在Ubuntu 17.10的命令行中执行tesseract。 我希望输出为.tsv文件,因为我需要置信度率。如此处所述,我执行以下操作:

tesseract testing_img.png out tsv

但是我遇到了以下错误:
read_params_file: Can't open tsv
Tesseract Open Source OCR Engine v3.05.00 with Leptonica

并且正确地将输出写入了名为 out.txt 的文件中。看起来它将 tsv 参数解读为要读取的文件,但我不知道为什么。
我从源代码编译了 Tesseract,因为我需要 Tesseract 3.05 以便可以输出一个 .tsv 文件,所以不能使用 Ubuntu 软件仓库中的版本,因为那里只有 Tesseract 3.04。
我正在运行 Ubuntu 17.10。
以下是有关我的 Tesseract 安装的一些信息:
$ tesseract --version
    tesseract 3.05.00
     leptonica-1.75.3
      libpng 1.6.34 : zlib 1.2.11

$ ls /usr/share/tesseract-ocr/tessdata/
    configs  eng.traineddata  ita.traineddata  osd.traineddata  pdf.ttf  tessconfigs

$ echo $TESSDATA_PREFIX
    /usr/share/tesseract-ocr/
1个回答

4

3
那个配置文件是 -c tessedit_create_tsv=1 的快捷方式。 - Cees Timmerman

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接