Tesseract OCR训练出现'APPLY_BOXES'错误

6

我正在为数字字体“digital-7”训练 Tesseract 3,但输出结果中出现了一些错误(来自 stderr):

APPLY_BOXES: boxfile line 35/I ((735,7860),(737,7890)): FAILURE! Couldn't find a matching blob

And

APPLY_BOXES: Unlabelled word at :Bounding box=(7523,-910)->(7549,-906)

它们是什么意思?

我正在使用的命令行是:

tesseract eng.digital-7.exp0.tif eng.digital-7.exp0 nobatch box.train

你在训练数字7字体方面成功了吗?我有类似的需求。请告诉我你在Tesseract方面的经验。我遇到了和你一样的问题。 - blganesh101
是的,就我所记得的,我成功地训练了它。 - sashoalm
1个回答

4
请检查您的.tif文件的字符间距:第一个错误可能是由于两个字符间距过近,导致产生一个单一的边界框(也可以参考这个线程)。我想第二个错误是第一个错误的结果。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接