我正在编写一个应用程序,用于从图像中扫描数字。
这些数字使用OCR-B字体,并且可能还包含"+"和">"字符。
这是我的源图像:
我创建了此培训图像并从中制作了框文件。框文件是正确的,所有字母都被正确匹配。
然后我执行了此处描述的所有步骤来创建其他必要的文件。
使用这个新训练的OCR-B tessdata-set,在源图像上得到了相当不错的结果,但有一个小错误:所有的
这些数字使用OCR-B字体,并且可能还包含"+"和">"字符。
这是我的源图像:
我创建了此培训图像并从中制作了框文件。框文件是正确的,所有字母都被正确匹配。
然后我执行了此处描述的所有步骤来创建其他必要的文件。
使用这个新训练的OCR-B tessdata-set,在源图像上得到了相当不错的结果,但有一个小错误:所有的
1
都被误认为是8
,反之亦然。处理该图像的命令如下:$ tesseract esr2c.tif ocrb-esr2c -l ocrb
对于源图像的输出为:
0800000001456>8 00000195731208 8 01050008 023+ 08 0301226>20
如果你交换所有的1
和8
,并将其与源图像进行比较,则输出将是正确的(除了最后两个字母可以忽略)。
为什么会发生这种情况?在训练过程中是否犯了一些错误?我该如何解决?