我从5MB以上的图片中使用tesseract时出现以下错误:
Tesseract开源OCR引擎v3.01 with Leptonica 第0页 图像太大: (39667, 56133) 处理期间发生错误。
这是因为文件大小有限制,还是有参数可以解决这个问题。
非常感谢您的帮助。
最大宽度和高度为32767。
从源代码(文件baseapi.cpp):
if (tesseract_->ImageWidth() > MAX_INT16 ||
tesseract_->ImageHeight() > MAX_INT16) {
tprintf("Image too large: (%d, %d)\n",
tesseract_->ImageWidth(), tesseract_->ImageHeight());
问题不在于文件大小,而是图像尺寸(维度)超出了Tesseract的限制。我使用Tesseract识别16MB的图像没有问题。尝试调整图像大小或比例,然后再试一次。