我目前正在开发一个项目,该项目将读取数独格子的图像,检测格子,识别数字,解决难题,并将解决方案叠加在图像上。为了识别数字,我将网格分成n * 2个图像,其中每个图像都是一个单独的网格(例如:ex2 ex9),并将它们输入到pytesseract中。然而,我的所有图像都没有检测到任何文本,即使它只是一个数字图像,没有噪声/边框等。
我尝试了常见的图像平滑方法、各种阈值方法、调整图像大小、反转图像和将数字裁剪到边界框中,但这些方法似乎都不起作用。我测试了我编写的 pytesseract 代码在其他图像上的运行情况,那些都可以正常工作,只有我的图像不能正常处理。
有人能提供建议,让我尝试什么或者为什么我的图像似乎不容易被处理吗?
供参考,这里是我一直在使用的 pytesseract 的 image_to_string 设置:
text = image_to_string(im, config='--psm 10 --oem 3' + '-c tessedit_char_whitelist=123456789')