OCR(Tesseract),智能旋转图像

6
我正在开发一个使用Tesseract OCR识别文本的Android应用程序,现在我有一个问题,就是不同的智能手机会以不同的方式旋转图像,所以在其中一种手机中它是横向模式,而在另一种手机中是纵向模式。因此,我想要智能旋转图像,使得Tesseract可以识别文本,因为文本只可能在这两个选项中的一个中出现,但由于用户拍照时可能会采用不同方向,所以我不希望用户每次都以相同的格式拍照,我希望对其进行旋转,以适应需要,如果可能的话,不会引起太大的性能损失。
带有自动旋转功能的Tesseract库似乎无法按照我期望的方式工作。有没有人有解决这个问题的想法?
谢谢。

2
Tessarct库没有提供自动旋转功能,您需要自己编写逻辑实现。 - Gru
1
请查看Tesseract的方向和脚本检测(OSD)示例。方向和倾斜角可能会引起您的兴趣。您需要相应地旋转图像。 - nguyenq
2个回答

2

1
如果您不介意亲自动手,http://www.leptonica.org/ 可能是一个很好的选项来评估字形(未被识别为文本的原始 Pix)并确定方向。我看到有关于 Leptonica 的 Android 绑定的参考。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接