谷歌 OCR API 适用于 Android(图像转文本)

3
我尝试使用Tesseract,但生成的apk文件大小为8 MB。 我在Play上看到了Goggles应用程序,它非常高效。 我想知道如何集成该技术。我没有在任何教程中看到过这个。 如果有人知道如何做到这一点,请回复。
另外,我该如何改善我正在使用的Tesseract的质量。 转换很顺利,但我想知道如果我将图像分成几部分,然后分别解析,那样是否有用。
要求是它应该读取账单或收据,所以我想提高文本转换的质量。 请给出建议。

请您能详细说明一下吗? - Sid
你好!请问你能告诉我如何构建tess-two吗?Eclipse给我编译错误。 - Newts
好的,我按照这个教程 http://gaut.am/making-an-ocr-android-app-using-tesseract/ 做了一遍。对我来说有效,你也应该可以试试看。 - Saurabh Verma
我喜欢 Google Goggles 的准确性,我们如何实现这一点? - Sheychan
1个回答

2

我相信你正在编译这个项目:tess-two,是吗?

如果是的话,你可以通过为特定的CPU架构编译不同的APK,大大减小APK的大小。此外,由于您不需要它们,可以删除大多数Leptonica的函数。

为了更好的准确性:

  • 如果您将手机相机用作输入,则应更改二值化算法。Leptonica具有一些二值化算法,请尝试Sauvola。
  • 微调tesseract的参数以获得更好的性能与速度。
  • 确保所有手机上的分辨率始终保持一致。大约在300dpi左右。

如果您想要一个在大多数手机上运行快速的小型应用程序,请考虑在服务器上运行OCR,而不是在手机上。

据我所知,Tesseract是目前为Android编译的最佳OCR引擎。它必须经过正确的调整并提供好的图像。


2
是的,我正在编译tess-two。问题在于,它在不同方向上不能给出准确的结果,使用闪光灯拍摄的图像存在问题,而且不同设备的结果也不同。我正在将我的应用与Google Goggles进行比较,但每次都失败了。我只想达到像Goggles一样的准确性和速度。Google使用的是什么技术?是通过Google Drive进行OCR吗?我已经实现了Abby,但它所需的时间比Goggle多20倍。您有没有实现与Google Goggles相同的想法? - Saurabh Verma
你到目前为止找到解决方案了吗? - Sheychan

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接