我该在Android中使用哪种OCR Java库?

41
我希望构建一个安卓应用,通过OCR库扫描图片并从中提取文字。想要使用哪个Java库?

1
谷歌最近发布了一个API来实现这个功能:https://developers.google.com/vision/text-overview - Wirling
4个回答

21

7
如果您正在寻找一个非常可扩展的选项或者有特定的问题域,您可以考虑使用Java面向对象神经引擎来自行开发。
我在个人项目中成功地使用它来识别像this这样的图像中的字母。您可以在github上找到我应用程序OCR组件的所有源代码,在这里

6

尝试使用tesseract,查看以下文章:http://www.itwizard.ro/interfacing-cc-libraries-via-jni-example-tesseract-163.html和这个例子http://code.google.com/p/mezzofanti/

编辑: 一些事实 - tesseract是由Google使用的最好的开源OCR之一 - 有许多语言的训练数据可用 - mezzofanti是一个使用tesseract的Android应用程序 - 注意:OCR会使用大量CPU功率。尝试使用您的T-Mob G1对A4页面进行OCR将需要很长时间,并且结果可能不会令您满意;-)


Tesseract确实可以工作,但它的阅读能力甚至对于最简单的文本也非常差。 - mP.
这就是为什么你必须训练它 @mP。 - 在实现ISBN读取器时,我能够在默认训练下获得良好的结果。尝试这个链接,我尚未使用他们的经验,但我已经将其收藏了很长时间,而且我认为它是一个很好的信息来源:http://vbridge.co.uk/2012/11/05/how-we-tuned-tesseract-to-perform-as-well-as-a-commercial-ocr-package/ - Srneczek

0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接