Android中的离线图像文本识别(OCR)

3
如何构建用于图像文字识别的Android本地SDK。(我在使用来自Web服务的某些API上做得很好。但这次,我只想制作一个没有任何互联网连接、没有API和没有Web服务的离线OCR应用程序)
那么我的问题是:
1.如何裁剪图片中包含的每个单词?
2.如何将剪裁后的文本与字母和字符进行比较?

OCR是一个复杂的主题。如果你是Android新手,我建议你给它一些时间。如果不是,这里有一个教程- http://androidadvance.com/blog/tutorial-getting-started-with-tessaract-ocr-in-android-android-studio/ - Sagar Nayak
正如@SagarNayak所说,OCR是一个复杂的话题。作为开发离线移动OCR团队的一部分,我可以说这花费了我们几年时间。如果您有特定的用例,请尝试使用其中一个可用的OCR工具。如果您想要尝试一下,那么Tesseract可能是一个不错的选择。 - ssasa
是的。谢谢。我打算将其离线化,因为我想为我的母语制作OCR。我将尝试使用Tesseract。 - Aung Si Min Htet
3个回答

10
你说你不想使用API,但我建议你使用谷歌最近发布的OCR API: https://developers.google.com/vision/text-overview 只需将以下代码添加到您的依赖项中即可:
compile 'com.google.android.gms:play-services-vision:9.2.0'

注意:第一次使用时,它会从Google服务器下载一些文件以便其能够正常工作。请确保添加此检查.isOperational()。之后,您可以在没有互联网连接的情况下使用它。


5
我想你可以使用谷歌开源的Tesseract OCR工具。通过Tesseract Android Tools在Android中集成它非常简单。看一下GitHub上的tess-two项目,它非常易于使用并且提供良好的OCR结果。请注意,不要删除原有的HTML标签。

Tesseract支持Xamarin吗? - Pingpong

3

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接