C/C++/Objective-C 文本识别库

21

有没有人知道在C/C++/Objective-C中有哪些免费/开源的文本识别库?基本上就是可以扫描图像并读出所有纯文本的东西。


4
不确定您是否已经看过这篇文章,但从您的问题中可以看出您可能对它感兴趣:http://sudokugrab.blogspot.com/2009/07/how-does-it-all-work.html - refulgentis
1
谢谢你提供的链接,你可以将它作为答案,我会给你点赞。 - Andy White
3个回答

14

2
跳转后提到 HP 作为来源... - stefanB
2
Tesseract非常好用,但是在处理非拉丁字符脚本(例如中文)时要注意其限制。 - Jonathan
我尝试使用一些示例来测试Tesseract,它可以识别整段文字中的一些字母,但其余的则是乱码符号,即使我在记事本中输入英语单词并截屏。 - James Wierzba

4
开源OCR库: 1. ABBYY Mobile OCR Engine 是一个功能强大的软件开发工具包,允许移动和小型应用程序的开发人员集成高度精确的光学字符识别(OCR)技术,将图像和照片转换为可管理和可搜索的文本。该工具包支持最流行的移动平台和设备 - iOS(iPhone)和Android。http://www.abbyy.com/mobileocr/ 2. Tesseract 可能是目前最准确的开源OCR引擎。https://code.google.com/p/tesseract-ocr/

为什么这个被踩了? - Mathai
我不是一个踩贴者,但这篇文章读起来很像是一篇ABBYY Mobile的广告,没有最初的免责声明说明Sumit与他们有关。我不认为情况是这样的,但我可以想象一个过于敏感的读者会因此而踩贴。 - RyanfaeScotland

3

这里有一篇关于如何从图片中提取数字的有趣文章。

作者收集了大量样本来训练他的神经网络算法,我相信使用了OpenCV进行图像处理。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接