开源的中文OCR技术

9
我已经搜索了很多关于中文的开源OCR,但是没有什么用的开源OCR(为中文而设)。
因此我在这里想知道:
1.是否有任何可以用于生产环境的中文开源OCR?
2.实现拉丁语言和中文OCR时的主要区别是什么?我知道一些好的OCR,如Tesseract或Ocropus,如果我想让它支持中文,该怎么办?
任何帮助都将不胜感激,先行致谢~
2个回答

4
您可以选择:
  • Tesseract 3.0支持中文/日语
  • NHOCR支持日语

Tesseract 3.0现在可以下载吗?我在哪里可以找到它的源代码? - Mickey Shine
你可以查看http://code.google.com/p/tesseract-ocr/source/checkout。 - Eric Liu

0

中文比拉丁语系的语言拥有更多的字符。有一些商业产品,其中一种方法是联系他们并获得帮助。

我认为没有针对中文或日文字符的开源软件。在OCR领域,有许多超越模式识别算法的技术,这是一家公司擅长的领域,而不是开源社区。


我发现了一些针对日语的开源OCR。似乎中文的选择不是很多。还是谢谢您~ - Mickey Shine

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接