我最近发现了Tesseract和OpenCV。看起来Tesseract是一个完整的OCR引擎,而OpenCV可以用作创建OCR应用/服务的框架。
我尝试在我的一些图像上使用Tesseract,它的准确性似乎还不错。后来,我发现了一个非常简单的教程,介绍如何使用Python使用OpenCV进行OCR,并且感到印象深刻。在短短几分钟内,我完成了系统的训练,其准确性也很好。但是,采用这种方法意味着我需要使用大量的训练集对系统进行广泛的训练。
我的具体问题如下:
我尝试在我的一些图像上使用Tesseract,它的准确性似乎还不错。后来,我发现了一个非常简单的教程,介绍如何使用Python使用OpenCV进行OCR,并且感到印象深刻。在短短几分钟内,我完成了系统的训练,其准确性也很好。但是,采用这种方法意味着我需要使用大量的训练集对系统进行广泛的训练。
我的具体问题如下:
- 如何在Tesseract和使用OpenCV构建自定义OCR应用之间进行选择?
- Tesseract有针对不同语言的训练数据集可用。OpenCV是否有类似的东西,以便我不必从头开始实现OCR?
- 哪个更适合想要成为商业应用程序的人?
有什么建议吗?