谷歌云视觉OCR API的准确度和性能是否比Tesseract OCR API更好?

9

我已经在我的Java应用程序中集成了Google Cloud Vision API,用于从格式复杂的文档中进行文本识别。我的一个同事建议使用"Tesseract API"。请问这两个API之间有什么区别?哪个在准确性方面更好或者有其他优势?谢谢!


1
是的,没错。我没有任何来源和链接来定义我的答案。我所拥有的是我曾经使用过它: 易于实现,离线可用,无需训练自己的语言,体积小,结果更加准确(比其他技术高30%),文档和示例更好。缺点 语言受限,尚未支持RTL语言,在移动设备上取决于Play服务版本。 - Muhammad Saqib
2个回答

2
我曾经使用过这两种工具。 Google Vision比Tesseract快得多,如果是一年前,准确性也更好。
最近,Tesseract采用了LSTM及其首选语言选择和训练数据。当进行优化时,速度可以提高2倍或更多。但除非他们开始支持CUDA,否则肯定无法比Google Vision更快。
关于准确性,我已经测试了它们的最佳和最差文档图像。其中Google Vision的准确率为66.6%,Tesseract为82%,这对我来说足够高了。
如果您更注重准确性,则Tesseract是赢家;如果您更注重时间,则Google Vision是最好的选择。
此外,还有一些支持CUDA的其他项目,可能比它们更好。

1

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接