谷歌云视觉OCR API的准确度和性能是否比Tesseract OCR API更好？

Question

9

我已经在我的Java应用程序中集成了Google Cloud Vision API，用于从格式复杂的文档中进行文本识别。我的一个同事建议使用"Tesseract API"。请问这两个API之间有什么区别？哪个在准确性方面更好或者有其他优势？谢谢！

- nik

1

是的，没错。我没有任何来源和链接来定义我的答案。我所拥有的是我曾经使用过它：易于实现，离线可用，无需训练自己的语言，体积小，结果更加准确（比其他技术高30％），文档和示例更好。缺点语言受限，尚未支持RTL语言，在移动设备上取决于Play服务版本。 - Muhammad Saqib

2个回答

1

谷歌视觉OCR是付费的，比tesseract更好，而tesseract完全免费并且是一个开源项目。

您可以阅读这些内容以了解它们之间的区别：

- Mukul

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Pratap Singh Mehra · Accepted Answer

我曾经使用过这两种工具。 Google Vision比Tesseract快得多，如果是一年前，准确性也更好。

最近，Tesseract采用了LSTM及其首选语言选择和训练数据。当进行优化时，速度可以提高2倍或更多。但除非他们开始支持CUDA，否则肯定无法比Google Vision更快。

关于准确性，我已经测试了它们的最佳和最差文档图像。其中Google Vision的准确率为66.6％，Tesseract为82％，这对我来说足够高了。

如果您更注重准确性，则Tesseract是赢家；如果您更注重时间，则Google Vision是最好的选择。

此外，还有一些支持CUDA的其他项目，可能比它们更好。