使用谷歌文档API进行OCR

3
我正在进行OCR检测,并使用这个代码实现tesseract OCR。
但我听说过Google Docs API会提供服务。
但是根据这个链接,API只能保存到Google文档?
有人在您的应用程序中实现或使用过此功能吗?我在哪里可以获得此API的一些示例用法?

1
Tesseract与此有什么关系?这不是与Google Docs API有关的问题吗? - Karol S
Tesseract是一种类似于Google文档API的开源OCR组件。我正在寻找一个更可靠的谷歌服务。有什么帮助吗? - 2vision2
1个回答

0

我现在正在使用Google Vision API在我的应用程序中进行OCR。

这非常容易。你可以在https://cloud.google.com/vision/上找到大量的文档。

但是为了回答你的问题,API响应是一个JSON,你可以从中过滤出任何你需要的内容,我假设在你的情况下是文本。

像这样:

response = client.text_detection(image= image)
texts = response.text_annotations
print('Texts:')
for text in texts:
    print('\n"{}"'.format(text.description))

    vertices = (['({},{})'.format(vertex.x, vertex.y)
                 for vertex in text.bounding_poly.vertices])

    print('bounds: {}'.format(','.join(vertices)))

基本上,您可以对响应执行任何操作。 在使用之前,您需要创建一个帐户、提供结算信息并进行一些设置等操作。 但是如果我没记错的话,每月最多可免费使用2000张图像,类似于这样。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接