使用谷歌文档API进行OCR

Question

使用谷歌文档API进行OCR

ocrtesseractgoogle-docs-apigoogle-drive-api

3

我正在进行OCR检测，并使用这个代码实现tesseract OCR。

但我听说过Google Docs API会提供服务。

但是根据这个链接，API只能保存到Google文档？

有人在您的应用程序中实现或使用过此功能吗？我在哪里可以获得此API的一些示例用法？

- 2vision2

1

Tesseract与此有什么关系？这不是与Google Docs API有关的问题吗？ - Karol S

Tesseract是一种类似于Google文档API的开源OCR组件。我正在寻找一个更可靠的谷歌服务。有什么帮助吗？ - 2vision2

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- KVG · Answer 1

我现在正在使用Google Vision API在我的应用程序中进行OCR。

这非常容易。你可以在https://cloud.google.com/vision/上找到大量的文档。

但是为了回答你的问题，API响应是一个JSON，你可以从中过滤出任何你需要的内容，我假设在你的情况下是文本。

像这样：

response = client.text_detection(image= image)
texts = response.text_annotations
print('Texts:')
for text in texts:
    print('\n"{}"'.format(text.description))

    vertices = (['({},{})'.format(vertex.x, vertex.y)
                 for vertex in text.bounding_poly.vertices])

    print('bounds: {}'.format(','.join(vertices)))

基本上，您可以对响应执行任何操作。在使用之前，您需要创建一个帐户、提供结算信息并进行一些设置等操作。但是如果我没记错的话，每月最多可免费使用2000张图像，类似于这样。