Amazon Textract与Amazon Rekognition DetectText的区别

Question

Amazon Textract与Amazon Rekognition DetectText的区别

amazon-web-servicesamazon-rekognitionamazon-textract

12

我该如何决定何时使用Amazon Textract而不是Amazon Rekognition的TextDetect方法？

我的用例是从移动设备拍照并将图像数据转换为文本，然后存储到AWS RDS中。

- vaquar khan

接受下面的答案有助于其他用户更容易地找到它！我经常看到这个问题，而绿色的“已回答”颜色使用户更有可能偶然发现此线程。 - Nick Walsh

2个回答

17

如果图片中只是随机文本，那么可以使用Amazon Rekognition。它能够在任何位置找到文本。 Amazon Textract 旨在将纸质文件转换为组织良好的数据。它可能无法很好地处理随机图片（虽然我没有尝试过，所以不能确定！）。

- John Rotenstein

继续John的回答，Amazon Textract API在处理任何包含文本的图像上都能很好地工作。然而，鉴于简单用例的价格较低，仍建议选择Rekognition Detect Text API。 - Rohan Kumar

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Nick Walsh · Accepted Answer

关于端到端的问题解决，Textract将表现更好，因为它对OCR功能更全面。如果您只是想从野外拍摄的图片中获取一两行文本，例如街道标志或广告牌（即不是文档或表格），我建议使用Amazon Rekognition。

Amazon Textract是一项较新的AWS服务，专为解决图像文档和PDF中OCR（光学字符识别）问题而创建。虽然Rekognition是一项更普遍的计算机视觉服务，但Textract具有更多的OCR定向参数，以优化准确有效地提取文本的过程。

开箱即用，如果您只是想检测文本和相关元数据（坐标，角度，置信度值），则Rekognition的DetectText方法可能与Textract中的等效analyze_document方法类似，但Textract提供了更进一步的语义结构，有助于文本筛选/格式化，抽象出其他传统上需要开发人员自己编写的后处理形式。

最后，在比较两种Detect Text方法的成本时，Textract的成本略高（$1.50/1k图像），而Rekognition的成本为（$1.00/1k图像）。