Amazon Textract与Amazon Rekognition DetectText的区别

12

接受下面的答案有助于其他用户更容易地找到它!我经常看到这个问题,而绿色的“已回答”颜色使用户更有可能偶然发现此线程。 - Nick Walsh
2个回答

20

关于端到端的问题解决,Textract将表现更好,因为它对OCR功能更全面。如果您只是想从野外拍摄的图片中获取一两行文本,例如街道标志或广告牌(即不是文档或表格),我建议使用Amazon Rekognition。

Amazon Textract是一项较新的AWS服务,专为解决图像文档和PDF中OCR(光学字符识别)问题而创建。虽然Rekognition是一项更普遍的计算机视觉服务,但Textract具有更多的OCR定向参数,以优化准确有效地提取文本的过程。

开箱即用,如果您只是想检测文本和相关元数据(坐标,角度,置信度值),则Rekognition的DetectText方法可能与Textract中的等效analyze_document方法类似,但Textract提供了更进一步的语义结构,有助于文本筛选/格式化,抽象出其他传统上需要开发人员自己编写的后处理形式。

最后,在比较两种Detect Text方法的成本时,Textract的成本略高($1.50/1k图像),而Rekognition的成本为($1.00/1k图像)。


17
如果图片中只是随机文本,那么可以使用Amazon Rekognition。它能够在任何位置找到文本。 Amazon Textract 旨在将纸质文件转换为组织良好的数据。它可能无法很好地处理随机图片(虽然我没有尝试过,所以不能确定!)。

继续John的回答,Amazon Textract API在处理任何包含文本的图像上都能很好地工作。然而,鉴于简单用例的价格较低,仍建议选择Rekognition Detect Text API。 - Rohan Kumar

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接