目前是否有任何服务或软件工具使用Google Cloud Vision作为OCR扫描PDF文件的后端?
如果没有,如何使用Google Cloud Vision将PDF转换为OCRed PDF?据我所知,Cloud Vision目前支持PDF文件,但它只会将识别出的文本作为JSON文件输出。因此,似乎需要在Google Cloud Vision之外的单独步骤中将此转换后的文本放置在PDF图像之上。
背景:
我经常需要将扫描的文档PDF文件转换为包含OCRed文本层的PDF文件。到目前为止,我一直在使用OCRKit或ABBYY FineReader等软件。我测试了这些解决方案与Google Cloud Vision的文本识别能力的准确性,并且后者表现更加出色。
如果没有,如何使用Google Cloud Vision将PDF转换为OCRed PDF?据我所知,Cloud Vision目前支持PDF文件,但它只会将识别出的文本作为JSON文件输出。因此,似乎需要在Google Cloud Vision之外的单独步骤中将此转换后的文本放置在PDF图像之上。
背景:
我经常需要将扫描的文档PDF文件转换为包含OCRed文本层的PDF文件。到目前为止,我一直在使用OCRKit或ABBYY FineReader等软件。我测试了这些解决方案与Google Cloud Vision的文本识别能力的准确性,并且后者表现更加出色。