我正在使用AWS Textract对基于图像的PDF进行OCR处理。每个PDF都有60多页,但是当我尝试对PDF文件进行OCR处理时,它只针对每个文件的前4页进行处理。请问AWS extract对PDF文件的页面数量是否有限制?我在这里找到了文档https://docs.aws.amazon.com/textract/latest/dg/limits.html,但其中并没有提及页面数量的限制!!请问是否有人知道PDF页面数量是否有限制?如果有,我该如何对整个60+页的文件进行OCR处理呢?
我认为你的问题与textract的批处理响应有关。您需要查看json输出中是否填充了“NextToken”键,如果是,则必须使用该令牌进行另一个请求。