我想使用Apache Tika库提取PDF内容,但遇到了用户名和密码加密的PDF文件。导致以下错误:
有人知道Apache Tika是否支持提取带有此安全功能的PDF文件吗?INFO Document is encrypted org.apache.tika.exception.EncryptedDocumentException: 无法处理:文档已加密 at org.apache.tika.parser.pdf.PDFParser.parse(PDFParser.java:153)
Caused by: org.apache.pdfbox.exceptions.CryptographyException: 找不到适当的安全处理程序 Adobe.APS at org.apache.pdfbox.pdmodel.PDDocument.decrypt(PDDocument.java:952) at org.apache.tika.parser.pdf.PDFParser.parse(PDFParser.java:139) ... 4 more