使用PDFBox保护PDF文件

8
我很困扰于PDFBox的文档。对于这么受欢迎的库来说,信息似乎有些匮乏(至少对我而言如此)。
无论如何,我的问题与保护PDF相关。目前,我只想控制用户访问权限。具体地说,我想防止用户能够修改PDF文件。
如果我省略访问权限代码,一切都完美地运行。我正在从外部资源读入PDF文件。然后我在填充字段、添加一些图片之后保存新的PDF文件。这一切都运行得非常完美。
但当我添加以下代码以管理访问权限时,就出现了问题:
/* Secure the PDF so that it cannot be edited */
try {
    String ownerPassword = "DSTE$gewRges43";
    String userPassword = "";

    AccessPermission ap = new AccessPermission();
    ap.setCanModify(false);

    StandardProtectionPolicy spp = new StandardProtectionPolicy(ownerPassword, userPassword, ap);
    pdf.protect(spp);
} catch (BadSecurityHandlerException ex) {
    Logger.getLogger(PDFManager.class.getName()).log(Level.SEVERE, null, ex);
}

当我添加这段代码时,所有的文本和图片都从输出的pdf中删除了。表单字段仍然存在于文档中,但它们都是空的,原始PDF中包含的所有文本和图像以及在代码中动态添加的内容都已消失。
更新: 好的,据我所知问题来自表单字段相关的错误。我将尝试另一种方法,不使用表单字段,并查看它会得到什么结果。

我遇到了相同的问题,随机的PDF文件返回空白。有什么想法吗? - NightWolf
我从未解决过这个问题。最终我不得不使用另一个库! - tarka
谢谢。我为您找到了一个解决方案。 - NightWolf
参考文档链接:https://pdfbox.apache.org/2.0/cookbook/encryption.html - Vadzim
1个回答

12
我找到了解决这个问题的方案。看起来,如果PDF来自外部来源,有时会受到保护或加密。
如果从外部源加载PDF文档时输出为空白,并添加了保护,您可能正在使用加密文档。我有一个处理PDF文档的流处理系统。所以下面的代码适用于我。如果您只是处理PDF输入,则可以将下面的代码与您的流集成。
public InputStream convertDocument(InputStream dataStream) throws Exception {
    // just acts as a pass through since already in pdf format
    PipedOutputStream os = new PipedOutputStream();
    PipedInputStream is = new PipedInputStream(os);

    System.setProperty("org.apache.pdfbox.baseParser.pushBackSize", "2024768"); //for large files

    PDDocument doc = PDDocument.load(dataStream, true);

    if (doc.isEncrypted()) { //remove the security before adding protections
        doc.decrypt("");
        doc.setAllSecurityToBeRemoved(true);
    }
    doc.save(os);
    doc.close();
    dataStream.close();
    os.close();
    return is;
}

现在使用返回的InputStream来进行您的安全应用程序;

   PipedOutputStream os = new PipedOutputStream();
   PipedInputStream is = new PipedInputStream(os);

   System.setProperty("org.apache.pdfbox.baseParser.pushBackSize", "2024768");
   InputStream dataStream = secureData.data();

   PDDocument doc = PDDocument.load(dataStream, true);
   AccessPermission ap = new AccessPermission();
   //add what ever perms you need blah blah...
   ap.setCanModify(false);
   ap.setCanExtractContent(false);
   ap.setCanPrint(false);
   ap.setCanPrintDegraded(false);
   ap.setReadOnly();

   StandardProtectionPolicy spp = new StandardProtectionPolicy(UUID.randomUUID().toString(), "", ap);

   doc.protect(spp);

   doc.save(os);
   doc.close();
   dataStream.close();
   os.close();

现在这应该返回一个完整的文档,没有空白输出!

诀窍是先移除加密!


你在单线程代码中使用 PipedOutputStreamPipedInputStream 有些奇怪。 - mkl
抱歉。在这个例子中,管道输入流引用实际上是传递给另一个线程的(此代码位于固定的akka actor中)。我在上面的代码中省略了发送。 - NightWolf

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接