如何使用Apache PDFBox拆分PDF文件?

3
我正在使用Apache PDFBox来处理Java应用程序中的PDF文件。 我想拆分PDF文档,例如在每个页面上。
请问是否可以使用Apache PDFBox完成此操作?如果可以,怎么做?

1
有关更高级的拆分,请参见此处:https://dev59.com/4o7da4cB1Zd3GeqP8RO4 顺便说一句,在提出一行问题之前,请考虑进行谷歌搜索。在谷歌中搜索“pdfbox split”只会找到Tunaki的答案中的类。 - Tilman Hausherr
我仍然需要一个例子。 - danny117
1个回答

7

这可以通过使用Splitter实现。

下面是一个示例代码,它将在每一页上拆分文档:

PDDocument document = PDDocument.load(myPDF);
Splitter splitter = new Splitter();
List<PDDocument> splittedDocuments = splitter.split(document);

您可以使用setSplitAtPage(split)来控制每个拆分的PDF的页面数量。


List<PDDocument> 是什么意思? - Shaheedul Islam
我是Java的初学者,以前从未使用过<>。 - Shaheedul Islam
1
这被称为泛型。你应该查看一个关于它的教程 - Tunaki
3
这句话的意思是“它表示一个由PDDocument元素组成的列表”。 - Tilman Hausherr
我希望这样拆分PDF不会导致任何内部结构树的丢失(确切地说是标签)。 - Pramesh Bajracharya
你必须关闭每个分割文档实例还是只需关闭文档?我只做了后者,但看到很多警告:警告:您没有关闭PDF文档。 - maxi

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接