如何在Python中将页面包含在PDF文档中

5

我正在使用Python中的reportlab工具包生成一些PDF格式的报告。我想使用已发布为PDF格式的文档的某些预定义部分,以包含在生成的PDF文件中。是否可能(以及如何)在reportlab或Python库中实现此目标?

我知道我可以使用一些其他工具,如PDF Toolkit(pdftk),但我正在寻找基于Python的解决方案。

3个回答

6

我目前正在使用PyPDF来读取、写入和合并现有的PDF文件,同时使用ReportLab来生成新的内容。使用这两个包似乎比我能找到的任何单个包都要好。


是的,我喜欢这个包。第一个例子就是我想要的,我会试一试。 - Jiri

2
如果你想在 Reportlab 文档中放置现有的 PDF 页面,我建议使用 pdfrw。与 PageCatcher 不同,它是免费的。
我已经在几个需要向现有文档添加条形码等的项目中使用过它,效果非常好。项目页面上有一些示例展示如何将其与 Reportlab 一起使用。
但需要注意以下几点:
如果源 PDF 包含错误(例如,由于原始程序不完美地遵循了 PDF 规范),尽管 Adobe Reader 等软件没有显示出问题,但 pdfrw 可能会失败。目前 pdfrw 的容错性不是很好。
另外,pdfrw 的工作方式是完全对放置的 PDF 页面内容不可知的。因此,例如,你无法使用 pdfrw 检查页面以查看右下角是否包含某个字符串。但是,如果你不需要这样做,那么应该没问题。

1

好的,这似乎是正确的工具。不幸的是,它是在reportlab工具包的商业版本中,我不能直接使用它 - 我正在使用开源版本。而且没有定价 - 看起来我必须在下载之前与reportlab协商一些价格。 - Jiri

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接