Reportlab: 如何给PDF文件添加页脚

13

我已经问过这个问题,但目前还没有答案,所以我想看一下Reportlab,它似乎是一个活跃开发且比fpdf Python库更好的选择。

我已经看过这个问题。给出的答案与这篇博客文章差不多。无论如何,这个脚本充满了错误,但我不想对它进行投票,原帖的提问者接受了它,并且似乎解决了他的问题,我有什么资格反驳呢?我宁愿问另一个问题。

首先你需要导入

from reportlab.pdfgen.canvas import Canvas

而不是canvas,而是Canvas,您不能只是这样做

Canvas.restoreState()Canvas.saveState()

也许还有更多错误,我宁愿使用另一个例子。昨晚我花了整个晚上试图让那段代码片段正常工作,但没成功。

是否有其他方法可以创建页脚? 我想要询问的特定方法是这个,那个人使用循环,在row[0]中写入一些内容,在row[1]中写入另外一些内容。

我在一个A4大小的LibreOffice文档中用12号Liberation Serif字体计算出有49行。 假设平均有45行,并根据字体大小确定页脚字体大小为8,难道就不能像这样插入页脚吗:x=row[45] ,然后基于页面编号递增x?那不会是一个更简单的解决方案吗?

如果我能检测到文件末尾或插入文本的最后一行,那么我可以这样做,我认为。

如果您参考我的另一个问题,您会注意到我将PowerPoint,Excel和Word文件转换为PDF,然后插入页脚。

如果有一个适用于Linux和Windows的库可以将PowerPoint和Excel转换为Word,然后添加页脚,然后再转换为PDF,那就太好了,因为我认为使用文档比使用PDF更容易。


直到有人回答之前,我会尝试使用os.system(“ libreoffice --headless --invisible --convert-to doc或类似的东西。 - Lynob
1个回答

25

首先,Reportlab非常棒。这是我找到的最好的生成pdf的库。

在尝试示例之前,请安装reportlab:

pip install reportlab

要创建脚注,您需要使用multibuild渲染文档,并使用canvasmaker添加页脚。

首先,让我们创建一个包含两个页面的简单pdf文件:

from reportlab.platypus import (SimpleDocTemplate, Paragraph, PageBreak)
from reportlab.lib.styles import getSampleStyleSheet
from reportlab.lib.pagesizes import LETTER


if __name__ == '__main__':

    # Content
    styles = getSampleStyleSheet()
    elements = []
    elements.append(Paragraph("Hello", styles["Normal"]))
    elements.append(Paragraph("World", styles["Normal"]))
    elements.append(PageBreak())
    elements.append(Paragraph("You are in page 2", styles["Normal"]))

    # Build
    doc = SimpleDocTemplate("my_file.pdf", pagesize=LETTER)
    doc.build(elements)

检查PDF文件是否正确创建。

现在,让我们添加一个canvas类来画页脚,显示一条线和页码,并将最后一行的build更改为multibuild:

from reportlab.pdfgen import canvas
from reportlab.platypus import (SimpleDocTemplate, Paragraph, PageBreak)
from reportlab.lib.styles import getSampleStyleSheet
from reportlab.lib.pagesizes import LETTER


class FooterCanvas(canvas.Canvas):

    def __init__(self, *args, **kwargs):
        canvas.Canvas.__init__(self, *args, **kwargs)
        self.pages = []

    def showPage(self):
        self.pages.append(dict(self.__dict__))
        self._startPage()

    def save(self):
        page_count = len(self.pages)
        for page in self.pages:
            self.__dict__.update(page)
            self.draw_canvas(page_count)
            canvas.Canvas.showPage(self)
        canvas.Canvas.save(self)

    def draw_canvas(self, page_count):
        page = "Page %s of %s" % (self._pageNumber, page_count)
        x = 128
        self.saveState()
        self.setStrokeColorRGB(0, 0, 0)
        self.setLineWidth(0.5)
        self.line(66, 78, LETTER[0] - 66, 78)
        self.setFont('Times-Roman', 10)
        self.drawString(LETTER[0]-x, 65, page)
        self.restoreState()


if __name__ == '__main__':

    # Content
    styles = getSampleStyleSheet()
    elements = []
    elements.append(Paragraph("Hello", styles["Normal"]))
    elements.append(Paragraph("World", styles["Normal"]))
    elements.append(PageBreak())
    elements.append(Paragraph("You are in page 2", styles["Normal"]))

    # Build
    doc = SimpleDocTemplate("my_file.pdf", pagesize=LETTER)
    doc.multiBuild(elements, canvasmaker=FooterCanvas)
在multibuild中,如果需要的话,您还可以为第一页指定一个不同的画布:
doc.multiBuild(Elements, onFirstPage=myFirstPage, onLaterPages=myLaterPages)

希望这能帮到你。

编辑

现在的目标是向现有的PDF文件添加页脚。不幸的是,使用Reportlab无法单独完成此操作(至少我认为免费版本不能,专业版可能具备此功能)。

首先,我们需要在配方中添加一些pdfrw

pip install pdfrw

现在我们可以通过以下方式向现有的PDF文件添加页脚:打开原始PDF文件,提取页面,并逐页将页面沿着页脚“绘制”到新的PDF文件中:

from reportlab.pdfgen.canvas import Canvas
from pdfrw import PdfReader
from pdfrw.toreportlab import makerl
from pdfrw.buildxobj import pagexobj

input_file = "my_file.pdf"
output_file = "my_file_with_footer.pdf"

# Get pages
reader = PdfReader(input_file)
pages = [pagexobj(p) for p in reader.pages]


# Compose new pdf
canvas = Canvas(output_file)

for page_num, page in enumerate(pages, start=1):

    # Add page
    canvas.setPageSize((page.BBox[2], page.BBox[3]))
    canvas.doForm(makerl(canvas, page))

    # Draw footer
    footer_text = "Page %s of %s" % (page_num, len(pages))
    x = 128
    canvas.saveState()
    canvas.setStrokeColorRGB(0, 0, 0)
    canvas.setLineWidth(0.5)
    canvas.line(66, 78, page.BBox[2] - 66, 78)
    canvas.setFont('Times-Roman', 10)
    canvas.drawString(page.BBox[2]-x, 65, footer_text)
    canvas.restoreState()

    canvas.showPage()

canvas.save()

免责声明:在Linux系统上测试,使用生成自Reportlab的PDF文件作为输入文件。它可能不适用于任意PDF文件。


1
页面页脚是在文档渲染后生成的。这就是为什么我使用multiBuild。我使用分页符只是为了轻松生成一个两页的文档。你使用的是什么类型的文件?文本文件吗? - Juan Fco. Roco
1
PDF文件,我有现有的PDF文件,我想给它们添加页脚,这些PDF文件不是我创建的。 - Lynob
1
我编辑了我的答案,并加入了一个小程序来实现这个功能。 - Juan Fco. Roco
1
我发现使用pdfrw读取pdf,然后使用reportlab在其上写入的问题是<a>链接无法正常工作。有什么解决办法吗? - Anonymous12332313
1
@SimplyOm 我并没有找到使用pdfrw和reportlab的解决方案。有一段时间我使用了https://pypi.org/project/numbering2pdf/,但是由于它与我Flask应用程序所需的某些其他库不兼容,我不得不停止使用它。它的可定制性不是很高,但是它能够工作。它是开源的,因此如果您需要自定义它,也许您可以编辑源代码以满足您的需求。最重要的是,如果我没记错的话,它会将字节写入PDF,这意味着<a>链接仍然有效。您是要创建PDF还是只是编辑现有的PDF? - Anonymous12332313
显示剩余5条评论

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接