使用Python编辑PDF中的文本

7
我有一个PDF文件,需要编辑其中的一些文本/数值。例如,在我拥有的PDF文件中,“BIRTHDAY DD/MM/YYYY”总是“N/A”。我想将其更改为任何我想要的值,然后将其保存为新文档。覆盖现有文档也可以。至此,我已经完成了以下工作:
from PyPDF2 import PdfReader, PdfWriter

reader = PdfReader("abc.pdf")
page = reader.pages[0]

writer = PdfWriter()
writer.add_page(reader.pages[0])
pdf_doc = writer.update_page_form_field_values(
    reader.pages[0], {"BIRTHDAY DD/MM/YYYY": "123"}
)
with open("new_abc1.pdf", "wb") as fh:
    writer.write(fh)

但是这个update_page_form_field_values()没有改变所需的值,可能是因为这不是一个表单字段?
显示需要更改的值的pdf截图: screenshot_image 有什么线索吗?

你能分享一下 abc.pdf 吗? - dosas
1个回答

0

我是pypdf和PyPDF2的现任维护者(请使用pypdf;PyPDF2已被弃用)

目前无法使用pypdf更改文本。

更改表单内容是另一回事。然而,我们在表单字段方面有几个问题:https://github.com/py-pdf/pypdf/labels/workflow-forms

update_page_form_field_values是正确的函数。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接