我一直在尝试使用pdftk来检查由Nitro Reader创建的压缩pdf流中的信息,但pdftk不能解压这些流。它不会产生任何错误,但似乎除了重新排列pdf对象外,并没有执行任何操作。在这里是一个这些pdf文件的最小示例。
当我尝试在其他pdf上使用pdftk时,它似乎能够正常工作。如果我手动提取数据流并在Python中使用zlib解压缩它们,它们可以正确地解压缩。此外,如果我在Adobe Reader中打开pdf并重新保存,则pdftk可以在生成的pdf上正常工作。
我已经尽力手动检查了Nitro pdf,并且它似乎是有效的pdf。我非常困惑发生了什么。
作为问题的背景,我有数百个这些pdf,并且正在尝试搜索特定关键字,如果我可以自动化解压缩,那么我应该能够做到这一点。 pdftk版本1.45
Windows 7 Home Premium SP1
Nitro Reader 2版本2.5.0.36
谢谢, 詹姆斯
pdftk test.pdf output test-d.pdf uncompress
当我尝试在其他pdf上使用pdftk时,它似乎能够正常工作。如果我手动提取数据流并在Python中使用zlib解压缩它们,它们可以正确地解压缩。此外,如果我在Adobe Reader中打开pdf并重新保存,则pdftk可以在生成的pdf上正常工作。
我已经尽力手动检查了Nitro pdf,并且它似乎是有效的pdf。我非常困惑发生了什么。
作为问题的背景,我有数百个这些pdf,并且正在尝试搜索特定关键字,如果我可以自动化解压缩,那么我应该能够做到这一点。 pdftk版本1.45
Windows 7 Home Premium SP1
Nitro Reader 2版本2.5.0.36
谢谢, 詹姆斯
gs
(GhostScript)的方法来实现这个? - Geremia