如何从命令行中删除PDF中隐藏的裁剪元素?

3
如何用命令行删除PDF中隐藏的裁剪元素?我尝试了许多解决方案,根据坐标裁剪PDF页面上的元素,但生成的PDF大小相同,额外元素只是被遮盖而不是删除。我找到了这个解决方案,但我正在寻找一个命令行工具。

1
我发现使用Apago的pdfE有一个更好的解决方案。它可以完成工作,而且速度更快。 - vivek85
1个回答

1

我所知道的唯一能够在命令行(Windows、Linux、MacOSX)上工作并且同时保留裁剪框内所有PDF对象的方法是由callassoftware提供的商业/付费软件。

如果您接受这种方法,请在评论中指出,我将更新答案并提供更多细节。

否则,另一种方法是将(裁剪后的)PDF页面转换为图像(例如使用Ghostscript转换为TIFF),然后将图像重新转换为PDF。所有先前的PDF对象都将消失,现在唯一存在的(图形)“对象”是嵌入在PDF页面上的图像。

如果您接受这种方法,请在评论中指出,我将更新答案并提供更多细节。


callassoftware绝对是我们可以使用的东西。我能否获得关于它的一些额外细节? - vivek85
@vivek85:您可以通过在PDF文件后应用OCR(光学字符识别)工具来“修复”该缺陷(无法从生成的图像中选择文本)。这将将文本嵌入为“隐藏”的文本(不直接可见,但可选择;可见的仍然只是图像)。 - Kurt Pfeifle
1
@vivek85:callassoftware工具本身没有太多功能,需要一个“配置文件”(.kfpx文件后缀)。但是,你需要使用软件的GUI/Desktop版本来创建该配置文件。该GUI仅适用于Windows和Mac OS X。但是,在Win/Mac上创建配置文件后,您可以将其导出并在Linux命令行版本中使用。因此,最简短的解释是:在Win或Mac上创建配置文件以删除不需要的元素,将其导出为.kfpx文件,并在调用该配置文件的Linux CLI上使用...* - Kurt Pfeifle
@vivek85:我没有考虑到你想要减小文件大小的意图。我的印象是你想要删除对象,以防止它们被完全评估(以防泄露机密信息)。 - Kurt Pfeifle
@vivek85:请注意,页面对象的位置有一半在裁剪框内,有一半在外部时,无法仅删除其中一半:您必须做出艰难的决定 - 保留全部或全部删除。 - Kurt Pfeifle
显示剩余3条评论

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接