有没有办法修复PDF文件中被截断的文本?

4

我有一本图书手册,创建者更改了部分LaTeX代码并更改了页面位置和大小,但在编译、压缩和发送之前没有进行检查。他目前不可用,所以如果我想打印它,我必须自己修复它。

我能够使用一些ghostscript命令将整个文本推向接近页面中心的位置,命令如下:

/usr/bin/gs -sDEVICE=pdfwrite -o /home/user/shiftdown.pdf -dPDFSETTINGS=/prepress -c "<</PageOffset [0 -35]>> setpagedevice" -f /home/user/brokendoc.pdf

问题在于,虽然现在页面可以不受硬件页边距的限制进行打印,但章节标题仍然被切掉了一半。如果我在Acrobat或Reader中打开PDF文件,我可以选择章节标题并将其复制,然后将完整的文本粘贴到我的程序中。当我尝试在具有部分不兼容驱动程序的Xerox MFP上打印它时,它会打印标题,但无法双面打印,而我也不想打印700多页,然后使用“复制到1-2”功能。
有人知道如何修复这些被切断的标题,使其在PDF文件中正确显示或者至少可以可靠地打印出来吗?我很容易可以获取ghostscript、TeX和标准版本的Acrobat X。
[更新:]
在下载了Acrobat Pro XI演示版之后,我能够进入“打印制作”选项卡并点击“编辑对象”。当我点击被切断的章节标题时,它显示了两个边框,一个略高于另一个,覆盖整个页面。右键单击它时,我有添加剪辑和删除剪辑的选项。当我点击“删除剪辑”时,它显示了整个章节标题。如果我点击“添加剪辑”,它会显示“所选区域中的一个或多个已经具有剪辑区域。是否继续为所选对象设置剪辑区域?[否] [是]”。
有了这些补充信息,我知道一定有一种批处理模式可以解决这个问题,有人知道哪个命令可以转换为此吗?

1
由于“没有触及硬件边界,章节标题仍然被切掉一半”,这听起来像是一些剪辑细节。不幸的是,剪辑可以通过/CropBox设置或剪辑路径来实现。您可能需要在Ghostscript文档中搜索这些关键字。 - mkl
我认为你是对的,但是即使使用那些术语,我的所有搜索结果都非常空洞。这绝对是那些细节之一,似乎没有得到很好的涵盖。 - Davron
1个回答

3
没有看到“brokendoc.pdf”文件很难知道问题出在哪里。如果我看到了文件,我可以告诉你问题所在,并(可能)告诉你如何修复它或解决它。
我不需要整个文件,只需要一个只显示有问题的几页的缩短版本即可。您可以使用以下命令从完整的brokendoc.pdf中获取:
gs -sDEVICE=pdfwrite -o part.pdf -dLastPage=10 brokendoc.pdf
此外,您也可以尝试:
gs -sDEVICE=pdfwrite -o fitted.pdf -dPDFFitPage -sPAPERSIZE=letter -dFIXEDMEDIA brokendoc.pdf
上述命令可以将页面缩放(并居中)到指定的页面大小。您可以指定“letter”或“a4”,或使用-dMEDIAWIDTHPOINTS=_ -dMEDIAHEIGHTPOINTS=_来获得特定的输出页面大小。-dFIXEDMEDIA选项会使gs忽略文件中的MediaBox。

FIXEDMEDIA命令似乎没有任何效果。我正在尝试找出在哪里放置文件,以便它是可访问的,因为我的公司阻止了所有各种文件共享服务。互联网上的文件版本比旧版高0.1个修订版本,但它也没有这个问题。 - Davron
我下载了Acrobat Pro演示版并使用了“编辑对象”功能。当我右键单击时,会出现两个框,并且我可以点击“删除剪辑”。这样可以移除覆盖在上部的区域。现在我只需要弄清楚如何批量执行此操作。 - Davron

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接