将两个PDF页面合并为一个新的页面,文本内容之间没有空白间隔。

4

全部

我想要将两个PDF合并为一个PDF。同时,我希望这两个PDF能够无缝地连接在一起。

举个例子,假设第一个PDF文件的最后一页有很多空白区域,在合并后,我希望第二个PDF从第一个PDF的空白区域开始。

我们有支持这种操作的工具吗?


1
你使用的操作系统是什么? - Houdini
2
您的请求涉及重新排列 PDF 页面内容。这不是一件简单的事情,尤其是如果需要支持页眉、页脚、链接等。因此,我怀疑您是否能找到一款适合您任务且价格低廉的好工具。 - mkl
1
+1 表示使用 mkl;您需要指定要保留多少空格,以及是否要保留第二个文档开头的空格。如果只想合并,可以使用 QPDF 或 PDFTK 进行合并。如果您想裁剪第一个 PDF 然后再合并,可以使用 Perl 工具 pdfcrop.pl,然后使用我提到的另外两个工具之一。 - user1914292
3个回答

4

这是一个不太难的任务:

假设我们有两个看起来像下面这样的PDF文件:

1 2

我们想要将这两个PDF页面合并成一个新的页面(单页),使之不会浪费太多纸张并节约空间(请参见以下左侧图像:http://ge.tt/1tl71Gf/v/3),而不是在两个页面文本之间留下很多空白(请参见以下右侧图像:http://ge.tt/1tl71Gf/v/5):

seamless_imposed normally joined

然后我们开始粗略估算第一个PDF页面文本之后的剩余空间,以便插入第二个页面和其文本。在我们的例子中,我们有一个A4文件,它的尺寸是595x841(后置点)。

在两个PDF页面中,我们假设文本的起始位置大致相同,或者换句话说,距离上边缘的距离相同,因此,如果我们想将第二个PDF页面及其文本强制加到第一个PDF页面上,而不覆盖第一个页面的文本,但将其放在此后,我们需要方便地向下移动第二个PDF页面的内容。

在我们的示例中,我使用pdftksed将第二个PDF页面的文本内容向下移动了200点(我们将下移的值添加到原始高度-在我们的例子中为841-以保持页面的几何形状,所以841变成1041,而页面的高度保持不变。

sed 's/MediaBox \[0 0 595 841]/MediaBox \[0 200 595 1041 ]/g'<2.pdf>2bis.pdf

并且结果是这样的(左上角的图像),而原本第二个pdf页面的文本内容以右上角的图像开始:
现在,完成此操作后,我们需要将第二个pdf页面重叠在第一个pdf页面上。
这可以再次通过pdftk完成,将第二个pdf页面和其下移的文本放在背景中。
pdftk 1.pdf background 2bis.pdf output seamless_imposed.pdf

以下是结果:http://ge.tt/1tl71Gf/v/3

seamless_imposed


1
不,这是不可能的。您可以合并页面,但无法合并内容。 您需要提取第一个页面的内容,并将第二个页面的内容附加到第一个页面上。标题和页脚未解决。

你为什么要在回答之前先说这不可能,然后又给出一个半有见地的答案呢?而且,这是完全有可能的,只是取决于你想付出多少努力。 - janechii
最终它不是一个可自动化的过程,总会有其缺点。 - Christian
1
我必须再次反对...如果说什么的话,Dingo给出的答案是自动化这个任务的好开始。当IBM可以编程Watson在Jeopardy中击败人类时,我不明白你怎么能认为这个相对简单的任务是“不可能”的。 - janechii
我同意这个简单的例子是可能的,其中第2页恰好适合第1页的空白处。这种情况有多频繁发生?我认为Dingo的假设太简单了。但如果第2页更长呢?你会在哪里切割?页脚中的页码呢?你会重新编号吗?自动化的吗?想象一下一个超过2个简单页面的文档。或者如果第2页有页眉呢?你能以编程方式检测页眉和页脚吗?文档中的索引或目录呢?你能重写它们吗? - Christian

0

在这些情况下,我们使用的工具是PdfArranger

not cropped

在之前的例子中,我们有几个运输标签,在页面底部浪费了一半的空白空间。

cropped

一旦我们通过单独或批量多选裁剪了底部的50%,我们将其保存为合并的PDF。

打印机和页面设置 然后在打印时,选择“打印为PDF”,在页面设置中选择每页2页,并调整缩放,适应和页面方向以满足您的要求。

ready to print

在我们的示例中,我们通过裁剪和组合使用PdfArranger和打印设置来每两个标签保存一页。当然,有几种工具可以实现相同的效果,但这个工具非常轻巧且易于使用。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接