从PDF中提取带有图层蒙版的图像。

我有一个带有图层蒙版(即透明度)的PDF文件,我需要提取图像的透明图层。
当我使用pdfimages来提取图像时,无论是.jpg还是.png都具有相同的白色非透明背景。ImageMagick的convert a.pdf image-%04d.png只输出单个非分层文件。
任何帮助将不胜感激。
3个回答

请看这个:如何从PDF中删除文本信息?

为了方便起见,将其粘贴在这里:

Openoffice

在 OpenOffice 的扩展管理器中安装 Oracle 的 PDF导入扩展,您就能够在 OpenOffice Draw 中打开和编辑您的 PDF 文件。这将创建所有的元素(文本、线条、图形等),并且您可以删除您不需要的部分。以下是一个屏幕截图:

enter image description here

Gimp

如果您更喜欢将 PDF 页面作为图层处理并将其作为图像进行编辑,那么您可以右键单击 PDF 文件并选择“使用 GIMP 图像编辑器打开”,在打开 GIMP 后将会显示“从 PDF 导入”的对话框,让您选择要编辑的页面以及其他选项,如下面的屏幕截图所示。

enter image description here

之后,您也可以像下面的屏幕截图一样编辑这些页面:

enter image description here

祝您好运!


我认为图层蒙版是PDF的一部分,而不是图像的一部分。但是,你可以使用一些PDF库获取蒙版的详细信息,然后使用其他图像处理库或工具将这些蒙版应用于提取出来的图像。

Scribus也会尝试打开PDF文件进行编辑。 具体效果取决于PDF的创建方式。我经常需要将多个在“提取”PDF中被切割的图像拼接在一起。

此外,据我所知,JPEG不支持透明度,而我遇到的大多数PDF都是将图像嵌入为JPEG格式。

我只希望你所需的透明图像实际上是SVG图形。如果是的话,使用Scribus应该非常成功。