如何将PDF转换为不带文本的图像

6

不是完全相同的问题,但这可能有所帮助:https://dev59.com/wHRB5IYBdhLWcg3wWF8H - Doc Brown
谢谢,我看了几乎所有关于转换的问题,我花了一整晚... 我已经可以将PDF转换为图像,但我希望没有字体或者更简单地处理没有文本的情况。 - yvan
如果你将PDF转换为PNG,那么在PNG中就没有“字体”。你能否详细解释一下,或者(更好的是)给出一个例子? - Doc Brown
我修改了我的问题并添加了一个例子,谢谢。 - yvan
3个回答

1

我也在寻找类似的东西。 在使用imagemagick时,我尝试了这个命令并得到了一些意外的结果。

convert -input.pdf -blur 0x0 output.jpg

这会从我尝试的pdf中删除文本层。我不能保证这对你有效,也不能确定这是正确的方法,但你可以尝试一下。

1

所以如果我理解正确,您想从PDF中删除一些文本(而不是字体),并且您想以编程方式完成。我怀疑您已经知道,只有在文本放置在PDF文件的某种单独层上时,才可能实现这一点。您可以尝试利用iText来实现。请注意,这意味着您将不得不投入几天的时间学习如何使用该库。


确切地说,我在考虑字体,因为有些人在没有字体的情况下会遇到文本问题。我看了一下iText,但我对Java完全不熟悉,我会尝试一下。 - yvan
我尝试了iText,不幸的是我无法达成我的目标。看起来他们没有我正在寻找的东西。 - yvan
@yvan:也许你应该在SO上提出一个新的、更具体的问题,发布一些使用iText的代码行,并告诉我们发生了哪些问题/什么不起作用。iText是一个强大的工具,但使用并不总是直截了当的。 - Doc Brown

0

您可以使用Adobe Acrobat来完成此操作。使用修整工具选择文本并将其删除。我认为您无法使用Ghostscript完成此操作。您可以考虑手动编辑PDF文件(qpdf 可以帮助您)。


不幸的是,我事先不知道我会有多少个PDF文件,手动处理每个文件需要很长时间。但是QPDF是一个非常有趣的工具。我会把它当作一个助手来考虑。 - yvan

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接