如何使用ImageMagick将PDF文件中特定数量的页面转换为PNG图像

3
我正在使用Imagemagick将我的.pdf文件转换为.png图像,但是当我发出以下命令时: $convert sample.pdf image.png
它会将sample.pdf文件的所有页面转换为.png图像,但我只想转换特定数量的页面(例如前10页或第22或12页等)。请建议一种解决此问题的方法。
还有一个问题是:当我们在Google文档.pdf查看器中查看我们的.pdf文件时,它们也是图像格式,但我们可以选择并复制页面上写的文本到剪贴板(只需选择文本并按Ctrl + c)。那么我如何实现这一点,以便我的网站用户可以从我的图像中选择文本。(已经有一些关于此的讨论stackoverflow,但它们不是很清楚)

2
那第二个问题应该是一个单独的问题。 - Pekka
2个回答

7
for i in {0..9} 11 21
do
    convert "sample.pdf[$i]" "image_$i".png
done

3

Benoit的回答是您寻找的有关将PDF切片并转换为图像的内容。

或者,您可以使用pdftk并进行拼接操作。例如,这将使您获得前10页并生成一个新的切片PDF。

pdftk YOUR.PDF cat 1-10 output SLICED.PDF

关于您的第二个问题,即将图像PDF转换为带有文本数据的PDF,唯一的方法是使用OCR工具,例如Tesseract。

唯一的问题是这些OCR工具并不总是那么准确。换句话说,有时它们将无法输出您在该图像上读到的内容。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接