32得票4回答
提取PDF文件的目录?

我正在使用SWFTools和XPDF将PDF转换成图片、swf和文本,这些操作都是在一个PDF脚本中完成的。 但现在我想更进一步,尝试从PDF中获取目录(TOC),请问有没有可能提取这个信息?

10得票6回答
如何以原始格式从PDF中提取图片

我正在使用命令“pdfimages -j bar.pdf /tmp/image”从PDF中提取图像。我的目标是以它们被添加时的原始状态获取它们。因此,如果它是 .tif 文件,则希望得到 .tif 文件;如果是 jpg 文件,则希望得到 .jpg 文件。但我提取出来的所有图像都是 .ppm 格...

8得票1回答
MuPdf库在从PDF页面渲染图像方面是否比xpdf/poppler更快?

MuPdf库在渲染PDF页面中的图像方面是否比xpdf/poppler更快?他们说它是高性能的。

8得票1回答
pdftoppm“无显示字体”错误

我正在使用pdftoppm从pdf文件中提取页面,以便稍后使用ImageMagick将生成的pbm文件转换为多页tiff。 我已经通过以下代码使其工作: os.system('pdftoppm -f %i -l %i -aa no -mono -q "%s" %sx' % (StartPag...