9得票2回答
错误提示:在加载共享库 libpoppler.so.58 时出错:无法打开共享对象文件。

我按照指示编译并安装了poppler-0.39.0。默认情况下,头文件被放置在\usr\local\include中,库文件被放置在\usr\local\lib中。pdftohtml已安装在\usr\local\bin中。 现在当我尝试运行pdftohtml时,它会出现以下错误。 pdft...

9得票2回答
将包含300dpi位图的PDF转换为SVG

我正在创建一个将pdf转换为svg的工具。这些pdf包含图形数据,包括300 dpi的大位图和一堆向量。在stackoverflow上找到了pdf2svg,它非常好用,向量数据完美无缺。但是看起来位图被缩小到了72dpi。虽然尺寸仍为8x10英寸,但当你放大时可以看出dpi不正确。默认值假设为...

9得票2回答
如何在Python中使用poppler库从PDF文件中提取图像?

我想用Python从一个pdf中提取一些图像。我可以使用poppler-utils库中的pdfimages在Linux命令行上轻松地提取图像,就像这样: pdfimages my_file.pdf /tmp/image 接下来,我找到了一个Python绑定库此处,并使用常规的sudo a...

8得票3回答
Pdf2Image库无法读取使用DocuSign签名的PDF文件

我正在尝试将使用DocuSign签署的pdf转换为图像格式。我们在convert_from_path方法中遇到了错误。以下是代码和错误信息: import pdf2image data=pdf2image.convert_from_path('name.pdf') PDFPageCoun...

8得票1回答
MuPdf库在从PDF页面渲染图像方面是否比xpdf/poppler更快?

MuPdf库在渲染PDF页面中的图像方面是否比xpdf/poppler更快?他们说它是高性能的。

8得票5回答
使用Ghostscript或ImageMagick从PDF中删除/删除所有图像

我想删除/移除PDF中的所有图像,只保留文本/字体,并使用任何命令行工具实现。 我尝试在Ghostscript命令中使用“-dGraphicsAlphaBits = 1”,但图像仍存在,但像素很大。

8得票6回答
如何在Python中显示已下载的PDF文件

我使用以下方式从网上获取了一个PDF文件: import requests pdf = requests.get("http://www.scala-lang.org/docu/files/ScalaByExample.pdf") 我希望您能修改这段代码以显示它。 from gi.re...

8得票3回答
脚本在命令行执行后未能继续运行

我有一个关于命令行脚本的问题。PHP脚本永远不会继续执行。 尝试通过putty直接调用命令行,它会输出很多错误信息,但会立即返回/完成。为什么它不会回到PHP呢? 对其他PDF文件运行良好,但对这个文件不行。 pdf http://docdro.id/b0M5vfw code $C...

7得票1回答
将PDF转换为图像,但在放大后

这个链接展示了如何将pdf文件转换为图像。在转换成图像之前,有没有一种方法可以对我的pdf文件进行缩放?在我的项目中,我将pdf文件转换为png文件,然后使用Python-tesseract库提取文本。我注意到,如果我放大pdf并将其部分保存为png,则OCR提供的结果更好。因此,有没有一种方...