如何在Windows上安装Poppler?

63

ScraperWiki 的最新版本依赖于 Poppler(如 GitHub 上所说)。不幸的是,它只指定了在 macOS 和 Linux 上获取 Poppler 的方式,而没有提供 Windows 的方法。

快速搜索并没有找到可靠的解决方案。有人知道如何在 Windows 上获取 Poppler 以配合 ScraperWiki 使用吗?

16个回答

94

其他答案已经提供了正确的Windows用户下载页面的链接,但没有说明如何为初学者安装它们。

  1. 前往 此页面 并下载您选择的二进制文件。在这个例子中,我们将下载并使用 poppler-0.68.0_x86

  2. 将存档文件poppler-0.68.0_x86.7z解压缩到C:\Program Files。因此,目录结构应该类似于这样:

C:
    └ Program Files
        └ poppler-0.68.0_x86
            └ bin
            └ include
            └ lib
            └ share
  1. 按照以下步骤将 C:\Program Files\poppler-0.68.0_x86\bin 添加到您系统的 PATH 中:点击 Windows 开始按钮,搜索 Edit the system environment variables,点击 Environment Variables...,在 System variables 下,查找并双击 PATH,点击 New,然后添加 C:\Users\Program Files\poppler-0.68.0_x86\bin,点击 OK

  2. 如果您正在使用终端执行 poppler(例如在命令行中运行 pdf2image),您可能需要重新打开终端以使 poppler 生效。

  3. 完成!


1
这个解决方案对我有用。但是命令 pdf2image 没有起作用,但是 pdfimage 起作用了。这正确吗?还是我漏掉了什么? - Sören Etler
1
@SörenEtler 预计 pdf2image 可以与此解决方案配合使用。 - Jeru Luke
1
同样适用于Python 3.8.5。 - Charalamm
1
到目前为止最简单的方式 - Ruben
4
链接页面中的poppler版本已经过时。当前版本是21.12,而该页面链接的版本为0.68。 - robertspierre
2
Poppler-Binaries 似乎更新得更及时 - 向 Disqus 评论区中使用名为'Rumpel Stielzchen' 的用户 致敬。 - David Renner

35

2
这个回答值得一千个点赞! - lisandro
无法在Windows上为Python安装软件包,它显示“setup.py”文件丢失。 - Coliban
这是由scoop install poppler安装的版本(它需要https://en.wikipedia.org/wiki/Scoop_Package_Manager,该软件会为当前登录的用户安装其他软件)。 - undefined

23

Poppler的Windows二进制文件可以从ftp://ftp.gnome.org/Public/GNOME/binaries/win32/dependencies/获取 - 但请注意,它们并不是最新的。

如果您正在寻找Python(2.7)绑定(如此问题的标签所示),我曾通过错误报告请求过。一些人显然成功制作了一些东西,但我还没有检查过。

至于最近的(与Python绑定无关的)poppler Windows二进制文件结果,请参见http://blog.alivate.com.au/poppler-windows/

最后,有全新的(目前更新频繁的)PyGObject all-in-one安装器(主要旨在为Windows提供PyGObject内省的Gtk+3 Python绑定等),因此如果您正在寻找这样的内容,请访问http://sourceforge.net/projects/pygobjectwin32/files/?source=navbar


1
最近我尝试了一些这些解决方案,但运气不佳。所以,我写了一篇关于如何解决Windows上的Poppler问题的文章。答案是使用Windows子系统来安装Linux。文章链接在这里:https://medium.com/@matthew_earl_miller/poppler-on-windows-179af0e50150 - Matthew E. Miller
3
虽然我相信这个答案对懂行的人很有帮助,但对于像我这样的新手来说,它读起来就像无意义的话语。 - Adam B

20

在Windows上安装Anaconda后,可以简单地执行以下命令:

conda install -c conda-forge poppler

这在Windows上完美运行! - Quinten
迄今为止最简单的答案! - codeananda

11

更新 2

请参阅Owen Schwartz的答案


更新 1

Rumpel Stielzchen评论中提到:

这个网站已经不再维护。Poppler版本0.68今天已经非常过时了。您可以在此处找到最新版本,也适用于Windows:https://anaconda.org/conda-forge/poppler/files 不幸的是没有32位版本,只有64位

...但是该软件包不包含任何依赖项

似乎Anaconda的人们有一个工具可以下载软件包和所有依赖项。而且TAR软件包中有一个文件:index.json,列出了它所依赖的软件包。我一次又一次地下载依赖项,没错:它很痛苦。


原始答案

最新的Poppler Windows二进制文件可以在此处找到:

http://blog.alivate.com.au/poppler-windows/


8

Chocolatey

Poppler 可以作为 Chocolatey 包 来获取:

choco install poppler

默认情况下,Poppler安装在C:\ProgramData\chocolatey\lib\poppler中,并自动创建以下工具的shim: pdfdetachpdffontspdfimagespdfinfopdfseparatepdftocairopdftohtmlpdftoppmpdftopspdftotextpdfunite
要更新Poppler,请运行:
cup poppler

Scoop

主仓库安装:

scoop install poppler

默认情况下,Poppler安装在~\scoop\apps\poppler,并自动为以下工具创建shim: pdfdetachpdffontspdfimagespdfinfopdfseparatepdftocairopdftohtmlpdftoppmpdftopspdftotextpdfunite
要更新Poppler,请运行:
scoop update poppler

TeX Live

另一个答案中所述,MiKTeX当前附带了Poppler工具,还有另一种LaTeX发行版TeX Live。

指南中可以看到:

命令行工具.

许多常见的Unix命令行程序的Windows端口与通常的TeX Live二进制文件一起安装。这些包括gzip, zip, unzip, 以及来自poppler套件的实用程序(pdfinfo, pdffonts, …)

Poppler套件默认位于C:\texlive\<年份>\bin\win32,如果您可以编译LaTeX文档,则应该可以直接使用它,因为此位置已由安装程序添加到PATH中。


scoop install poppler现在运行良好,并安装了一个非常新的版本,但choco install poppler不仅过时,而且目前明显失败:https://github.com/chtof/chocolatey-packages/issues/75 只有choco install poppler --version=0.89.0仍然有效,但安装的是一个非常旧的版本。 - undefined
请注意,choco install miktex 安装非常缓慢,并且安装的可执行文件都带有 miktex- 前缀;这些可执行文件的启动速度也非常慢(与 scoop 的可执行文件相比,后者启动速度更快)。 - undefined

5

在不触及环境变量的情况下,按照以下步骤简单安装Poppler:

  1. 从网址http://blog.alivate.com.au/poppler-windows/index.html下载最新的Poppler二进制文件。
  2. 解压并将poppler-0.68.0_x86文件夹复制到某个路径中,例如C:/User/Poppler/poppler-0.68.0_x86/poppler-0.68.0/bin。

现在进入你想要调用Poppler进行图像转换的Python代码,并使用以下代码片段:

from pdf2image import convert_from_path
pages = convert_from_path('MyPdf.pdf', 500, poppler_path = r'C:\User\Poppler\poppler-0.68.0_x86\poppler-0.68.0\bin')
for page in pages:
    page.save('out.jpg', 'JPEG')

4
你应该考虑使用Windows子系统Linux (WSL)
  1. 在Windows 10上启用WSL(S版本不支持)
  2. 从Windows商店安装最新版本的Ubuntu到WSL中
  3. 打开Ubuntu命令行

在Ubuntu命令行中,运行以下命令:

  • sudo apt-get update
  • sudo apt-get upgrade
  • sudo apt install poppler-utils
  • pdftocairo -v - 检查已安装的版本

然后可以以两种方式之一运行pdftocairo(例如):

  1. 在Ubuntu命令行中:pdftocairo ...
  2. 直接从Windows命令行中:wsl pdftocairo...
注意:每个Ubuntu的版本都有一个默认的poppler版本。您需要查找安装最新版本poppler-utils的说明(互联网上应该有很多),这可能涉及到编译源代码的许多步骤。例如,像这样的东西https://askubuntu.com/a/722955。然后你可能会遇到很多问题。
最新的Ubuntu 19.04版本可以安装Poppler 74。但是目前看来,Ubuntu 18.04似乎是WSL可以安装的最新版本,它安装了Poppler 62。

请注意,WSL 1于2016年8月发布。WSL 2于2019年5月左右发布。为了成功,可能需要使用更新的版本(和Windows)。 - Kind Contributor

2

我推荐使用MINGW。我最初采用了MSVC方法,但是维护许多依赖项的源URL太麻烦了。使用MINGW,所有依赖项也可以轻松编译。MINGW版本是最新的。 - Kind Contributor

2

在Windows上安装Poppler

  1. 访问https://github.com/oschwartz10612/poppler-windows/releases/
  2. 在Release 21.11.0-0 Latest v21.11.0-0下面
  3. 进入Assets 3下载
  4. 下载Release-21.11.0-0.zip

将Poppler添加到路径中

  1. 将Poppler安装到位置:C:\Users\UserName\Downloads\Release-21.11.0-0.zip
  2. 将C:\Users\UserName\Downloads\Release-21.11.0-0.zip添加到环境变量的系统变量路径中

4
您建议将一个包含可执行文件的ZIP归档路径添加到系统变量PATH中。您尝试过这样做吗?据我所知,该变量只能包含指向文件夹的路径,而不能包含归档文件的路径。 - Alexey Popkov

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接