在Python 3中解析.docx文档

6
我正在编写一个Python 3程序,用于解析特定的docx文件并从中提取文本和图像。我一直在尝试使用docx,但它无法导入我的程序。我已经安装了lxml、Pillow和python-docx,但它仍然无法导入。当我尝试从终端使用python-docx时,我无法使用example-extracttext.py或example-makedocument.py,这让我相信安装没有正确运行。是否有一种方法可以检查是否正确安装了该软件包,或者是否有一种方法可以使其正常工作,以便我可以将其导入到我的项目中?我使用的是Ubuntu 13.10。

1
你是如何安装的?使用 pip 吗?听起来像是一个多 Python 环境问题,你可能是在一个环境中安装,而在另一个环境中执行。 - scanny
我正在使用pip进行安装,但没有成功。我还尝试通过下载项目并使用python3 setup.py install手动安装,但也没有成功。 - thehoule64
3个回答

13

我建议你尝试安装最新版本的python-docx,方法如下:

$ pip install python-docx

文档在这里可用:http://python-docx.readthedocs.org/

安装应该会显示安装成功的消息。如果需要暂时使用sudo以临时获得root权限进行安装:

$ sudo pip install python-docx

安装完成后,您应该能够在Python解释器中执行以下操作:

>>> from docx import Document
>>>

如果您获得类似于此的东西,则安装过程出了问题:

>>> from docx import Document
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ImportError: No module named docx

如果您能提供更多的尝试反馈,我可以详细说明答案。

请注意,Python-docx包在v0.2.x之后已重写。 v0.3.x+的API与包名称和存储库位置不同。所有进一步的开发都将在新版本上进行。如果您刚开始使用该软件包,选择最新版本可能是一个好主意,因为旧版本将只会获得遗留支持。

此外,Python 3支持是从v0.3.0开始添加的。 以前的版本不兼容Python 3。


1
你可以通过先卸载现有的安装,然后使用pip3重新安装来解决导入问题。我用这个方法解决了我的问题输入图像描述
    pip uninstall python-docx
    pip3 install python-docx

0

使用命令sudo pip install --pre python-docx安装最新版本的python-docx。


尽管它似乎已经成功安装,但它没有列在我的site-packages文件夹中(我无法在评论中附加截图)**收集python-docx 收集lxml>=2.3.2(来自python-docx)下载https://files.pythonhosted.org/packages/5c/4c/...macosx_10_6_intel.macosx_10_9_intel....(8.8MB) 100%安装收集的软件包:lxml,python-docx 成功安装lxml-4.2.3 python-docx-0.8.6**Mac High Sierra,Python 3.7,Pycharm 2018。有人能告诉我为什么安装成功后它没有列出来吗?谢谢。 - Chris22

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接