我正在尝试使用python-docx
模块 (pip install python-docx
),但是在GitHub存储库的测试样例中,他们在使用opendocx
函数,而在readthedocs中则使用Document
类。即使它们只展示了如何向docx文件添加文本,而没有阅读现有的文件?
第一个函数opendocx
不起作用,可能已被弃用。对于第二种情况,我正在尝试使用:
from docx import Document
document = Document('test_doc.docx')
print(document.paragraphs)
它返回了一个列表,其中包含<docx.text.Paragraph object at 0x... >
然后我做了:
for p in document.paragraphs:
print(p.text)
它返回了所有的文本,但是有些东西丢失了。所有的URL(CTRL + 点击跳转到URL)都没有出现在控制台的文本中。
问题是什么?为什么URL丢失了?
我怎样才能获得完整的文本而不需要遍历循环(类似于open().read()
)?