有没有一种方法可以使用Python高效地获取Word文档(.doc、.docx)的页数?
对于.odt文件呢?
我想将其用于基于Linux上的Web2py的Web应用程序。
谢谢!
只针对那些寻找此博客文章的人....
from win32com.client import Dispatch
#open Word
word = Dispatch('Word.Application')
word.Visible = False
word = word.Documents.Open(doc_path)
#get number of sheets
word.Repaginate()
num_of_sheets = word.ComputeStatistics(2)
'<win32com.gen_py.Microsoft Word 16.0 Object Library._Application instance at 0x412510792>' object has no attribute 'Repaginate'
。Repaginate
被弃用了吗? - Jed<Properties>
<Pages>CountValue</Pages>
从docx包中的docProps/app.xml文件中获取或者
<office:document-meta>
<office:meta>
<meta:document-statistic meta:page-count="CountValue">
从odt包中的meta.xml表单开始。
如果这些值不存在(它们是可选的),您必须对整个文档进行计算,实际上执行渲染,这会更加困难。
docx
,可以让你访问Word文档的XML。这可能会或可能不会包含页面数。 - Sam Mussmann