我希望创建一个验证工具;
有没有人能帮我使用Python读取.doc/.docx文档,以便搜索和比较文件内容。
有没有人能帮我使用Python读取.doc/.docx文档,以便搜索和比较文件内容。
是的,这是可能的。LibreOffice(至少)有一个命令行选项来转换文件,非常有效。使用它将文件转换为文本。然后按照常规操作将文本文件加载到Python中。
这对我在LibreOffice 4.2 / Linux上运行良好:
soffice --headless --convert-to txt:Text /path_to/document_to_convert.doc
soffice
。