我正在尝试使用
requests.get()
请求下载一个.doc
文件(虽然我听说还有其他方法 - 但它们都需要保存)。是否有任何方法可以直接从中提取文本(甚至将其转换为.txt
)而不需要将其保存到文件中?我已经尝试将request.raw
传递给各种转换器(例如docx2txt.process()
),但我认为它们都是用于文件而不是流的。
.docx
格式的 Stack Overflow 回答:https://stackoverflow.com/a/46263156/3129414。不过对于.doc
格式我不确定。 - arshovon