如何将doc/docx文件转换为Markdown或结构化文本?

116
有没有一个程序或工作流可以将 .doc.docx 文件转换为 Markdown 或类似的文本格式?
注:理想情况下,我希望在 MS Word 文档中指定的字体(例如consolas)被呈现为text-code: ```....```

2
看起来 pandoc 现在支持直接将 .docx 转换为 .md,包括数学公式。请查看这里的第35个示例。 - akhmed
请访问wordtomarkdown.com。Windows商店里有一个非常有用的应用程序。它比Pandoc功能更强大,包括表格、图片和代码等方面。 - Bruno
1
wordtomarkdown.com在撰写本文时存在勒索病毒。 - MarkD
Pandoc经常被引用,而且是开源的。在维基百科上查看它的页面。 - Roland
12个回答

0

对于项目符号列表,您可以将列表粘贴到Sublime Text中,并使用多选(已测试)或查找和替换(未测试)来替换专有的MS Word字符,例如---等。

这对标题无效,但可能可以使用类似的技术处理其他元素。


0

如果您在使用Linux,可以尝试使用Pandoc(首先使用LibreOffice或其他软件将.doc/.docx转换为html,然后再运行Pandoc)。

在Windows上(或者如果Pandoc不适用于您的情况),您可以尝试这个网站(在线演示,您也可以下载它):Markdownify


Markdownify会输出“Strict Standards:”-PHP消息,而pandoc -f html -t markdown -s mydoc.html -o mydoc.md则会产生纯文本/非重构文本(即与复制并粘贴到文本编辑器中的内容相同)。您对这两个工具有什么经验? - Lorenz Lo Sauer

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接