没有安装MS Word,最好的将HTML导出为Word的方法是什么?

16

是否有一种方法可以将简单的HTML页面导出为Word (.doc格式,而非.docx),而不需要安装Microsoft Word?


尝试一些在线工具,例如 Zamzar - Niyaz
11个回答

12

如果您只有像您所说的简单HTML页面,那么可以用Word打开。

否则,有一些库可以做到这一点,但我没有使用过。

我最后的想法是,如果您正在使用ASP.NET,请尝试将application/msword添加到头部,然后可以将其保存为Word文档(它不会是真正的Word文档,只是将HTML重命名为doc以便能够打开)。


这种方法是指通过电子邮件发送HTML,但同样适用于MS Word:http://www.4guysfromrolla.com/articles/122006-1.aspx - Nathan Prather

4
有一个叫做JODConverter的工具,它连接到Open Office以暴露其文件格式转换器,有作为Web应用程序(位于Tomcat中)的版本,您可以将其发布到其中,并且有一个命令行工具。我一直在使用它来转换HTML到.DOC和PDF,已经在一个相当大的项目中使用,尚未上线,但我认为我会继续使用它。 http://sourceforge.net/projects/jodconverter/

2
我最终没用它,因为它泄漏内存太严重了,无法用于生产。 - Andrew Hancox

3

有一个名为HTMLtoWord的开源项目,允许用户将格式良好的HTML(XHTML)片段插入到Word文档中作为格式化文本。

HTMLtoWord文档


2
如果您在使用Java,可以使用我发布在docx4j 2.8.0中的代码将HTML转换为真正的docx内容。我说“真正的”是因为另一种方法是创建一个HTML altChunk,这依赖于Word在文档首次打开时进行实际转换。
请参阅各种以ConvertInXHTML为前缀的示例。导入过程需要格式良好的XML,因此您可能需要先整理它。

2

虽然可以制作一个以“.doc”为后缀的Microsoft Word文件,但制作一个“.rtf”文件可能更容易且更便携。


1

1
我猜你想用程序实现这个功能,看到你使用了 "C#" 标签。
可以试试 Aspose.Words for .NET

很遗憾,Aspose.Words有一个ImportHTML过程,但它不支持CSS。因此,您将不得不手动重新创建结果文档中的所有格式。这包括表格格式、列表和文本样式。 - nullnvoid

1
如果只是HTML文件,你只需要将扩展名改为.doc,Word就会像打开Word文档一样打开它。但是,如果需要包含图片或运行JavaScript,情况可能会变得更加复杂。

0

你可以使用Libreoffice Writer打开HTML文件,然后从“文件”菜单中导出为PDF。此外,浏览器也可以将HTML导出为PDF文件。


这不是回答问题 - michal krzych

0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接