在.NET中将HTML转换为Word

4
我需要从ASP.NET服务器应用程序中的HTML内容创建一个Word文件,但找不到可靠的方法。因此决定在这里开展讨论,看看有哪些可能的解决方案。
Aspose为此提供了一个.NET组件,但价格太高,无法解决(由于预算问题)。
我们希望此转换可以保留表格、图像、隐藏不可见元素、链接等。
有一个类似的讨论here,但提供的解决方案都围绕Office Interop,这不是服务器应用程序的推荐解决方案。
有什么想法吗?基本上,像Aspose这样的组件是如何工作的?

请审查您的预算。从长远来看,许可证比开发这样的子系统更便宜。 - zproxy
4个回答

9

3

不错!这能让你将输出保存为docx文件吗? - Mo Valipour
是的,它确实如此。如果你有使用旧的COM对象的经验,那么使用它非常简单。此外,请确保获取"Productivity tool"。它可以让你打开一个Word文档并查看OpenXML标记和生成标记的C#代码。 - Glenn Ferrie
这太酷了!让我玩一下。谢谢! - Mo Valipour

1

值得一提的是,可以尝试使用微软自己的XSLT推理工具,该工具可以从XML输入生成WordML。

如果您对文档本身的来源(HTML / XHTML / XML)有弹性,那么这个工具可以轻松完成任务。

http://msdn.microsoft.com/en-us/library/aa212886%28v=office.11%29.aspx

http://www.microsoft.com/download/en/details.aspx?displaylang=en&id=3412

我过去曾经在ASP .NET应用程序内部使用它来生成Word文档,该程序从SQL存储过程中获取其源XML数据。

这个工具可能有点难以捉摸,但只要对其生成的XSLT进行一些清理处理,它就可以正常工作。


0

如果适用于docx,您可以创建一个Word文档,将其保存为docx,反向工程xml并创建自己的xml/docx。我用excel/xslx做过,效果非常好。为了加快速度,我们将XML作为文本创建并连接字符串(在我们的数据之前-我们的数据-在我们的数据之后)。

据我所知,RTF格式不是标准格式,但它很普遍。创建一个RTF文档并将其返回为Word文档。Word可以毫无问题地打开rtf。

创建一个HTML文档并将其返回为Word文档。

希望对您有所帮助。


但那太复杂了,几乎不可能支持所有格式等。 - Mo Valipour

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接