将.docx文件转换为html

3

我想将.docx文件转换为.html格式。我的工作语言是C#。我的代码如下:

Microsoft.Office.Interop.Word.Application word = new Microsoft.Office.Interop.Word.Application();
        Microsoft.Office.Interop.Word.Document wordDoc = new Microsoft.Office.Interop.Word.Document();
        Object oMissing = System.Reflection.Missing.Value;
        wordDoc = word.Documents.Add(ref oMissing, ref oMissing, ref oMissing, ref oMissing);
        word.Visible = false;
        Object filepath = @"C:\Users\John\Desktop\begin.docx";
        Object confirmconversion = System.Reflection.Missing.Value;
        Object readOnly = false;
        Object saveto = @"C:\Users\John\Desktop\result.html";
        Object oallowsubstitution = System.Reflection.Missing.Value;

        wordDoc = word.Documents.Open(ref filepath, ref confirmconversion, ref readOnly, ref oMissing,
                                      ref oMissing, ref oMissing, ref oMissing, ref oMissing,
                                      ref oMissing, ref oMissing, ref oMissing, ref oMissing,
                                      ref oMissing, ref oMissing, ref oMissing);
        object fileFormat = WdSaveFormat.wdFormatHTML;
        wordDoc.SaveAs(ref saveto, ref fileFormat, ref oMissing, ref oMissing, ref oMissing,
                       ref oMissing, ref oMissing, ref oMissing, ref oMissing, ref oMissing,
                       ref oMissing, ref oMissing, ref oMissing, ref oallowsubstitution, ref oMissing,
                       ref oMissing);

问题是,这不包括页头和页脚。它们不在 .html 输出文件中。如何将它们包含在输出结果中?

3
你试过手动操作吗?我的意思是从Word保存为HTML。它包括页眉和页脚吗? - Snowbear
是的,但我已经尝试了很多。 - petko_stankoski
1
问题在于Word文档由页面(带页眉和页脚)组成,而HTML文件只是单个页面 - 没有页眉/页脚的位置。 - Hans Kesting
是的,但客户说他需要html与.docx文件完全相同,因此页眉和页脚必须包括在内。 - petko_stankoski
1
所以,你的客户想要将一个多页文档转换成单页文档,并且还希望它看起来完全相同?这似乎可能吗?你的客户能否提供一个简单的docx/html元组(例如手动编写),以演示应该如何呈现?另一方面,你为什么要选择HTML呢?它根本不适合打印。如果你想要更易于访问的替代方案,请考虑RTF。或者像@hype8912下面说的那样,使用PDF。 - vgru
显示剩余2条评论
1个回答

2

在 Word 中看到页眉和页脚的原因是因为你基本上处于打印视图中。在 HTML 文档中,你处于“草稿”样式视图中,其中不存在页眉和页脚。你可以为 HTML 文档设置不同的样式,用于打印时称为打印样式表。这个打印样式表仅在浏览器中打印文档时使用。

另一个选择是将其转换为 PDF 并允许用户查看 PDF,因为现在大多数浏览器都支持 PDF 查看或有插件支持它。

你还可以将页眉和页脚添加到 HTML 文件作为元素,然后使用一些 CSS 技巧使元素显示在顶部和底部。这里是一个链接描述如何做到这一点。

[2]: 旧链接重定向到一个要求提供带有“Telegram”品牌的电话号码的俄罗斯网站。现在更改为 2012 年内容的 Web 存档。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接