在C#中读取Word文档

6
我有一个Word文档想要用C#进行解析。网络上有很多教程,但我很难决定使用哪个库。我发现了以下dll库:
  1. Microsoft.Office.Interop.Word
  2. Microsoft.Office.Tools.Word
  3. Microsoft.Office.Tools.Word.v4.0.Utilities
  4. COM Microsoft Word 12.0 Object Library
  5. Open XML sdk
这些都是我在网上找到的。我应该使用哪个?它们中的哪些已经过时了?

@SteveDanner,我要从一个文档中解析表格并插入到数据库中。我有20个带有表格和文本的文档,它们都具有相同的结构,没有模板。我需要为这些文档定义解析规则。 - user194076
1
你将如何分发这个应用程序?这些文件来自哪里? - Jeremy McGee
@JeremyMcGee 不得分发。仅限内部使用。这些文档来自我的硬盘 :) - user194076
2个回答

7
您也可以使用NetOffice来完成这项工作。
网站:http://netoffice.codeplex.com/ 使用NetOffice,您不需要担心版本问题,它的语法和语义与Microsoft Interop Assemblies完全一致,因此您可以按照相同的方式编写代码。其他优点包括:
- 无需担心版本限制的Office集成 - 包含Office 2000、2002、2003、2007和2010版的所有对象、方法、属性和事件 - 属性概念和XML源文件文档,用于提供特定方法或属性的Office版本信息 - 如果您已经了解了Office对象模型,则无需培训,直接使用现有的PIA代码即可 - 自动管理COM代理,减少冗余且易于阅读的代码 - 无需注册、无需依赖、无需Interop程序集,也不需要VSTO,避免了部署障碍 - 可用于.NET 2.0或更高版本的开发 - 易于开发插件

0
Beth Massi在她的博客http://blogs.msdn.com/b/bethmassi上写了好几篇关于OpenXML SDK的文章,甚至还在www.dnrtv.com上做了几个屏幕录像 - 这可能会给你一个对你所面临的情况有所了解的想法。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接