如何在XDocument中使用XPath?

118

有一个类似的问题,但似乎解决方案在我的情况下不起作用:Weirdness with XDocument, XPath and namespaces

这是我正在处理的XML:

<?xml version="1.0" encoding="utf-8"?>
<Report Id="ID1" Type="Demo Report" Created="2011-01-01T01:01:01+11:00" Culture="en" xmlns="http://demo.com/2011/demo-schema">
    <ReportInfo>
        <Name>Demo Report</Name>
        <CreatedBy>Unit Test</CreatedBy>
    </ReportInfo>
</Report>

以下是我认为应该可以工作的代码,但实际上并没有...

XDocument xdoc = XDocument.Load(@"C:\SampleXML.xml");
XmlNamespaceManager xnm = new XmlNamespaceManager(new NameTable()); 
xnm.AddNamespace(String.Empty, "http://demo.com/2011/demo-schema");
Console.WriteLine(xdoc.XPathSelectElement("/Report/ReportInfo/Name", xnm) == null);

有人有任何想法吗? 谢谢。


1
请看下面的答案,它不起作用,因为XPath 1.0实现无法处理空前缀。 - Paul Hatcher
1
正如其他人在这里所说的,当向[XmlNamespaceManager]添加命名空间时不要使用空前缀。我只是添加了这个评论,以防有人想看一个带有多个[xmlns]属性的文档的小代码示例,有些有后缀,有些没有后缀。请参见此处:https://dev59.com/jmUq5IYBdhLWcg3wMNgK#38272604 - Jelgab
4个回答

175

如果您有XDocument,使用LINQ-to-XML会更容易:

var document = XDocument.Load(fileName);
var name = document.Descendants(XName.Get("Name", @"http://demo.com/2011/demo-schema")).First().Value;

如果你确信XPath是你需要的唯一解决方案:

using System.Xml.XPath;

var document = XDocument.Load(fileName);
var namespaceManager = new XmlNamespaceManager(new NameTable());
namespaceManager.AddNamespace("empty", "http://demo.com/2011/demo-schema");
var name = document.XPathSelectElement("/empty:Report/empty:ReportInfo/empty:Name", namespaceManager).Value;

17
在大多数情况下,我认为很难说LINQ比XPath更容易。例如,在这种情况下,LINQ的等效方式并不真正等效,因为它还会获取其他节点下的“Name”节点(现在并不存在,但可能会因文件格式的后续更改而被添加)。然而,你的解决方案肯定是正确的。 - Marco Mp
12
注意:使用 System.Xml.XPath; 是非常重要的,因为 XPathSelectElement 是一个扩展方法。不要像我一样忽略了这部分内容 ;) - Mark van Straten
7
XPath仍然有用,因为它允许你将父子关系放入上下文中。例如,如果你想要获取/Banana/Banana/Banana,而不是获取每个香蕉。 - Sebastian Patten
4
这里使用“empty”有些误导和混淆。你可以使用除XPath之外的任何内容,比如字符串空值String.Empty(正如提问者所发现的)。在这个例子中,“demo”更加合适。 - Tom Blodget

9
XPath 1.0没有默认命名空间的概念,这也是微软实现的方式。因此,请尝试以下方法:
XDocument xdoc = XDocument.Load(@"C:\SampleXML.xml");
XmlNamespaceManager xnm = new XmlNamespaceManager(new NameTable()); 
xnm.AddNamespace("x", "http://demo.com/2011/demo-schema");
Console.WriteLine(xdoc.XPathSelectElement("/x:Report/x:ReportInfo/x:Name", xnm) == null);

9
您的回答表明XPath 2.0与XPath 1.0相比,“具有”默认命名空间的概念。我不知道这种新的XPath特性(我们在谈论XPath,而不是XSLT或XQuery)。因此,请在您的回答中明确说明您所暗示的内容是什么。 - Dimitre Novatchev
2
我认为他在这里的意思是,如果您有一个定义命名空间的文档,则您的xpath必须包括限定元素,即您不能执行xnm.AddNamespace(string.Empty, "http://demo.com/2011/demo-schema"); 然后执行xdoc.XPathSelectElement("/Report/ReportInfo/Name", xnm) - 结果始终为空。 - Paul Hatcher

7

您可以使用来自Microsoft的示例 - 对于没有命名空间的用户:

using System.Xml.Linq;
using System.Xml.XPath;
var e = xdoc.XPathSelectElement("./Report/ReportInfo/Name");     

应该这样做


这个示例之所以有效,是因为文档没有默认命名空间。但是,OPs文档包含一个默认命名空间“xmlns=...”,并且使用xpath执行相同的操作不被支持。您必须始终指定一个非空的后缀。 - Kux

0

为了在没有默认命名空间后缀的情况下工作,我会自动展开路径。

用法:SelectElement(xdoc.Root, "/Report/ReportInfo/Name");

private static XElement SelectElement(XElement startElement, string xpathExpression, XmlNamespaceManager namespaceManager = null) {
    // XPath 1.0 does not have support for default namespace, so we have to expand our path.
    if (namespaceManager == null) {
        var reader = startElement.CreateReader();
        namespaceManager = new XmlNamespaceManager(reader.NameTable);
    }
    var defaultNamespace = startElement.GetDefaultNamespace();
    var defaultPrefix = namespaceManager.LookupPrefix(defaultNamespace.NamespaceName);
    if (string.IsNullOrEmpty(defaultPrefix)) {
        defaultPrefix = "ᆞ";
        namespaceManager.AddNamespace(defaultPrefix, defaultNamespace.NamespaceName);
    }
    xpathExpression = AddPrefix(xpathExpression, defaultPrefix);
    var selected = startElement.XPathSelectElement(xpathExpression, namespaceManager);
    return selected;
}

private static string AddPrefix(string xpathExpression, string prefix) {
    // Implementation notes:
    // * not perfect, but it works for our use case.
    // * supports: "Name~~" "~~/Name~~" "~~@Name~~" "~~[Name~~" "~~[@Name~~"
    // * does not work in complex expressions like //*[local-name()="HelloWorldResult" and namespace-uri()='http://tempuri.org/']/text()
    // * does not exclude strings like 'string' or function like func()
    var s = Regex.Replace(xpathExpression, @"(?<a>/|\[@|@|\[|^)(?<name>\w(\w|[-])*)", "${a}${prefix}:${name}".Replace("${prefix}", prefix));
    return s;
}

如果有人有更好的查找元素和属性名称的解决方案,请随意更改此帖子。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接