XPath - 选择等于某个值的元素

134

Xpath中,我想选择等于特定值的元素。

示例XML数据:

<aaa id="11" >
    <aaa id="21" >
        <aaa id="31" ></aaa>
        <bbb id="32" >
            <aaa id="41" ></aaa>
            <bbb id="42" ></bbb>
            <ccc id="43" ></ccc>
            <ddd id="44" >qwerty</ddd>
            <ddd id="45" ></ddd>
            <ddd id="46" ></ddd>
        </bbb>
    </aaa>
    <bbb id="22" >
         <aaa id="33" >qwerty</aaa>
         <bbb id="34" ></bbb>
         <ccc id="35" ></ccc>
         <ddd id="36" ></ddd>
         <ddd id="37" ></ddd>
         <ddd id="38" ></ddd>
    </bbb>
    <ccc id="23" >qwerty</ccc>
    <ccc id="24" ></ccc>
 </aaa>

现在,使用XPath:

//ccc[.='qwerty']

我得到了正确的、预期的结果:

Name    Value
ccc     qwerty

现在,使用XPath:

//aaa[.='qwerty']

我得到了 意料之外的 结果:

Name    Value
aaa      
aaa     qwerty

我特别感兴趣的是如何选择具有该值的任何元素

XPath:

//*[.='qwerty']

我得到了非常奇怪的意外结果:

Name    Value
aaa
bbb
ddd     qwerty
bbb     qwerty
aaa     qwerty
ccc     qwerty

有人能解释一下这些结果,以及如何修复我的XPath表达式以获得更多预期的结果吗?


1
因为XPath . =与XPath text() =是不同的。请参阅匹配文本节点与匹配字符串值不同以了解原因。 - kjhughes
3个回答

229

XPath规范将元素的“字符串值”定义为其所有文本节点后代的串联(按文档顺序)

这解释了“奇怪的结果”。

使用以下表达式可以获得“更好”的结果:

//*[text() = 'qwerty']

上面的代码选择文档中至少有一个文本节点子元素值为'qwerty'的所有元素。

//*[text() = 'qwerty' and not(text()[2])]

上面的代码选择了文档中仅有一个文本节点子元素且其值为'qwerty'的所有元素。


4
很高兴它管用。是否接受/点赞呢?text()是XPath中可能的节点测试之一,意思是“这是一个文本节点吗?”其他节点测试包括comment()processing-instruction()或者只是node() - Dimitre Novatchev

19

尝试使用//*[text()='qwerty'],因为.是您当前的元素


2
最好使用//*[normalize-space(text()) = 'qwerty']。如果文本周围有任何空格,它们将被删除。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接