如何在Python中按给定属性值搜索XML节点

Question

如何在Python中按给定属性值搜索XML节点

5

我有一个XML文件，我想获取国家节点，这些节点在它们的名称中具有“in”模式。

<?xml version="1.0"?>
<data>
    <country name="Liechtenstein">
        <rank>1</rank>
        <year>2008</year>
        <gdppc>141100</gdppc>
        <neighbor name="Austria" direction="E"/>
        <neighbor name="Switzerland" direction="W"/>
    </country>
    <country name="Singapore">
        <rank>4</rank>
        <year>2011</year>
        <gdppc>59900</gdppc>
        <neighbor name="Malaysia" direction="N"/>
    </country>
    <country name="Panama">
        <rank>68</rank>
        <year>2011</year>
        <gdppc>13600</gdppc>
        <neighbor name="Costa Rica" direction="W"/>
        <neighbor name="Colombia" direction="E"/>
    </country>
</data>

我已经尝试过这个

    import xml.etree.ElementTree as ET
    tree = ET.parse('test.xml')
    root = tree.getroot()
    list=root.find(".//country[contains(@name, 'Pana')]")

但是我遇到了一个错误：SyntaxError: invalid predicate。

请问有人可以帮忙解决这个问题吗？

- Abhishek Moondra

3个回答

1

我无法评论为什么您的原始代码不起作用，但这与XPath表达式无关。表达式是正确的，除了可以安全省略的前导 . 之外。

有任何理由您不使用lxml xpath() 方法？

from lxml import etree
tree = etree.parse('etree.xml')
root = tree.getroot()
list = root.xpath("//country[contains(@name,'Pana')]")

print list[0].tag

返回一个 country 元素：

$ python test.py
country

- Mathias Müller

0

你正在使用的 XML 解析器不支持 contains。你需要使用另一个解析器来获得完整的 XPath 支持。

https://docs.python.org/2/library/xml.etree.elementtree.html#elementtree-xpath

- Leon

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- har07 · Accepted Answer

xml.etree.ElementTree 仅提供了定位树中元素的 XPath 表达式的有限支持，其中不包括 xpath 的 contains() 函数。请参见文档获取支持的 xpath 语法列表。

您需要使用提供更好 XPath 支持的库，如 lxml，或者使用更简单的 XPath 并手动进行进一步过滤，例如：

import xml.etree.ElementTree as ET
tree = ET.parse('test.xml')
root = tree.getroot()
list = filter(lambda x: 'Pana' in x.get('name'), root.findall(".//country[@name]"))