如何在Python中按给定属性值搜索XML节点

5
我有一个XML文件,我想获取国家节点,这些节点在它们的名称中具有“in”模式。
<?xml version="1.0"?>
<data>
    <country name="Liechtenstein">
        <rank>1</rank>
        <year>2008</year>
        <gdppc>141100</gdppc>
        <neighbor name="Austria" direction="E"/>
        <neighbor name="Switzerland" direction="W"/>
    </country>
    <country name="Singapore">
        <rank>4</rank>
        <year>2011</year>
        <gdppc>59900</gdppc>
        <neighbor name="Malaysia" direction="N"/>
    </country>
    <country name="Panama">
        <rank>68</rank>
        <year>2011</year>
        <gdppc>13600</gdppc>
        <neighbor name="Costa Rica" direction="W"/>
        <neighbor name="Colombia" direction="E"/>
    </country>
</data>

我已经尝试过这个

    import xml.etree.ElementTree as ET
    tree = ET.parse('test.xml')
    root = tree.getroot()
    list=root.find(".//country[contains(@name, 'Pana')]")

但是我遇到了一个错误:SyntaxError: invalid predicate。
请问有人可以帮忙解决这个问题吗?
3个回答

3
xml.etree.ElementTree 仅提供了定位树中元素的 XPath 表达式的有限支持,其中不包括 xpath 的 contains() 函数。请参见 文档 获取支持的 xpath 语法列表。
您需要使用提供更好 XPath 支持的库,如 lxml,或者使用更简单的 XPath 并手动进行进一步过滤,例如:
import xml.etree.ElementTree as ET
tree = ET.parse('test.xml')
root = tree.getroot()
list = filter(lambda x: 'Pana' in x.get('name'), root.findall(".//country[@name]"))

谢谢。您提供的解决方案有效。是否有一种方法也进行不区分大小写的搜索? - Abhishek Moondra
@AbhishekMoondra,你可以更改 lambda 函数将属性值转换为小写后再进行比较:lambda x: 'pana' in x.get('name').lower()。这样就可以进行不区分大小写的搜索了。 - har07

1
我无法评论为什么您的原始代码不起作用,但这与XPath表达式无关。表达式是正确的,除了可以安全省略的前导 . 之外。
有任何理由您不使用lxml xpath() 方法
from lxml import etree
tree = etree.parse('etree.xml')
root = tree.getroot()
list = root.xpath("//country[contains(@name,'Pana')]")

print list[0].tag

返回一个 country 元素:
$ python test.py
country

0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接