从lxml中选择属性值

64

我想使用xpath表达式来获取属性的值。

我原以为以下内容可以工作

from lxml import etree

for customer in etree.parse('file.xml').getroot().findall('BOB'):
    print customer.find('./@NAME')

但是这会产生一个错误:

Traceback (most recent call last):
  File "bob.py", line 22, in <module>
    print customer.find('./@ID')
  File "lxml.etree.pyx", line 1409, in lxml.etree._Element.find (src/lxml/lxml.etree.c:39972)
  File "/usr/local/lib/python2.7/dist-packages/lxml/_elementpath.py", line 272, in find
    it = iterfind(elem, path, namespaces)
  File "/usr/local/lib/python2.7/dist-packages/lxml/_elementpath.py", line 262, in iterfind
    selector = _build_path_iterator(path, namespaces)
  File "/usr/local/lib/python2.7/dist-packages/lxml/_elementpath.py", line 246, in _build_path_iterator
    selector.append(ops[token[0]](_next, token))
KeyError: '@'

我期望这样做能奏效,这有错吗?

2个回答

88
findfindall只实现了XPath的子集,详见此处。它们的存在是为了与其他ElementTree实现(如ElementTreecElementTree)兼容。
相反,xpath方法提供了对XPath 1.0的完全访问权限。
print customer.xpath('./@NAME')[0]

然而,你可以使用get代替:

print customer.get('NAME')

attrib

print customer.attrib['NAME']

11
正确,但如果你想要“官方”推荐的方式:使用customer.get('NAME')(请参见http://docs.python.org/library/xml.etree.elementtree.html#xml.etree.ElementTree.Element.attrib)。 - Steven
所以没有直接获取值的方法! - Chang Zhao

2

作为一个有用的补充,以下是如何获取具有多个属性的元素中某个属性的值,这是与另一个元素唯一的区别。 例如,给定以下file.xml文件:

<?xml version ="1.0" encoding="UTF-8"?>
    <level1>
      <level2 first_att='att1' second_att='foo'>8</level2>
      <level2 first_att='att2' second_att='bar'>8</level2>
    </level1>

使用以下代码可以访问属性“bar”:

import lxml.etree as etree
tree = etree.parse("test_file.xml")
print tree.xpath("//level1/level2[@first_att='att2']/@second_att")[0]

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接