按节点属性使用getElementsByTagName后对节点进行排序

3

编辑

问题在于字典,标记为答案的回答是正确的,但是字典会任意操作。在这种情况下,对字典进行排序是答案,现在我知道如何按属性对节点进行排序了,你也知道了。

结束

我很高兴能够问Python问题,以下是我的问题:

def parse_fixed_data(self, format):
    return_message = {}
    nodes = format.getElementsByTagName('data')
    for node in nodes:
        return_message[node.attributes['name'].value] = self.raw_message[int(node.attributes['from'].value):int(node.attributes['to'].value)] 
    return return_message

这个几乎完美地运行了。'format'变量是一个已解析的节点,其中包含一堆'data'节点。以下是xml:

<pmbmsg id='pmb_header'>
    <version maj='01' min='00' rev='0000' type='FIXED' delimeter=''>
        <data seq='1'   from='0'   to='3'    name='message_type'/>
        <data seq='2'   from='3'   to='13'   name='version'/>
        <data seq='3'   from='13'  to='33'   name='from_system'/>
        <data seq='4'   from='33'  to='53'   name='to_system'/>
        <data seq='5'   from='53'  to='73'   name='family'/>
        <data seq='6'   from='73'  to='83'   name='priority'/>
        <data seq='7'   from='83'  to='103'  name='msg_format_id'/>
        <data seq='8'   from='103' to='135'  name='msg_unique_id'/>
        <data seq='9'   from='135' to='161'  name='created'/>
        <data seq='10'  from='161' to='163'  name='hop_count'/>
        <data seq='11'  from='163' to='173'  name='original_msg_format_id'/>
        <data seq='12'  from='173' to='205'  name='original_unique_id'/>
        <data seq='13'  from='205' to='245'  name='padding'/>
        <data seq='14'  from='245' to='4086' name='message_data'/>
    </version>
</pmbmsg>

这很好,但我得到的字典元素是按照这个顺序返回的:

u'to_system'            
u'padding'          
u'original_msg_format_id'   
u'original_unique_id'       
u'family'           
u'created'          
u'msg_format_id'        
u'hop_count'            
u'msg_unique_id'            
u'priority'         
u'version'          
u'from_system'          
u'message_type'         
u'message_data'

我希望它们按照在XML中出现的顺序返回,而seq属性可以帮助实现这一点。在Python代码的这行之后:

nodes = format.getElementsByTagName('data')

有没有一些能够对节点进行排序的函数?或者在获取节点时是否有一些语句可以让它知道如何对节点进行排序?你会认为它应该自然地按照xml编写的顺序排序吧?

如果没有自动实现这个功能的函数,我可以自己处理。


你需要按值对字典进行排序。在这里看一下:https://dev59.com/EHRB5IYBdhLWcg3weHLx。或者不使用字典。 - eat_a_lemon
我的字典里没有序列号的空间。我的问题是关于按照节点属性排序,而不是排序字典,那很容易,如果必要的话我会想办法解决,但我想知道是否可以对getElementsByTagName获取的节点进行排序,而不是对字典进行排序。 - KacieHouser
@KacieHouser 一开始我以为它们没有排序是因为字典。我使用ElementTree来满足我的Python XML需求。我不确定DOM实现的工作原理。 - eat_a_lemon
@eat_a_lemon,Element Tree 是否具有我正在查找的功能? - KacieHouser
@KacieHouser 我相当确定元素树将按照它们在文档中的顺序返回值。 - eat_a_lemon
@eat_a_lemon,结果它确实按照XML定义的顺序执行,参见问题的编辑。不过还是感谢你的帮助。 - KacieHouser
2个回答

2
节点在XML中的顺序与节点列表不一致,它们将按照迭代的顺序出现。列表是有序的,而字典则不是。你遇到的问题是,在迭代字典键时,属性名称的顺序是无序的,除非对字典进行排序,否则没有其他解决方法。
你可以在处理字典之前对节点进行排序(但这仍然不能保证字典本身是有序的):
>>> [node.attributes['name'].value for node in sorted(nodes, key=lambda x: x.attributes['name'].value)]
[u'created', u'family', u'from_system', u'hop_count', 
u'message_data', u'message_type', u'msg_format_id', u'msg_unique_id', 
u'original_msg_format_id', u'original_unique_id', u'padding', u'priority', 
u'to_system', u'version']

或者你可以使用 collections.OrderedDict(在 Python 2.7+ 中可用)代替普通字典来创建 return_message

# No example because I don't have acces to Python 2.7

或者你可以使用sorted()按值对字典进行排序。

>>> import operator
>>> sorted_return_message = sorted(return_message.iteritems(), key=operator.itemgetter(0))
>>> for k,v in sorted_return_message: print k
... 
created
family
from_system
hop_count
message_data
message_type
msg_format_id
msg_unique_id
original_msg_format_id
original_unique_id
padding
priority
to_system
version

或者您可以在运行时对键进行排序:

>>> for k in sorted(return_message):
...     print k
... 
created
family
from_system
hop_count
message_data
message_type
msg_format_id
msg_unique_id
original_msg_format_id
original_unique_id
padding
priority
to_system
version

我实际上想按照“seq”属性对它们进行排序,但我认为这已经足够让我得到我所需的内容了。谢谢,知道字典可能有自己的思想是很好的。你会认为字典会将第一个键=>值分配放在顶部,第二个键=>值分配放在其下面,依此类推,我们将看到。 - KacieHouser
起初可能会有些困惑,但这就是为什么Python 2.7添加了OrderedDict对象。来自diveintopython.org的说法:“字典在元素之间没有顺序概念。说元素“无序”是不正确的;它们只是无序的。这是一个重要的区别,当您想以特定、可重复的顺序(例如按键的字母顺序)访问字典的元素时,这将使您感到恼火。有方法可以做到这一点,只是它们没有内置到字典中。” - jathanism
哈哈,我刚刚看到了那个,原来是词典的问题。你的代码很巧妙,而且也许对我有用。感谢你的帮助 :) - KacieHouser

0

自 Python 2.7 开始,OrderedDict 是一个新功能


我正在运行像2.4一样,再次强调,我不是要订购字典,我没有在字典中订购的关键字。我想按照它们的属性对XML中的节点进行排序。 - KacieHouser

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接