如何在Python中从YAML文件创建一棵树形数据结构?

3
假设我有一个如下的YAML文件:
template:
 artifacts:
  config:
   a: value1
   b: value2
  jars:
   a: value1
   b: value2
  scripts:
   a: value1
   b: value2

我希望它像下面这棵树一样:

template--
          |__artifacts__
                        |__config__
                        |          |__a__
                        |          |     |__value1
                        |          |
                        |          |__b__
                        |                |__value2
                        |__jars__ ...

我该怎么做?
1个回答

3
Python有多个用于YAML的解析器,但唯一支持最新的YAML规范(1.2,发布于2009年)的是ruamel.yaml(免责声明:我是该软件包的作者)。其他软件包(PySyck、PyYAML)也不支持将序列/映射作为映射键加载的有效YAML结构。 ruamel.yaml可以被指示为那些仅支持该YAML规范版本的过时软件包转储YAML 1.1。
嵌套的Pythondict可以用作树形结构,其中键是节点的值,而非dict的值是叶节点。这是从您的YAML文件中的映射加载的数据结构。
from pathlib import Path
from pprint import pprint
import ruamel.yaml

input = Path('input.yaml')
yaml = ruamel.yaml.YAML()
data = yaml.load(input)
pprint(data)

这将给出:

{'template': {'artifacts': {'config': {'a': 'value1',
                                       'b': 'value2'},
                            'jars': {'a': 'value1',
                                     'b': 'value2'},
                            'scripts': {'a': 'value1',
                                        'b': 'value2'}}}}

这看起来不像你期望的输出,字典也不是真正的树形结构。 当然,你可以遍历你的数据结构并创建一棵节点树,但这有点反向,因为你可以告诉解析器直接创建一个节点来构建树。
import sys
from ruamel.yaml.constructor import SafeConstructor

class Node:
    # your node definition here
    pass


class MyConstructor(SafeConstructor):
    def construct_yaml_map(self, node):
        data = Node()
        yield data
        res = self.construct_mapping(node)
        # and update data with the parsed data

MyConstructor.add_constructor('tag:yaml.org,2002:map', 
                              MyConstructor.construct_yaml_map)


yaml = ruamel.yaml.YAML()
yaml.Constructor = MyConstructor
data = yaml.load(input)

请注意,上述内容自动处理了您的YAML文件中的递归结构,在正常方式下对加载的YAML进行遍历时难以实现。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接