Python中值为列表的二维字典

Question

Python中值为列表的二维字典

3

我正在编写一个简单的解析器用于练习，但在将下载的数据保存到字典中时遇到了问题。

data = {"":{"":[]}}

with open("Training_01.txt", "r") as open_file:
    text = open_file.read()
    text = text.split("\n")

    for i in text:
        i = i.split("/")
        try:
           data[i[1]] = {i[2]:[].append(i[3])}
        except:
            print("Can't")

这是我想解析的数据的示例：

这个段落标签包裹着要解析的内容。

/a/abbey/sun_aobrvxdhumowzajn.jpg
/a/abbey/sun_apstfzmbeiwbjqvb.jpg
/a/abbey/sun_apyilcssuybumhbu.jpg
/a/abbey/sun_arrohcvipmrghrzh.jpg
/a/abbey/sun_asgeghboyugsatii.jpg
/a/airplane_cabin/sun_blczihbhbntqccux.jpg
/a/airplane_cabin/sun_ayzaayjpoknjvpds.jpg
/a/airplane_cabin/sun_afuoinkozbbhqksk.jpg
/b/butte/sun_asfnwmuzhtjrztns.jpg
/b/butte/sun_ajzkngginlffsozz.jpg
/b/butte/sun_adonkmfgywrhpakt.jpg
/c/cabin/outdoor/sun_atqvmarllxqynnks.jpg
/c/cabin/outdoor/sun_acfcobswmnoyhyfi.jpg
/c/cabin/outdoor/sun_afgjdqosvakljsmc.jpg

我想创建一个字典，以"a"、"b"、"c"或任何字母作为键（无法硬编码），该字典的值包含拍摄地点和图像列表。

但是当我想读取保存的数据时，我得到的值是None。

 print(data["a"])
 Output: {'auto_factory': None}

- Jacob233

1

'auto_factory' 是从哪里来的？ - Andy G

我有19,000行类似于这样的代码，auto_factory 是最后一个带有索引 /a/ 的。这只是一个例子。数据文件链接：http://www.practicepython.org/assets/Training_01.txt - Jacob233

字典嵌套的层数是否有限制？例如，{'c': {'cabin': {'outdoor': 'sun_atqvmarllxqynnks.jpg'}}}。 - rahlf23

我认为最大值将是{'c': {'cabin': {'outdoor': 'sun_atqvmarllxqynnks.jpg'}}}，但我不确定，没有指定限制。 - Jacob233

2个回答

1

因为data[i[1]] = {i[2]:[].append(i[3])}每次都创建一个新的二层字典。

这是可能的解决方案。它是最清晰的解决方案，但它逐步显示。如果键不在最后一层字典中，它会创建一个新的字典和列表。但是，如果字典具有该键，则将值附加到列表中。

data = {"":{"":[]}}

with open("Training_01.txt", "r") as open_file:
    text = open_file.read()
    text = text.split("\n")

    for i in text:

        i = i.split("/")
        key_1 = i[1]
        key_2 = i[2]
        value = i[3]
        try:
            if key_1 in data.keys():  # Whether the key i[1] is in the 1st layer of the Dict
                if key_2 in data[key_1].keys():  # Whether the key i[2] is in the 2nd layer of the Dict
                    # Yes, Append to the list
                    data[key_1][key_2].append(value)
                else:
                    # No, Creat a new list
                    data[key_1][key_2] = [value]
            # if i[1] not in the 1st layer, creat a 2nd layer dict with i[2] as key, i[3] as value
            else:
                data[key_1] =  {key_2:[value]}
        except:


             print("Can't")
    print(data['a'])

- Echan

虽然从技术上讲是正确的，但为了可读性，我建议为“i[1]”、“i[2]”等引入有意义的名称。这样理解代码片段背后的思想会更容易些。 - Ivan Velichko

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Ivan Velichko · Accepted Answer

尝试使用Python标准库中的defaultdict。在这种情况下非常方便：

from collections import defaultdict

data = defaultdict(lambda: defaultdict(list))

with open("Training_01.txt", "r") as open_file:
    text = open_file.read()
    text = text.split("\n")

    for line in text:
        try:
            _, key, subkey, rem = line.split("/", 3)
            data[key][subkey].append(rem)        
        except:
            print("Can't")

print(data)

解释：第一次使用不存在的键访问数据（即字典）时，将为该键创建一个新条目。此条目将再次成为默认字典，但是在您尝试使用不存在的键再次访问它时，又会创建一个新的（这次是嵌套的）条目。并且这个条目将是一个列表。因此，您可以安全地将新元素附加到这样的列表中。

UPD: 这里有一种实现相同要求但不使用defaultdict的方法：

data = {}  # just a plain dict
# for ...:
    data[key] = data.get(key, {})  # try to access the key, if it doesn't exist - create a new dict entry for such a key
    data[key][subkey] = data[key].get(subkey, [])  # same as above but for the sub key
    data[key][subkey].append(rem)  # finally do the job