Python中值为列表的二维字典

3
我正在编写一个简单的解析器用于练习,但在将下载的数据保存到字典中时遇到了问题。
data = {"":{"":[]}}

with open("Training_01.txt", "r") as open_file:
    text = open_file.read()
    text = text.split("\n")

    for i in text:
        i = i.split("/")
        try:
           data[i[1]] = {i[2]:[].append(i[3])}
        except:
            print("Can't")

这是我想解析的数据的示例:

这个段落标签包裹着要解析的内容。

/a/abbey/sun_aobrvxdhumowzajn.jpg
/a/abbey/sun_apstfzmbeiwbjqvb.jpg
/a/abbey/sun_apyilcssuybumhbu.jpg
/a/abbey/sun_arrohcvipmrghrzh.jpg
/a/abbey/sun_asgeghboyugsatii.jpg
/a/airplane_cabin/sun_blczihbhbntqccux.jpg
/a/airplane_cabin/sun_ayzaayjpoknjvpds.jpg
/a/airplane_cabin/sun_afuoinkozbbhqksk.jpg
/b/butte/sun_asfnwmuzhtjrztns.jpg
/b/butte/sun_ajzkngginlffsozz.jpg
/b/butte/sun_adonkmfgywrhpakt.jpg
/c/cabin/outdoor/sun_atqvmarllxqynnks.jpg
/c/cabin/outdoor/sun_acfcobswmnoyhyfi.jpg
/c/cabin/outdoor/sun_afgjdqosvakljsmc.jpg

我想创建一个字典,以"a"、"b"、"c"或任何字母作为键(无法硬编码),该字典的值包含拍摄地点和图像列表。

但是当我想读取保存的数据时,我得到的值是None

 print(data["a"])
 Output: {'auto_factory': None}

1
'auto_factory' 是从哪里来的? - Andy G
我有19,000行类似于这样的代码,auto_factory 是最后一个带有索引 /a/ 的。这只是一个例子。数据文件链接:http://www.practicepython.org/assets/Training_01.txt - Jacob233
字典嵌套的层数是否有限制?例如,{'c': {'cabin': {'outdoor': 'sun_atqvmarllxqynnks.jpg'}}}。 - rahlf23
我认为最大值将是{'c': {'cabin': {'outdoor': 'sun_atqvmarllxqynnks.jpg'}}},但我不确定,没有指定限制。 - Jacob233
2个回答

4

尝试使用Python标准库中的defaultdict。在这种情况下非常方便:

from collections import defaultdict

data = defaultdict(lambda: defaultdict(list))

with open("Training_01.txt", "r") as open_file:
    text = open_file.read()
    text = text.split("\n")

    for line in text:
        try:
            _, key, subkey, rem = line.split("/", 3)
            data[key][subkey].append(rem)        
        except:
            print("Can't")

print(data)

解释:第一次使用不存在的键访问数据(即字典)时,将为该键创建一个新条目。此条目将再次成为默认字典,但是在您尝试使用不存在的键再次访问它时,又会创建一个新的(这次是嵌套的)条目。并且这个条目将是一个列表。因此,您可以安全地将新元素附加到这样的列表中。
UPD: 这里有一种实现相同要求但不使用defaultdict的方法:
data = {}  # just a plain dict
# for ...:
    data[key] = data.get(key, {})  # try to access the key, if it doesn't exist - create a new dict entry for such a key
    data[key][subkey] = data[key].get(subkey, [])  # same as above but for the sub key
    data[key][subkey].append(rem)  # finally do the job

谢谢您的回答,但我想在默认的Python中完成它,因为我正在准备一场考试,不能使用任何模块。 - Jacob233
1
这是Python的默认设置。但等一下,我会展示如何在不使用defaultdict的情况下完成它,你会看到Python标准库有多么美妙。 - Ivan Velichko
总之,在我检查/创建第一层之前,我不能为第二层字典分配值?我理解得对吗? - Jacob233
1
是的,在访问第二层之前,需要检查并可能在第一层上创建一个条目。dict.get(key, default_value) 只需简化此模式为单个调用。 - Ivan Velichko
在同一行中创建两个层也不起作用,对吗?我的意思是如果第一层尚未创建,那么类似于dict[lay1][lay2] = value这样的操作就无法实现。 - Jacob233
1
这正是defaultdict所做的。 - Ivan Velichko

1
因为data[i[1]] = {i[2]:[].append(i[3])}每次都创建一个新的二层字典。
这是可能的解决方案。它是最清晰的解决方案,但它逐步显示。如果键不在最后一层字典中,它会创建一个新的字典和列表。但是,如果字典具有该键,则将值附加到列表中。
data = {"":{"":[]}}

with open("Training_01.txt", "r") as open_file:
    text = open_file.read()
    text = text.split("\n")

    for i in text:

        i = i.split("/")
        key_1 = i[1]
        key_2 = i[2]
        value = i[3]
        try:
            if key_1 in data.keys():  # Whether the key i[1] is in the 1st layer of the Dict
                if key_2 in data[key_1].keys():  # Whether the key i[2] is in the 2nd layer of the Dict
                    # Yes, Append to the list
                    data[key_1][key_2].append(value)
                else:
                    # No, Creat a new list
                    data[key_1][key_2] = [value]
            # if i[1] not in the 1st layer, creat a 2nd layer dict with i[2] as key, i[3] as value
            else:
                data[key_1] =  {key_2:[value]}
        except:


             print("Can't")
    print(data['a'])

虽然从技术上讲是正确的,但为了可读性,我建议为“i[1]”、“i[2]”等引入有意义的名称。这样理解代码片段背后的思想会更容易些。 - Ivan Velichko

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接