如何从一个包含不同长度列表的字典创建一个字典列表

Question

如何从一个包含不同长度列表的字典创建一个字典列表

pythondictionarylist-comprehensionpython-itertools

28

我希望创建一个包含每个列表相同索引元素的字典列表。

我有这个字典：

d = {'name': ['bob', 'john', 'harry', 'mary'], 
     'age': [13, 19, 23], 
     'height': [164, 188], 
     'job': ['programmer']}

期望的输出结果是：

d2 = [{'name': 'bob', 'age': 13, 'height': 164, 'job': 'programmer'}, 
      {'name': 'john', 'age': 19, 'height': 188}, 
      {'name': 'harry', 'age': 23},
      {'name': 'mary'}]

我尝试了类似以下的方法：

d2 = [dict(zip(d, t)) for t in zip(*d.values())]

但是我的输出结果是：

d2 = [{'name': 'bob', 'age': 13, 'height': 164, 'job': 'programmer'}]

我认为这是因为列表的长度不同。

- raul

5个回答

13

您可以在这里使用zip_longest：

from itertools import zip_longest

keys = d.keys()

d2 = [
    {k: v for k, v in zip(keys, vs) if v is not None}
    for vs in <b>zip_longest(*d.values())</b>
]

如果值也可以是 None，那么我们可以通过使用虚拟值来规避这个问题:

from itertools import zip_longest

keys = d.keys()
dummy = object()

d2 = [
    {k: v for k, v in zip(keys, vs) if v is not dummy}
    for vs in <b>zip_longest(*d.values(), fillvalue=dummy)</b>
]

这里的虚拟值是一个对象，我们确定它不是 d 中的任何项（因为我们在构建 d 之后才构建它）。通过使用 is 进行比较，我们可以知道该值是否是“填充值”。

这将给我们：

>>> d2
[{'name': 'bob', 'age': 13, 'height': 164, 'job': 'programmer'}, {'name': 'john', 'age': 19, 'height': 188}, {'name': 'harry', 'age': 23}, {'name': 'mary'}]

- Willem Van Onsem

5

以下是一种不使用zip_longest的简单解决方案，供参考：

d = {'name': ['bob', 'john', 'harry', 'mary'], 'age': [13, 19, 23], 'height': [164, 188], 'job': ['programmer']}

recordset = [{k: v[i] for k, v in d.items() if i < len(v)} for i in range(max([len(l) for l in d.values()]))]

print(recordset)  # >> [{'name': 'bob', 'age': 13, 'height': 164, 'job': 'programmer'}, 
                        {'name': 'john', 'age': 19, 'height': 188}, 
                        {'name': 'harry', 'age': 23}, 
                        {'name': 'mary'}]

- olinox14

4

这里有另一种方法：

d = {'name': ['bob', 'john', 'harry', 'mary'], 'age': [13, 19, 23], 'height': [164, 188], 'job': ['programmer']}
m = max(map(len, d.values()))
d1 = {k : (v if len(v)==m else v+['']*(m-len(v))) for k,v in d.items()}
d2 = [{k:v for k,v in zip(d, t) if v} for t in zip(*d1.values())]
print(d2)

输出：

[{'height': 164, 'age': 13, 'job': 'programmer', 'name': 'bob'}, {'height': 188, 'age': 19, 'name': 'john'}, {'age': 23, 'name': 'harry'}, {'name': 'mary'}]

- Arkistarvh Kltzuonstev

0

保留现有的所有内容并添加以下导入语句：

from itertools import zip_longest as zip

- Paal Pedersen

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- user2390182 · Accepted Answer

你可以使用itertools.zip_longest并过滤掉None值：

from itertools import zip_longest

[{x: y for x, y in zip(d, t) if y is not None} for t in zip_longest(*d.values())]
# [{'name': 'bob', 'age': 13, 'height': 164, 'job': 'programmer'}, 
#  {'name': 'john', 'age': 19, 'height': 188}, 
#  {'name': 'harry', 'age': 23}, 
#  {'name': 'mary'}]