按照特定键合并字典列表

4
我有一个由相同结构的字典组成的列表。list是由dict组成的。
sample = [{'a':1, 'b':2, 'c':3}, {'a':1, 'b':2, 'c':4}, {'a':2, 'b':2, 'c':5}, {'a':2, 'b':3, 'c':5}]

我希望通过键 a 将它们组合在一起,输出应该为:
[{'a': 1, 'd': [{'b':2, 'c':3}, {'b':2, 'c':4}]}, {'a': 2, 'd': [{'b':2, 'c':5}, {'b': 3, 'c':5}]}]
5个回答

9
您可以使用 itertools.groupby函数:
>>> from itertools import groupby
>>> result = []
>>> for key, group in groupby(sorted(sample, key=lambda x:x['a']), key=lambda x:x.pop('a')):
        result.append({'a':key, 'd':[*group]})
>>> result
[{'a': 1, 'd': [{'b': 2, 'c': 3}, {'b': 2, 'c': 4}]},
 {'a': 2, 'd': [{'b': 2, 'c': 5}, {'b': 3, 'c': 5}]}]

注意:如果确保字典列表按键a的值排序,则不需要使用sorted


4

按键合并:

dict_list = [{'a':1, 'b':2, 'c':3}, {'a':1, 'b':2, 'c':4}, {'a':2, 'b':2, 'c':5}, {'a':2, 'b':3, 'c':5}]
new_dict = {}

for d in dict_list:
    a = d.pop('a', None)
    if new_dict.get(a):
         new_dict[a].append(d)
    else:
        new_dict[a] = [d]

转换为列表:

final_list = [{'a': key, 'd': value} for key, value in new_dict.items()]
print(final_list)

[{'a': 1, 'd': [{'c': 3, 'b': 2}, {'c': 4, 'b': 2}]}, {'a': 2, 'd': [{'c': 5, 'b': 2}, {'c': 5, 'b': 3}]}]

2
sample = [{'a':1, 'b':2, 'c':3}, {'a':1, 'b':2, 'c':4}, {'a':2, 'b':2, 'c':5}, {'a':2, 'b':3, 'c':5}]


tmp = {}
for v in sample:
    tmp.setdefault(v['a'], []).append(v)
    del v['a']

out = [{'a': k, 'd': v} for k, v in tmp.items()]

from pprint import pprint
pprint(out)

输出:

[{'a': 1, 'd': [{'b': 2, 'c': 3}, {'b': 2, 'c': 4}]},
 {'a': 2, 'd': [{'b': 2, 'c': 5}, {'b': 3, 'c': 5}]}]

1

很遗憾,这段代码可能有点凌乱,但它是可以正常工作的:

from itertools import groupby

sample = [{'a':1, 'b':2, 'c':3},
          {'a':1, 'b':2, 'c':4},
          {'a':2, 'b':2, 'c':5},
          {'a':2, 'b':3, 'c':5}]

main_key = "a"

print(
    [{main_key:k,
      "d": [{kk: vv for kk, vv in dct.items() if kk != main_key}
            for dct in v]}
     for k, v in groupby(sample, lambda d:d[main_key])]
)

给出:
[{'a': 1, 'd': [{'b': 2, 'c': 3}, {'b': 2, 'c': 4}]},
 {'a': 2, 'd': [{'b': 2, 'c': 5}, {'b': 3, 'c': 5}]}]

抱歉,我不太明白您的请求。能否提供更具体的内容和上下文,以便我更好地为您服务?

0

使用Pandas的另一种解决方案来处理您的查询。

import pandas as pd
sample = [{'a':1, 'b':2, 'c':3}, {'a':1, 'b':2, 'c':4}, {'a':2, 'b':2, 'c':5}, {'a':2, 'b':3, 'c':5}]

df=pd.DataFrame(sample)

这将使用上述示例列表创建一个DataFramedf。下一步是迭代GroupBy对象并按要求创建输出。

final_list=[]
for i, temp_df in df.groupby('a'):
    temp_list=[]
    for j in temp_df.index:
        temp_list.append({'b':temp_df.loc[:,'b'][j],'c':temp_df.loc[:,'c'][j]})
    final_list.append({'a':temp_df.loc[:,'a'][j],'d':temp_list})

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接