我有一个字典列表:
[{'name':'Jay', 'value':'1'},{'name':'roc', 'value':'9'},{'name':'Jay', 'value':'7'},{'name':'roc', 'value':'2'}]
我希望它是:
[{'name':'Jay', 'value':'8'},{'name':'roc', 'value':'11'}]
我尝试过循环,但无法找到可以这样做的示例。任何提示或想法将不胜感激。
我有一个字典列表:
[{'name':'Jay', 'value':'1'},{'name':'roc', 'value':'9'},{'name':'Jay', 'value':'7'},{'name':'roc', 'value':'2'}]
我希望它是:
[{'name':'Jay', 'value':'8'},{'name':'roc', 'value':'11'}]
我尝试过循环,但无法找到可以这样做的示例。任何提示或想法将不胜感激。
lst = [{'name':'Jay', 'value':'1'},{'name':'roc', 'value':'9'},{'name':'Jay', 'value':'7'},{'name':'roc', 'value':'2'}]
1)为每个姓名求和:
from collections import defaultdict
result = defaultdict(int)
for d in lst:
result[d['name']] += int(d['value'])
2) 将名称-值对转换为字典列表:
[{'name': name, 'value': value} for name, value in result.items()]
# [{'name': 'roc', 'value': 11}, {'name': 'Jay', 'value': 8}]
如果您希望将值作为字符串类型输出,可以按照@Kevin的注释所述执行:
[{'name': name, 'value': str(value)} for name, value in result.items()]
# [{'name': 'roc', 'value': '11'}, {'name': 'Jay', 'value': '8'}]
这是应用 itertools.groupby
的一个很好的例子。
from itertools import groupby
from operator import itemgetter
orig = [{'name':'Jay', 'value':'1'},
{'name':'roc', 'value':'9'},
{'name':'Jay', 'value':'7'},
{'name':'roc', 'value':'2'}]
get_name = itemgetter('name')
result = [{'name': name, 'value': str(sum(int(d['value']) for d in dicts))}
for name, dicts in groupby(sorted(orig, key=get_name), key=get_name)]
分解如下:
get_name
是一个函数,给定一个字典,返回其"名称"键的值。即,get_name = lambda x: x['name']
。
sorted
返回按"名称"键的值排序后的字典列表。
groupby
返回迭代器(名称, 字典)
,其中字典
是具有相同"名称"
键值的字典的列表(好吧,是生成器)。(仅对具有相同键值的连续项进行分组,因此需要在上一步中对列表进行排序。)
结果是一个新字典列表,使用给定的名称和所有相关"value"
元素的总和。
collections.Counter
,这是累积整数值的完美选择。import collections
d =[{'name':'Jay', 'value':'1'},{'name':'roc', 'value':'9'},{'name':'Jay', 'value':'7'},{'name':'roc', 'value':'2'}]
c = collections.Counter()
for sd in d:
c[sd["name"]] += int(sd["value"])
print([{"name":n,"value":str(v)} for n,v in c.items()])
结果:
[{'name': 'Jay', 'value': '8'}, {'name': 'roc', 'value': '11'}]
defaultdict
,因为你所做的只是将defaultdict(int)
替换为Counter
。你没有利用Counter
的主要优势,即在不显式迭代序列的情况下对相关元素进行计数。 - chepnerCounter
就不那么有趣了。 - Jean-François Fabrecollections.defaultdict
:
data = [{'name': 'Jay', 'value': '1'}, {'name': 'roc', 'value': '9'},
{'name': 'Jay', 'value': '7'}, {'name': 'roc', 'value': '2'}]
result = {}
# concetrate
for element in data:
result[element["name"]] = result.get(element["name"], 0) + int(element["value"])
# unpack
result = [{"name": element, "value": result[element]} for element in result]
# optionally, you can loop through result.items()
# you can, also, turn back result[elements] to str if needed
print(result)
# prints: [{'name': 'Jay', 'value': 8}, {'name': 'roc', 'value': 11}]
使用 itertools
模块中的 groupby
可以解决您的问题:
from itertools import groupby
a = [{'name':'Jay', 'value':'1'},{'name':'roc', 'value':'9'},{'name':'Jay', 'value':'7'},{'name':'roc', 'value':'2'}]
final = []
for k,v in groupby(sorted(a, key= lambda x: x["name"]), lambda x: x["name"]):
final.append({"name": k, "value": str(sum(int(j["value"]) for j in list(v)))})
print(final)
输出:
[{'name': 'Jay', 'value': '8'}, {'name': 'roc', 'value': '11'}]
这里有另一种使用pandas的方法
names = [{'name':'Jay', 'value':'1'},{'name':'roc', 'value':'9'},{'name':'Jay', 'value':'7'},
{'name':'roc', 'value':'2'}]
df = pd.DataFrame(names)
df['value'] = df['value'].astype(int)
group = df.groupby('name')['value'].sum().to_dict()
result = [{'name': name, 'value': value} for name, value in group.items()]
输出结果为:
[{'value': 8, 'name': 'Jay'}, {'value': 11, 'name': 'roc'}]
ld = [{'name':'Jay', 'value':'1'},{'name':'roc', 'value':'9'},{'name':'Jay', 'value':'7'},{'name':'roc', 'value':'2'}]
tempDict = {}
finalList = []
for d in ld:
name = d['name']
value = d['value']
if name not in tempDict:
tempDict[name] = 0
tempDict[name] += int(value)
#tempDict => {'Jay': 8, 'roc': 11}
for name,value in tempDict.items():
finalList.append({'name':name,'value':value})
print(finalList)
# [{'name': 'Jay', 'value': 8}, {'name': 'roc', 'value': 11}]
'value': str(value)
。 - Kevincollections.Counter
也可以是一个不错的替代选择。 - Jean-François Fabre