初学者问题。这似乎应该是一个直接的操作,但我从阅读文档中无法理解。
我的df具有以下结构:
|integer_id|int_field_1|int_field_2|
integer_id这一列是非唯一的,所以我想按照integer_id对数据框进行分组,并对两个字段求和。
相应的SQL语句如下:
SELECT integer_id, SUM(int_field_1), SUM(int_field_2) FROM tbl
GROUP BY integer_id
有没有最简单的方法来实现这个?
编辑:包括输入/输出
Input:
integer_id int_field_1 int_field_2
2656 36 36
2656 36 36
9702 2 2
9702 1 1
使用df.groupby('integer_id').sum()进行输出:
integer_id int_field_1 int_field_2
2656 72 72
9702 3 3
df.groupby(['field1', 'field2']).sum()
。 - Herms