有没有办法在numpy中通过多列进行分组聚合?
我正在尝试使用这个模块:https://github.com/ml31415/numpy-groupies
目标是比pandas更快地进行分组聚合。
例如:
group_idx = np.array([
np.array([4, 3, 3, 4, 4, 1, 1, 1, 7, 8, 7, 4, 3, 3, 1, 1]),
np.array([4, 3, 2, 4, 7, 1, 4, 1, 7, 8, 7, 2, 3, 1, 14 1]),
np.array([1, 2, 3, 4, 5, 1, 1, 2, 3, 4, 5, 4, 2, 3, 1, 1])
]
a = np.array([1, 2, 1, 2, 1, 2, 1, 2, 3, 4, 5, 4, 2, 3, 1, 1])
result = aggregate(group_idx, a, func='sum')
应该像这样:pandas df.groupby(['列1','列2','列3']).sum().reset_index()
group_idx
中的数字都是正数吗? - Divakarnumba
的依赖? - senderle