NumPy中的加权计数

Question

4

在numpy中有没有方法可以对以下操作进行向量化处理？

a = np.zeros(3)
idx = np.array([1, 0, 1])
val = np.array([1, 2, 3])
for i, v in zip(idx, val):
    a[i] += v
# a = [2, 4, 0]

下面的代码不能像期望的那样正常工作。

a = np.zeros(3)
idx = np.array([1, 0, 1])
val = np.array([1, 2, 3])
a[idx] += val
# wrong answer: a = [2, 3, 0]

- Maybe

问题肯定在于重复索引，但我有点惊讶它无法做到显而易见的事情。 - orlp

是的，在实践中很容易被忽视。 - Maybe

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- yatu · Accepted Answer

我们可以使用np.bincount函数，将val参数作为权重进行设置：

np.bincount(idx, weights=val, minlength=len(idx)).astype(int)
#array([2, 4, 0])

实际上这正是问题中所分享的内容。通过给np.bincount添加weight参数，而不是：

np.bincount(idx, minlength=len(idx)) 
# array([1, 2, 0], dtype=int64)

这等同于获取计数：

for i in idx:
    a[i] += 1

print(a)
# array([1., 2., 0.])

我们有这样一个代码：out[n] += weight[i]:

for i, v in zip(idx, val):
    a[i] += v

print(a)
# array([2., 4., 0.])