如何在将numpy数组相乘后高效地求和？

Question

如何在将numpy数组相乘后高效地求和？

arraysfor-loopnumpyadditionmultiplication

4

实际上我需要计算：

S_i = sum(U_j * U_j.transpose) * K_i

在哪里

U_j is a n * k dim matrix, 
K_i is a n * n dim matrix, 
j != i, 
i = 1, 2, ..., n

我使用了如下的循环：

import numpy as np
for i in xrange(n):
    temp = np.zeros((n, n))
    for j in xrange (n):
        if j != i:
            temp += np.dot(U[j], U[j].T)
    S[i] = np.dot(temp, K[i])

有没有更高效的方法来完成这个任务？

- LittleLittleQ

for j in xrange (n) and j != i 应该会抛出一个语法错误。你是不是想要将其拆分成一个 for-loop 和一个 if-statement？ - unutbu

@unutbu 是的，你说得对，我想做的是 for j in xrange(n): if j != i: 但是我在语法上犯了一个错误，我想知道有没有更好的方法来做这件事~ - LittleLittleQ

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- unutbu · Accepted Answer

import numpy as np

n, k = 30, 40

U = np.random.random((n, n, k))
K = np.random.random((n, n, n))

def using_loops(U, K):
    S = np.empty((n, n, n))
    for i in xrange(n):
        temp = np.zeros((n, n))
        for j in xrange (n):
            if j != i:
                temp += np.dot(U[j], U[j].T)
        S[i] = np.dot(temp, K[i])
    return S

def using_einsum(U, K):
    uut = np.einsum('ijk,ilk->ijl', U, U)
    total = uut.sum(axis=0)
    total = total - uut
    S = np.einsum('ijk,ikl->ijl', total, K)
    return S

这个测试旨在验证 using_loops 和 using_einsum 是否产生相同的结果。

In [260]: np.allclose(using_loops(U, K), using_einsum(U, K))
Out[260]: True

这表明使用_einsum更快；速度提升取决于n和k的大小：

In [262]: %timeit using_loops(U, K)
100 loops, best of 3: 17.1 ms per loop

In [263]: %timeit using_einsum(U, K)
1000 loops, best of 3: 1.92 ms per loop

一般而言，只要看到乘积的总和，就有很大可能性可以使用np.einsum来快速得出结果。它几乎肯定能够击败Python的for循环。