import numpy as np
n, k = 30, 40
U = np.random.random((n, n, k))
K = np.random.random((n, n, n))
def using_loops(U, K):
S = np.empty((n, n, n))
for i in xrange(n):
temp = np.zeros((n, n))
for j in xrange (n):
if j != i:
temp += np.dot(U[j], U[j].T)
S[i] = np.dot(temp, K[i])
return S
def using_einsum(U, K):
uut = np.einsum('ijk,ilk->ijl', U, U)
total = uut.sum(axis=0)
total = total - uut
S = np.einsum('ijk,ikl->ijl', total, K)
return S
这个测试旨在验证 using_loops
和 using_einsum
是否产生相同的结果。
In [260]: np.allclose(using_loops(U, K), using_einsum(U, K))
Out[260]: True
这表明使用_einsum更快;速度提升取决于
n
和
k
的大小:
In [262]: %timeit using_loops(U, K)
100 loops, best of 3: 17.1 ms per loop
In [263]: %timeit using_einsum(U, K)
1000 loops, best of 3: 1.92 ms per loop
一般而言,只要看到乘积的总和,就有很大可能性可以使用
np.einsum来快速得出结果。它几乎肯定能够击败Python的for循环。
for j in xrange (n) and j != i
应该会抛出一个语法错误。你是不是想要将其拆分成一个for-loop
和一个if-statement
? - unutbufor j in xrange(n): if j != i:
但是我在语法上犯了一个错误,我想知道有没有更好的方法来做这件事~ - LittleLittleQ