下面是一个用于计算轨迹(xy坐标)连续线段点积的函数。结果符合预期,但由于“for循环”的存在,运行速度非常慢。
In [94]:
def func1(xy, s):
size = xy.shape[0]-2*s
out = np.zeros(size)
for i in range(size):
p1, p2 = xy[i], xy[i+s] #segment 1
p3, p4 = xy[i+s], xy[i+2*s] #segment 2
out[i] = np.dot(p1-p2, p4-p3)
return out
xy = np.array([[1,2],[2,3],[3,4],[5,6],[7,8],[2,4],[5,2],[9,9],[1,1]])
func1(xy, 2)
Out[94]:
array([-16., 15., 32., 31., -14.])
我寻找一种向量化上述内容的方法,希望能够使它运行更快。以下是我想出的方法:
In [95]:
def func2(xy, s):
size = xy.shape[0]-2*s
p1 = xy[0:size]
p2 = xy[s:size+s]
p3 = p2
p4 = xy[2*s:size+2*s]
return np.diagonal(np.dot((p1-p2), (p4-p3).T))
func2(xy, 2)
Out[95]:
array([-16, 15, 32, 31, -14])
不幸的是,点积会产生一个方阵,我需要从中取出对角线:
In [96]:
print np.dot((p1-p2), (p4-p3).T)
np.diagonal(np.dot((p1-p2), (p4-p3).T))
[[-16 10 16 -24 10]
[-24 15 24 -36 15]
[-32 20 32 -48 20]
[ 20 -13 -18 31 -14]
[ 32 -18 -40 44 -14]]
Out[96]:
array([-16, 15, 32, 31, -14])
我的解决方案真的很糟糕。它只能将速度提高2倍,更重要的是它现在不可扩展。我的平均轨迹有几万个点,这意味着我必须处理巨大的矩阵。
你们知道更好的方法吗? 谢谢
编辑: 太棒了!einsum绝对是解决方案。在我沮丧的时候,我自己写了点积。我知道,不太可读,并且它违背了使用优化库的目的,但是这里还是有(func4)。速度与einsum相当。
def func4(xy, s):
size = xy.shape[0]-2*s
tmp1 = xy[0:size] - xy[s:size+s]
tmp2 = xy[2*s:size+2*s] - xy[s:size+s]
return tmp1[:, 0] * tmp2[:, 0] + tmp1[:, 1] * tmp2[:, 1]
func4
更快。 - hpaulj