我一直在尝试用Python编写cffi模块,并且它们的速度让我怀疑我是否正确地使用了标准的Python。这让我想完全切换到C!但实际上,有一些很棒的Python库我永远无法在C中重新实现,所以这更多是假设。
这个例子展示了在Python中使用numpy数组进行求和的函数,与使用c函数相比较慢的情况。有没有更快的Pythonic方式计算numpy数组的总和?
def cast_matrix(matrix, ffi):
ap = ffi.new("double* [%d]" % (matrix.shape[0]))
ptr = ffi.cast("double *", matrix.ctypes.data)
for i in range(matrix.shape[0]):
ap[i] = ptr + i*matrix.shape[1]
return ap
ffi = FFI()
ffi.cdef("""
double sum(double**, int, int);
""")
C = ffi.verify("""
double sum(double** matrix,int x, int y){
int i, j;
double sum = 0.0;
for (i=0; i<x; i++){
for (j=0; j<y; j++){
sum = sum + matrix[i][j];
}
}
return(sum);
}
""")
m = np.ones(shape=(10,10))
print 'numpy says', m.sum()
m_p = cast_matrix(m, ffi)
sm = C.sum(m_p, m.shape[0], m.shape[1])
print 'cffi says', sm
只为展示函数的工作原理:
numpy says 100.0
cffi says 100.0
现在,如果我计时这个简单的函数,我发现numpy非常慢!我是否正确地使用了numpy?在Python中有更快的计算总和的方法吗?
import time
n = 1000000
t0 = time.time()
for i in range(n): C.sum(m_p, m.shape[0], m.shape[1])
t1 = time.time()
print 'cffi', t1-t0
t0 = time.time()
for i in range(n): m.sum()
t1 = time.time()
print 'numpy', t1-t0
时代:
cffi 0.818415880203
numpy 5.61657714844
%timeit np.sum(np.sum(m))
和%timeit np.matrix.sum(x)
,否则可能会出现垃圾回收等问题(参见 https://docs.python.org/2/library/timeit.html#timeit.Timer.timeit)。 - Fredrik Pihl1E3x1E3
,并减少循环次数,就会看到更加可比较的时间。 - Daniel