我正在尝试使用Cython加速一些Python代码,并利用Cython的
在下面的简单函数中,我使用缓冲语法声明了numpy数组参数
-a
选项查看我可以改进哪些地方。据我了解,在生成的HTML文件中,高亮显示的行是调用Python函数的行-是这样吗?在下面的简单函数中,我使用缓冲语法声明了numpy数组参数
arr
。我认为这允许索引操作纯粹在C中进行,而无需调用Python函数。然而,cython -a
(版本0.15)突出显示了我设置arr
元素值的行,但没有突出显示读取其元素之一的行。为什么会发生这种情况?有更有效的访问numpy数组元素的方法吗?import numpy
cimport numpy
def foo(numpy.ndarray[double, ndim=1] arr not None):
cdef int i
cdef double elem
for i in xrange(10):
elem = arr[i] #not highlighted
arr[i] = 1.0 + elem #highlighted
编辑: 此外,mode
缓冲区参数如何与numpy交互? 假设我没有改变numpy.array
的默认order
参数,是否总是安全使用mode ='c'
? 这对性能有实际影响吗?
在delnan的评论之后进行编辑:arr[i] + = 1
也会被突出显示(这就是我首先分开它的原因,以查看操作的哪个部分引起了问题)。 如果我关闭边界检查以简化事情(这不会影响到什么被突出显示),所生成的C代码为:
/* "ct.pyx":11
* cdef int i
* cdef double elem
* for i in xrange(10): # <<<<<<<<<<<<<<
* elem = arr[i]
* arr[i] = 1.0 + elem
*/
for (__pyx_t_1 = 0; __pyx_t_1 < 10; __pyx_t_1+=1) {
__pyx_v_i = __pyx_t_1;
/* "ct.pyx":12
* cdef double elem
* for i in xrange(10):
* elem = arr[i] # <<<<<<<<<<<<<<
* arr[i] = 1.0 + elem
*/
__pyx_t_2 = __pyx_v_i;
__pyx_v_elem = (*__Pyx_BufPtrStrided1d(double *, __pyx_bstruct_arr.buf, __pyx_t_2, __pyx_bstride_0_arr));
/* "ct.pyx":13
* for i in xrange(10):
* elem = arr[i]
* arr[i] = 1.0 + elem # <<<<<<<<<<<<<<
*/
__pyx_t_3 = __pyx_v_i;
*__Pyx_BufPtrStrided1d(double *, __pyx_bstruct_arr.buf, __pyx_t_3, __pyx_bstride_0_arr) = (1.0 + __pyx_v_elem);
}
arr[i] += 1
是否被突出显示?此外,我相信您可以在cython -a
生成的 HTML 文档中直接查看该特定行生成的代码,这可能有助于了解该行发生了哪些 Python API 调用。 - user395760