我正在使用Python和Numpy开发一个音频算法。现在我想通过用C来实现其中的一部分来加速该算法。以前,我曾使用cython实现过这个。现在我想使用新的cffi来完成同样的事情。
为了测试目的,我编写了一个简单的C函数:
void copy(float *in, float *out, int len) {
for (int i=0; i<len; i++) {
out[i] = in[i];
}
}
现在我想创建两个numpy数组,并让它们通过这个函数进行处理。我找到了一种方法:
import numpy as np
from cffi import FFI
ffi = FFI()
ffi.cdef("void copy(float *in, float *out, int len);")
C = ffi.dlopen("/path/to/copy.dll")
float_in = ffi.new("float[16]")
float_out = ffi.new("float[16]")
arr_in = 42*np.ones(16, dtype=np.float32)
float_in[0:16] = arr_in[0:16]
C.copy(float_in, float_out, 16)
arr_out = np.frombuffer(ffi.buffer(float_out, 16*4), dtype=np.float32)
然而,我想改进这段代码:
- 有没有一种方法可以直接访问numpy数组的底层浮点缓冲区而不复制它们?
ffi.buffer
非常方便,可以快速将C数组的内容转换为Numpy数组。有没有一种等效的方法可以快速将Numpy数组转换为C数组而不复制单个元素?- 对于某些应用程序,
float_in[0:16] = arr_in[0:16]
是访问数据的一种方便方式。 相反,arr_out[0:16] = float_out[0:16]
却不起作用。为什么?