假设我们有一个C函数,它接受一组或多组输入数组,对其进行处理,并将输出写入一组输出数组。函数签名如下所示(其中count
表示要处理的数组元素数):
void compute (int count, float** input, float** output)
我想通过ctypes从Python调用这个函数,并将其用于一组NumPy数组的转换。对于定义为一个输入/一个输出函数的函数,例如:
void compute (int count, float* input, float* output)
以下内容可以正常运作:
import ctypes
import numpy
from numpy.ctypeslib import ndpointer
lib = ctypes.cdll.LoadLibrary('./block.so')
fun = lib.compute
fun.restype = None
fun.argtypes = [ctypes.c_int,
ndpointer(ctypes.c_float),
ndpointer(ctypes.c_float)]
data = numpy.ones(1000).astype(numpy.float32)
output = numpy.zeros(1000).astype(numpy.float32)
fun(1000, data, output)
然而,我不知道如何为多个输入(和/或输出)创建对应的指针数组。有什么想法吗?
编辑:所以人们一直在想,compute
如何知道要期望多少个数组指针(因为count
指的是每个数组的元素数量)。实际上,这是硬编码的;给定的compute
知道要期望多少个输入和输出。调用方的任务是验证input
和output
指向正确数量的输入和输出。这是一个将2个输入写入1个输出数组的示例compute
:
virtual void compute (int count, float** input, float** output) {
float* input0 = input[0];
float* input1 = input[1];
float* output0 = output[0];
for (int i=0; i<count; i++) {
float fTemp0 = (float)input1[i];
fRec0[0] = ((0.09090909090909091f * fTemp0) + (0.9090909090909091f * fRec0[1]));
float fTemp1 = (float)input0[i];
fRec1[0] = ((0.09090909090909091f * fTemp1) + (0.9090909090909091f * fRec1[1]));
output0[i] = (float)((fTemp0 * fRec1[0]) - (fTemp1 * fRec0[0]));
// post processing
fRec1[1] = fRec1[0];
fRec0[1] = fRec0[0];
}
}
我无法影响compute
的签名和实现。我可以验证(使用Python!)需要多少输入和输出。关键问题是如何为函数提供正确的argtypes
,以及如何在NumPy中生成适当的数据结构(指向NumPy数组的指针数组)。
compute
函数以将数据存储为平面结构。 - ilmiacscompute
函数是自动生成的,因此我在签名和实现方面几乎没有任何影响力。 - apl