我编写了一个简单的Python扩展模块,用于模拟3位模拟数字转换器。它应该接受浮点数数组作为输入,并返回相同大小的输出数组。实际输出由量化的输入数字组成。这是我的(简化版)模块:
static PyObject *adc3(PyObject *self, PyObject *args) {
PyArrayObject *inArray = NULL, *outArray = NULL;
double *pinp = NULL, *pout = NULL;
npy_intp nelem;
int dims[1], i, j;
/* Get arguments: */
if (!PyArg_ParseTuple(args, "O:adc3", &inArray))
return NULL;
nelem = PyArray_DIM(inArray,0); /* size of the input array */
pout = (double *) malloc(nelem*sizeof(double));
pinp = (double *) PyArray_DATA(inArray);
/* ADC action */
for (i = 0; i < nelem; i++) {
if (pinp[i] >= -0.5) {
if (pinp[i] < 0.5) pout[i] = 0;
else if (pinp[i] < 1.5) pout[i] = 1;
else if (pinp[i] < 2.5) pout[i] = 2;
else if (pinp[i] < 3.5) pout[i] = 3;
else pout[i] = 4;
}
else {
if (pinp[i] >= -1.5) pout[i] = -1;
else if (pinp[i] >= -2.5) pout[i] = -2;
else if (pinp[i] >= -3.5) pout[i] = -3;
else pout[i] = -4;
}
}
dims[0] = nelem;
outArray = (PyArrayObject *)
PyArray_SimpleNewFromData(1, dims, NPY_DOUBLE, pout);
//Py_INCREF(outArray);
return PyArray_Return(outArray);
}
/* ==== methods table ====================== */
static PyMethodDef mwa_methods[] = {
{"adc", adc, METH_VARARGS, "n-bit Analog-to-Digital Converter (ADC)"},
{NULL, NULL, 0, NULL}
};
/* ==== Initialize ====================== */
PyMODINIT_FUNC initmwa() {
Py_InitModule("mwa", mwa_methods);
import_array(); // for NumPy
}
我原以为,如果引用计数得到正确处理,Python 垃圾回收会(足够频繁地)释放输出数组占用的内存,前提是该数组名称相同且被重复使用。因此,我用以下代码对一些虚拟(但庞大)数据进行了测试:
for i in xrange(200):
a = rand(1000000)
b = mwa.adc3(a)
print i
在这里,名为“b”的数组被多次重用,它的内存从堆中借用,预计会被归还给系统。我使用gnome-system-monitor进行检查。与我的期望相反,Python拥有的内存迅速增长,并且只有通过退出程序(我使用IPython)才能释放该内存。
为了比较,我尝试使用标准NumPy函数zeros()和copy()执行相同的过程:
for i in xrange(1000):
a = np.zeros(10000000)
b = np.copy(a)
print i
如您所见,后面的代码不会引起任何内存积累。 我阅读了很多标准文档和网上的文章,尝试使用Py_INCREF(outArray)和不使用它。但是都没有成功:问题仍然存在。
然而,我在http://wiki.scipy.org/Cookbook/C_Extensions/NumPy_arrays中找到了解决方案。 作者提供了一个扩展程序matsq(),它创建一个数组并返回它。当我尝试使用作者建议的调用时:
outArray = (PyArrayObject *) PyArray_FromDims(nd,dims,NPY_DOUBLE);
pout = (double *) outArray->data;
代替我的
pout = (double *) malloc(nelem*sizeof(double));
outArray = (PyArrayObject *)
PyArray_SimpleNewFromData(1, dims, NPY_DOUBLE, pout);
/* no matter with or without Py_INCREF(outArray)) */
内存泄漏问题解决了!程序现在正常工作。
一个问题:有人能解释为什么PyArray_SimpleNewFromData()不能提供正确的引用计数,而PyArray_FromDims()可以吗?
非常感谢。
补充说明。我可能在评论中超出了空间/时间限制,所以我在这里向Alex添加评论。我尝试通过以下方式设置OWNDATA标志:
outArray->flags |= OWNDATA;
但是我得到了“错误:‘OWNDATA’未声明”。其余内容在注释中。谢谢。
解决:正确的标志设置是
outArray->flags |= NPY_ARRAY_OWNDATA;
现在它可以工作。
Alex,抱歉。
PyArray_ENABLEFLAGS(outArray, NPY_ARRAY_OWNDATA);
是标准的方法,但我猜你在问题的编辑中提到的方法也可以在这个版本中使用。为了未来的兼容性,我建议使用文档中记录的方法,但也许我只是一个严格遵守文档的人 :-)。那么现在可以接受我的回答吗?-) - Alex Martelli