正如在这个问题中所指出的,列表推导式在幕后使用list.append
,因此它将调用列表调整大小方法,进行过量分配。
要自行证明这一点,您可以实际使用dis
反汇编器:
>>> code = compile('[x for x in iterable]', '', 'eval')
>>> import dis
>>> dis.dis(code)
1 0 LOAD_CONST 0 (<code object <listcomp> at 0x10560b810, file "", line 1>)
2 LOAD_CONST 1 ('<listcomp>')
4 MAKE_FUNCTION 0
6 LOAD_NAME 0 (iterable)
8 GET_ITER
10 CALL_FUNCTION 1
12 RETURN_VALUE
Disassembly of <code object <listcomp> at 0x10560b810, file "", line 1>:
1 0 BUILD_LIST 0
2 LOAD_FAST 0 (.0)
>> 4 FOR_ITER 8 (to 14)
6 STORE_FAST 1 (x)
8 LOAD_FAST 1 (x)
10 LIST_APPEND 2
12 JUMP_ABSOLUTE 4
>> 14 RETURN_VALUE
>>>
在<listcomp>
代码对象的反汇编中注意LIST_APPEND
操作码。从文档中得知:
LIST_APPEND(i)
调用list.append(TOS[-i], TOS)
,用于实现列表推导。
现在,对于列表重复操作,如果我们考虑以下内容,则可以了解正在发生的情况:
>>> import sys
>>> sys.getsizeof([])
64
>>> 8*10
80
>>> 64 + 80
144
>>> sys.getsizeof([None]*10)
144
因此,看起来可以精确地分配大小。查看源代码,我们可以看到这正是发生的事情:
static PyObject *
list_repeat(PyListObject *a, Py_ssize_t n)
{
Py_ssize_t i, j;
Py_ssize_t size;
PyListObject *np;
PyObject **p, **items;
PyObject *elem;
if (n < 0)
n = 0;
if (n > 0 && Py_SIZE(a) > PY_SSIZE_T_MAX / n)
return PyErr_NoMemory();
size = Py_SIZE(a) * n;
if (size == 0)
return PyList_New(0);
np = (PyListObject *) PyList_New(size);
即,在这里:
size = Py_SIZE(a) * n;
。其余函数只是填充数组。
(144 == sys.getsizeof([]) + 8*10)
。 - juanpa.arrivillaga10
更改为11
,则[None] * 11
列表的大小为152
,但列表推导式的大小仍为192
。之前链接的问题不是完全重复的,但它有助于理解为什么会发生这种情况。 - Patrick Haugh