如何向一个空的numpy数组中添加新行

237

使用标准的 Python 数组,我可以做到以下几点:

arr = []
arr.append([1,2,3])
arr.append([4,5,6])
# arr is now [[1,2,3],[4,5,6]]

然而,在numpy中我无法做到同样的事情。例如:

arr = np.array([])
arr = np.append(arr, np.array([1,2,3]))
arr = np.append(arr, np.array([4,5,6]))
# arr is now [1,2,3,4,5,6]

我也研究了 vstack,但是当我在一个空数组上使用 vstack 时,我得到了以下结果:

我还研究了 vstack,但是当我在一个空的数组上使用 vstack 时,我会获得以下输出:

ValueError: all the input array dimensions except for the concatenation axis must match exactly

那么,我该如何在numpy中向空数组追加新行?


1
如果它是空的,那么何必费心呢?只需从一个仅包含第一行的数组开始。 - jonrsharpe
20
我只想知道是否可以向空的numpy数组追加元素。有时候在循环中追加元素会更加简洁明了。请注意不要改变原意,使翻译更加通俗易懂。 - Tony Stark
7
鉴于numpy数组的工作方式,最好先建立一个空数组,然后再将数据放入其中,例如请参考:https://dev59.com/PHRB5IYBdhLWcg3wn4fb。 - jonrsharpe
如何创建单维数组? np.empty(3, float) 返回 array([0.00e+000, 0.00e+000, 2.77e-322]),而不是 array([]) - Mahesha999
7个回答

336

你想要“开始”一个数组的方法是:

arr = np.empty((0,3), int)

这是一个空数组,但它具有正确的维度。

>>> arr
array([], shape=(0, 3), dtype=int64)

那么一定要沿着0轴进行追加:

arr = np.append(arr, np.array([[1,2,3]]), axis=0)
arr = np.append(arr, np.array([[4,5,6]]), axis=0)

但是,@jonrsharpe是正确的。实际上,如果您要在循环中进行追加操作,那么像您第一个示例中那样追加到列表中,然后在结束时将其转换为numpy数组,速度会更快,因为您在循环期间并没有按照numpy的意图使用它:

In [210]: %%timeit
   .....: l = []
   .....: for i in xrange(1000):
   .....:     l.append([3*i+1,3*i+2,3*i+3])
   .....: l = np.asarray(l)
   .....: 
1000 loops, best of 3: 1.18 ms per loop

In [211]: %%timeit
   .....: a = np.empty((0,3), int)
   .....: for i in xrange(1000):
   .....:     a = np.append(a, 3*i+np.array([[1,2,3]]), 0)
   .....: 
100 loops, best of 3: 18.5 ms per loop

In [214]: np.allclose(a, l)
Out[214]: True

根据您的应用程序,numpythonic方式会更加适合,但实现方法会更像:

In [220]: timeit n = np.arange(1,3001).reshape(1000,3)
100000 loops, best of 3: 5.93 µs per loop

In [221]: np.allclose(a, n)
Out[221]: True

1
如果我需要执行10^5或10^6次,那该怎么办?似乎这两种方法都无法支持。有什么建议吗? - Rho Phi
@Roberto,通常有一些方法可以提前确定数组的大小或形状(至少值是首选)。你认为你能做到吗?添加应该真的只是一个或两个操作。 - askewchan
不需要蒙版,只需切片! a = a[:N]。虽然我强烈建议您找到一种向量化方法(如果需要帮助,请发布新问题并说明您的具体情况),或者在循环结束之前使用列表。 - askewchan
我使用Python的次数越多,Matlab就越有意义。arr = []; arr = [arr; x]; - malintha
你展示了如何将一个只有一行的二维数组(np.array([[1,2,3]]))附加到 arr 上。是否可以附加一个一维数组(np.array([1,2,3]))? - mins
显示剩余3条评论

48

这是我的解决方案:

arr = []
arr.append([1,2,3])
arr.append([4,5,6])
np_arr = np.array(arr)

1
生成的数组具有对象类型,某些情况下这是不可接受的。 - zer0fool
这是使用matplotlib线集合的简单解决方案,谢谢!! - undefined

31

在这种情况下,您可能希望使用函数 np.hstack 和 np.vstack。

arr = np.array([])
arr = np.hstack((arr, np.array([1,2,3])))
# arr is now [1,2,3]

arr = np.vstack((arr, np.array([4,5,6])))
# arr is now [[1,2,3],[4,5,6]]
你也可以使用np.concatenate函数。
干杯。

9
如果第二个数组的维度大于或等于2,例如ones((2, 2)),则此方法将无法奏效。在通过连接操作从空数组构建数组时,似乎无法避免边界情况的出现。 - Taozi
1
不是一个好的解决方案,因为每次都需要检查维度。 - SKR

2
我想要使用for循环,但是使用askewchan的方法并不好用,所以我对其进行了修改。原始答案为"最初的回答"。
x = np.empty((0,3))
y = np.array([1,2,3])
for i in ...
    x = np.vstack((x,y))

1
在循环中添加新行到数组时,第一次循环直接为数组分配值,而不是初始化一个空数组。
for i in range(0,len(0,100)):
    SOMECALCULATEDARRAY = .......
    if(i==0):
        finalArrayCollection = SOMECALCULATEDARRAY
    else:
        finalArrayCollection = np.vstack(finalArrayCollection,SOMECALCULATEDARRAY)

这在数组形状未知时特别有用。

1

使用自定义的数据类型定义,对我而言有效的方法是:

import numpy

# define custom dtype
type1 = numpy.dtype([('freq', numpy.float64, 1), ('amplitude', numpy.float64, 1)])
# declare empty array, zero rows but one column
arr = numpy.empty([0,1],dtype=type1)
# store row data, maybe inside a loop
row = numpy.array([(0.0001, 0.002)], dtype=type1)
# append row to the main array
arr = numpy.row_stack((arr, row))
# print values stored in the row 0
print float(arr[0]['freq'])
print float(arr[0]['amplitude'])

-1

考虑到内存,这是更有效的方法:

shape = (n, inp_len)
arr= np.empty(shape)

for i in range(n):
    arr[i] = np.expand_dims(arr, axis=0)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接