在NumPy数组中查找等于零的元素索引

201

NumPy提供了高效的函数/方法nonzero(),用于确定ndarray对象中非零元素的索引。那么,获取具有零数值的元素的索引的最有效方法是什么?

9个回答

303

numpy.where()是我最喜欢的函数。

>>> x = numpy.array([1,0,2,0,3,0,4,5,6,7,8])
>>> numpy.where(x == 0)[0]
array([1, 3, 5])
方法where返回一个元组(ndarrays),每个元素对应于输入的不同维度。由于输入是一维的,[0]用于解构元组中的唯一元素。

22
我正在努力回忆Python。为什么where()会返回一个元组?numpy.where(x == 0)[1]越界了。那么与之配对的索引数组是什么? - Zhubarb
8
where 函数返回一个包含若干个 ndarray 数组的元组,其中每个数组对应输入数组的一个维度。如果输入是一个一维数组,那么输出是一个包含一个数组的元组。如果输入是一个矩阵,那么输出将是一个包含两个数组的元组,以此类推。请注意,该函数返回的是元组而不是单个数组。 - Ciprian Tomoiagă
5
从numpy 1.16版本开始,关于numpy.where的文档明确建议直接使用numpy.nonzero而不是仅传递一个参数给where函数。 - jirassimok
1
@jirassimok,你如何使用 nonzero 找到零,就像问题所问的那样? - mLstudent33
1
@mLstudent33 与使用 where 相同,如Dusch的答案所示。根据where的文档where(x) 等同于 asarray(x).nonzero() - jirassimok
显示剩余2条评论

58

有一个np.argwhere函数,

import numpy as np
arr = np.array([[1,2,3], [0, 1, 0], [7, 0, 2]])
np.argwhere(arr == 0)

它会将所有找到的索引作为行返回:

array([[1, 0],    # Indices of the first zero
       [1, 2],    # Indices of the second zero
       [2, 1]],   # Indices of the third zero
      dtype=int64)

29

您可以使用以下方法搜索任何标量条件:

>>> a = np.asarray([0,1,2,3,4])
>>> a == 0 # or whatver
array([ True, False, False, False, False], dtype=bool)

这将以条件的布尔掩码形式返回数组。


1
你可以使用以下代码访问零元素:a[a==0] = epsilon - Quant Metropolis
最近发现了这种符号表示法。在我看来,这是最丑陋的语法糖之一。非常、非常错误,就像 C 语言中比较运算符中的赋值操作一样。 - Boris Burkov

26

由于False也是一种零,您还可以通过在条件的布尔掩码上使用nonzero()来使用它。

>>> x = numpy.array([1,0,2,0,3,0,4,5,6,7,8])

>>> x==0
array([False, True, False, True, False, True, False, False, False, False, False], dtype=bool)

>>> numpy.nonzero(x==0)[0]
array([1, 3, 5])

它与 mtrw 的方法完全相同,但更与问题相关 ;)


2
这应该是被接受的答案,因为这是建议使用nonzero方法来检查条件。 - sophros

7
你可以使用numpy.nonzero来查找零。
>>> import numpy as np
>>> x = np.array([1,0,2,0,3,0,0,4,0,5,0,6]).reshape(4, 3)
>>> np.nonzero(x==0)  # this is what you want
(array([0, 1, 1, 2, 2, 3]), array([1, 0, 2, 0, 2, 1]))
>>> np.nonzero(x)
(array([0, 0, 1, 2, 3, 3]), array([0, 2, 1, 1, 0, 2]))

6

如果你正在使用一维数组,那么有一个语法糖:

>>> x = numpy.array([1,0,2,0,3,0,4,5,6,7,8])
>>> numpy.flatnonzero(x == 0)
array([1, 3, 5])

只要我只有一个条件,这个程序就可以正常工作。但是如果我想搜索“x == numpy.array(0,2,7)”怎么办?结果应该是array([1,2,3,5,9])。但是我该如何得到这个结果呢? - MoTSCHIGGE
你可以使用以下代码实现: numpy.flatnonzero(numpy.logical_or(numpy.logical_or(x==0, x==2), x==7)) - Dusch

3
import numpy as np
arr = np.arange(10000)
arr[8000:8900] = 0

%timeit np.where(arr == 0)[0]
%timeit np.argwhere(arr == 0)
%timeit np.nonzero(arr==0)[0]
%timeit np.flatnonzero(arr==0)
%timeit np.amin(np.extract(arr != 0, arr))

23.4 µs ± 1.5 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
34.5 µs ± 680 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
23.2 µs ± 447 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
27 µs ± 506 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
109 µs ± 669 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

2
我会按照以下方式进行操作:
>>> x = np.array([[1,0,0], [0,2,0], [1,1,0]])
>>> x
array([[1, 0, 0],
       [0, 2, 0],
       [1, 1, 0]])
>>> np.nonzero(x)
(array([0, 1, 2, 2]), array([0, 1, 0, 1]))

# if you want it in coordinates
>>> x[np.nonzero(x)]
array([1, 2, 1, 1])
>>> np.transpose(np.nonzero(x))
array([[0, 0],
       [1, 1],
       [2, 0],
       [2, 1])

1
import numpy as np

x = np.array([1,0,2,3,6])
non_zero_arr = np.extract(x>0,x)

min_index = np.amin(non_zero_arr)
min_value = np.argmin(non_zero_arr)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接