基于一列中的值对2D numpy数组进行掩码操作

13

假设我有以下的numpy数组:

a = [[1, 5, 6],
     [2, 4, 1],
     [3, 1, 5]]

我想要遮蔽所有第一栏含有1的行。也就是说,我想要

   [[--, --, --],
     [2, 4, 1],
     [3, 1, 5]]

使用NumPy掩码数组操作是否可以实现这一点?如何做到?

谢谢。

3个回答

7
import numpy as np

a = np.array([[1, 5, 6],
              [2, 4, 1],
              [3, 1, 5]])

np.ma.MaskedArray(a, mask=(np.ones_like(a)*(a[:,0]==1)).T)

# Returns: 
masked_array(data =
 [[-- -- --]
 [2 4 1]
 [3 1 5]],
             mask =
 [[ True  True  True]
 [False False False]
 [False False False]])

4

您可以通过以下方式创建所需的掩码:

mask = numpy.repeat(a[:,0]==1, a.shape[1])

以及通过掩码数组

masked_a = numpy.ma.array(a, mask=numpy.repeat(a[:,0]==1, a.shape[1]))

谢谢您的回复,Sven!我是numpy的新手,不知道repeat方法。我会查一下的。 - Curious2learn

2

您可以创建一个空掩码,然后使用numpy广播(如@eumiro所示),但使用元素和按位“或”运算符|:

>>> a = np.array([[1, 5, 6], [2, 4, 1], [3, 1, 5]])

>>> mask = np.zeros(a.shape, bool) | (a[:, 0] == 1)[:, None]

>>> np.ma.array(a, mask=mask)
masked_array(data =
 [[-- -- --]
 [2 4 1]
 [3 1 5]],
             mask =
 [[ True  True  True]
 [False False False]
 [False False False]],
       fill_value = 999999)

稍作解释:
>>> # select first column
>>> a[:, 0]  
array([1, 2, 3])

>>> # where the first column is 1
>>> a[:, 0] == 1  
array([ True, False, False], dtype=bool)

>>> # added dimension so that it correctly broadcasts to the empty mask
>>> (a[:, 0] == 1)[:, None]  
array([[ True],
       [False],
       [False]], dtype=bool)

>>> # create the final mask
>>> np.zeros(a.shape, bool) | (a[:, 0] == 1)[:, None]  
array([[ True,  True,  True],
       [False, False, False],
       [False, False, False]], dtype=bool)

这种方法的另一个优点是它不需要使用可能很昂贵的乘法或np.repeat,因此速度应该相当快。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接