我希望找到一个满足特定条件(在我的例子中为中间阈值)的一维NumPy数组中最小值的位置。例如:
import numpy as np
limit = 3
a = np.array([1, 2, 4, 5, 2, 5, 3, 6, 7, 9, 10])
我希望有效地屏蔽所有低于限制值的a
中的数字,以使np.argmin
的结果为6。是否有一种计算便宜的方法来屏蔽不符合条件的值,然后应用np.argmin
?我希望找到一个满足特定条件(在我的例子中为中间阈值)的一维NumPy数组中最小值的位置。例如:
import numpy as np
limit = 3
a = np.array([1, 2, 4, 5, 2, 5, 3, 6, 7, 9, 10])
我希望有效地屏蔽所有低于限制值的a
中的数字,以使np.argmin
的结果为6。是否有一种计算便宜的方法来屏蔽不符合条件的值,然后应用np.argmin
?a
中选择有效元素,并使用所选元素中的argmin()
进行索引以获取最终索引输出。因此,实现应该类似于这样 -valid_idx = np.where(a >= limit)[0]
out = valid_idx[a[valid_idx].argmin()]
运行示例:
In [32]: limit = 3
...: a = np.array([1, 2, 4, 5, 2, 5, 3, 6, 7, 9, 10])
...:
In [33]: valid_idx = np.where(a >= limit)[0]
In [34]: valid_idx[a[valid_idx].argmin()]
Out[34]: 6
运行时测试 -
为了进行性能基准测试,本节将比较基于掩码数组的其他解决方案
和此帖子中先前提出的基于常规数组的解决方案在各种数据大小上的表现。
def masked_argmin(a,limit): # Defining func for regular array based soln
valid_idx = np.where(a >= limit)[0]
return valid_idx[a[valid_idx].argmin()]
In [52]: # Inputs
...: a = np.random.randint(0,1000,(10000))
...: limit = 500
...:
In [53]: %timeit np.argmin(np.ma.MaskedArray(a, a<limit))
1000 loops, best of 3: 233 µs per loop
In [54]: %timeit masked_argmin(a,limit)
10000 loops, best of 3: 101 µs per loop
In [55]: # Inputs
...: a = np.random.randint(0,1000,(100000))
...: limit = 500
...:
In [56]: %timeit np.argmin(np.ma.MaskedArray(a, a<limit))
1000 loops, best of 3: 1.73 ms per loop
In [57]: %timeit masked_argmin(a,limit)
1000 loops, best of 3: 1.03 ms per loop
这可以通过使用numpy的MaskedArray
轻松实现
import numpy as np
limit = 3
a = np.array([1, 2, 4, 5, 2, 5, 3, 6, 7, 9, 10])
b = np.ma.MaskedArray(a, a<limit)
np.ma.argmin(b) # == 6
b.argmin()
? - Carlos Vegab = np.ma.masked_less(a, limit)
。 - Alexander Pozdneev
[--, --, 4, 5, --, 5, 3, 6, 7, 9, 10]
。然后最小元素是3,位于掩码数组的第6个位置(从0开始计数)。这就是MaxPowers答案中的情况。 - Qaswed