ndarray每行中的N个最大值

8
我有一个ndarray,其中每一行都是一个单独的直方图。对于每一行,我希望找到前N个值。
我知道有一个解决方案可以找到全局前N个值(在numpy数组中查找最大的N个元素的快速方法),但我不知道如何获取每行的前N个。
我可以迭代每一行并应用1D解决方案,但是我不应该能够使用numpy广播来完成此操作吗?
2个回答

12

您可以像链接的问题一样使用 np.partition,排序已在最后一个轴上完成:

In [2]: a = np.array([[ 5,  4,  3,  2,  1],
               [10,  9,  8,  7,  6]])
In [3]: b = np.partition(a, -3)    # top 3 values from each row
In [4]: b[:,-3:]
Out[4]: 
array([[ 3,  4,  5],
       [ 8,  9, 10]])

7
你可以像这样使用 np.argsort 沿着行的方向并设置 axis = 1 -
import numpy as np

# Find sorted indices for each row
sorted_row_idx = np.argsort(A, axis=1)[:,A.shape[1]-N::]

# Setup column indexing array
col_idx = np.arange(A.shape[0])[:,None]

# Use the column-row indices to get specific elements from input array. 
# Please note that since the column indexing array isn't of the same shape 
# as the sorted row indices, it will be broadcasted
out = A[col_idx,sorted_row_idx]

例子运行 -


In [417]: A
Out[417]: 
array([[0, 3, 3, 2, 5],
       [4, 2, 6, 3, 1],
       [2, 1, 1, 8, 8],
       [6, 6, 3, 2, 6]])

In [418]: N
Out[418]: 3

In [419]: sorted_row_idx = np.argsort(A, axis=1)[:,A.shape[1]-N::]

In [420]: sorted_row_idx
Out[420]: 
array([[1, 2, 4],
       [3, 0, 2],
       [0, 3, 4],
       [0, 1, 4]], dtype=int64)

In [421]: col_idx = np.arange(A.shape[0])[:,None]

In [422]: col_idx
Out[422]: 
array([[0],
       [1],
       [2],
       [3]])

In [423]: out = A[col_idx,sorted_row_idx]

In [424]: out
Out[424]: 
array([[3, 3, 5],
       [3, 4, 6],
       [2, 8, 8],
       [6, 6, 6]])

如果您想按降序排序元素,可以使用以下步骤 -
In [425]: out[:,::-1]
Out[425]: 
array([[5, 3, 3],
       [6, 4, 3],
       [8, 8, 2],
       [6, 6, 6]])

你能解释一下如何通过对A进行索引来获取顶部值吗? - waldol1
我喜欢这个答案,因为我还可以获得前N行的索引。 - m13op22

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接