基于计数排序的numpy.unique排序

Question

基于计数排序的numpy.unique排序

16

numpy.unique函数允许在return_counts为True时返回唯一元素的计数。现在返回的元组包含两个数组，一个包含唯一元素，第二个包含计数数组，两个数组都按唯一元素排序。现在是否有一种方法按计数数组而不是唯一元素对两者进行排序？我的意思是，我知道如何通过困难的方法来做到这一点，但是否有一些简洁的单行或lambda功能可以处理这种情况？

my_chr_list = ["a","a","a", "b", "c", "b","d", "d"]
unique_els, counts = np.unique(my_chr_list, return_counts=True)
print(unique_els, counts)

它会返回类似于这样的内容：

>>> (array(['a', 'b', 'c', 'd'], 
     dtype='<U1'), array([3, 2, 1, 2], dtype=int64))

然而，我想要的是：

>>> (array(['a', 'b', 'd', 'c'], 
     dtype='<U1'), array([3, 2, 2, 1], dtype=int64))

- meow

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Mazdak · Accepted Answer

使用unique函数无法直接完成此操作。作为Numpythonic方法，您可以使用return_index关键字来获取唯一项目的索引，然后使用np.argsort获取排序过的count项的索引，最后根据它们的频率查找项。

In [33]: arr = np.array(my_chr_list)

In [34]: u, count = np.unique(my_chr_list, return_counts=True)

In [35]: count_sort_ind = np.argsort(-count)

In [36]: u[count_sort_ind]
Out[36]: 
array(['a', 'b', 'd', 'c'], 
      dtype='<U1')

In [37]: count[count_sort_ind]
Out[37]: array([3, 2, 2, 1])