Pandas：查找第二高值的行的索引

Question

Pandas：查找第二高值的行的索引

4

我试图在 groupby 后获取第二高值的行索引，但我没有得到正确的结果。

df = pd.DataFrame({'Sp':['a','b','c','d','e','f'], 'Mt':['s1', 's1', 's2','s2','s2','s3'], 'Value':[1,2,3,4,5,6], 'count':[3,2,5,10,10,6]})

这样做

df.iloc[df.groupby(['Mt'])['Value'].apply(lambda x: (x!=max(x)).idxmax())]

返回

    Mt  Sp  Value   count
0   s1  a   1   3
2   s2  c   3   5
5   s3  f   6   6

对于 group s2，应返回原数据帧的第3个索引。

- MARK

2个回答

0

好的，我得到了答案，除了一件事。这段代码似乎可以工作。

df.iloc[df.groupby(['Mt'])['Value'].apply(lambda x: (x!=max(x)).order(ascending=False).head(1).index[0])]

我现在唯一不明白的是，即使只有一行的组也会返回那一行。我原以为x！=max(x)的检查会排除那一行。

- MARK

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Andy Hayden · Accepted Answer

由于“Value”已经排序，您可以使用nth函数：

In [11]: g = df.groupby("Mt", as_index=False)

In [12]: g.nth(-2)
Out[12]:
   Mt Sp  Value  count
0  s1  a      1      3
3  s2  d      4     10

否则，我会先按值进行排序：df = df.sort_values("Value")。

如果你想获取最后一个（如果给定组中少于两个），你也可以这样做。

In [21]: g = df.groupby("Mt")

In [22]: res = g.nth(-1)

In [23]: res.update(g.nth(-2))

In [24]: res
Out[24]:
   Sp  Value  count
Mt
s1  a      1      3
s2  d      4     10
s3  f      6      6

一个相关的函数是tail（用于获取最后两个元素）：

In [31]: g.tail(2)
Out[31]:
   Mt Sp  Value  count
0  s1  a      1      3
1  s1  b      2      2
3  s2  d      4     10
4  s2  e      5     10
5  s3  f      6      6