如何按照多个条件对Pandas DataFrame进行排序?

29

我有一个包含歌曲名称、其峰值排名和在第一位停留的周数的DataFrame:

                                          Song            Peak            Weeks
76                            Paperback Writer               1               16
117                               Lady Madonna               1                9
118                                   Hey Jude               1               27
22                           Can't Buy Me Love               1               17
29                          A Hard Day's Night               1               14
48                              Ticket To Ride               1               14
56                                       Help!               1               17
109                       All You Need Is Love               1               16
173                The Ballad Of John And Yoko               1               13
85                               Eleanor Rigby               1               14
87                            Yellow Submarine               1               14
20                    I Want To Hold Your Hand               1               24
45                                 I Feel Fine               1               15
60                                 Day Tripper               1               12
61                          We Can Work It Out               1               12
10                               She Loves You               1               36
155                                   Get Back               1                6
8                               From Me To You               1                7
115                              Hello Goodbye               1                7
2                             Please Please Me               2               20
92                   Strawberry Fields Forever               2               12
93                                  Penny Lane               2               13
107                       Magical Mystery Tour               2               16
176                                  Let It Be               2               14
0                                   Love Me Do               4               26
157                                  Something               4                9
166                              Come Together               4               10
58                                   Yesterday               8               21
135                       Back In The U.S.S.R.              19                3
164                         Here Comes The Sun              58               19
96       Sgt. Pepper's Lonely Hearts Club Band              63               12
105         With A Little Help From My Friends              63                7

我希望按受欢迎程度对这些歌曲进行排名,所以我想根据以下标准对它们进行排序:首先是达到的最高位置的歌曲,但如果有并列的情况,则先考虑在排行榜上停留时间最长的歌曲。
我似乎无法在Pandas中解决这个问题。
6个回答

33
在pandas 0.9.1及更高版本中,这应该可以工作(这是使用0.10.0b1的版本):
(编辑:从Pandas 0.19开始,方法sort_index已被弃用。请优先考虑sort_values方法)
In [23]: songs.sort_index(by=['Peak', 'Weeks'], ascending=[True, False])
Out[23]: 
                                      Song  Peak  Weeks
10                           She Loves You     1     36
118                               Hey Jude     1     27
20                I Want To Hold Your Hand     1     24
22                       Can't Buy Me Love     1     17
56                                   Help!     1     17
76                        Paperback Writer     1     16
109                   All You Need Is Love     1     16
45                             I Feel Fine     1     15
29                      A Hard Day's Night     1     14
48                          Ticket To Ride     1     14
85                           Eleanor Rigby     1     14
87                        Yellow Submarine     1     14
173            The Ballad Of John And Yoko     1     13
60                             Day Tripper     1     12
61                      We Can Work It Out     1     12
117                           Lady Madonna     1      9
8                           From Me To You     1      7
115                          Hello Goodbye     1      7
155                               Get Back     1      6
2                         Please Please Me     2     20
107                   Magical Mystery Tour     2     16
176                              Let It Be     2     14
93                              Penny Lane     2     13
92               Strawberry Fields Forever     2     12
0                               Love Me Do     4     26
166                          Come Together     4     10
157                              Something     4      9
58                               Yesterday     8     21
135                   Back In The U.S.S.R.    19      3
164                     Here Comes The Sun    58     19
96   Sgt. Pepper's Lonely Hearts Club Band    63     12
105     With A Little Help From My Friends    63      7

2
谢谢!您知道是否可以让数据框根据新的顺序重新计算索引吗?(即,使得数据框中每行关联的索引根据新的排序方式增长) - Amelio Vazquez-Reina
3
这是一个老问题,但以防万一还有人需要解决这个问题... 您想要的可以使用pandas.DataFrame.reset_index来实现(尝试 df.reset_index(drop=True, inplace=True))。 - robodasha
重新计算排序后的索引,请尝试使用 df.index = range(len(df)) - visitor
在0.22.0版本中,sort_index仍然可用且未标记为已弃用。 - Jesse

23
自从 pandas 0.17.0 版本开始,sort 已被弃用并被 sort_values 替代。
df.sort_values(['Peak', 'Weeks'], ascending=[True, False], inplace=True)

18
df.sort(['Peak', 'Weeks'], ascending=[True, False], inplace=True)
如果您想要将排序结果用于未来,inplace=True 是必需的。

5
通过使用 .sort() 方法来排序 DataFrame
df.sort(['Peak', 'Weeks'], ascending=[True, False])

将其按峰值位置升序排序,然后在其中按图表长度降序排序。

是的,出于某种原因情况并非如此。我也以为它应该这样工作。 - mpjan
@user1715271 你能详细说明一下吗?比如说,你实际得到了什么? - Jon Clements
1
@user1715271,你正在查看从排序中返回的DataFrame对象,对吗?除非将inplace=True传递给sort,否则原始对象不会改变... - Jon Clements
第二个标准仍按“Peak”列中的降序排序绑定。 - mpjan
当“Peak”列中存在平局时,它会继续按照“Weeks”列的降序进行排序。 - mpjan
显示剩余2条评论

0

pandas.DataFrame.sort_values df.sort_values(['Peak', 'Weeks'], ascending=[True, False])

请在以下链接中查找更多详细信息:


0
如果“Peak”和“Week”的数据类型不是“int”或“float”,则使用以下命令。
df.convert_objects(convert_numeric=True).sort_values(['Peak', 'Weeks'], ascending=[True, False], inplace=True)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接