多级索引数据框的列排序

10
我可以帮助您翻译,请问需要翻译成哪种语言呢?
                  B2                  B5             B3
bkt              A1      A2           A2      A1     Z2      C1
Date                                                                        
2019-06-11       0.8     0.2          -6.0    -0.8   -4.1    -0.6    
2019-06-12       0.8     0.2          -6.9    -1.6   -5.3    -1.2    

df.columns
MultiIndex(levels=[['B2', 'B5', 'B3', .....], ['A1', 'A2' ......]],
           labels=[[1, 1, ....], [1, 0, ....]],
           names=[None, 'bkt'])

我正在尝试仅对列名进行排序,并保留每列中的值不变,以获得以下期望输出:
                 B2                  B3             B5
bkt              A1      A2          C1      Z2     A1      A2
Date                                                                        
2019-06-11       ..
2019-06-12       ..

..表示来自原始数据帧的值。我只是没有重新输入它们。

设置

df = pd.DataFrame([
    [.8, .2, -6., -.8, -4.1, -.6],
    [.8, .2, -6.9, -1.6, -5.3, -1.2]
],
    pd.date_range('2019-06-11', periods=2, name='Date'),
    pd.MultiIndex.from_arrays([
        'B2 B2 B5 B5 B3 B3'.split(),
        'A1 A2 A2 A1 Z2 C1'.split()
    ], names=[None, 'bkt'])
)

2
sort_index(level=0, axis=1)? - BENY
2个回答

13

使用 sort_index 进行排序并将其赋回到原变量

df.columns=df.sort_index(axis=1,level=[0,1],ascending=[True,False]).columns

从 piR 中,我们不需要创建 df 的副本,只需对列进行修改。

df.columns=df.columns.sort_values(ascending=[True, False])

3
为避免创建新的数据框并仅关注于对索引进行排序,请执行以下操作:df.columns = df.columns.sort_values(ascending=[True, False]) - piRSquared
1
@piRSquared 那是真的 :-) - BENY
1
我不确定 @piRSquared 的解决方案是否有效。但是你的原始解决方案确实有效。 - Zanam
你的方法可行,而@piRSquared的方法不行。 - Aaron
此外,这只是重新排列列,并不会将列数据一起移动。要做到这一点,应该是 df.columns=df.sort_index(axis=1,level=[0,1],ascending=[True,False]).columns - Aaron
显示剩余3条评论

6

应使用sort_index来移动列名和数据:

df.sort_index(axis=1, level=[0, 1], ascending=[True, False], inplace=True)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接