重新分组Pandas MultiIndex列

4

我遇到了一个问题,就是给多级索引列的DataFrame添加新列时,新列会被追加到DataFrame的末尾。例如:

Group 1         | Group 2        | Group 1 | Group 2 |
------------------------------------------------------
Sub 1  | Sub 2  | Sub 1  | Sub 2 | New Sub | New Sub |

我需要的是:

Group 1                   | Group 2                  |
------------------------------------------------------
Sub 1  | Sub 2  | New Sub | Sub 1  | Sub 2 | New Sub |

有没有一种方法可以重新对我的多级索引进行分组/排序以实现此目的?注意-我不想按名称重新排序子组,因为新子组需要放在最后,按字母顺序可能无法正确排序。


你如何设置它? - cs95
2个回答

5

我认为你需要使用自定义list进行reindexreindex_axis

df1=pd.DataFrame(columns=pd.MultiIndex.from_product((('C','R', 'A'),(1,2))),
                 data=np.arange(6).reshape(1,-1))
df2=pd.DataFrame(columns=pd.MultiIndex.from_tuples((('C','3'),('R',5),('A',4))),
                 data=[[9,9,4]])
df=df1.join(df2)
print (df)
  C     R     A     C  R  A
   1  2  1  2  1  2  3  5  4
0  0  1  2  3  4  5  9  9  4

df1 = df.reindex(columns = ['C','R','A'], level=0)
print (df1)
   C        R        A      
   1  2  3  1  2  5  1  2  4
0  0  1  9  2  3  9  4  5  4

df1 = df.reindex_axis(['C','R','A'], level=0, axis=1)
print (df1)
   C        R        A      
   1  2  3  1  2  5  1  2  4
0  0  1  9  2  3  9  4  5  4

Jezrael,方法1和方法2有什么区别? - cs95
1
我认为没有任何解决方案(也许我错了),还有其他的选择。 - jezrael
但是个人更喜欢reindex_axis,但我无法解释为什么 ;) - jezrael
太好了。我最终使用了df1=df.reindex(columns=df.columns.levels[0], level=0),因为分组取决于导入的文件而有所不同。这似乎保留了顺序,同时正确地重新分组了所有内容。谢谢! - MarkD

2

在设置完之后,您只需要调用df.sort_index即可:

df1=pd.DataFrame(columns=pd.MultiIndex.from_product((('a','b'),
(1,2))),data=np.arange(4).reshape(1,-1))
df2=pd.DataFrame(columns=pd.MultiIndex.from_tuples((('a','3'),('b',5))),data=[[9,9]])
df=df1.join(df2)

#    a     b     a  b
#    1  2  1  2  3  5
# 0  0  1  2  3  9  9

df.sort_index(axis=1,inplace=True)

#    a        b      
#    1  2  3  1  2  5
# 0  0  1  9  2  3  9

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接