将带有多级索引列的2D数据从pandas转换为1D。

4

我有一个包含索引和列的简单二维数据框。我需要按照我的同事的布局将其导出到Excel文件中,例如使用具有2个层级的多索引列的单行。第一层对应于我的数据框索引,第二层对应于我的数据框列。

我的数据框:

          Ah-Step    Wh-Step     T[°C]
C-Rate                                
1C     -30.133791 -63.016814  30.86355
2C     -25.557269 -51.937002  37.10111
3C     -20.338776 -40.632206  43.84840
4C      -8.023851 -16.609749  45.63529
5C      -3.868425  -8.111969  46.74843

我需要的是:

          1C                              2C                              3C  \
     Ah-Step    Wh-Step     T[°C]    Ah-Step    Wh-Step     T[°C]    Ah-Step   
0 -30.133791 -63.016814  30.86355 -25.557269 -51.937002  37.10111 -20.338776   

                             4C                             5C            \
     Wh-Step    T[°C]   Ah-Step    Wh-Step     T[°C]   Ah-Step   Wh-Step   
0 -40.632206  43.8484 -8.023851 -16.609749  45.63529 -3.868425 -8.111969   


      T[°C]  
0  46.74843  

我目前的解决方案(我的数据框由“Summary”变量持有,“writer”用于导出到Excel):

m_cols = pd.MultiIndex.from_product([Summary.index.tolist(),
                            Summary.columns.tolist()])
df = pd.DataFrame(data=pd.np.zeros((1,15)),
                  columns=m_cols)
for c in Summary.index:
    for k in Summary.columns:
        df[c,k].iloc[0] = Summary.loc[c,k]
df.to_excel(writer,sheet_name='Summary')

我的解决方案缺乏对变化的抵抗力,也不够优雅。

是否有一种内嵌方法可以做到这样,而不需要使用for循环和预先分配一个带有零的行?

2个回答

11

您可以使用stack方法将列索引转换为新的行索引级别:

In [61]: df.stack()
Out[61]: 
C-Rate         
1C      Ah-Step   -30.133791
        T[°C]      30.863550
        Wh-Step   -63.016814
2C      Ah-Step   -25.557269
        T[°C]      37.101110
        Wh-Step   -51.937002
3C      Ah-Step   -20.338776
        T[°C]      43.848400
        Wh-Step   -40.632206
4C      Ah-Step    -8.023851
        T[°C]      45.635290
        Wh-Step   -16.609749
5C      Ah-Step    -3.868425
        T[°C]      46.748430
        Wh-Step    -8.111969
dtype: float64

好处是,这个过程会自动为您构建多级索引。坏处是,这是一个Series,而不是DataFrame,并且它是纵向定位的,而不是横向。为了解决这个问题,请调用to_frame并进行转置:


import pandas as pd
df = pd.DataFrame({'Ah-Step': [-30.133791, -25.557269, -20.338776, -8.023850999999999, -3.868425], 'T[°C]': [30.86355, 37.10111, 43.8484, 45.635290000000005, 46.74843], 'Wh-Step': [-63.016814000000004, -51.937002, -40.632206, -16.609749, -8.111969]}, index=pd.Series(['1C', '2C', '3C', '4C', '5C'], name='C-Rate')) 
result = df.stack().to_frame().T
print(result)

产出率
C-Rate         1C                              2C                       \
          Ah-Step     T[°C]    Wh-Step    Ah-Step     T[°C]    Wh-Step   
0      -30.133791  30.86355 -63.016814 -25.557269  37.10111 -51.937002   

C-Rate         3C                            4C                       \
          Ah-Step    T[°C]    Wh-Step   Ah-Step     T[°C]    Wh-Step   
0      -20.338776  43.8484 -40.632206 -8.023851  45.63529 -16.609749   

C-Rate        5C                      
         Ah-Step     T[°C]   Wh-Step  
0      -3.868425  46.74843 -8.111969  

1
或者使用 unstack
 df.T.unstack().to_frame().T
    Out[139]: 
    C-Rate         1C                              2C                       \
              Ah-Step    Wh-Step     T[°C]    Ah-Step    Wh-Step     T[°C]   
    0      -30.133791 -63.016814  30.86355 -25.557269 -51.937002  37.10111   
    C-Rate         3C                            4C                       \
              Ah-Step    Wh-Step    T[°C]   Ah-Step    Wh-Step     T[°C]   
    0      -20.338776 -40.632206  43.8484 -8.023851 -16.609749  45.63529   
    C-Rate        5C                      
             Ah-Step   Wh-Step     T[°C]  
    0      -3.868425 -8.111969  46.74843 

unstack 做的是我不想要的相反操作。 - hyamanieu
你的意思是我的输出不符合你的要求吗? - BENY
级别已交换。 - hyamanieu

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接