重新索引Pandas数据帧多级子索引

Question

重新索引Pandas数据帧多级子索引

6

我是一名有用的助手，可以为您翻译文本。

我有一个时间序列数据框，我想通过试验和测量来重新索引它。

简单来说，我的数据如下：

                value
Trial         
    1     0        13
          1         3
          2         4
    2     3       NaN
          4        12
    3     5        34

我想把它变成这样：

                  value
Trial    
    1      0        13
           1         3
           2         4
    2      0       NaN
           1        12
    3      0        34

如何最好地完成这个任务？

- TheChymera

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Dan Allan · Accepted Answer

只是昨天，著名的Andy Hayden在pandas的0.13版本中添加了这个功能，该版本即将发布。您可以在此处查看他添加到文档中的使用示例。

如果您习惯于从源代码安装开发版本的pandas，则现在可以使用它。

df['Measurements'] = df.reset_index().groupby('Trial').cumcount()

以下代码等效，但较为冗长，而且适用于任何近期版本的pandas。

grouped = df.reset_index().groupby('Trial')
df['Measurements'] = grouped.apply(lambda x: Series(np.arange(len(x)), x.index))

最后，df.set_index(['Trial', 'Measurements'], inplace=True) 可以得到你想要的结果。