我正在尝试将一个未堆叠的、多索引的数据框转换回一个单独的pandas日期时间索引。
我的原始数据框的索引,在进行多索引和取消堆叠之前,看起来像这样:
In [1]: df1_season.index
Out [1]:
<class 'pandas.tseries.index.DatetimeIndex'>
[2013-05-01 02:00:00, ..., 2014-07-31 23:00:00]
Length: 1472, Freq: None, Timezone: None
然后我使用多重索引和取消堆叠来绘制每年的数据,使它们像这样叠放在一起:
df_sort = df1_season.groupby(lambda x: (x.year, x.month, x.day, x.hour)).agg(lambda s: s[-1])
df_sort.index = pd.MultiIndex.from_tuples(df_sort.index, names=['Y','M','D','H'])
unstacked = df_sort.unstack('Y')
我五月前两天的新数据框架如下:
In [2]: unstacked
Out [2]:
temp season
Y 2013 2014 2013 2014
M D H
5 1 2 24.2 22.3 Summer Summer
8 24.1 22.3 Summer Summer
14 24.3 23.2 Summer Summer
20 24.6 23.2 Summer Summer
2 2 24.2 22.5 Summer Summer
8 24.8 22.2 Summer Summer
14 24.9 22.4 Summer Summer
20 24.9 22.8 Summer Summer
736 rows × 4 columns
新的数据框架的索引现在如下所示:
In [2]: unstacked.index.values[0:8]
Out [2]:
array([(5, 1, 2), (5, 1, 8), (5, 1, 14), (5, 1, 20), (5, 2, 2), (5, 2, 8), (5, 2, 14),
(5, 2, 20], dtype=object)
当前解决方案:
由于x轴刻度(主要和次要)的问题,绘制出来的图形效果不是很好。如果我可以将这个多级索引转换回仅使用月份、日期和小时数据的单个Pandas日期时间索引,则主/次要刻度将自动绘制出我所期望的方式(我想)。例如:
xticks = (5, 1, 2), (5, 1, 8) … (5, 2, 20)
所需解决方案:
xticks(major) = Day, Month (displayed as MAY 01, MAY 02 etc etc)
xticks(minor) = Hour (displayed as 02h 08h … 20h)