为什么我在对多级索引的DataFrame进行rolling操作时不能使用偏移量?例如,使用以下代码:
rng = pd.date_range('2017-01-03', periods=20, freq='8D')
i = pd.MultiIndex.from_product([['A','B','C'], rng], names=['Name','Date'])
df = pd.DataFrame(np.random.randn(60), i, columns=['Vals'])
如果我尝试使用偏移量进行分组和滚动,会出现“ValueError: window must be an integer”的错误提示:
df['Avg'] = df.groupby(['Name'])['Vals'].rolling('30D').mean() # << Why doesn't this work?
虽然以下的变量不符合我的需求,但是请注意使用int
进行分组和滚动是可行的:
df['Avg'] = df.groupby(['Name'])['Vals'].rolling(4).mean()
我可以在DataFrame的单索引子集上使用偏移量进行滚动:
d = df.loc['A']
d['Avg'] = d['Vals'].rolling('30D').mean()
如果在多索引数据框上无法进行滚动偏移操作,那么应该采用什么最有效的解决方法来将其应用于每个0级索引项?