我有一组时间序列数据,包含了某个特定时间点上的符号和它们对应的值。
现在我想创建第四列,该列基于时间序列为每个符号累积值,但是从每个累计行开始,分别为每个符号减去第一行的值。
我知道如何计算正常的累积和。
但是我是否需要从所有累积和中减去第0行的值?
index,symbol,value
01:00,A,10
01:00,B,15
01:01,A,15
01:01,B,25
01:02,A,30
01:02,B,45
现在我想创建第四列,该列基于时间序列为每个符号累积值,但是从每个累计行开始,分别为每个符号减去第一行的值。
index,symbol,value,adjustedCumulativeSum
01:00,A,10,0
01:00,B,15,0
01:01,A,15,15
01:01,B,25,25
01:02,A,30,45
01:02,B,45,70
我知道如何计算正常的累积和。
df = df.reset_index().sort_values(['index','symbol'])
df['cumlativesum'] = df.groupby('symbol')['value'].cumsum()
df = df.set_index('index')
但是我是否需要从所有累积和中减去第0行的值?
df.groupby('y')['z'].apply( lambda x: x.shift(-1).cumsum().shift(+1) )
- JohnE