我有一个表格,其中一列是发生日期(数据框没有按日期索引)
我想按日期分组表格,其中所有早于某个日期的项目都被分为一个桶。这需要是累积的,因此后面的桶将包括早期桶中的所有数据点。
这是我需要按组的日期范围对象:
date_rng = date_range('28/02/2010','31/08/2014',freq='3M')
这里有一个数据表中的几个数据点示例:
df_raw.head()
Ticker FY Periodicity Measure Val Date
0 BP9DL90 2009 ANN CPX 1000.00 2008-03-31 00:00:00
1 BP9DL90 2010 ANN CPX 600.00 2009-03-25 00:00:00
2 BP9DL90 2010 ANN CPX 600.00 2009-09-16 00:00:00
3 BP9DL90 2011 ANN CPX 570.00 2010-03-17 00:00:00
4 BP9DL90 2011 ANN GRM 57.09 2010-09-06 00:00:00
[5 rows x 6 columns]
任何意见都将不胜感激。
谢谢。
cumsum()
或pd.rolling_apply()
来获得“运行总计”。 - Lucianopd.read_csv()
的index_col
和parse_dates
参数),然后您可以轻松地循环,如下所示:for d in date_range: print(df_raw[:d])
,这将打印出截止到日期d的(子)表格。 - Luciano