当前的数据框:
ID Date
11 3/19/2018
22 1/5/2018
33 2/12/2018
.. ..
我有一个包含ID和日期的df。在原始df中,每个ID都是唯一的。 我想基于日期创建一个新的df。每个ID都有一个最大日期,我想使用该日期并向后推4天(每个ID的5行)。 有成千上万个ID。
期望得到:
ID Date
11 3/15/2018
11 3/16/2018
11 3/17/2018
11 3/18/2018
11 3/19/2018
22 1/1/2018
22 1/2/2018
22 1/3/2018
22 1/4/2018
22 1/5/2018
33 2/8/2018
33 2/9/2018
33 2/10/2018
33 2/11/2018
33 2/12/2018
… …
我尝试了以下方法,我认为使用
date_range
可能是正确的方向,但我一直得到错误。
pd.date_range
def date_list(row):
list = pd.date_range(row["Date"], periods=5)
return list
df["Date_list"] = df.apply(date_list, axis = "columns")