我有一个类似于这样的pandas数据框:
userid name date
1 name1 2016-06-04
1 name2 2016-06-05
1 name3 2016-06-04
1 name1 2016-06-06
2 name23 2016-06-01
2 name2 2016-06-01
3 name1 2016-06-03
3 name6 2016-06-03
3 name12 2016-06-03
3 name65 2016-06-04
因此,我希望保留用户的行数据直到第一个日期事件,并将其余部分剪切。
最终数据框如下:
userid name date
1 name1 2016-06-04
1 name2 2016-06-04
2 name23 2016-06-01
2 name2 2016-06-01
3 name1 2016-06-03
3 name6 2016-06-03
3 name12 2016-06-03
userid int64
name object
time object
时间列中的数据点的type()
是datetime.date
因此,任务涉及按userid分组
,按日期排序
,然后仅保留第一个(最早)日期的行
。