我有一个包含“DATE_TIME”列的pandas数据框架。
我想在时间间隔大于5分钟时将数据框拆分为不同的数据框。
我发现这篇帖子非常有用,但它没有解决我的问题,因为它没有创建数据框。我找不到错误:
非常感谢您的帮助!
DATE_TIME | SAMPLE | VALUE |
---|---|---|
2020-12-10 10:52:48 | 1 | 3.22 |
2020-12-10 10:52:54 | 2 | 2.93 |
2020-12-10 10:53:00 | 3 | 2.27 |
我发现这篇帖子非常有用,但它没有解决我的问题,因为它没有创建数据框。我找不到错误:
all_data["DATE_TIME"] = pd.to_datetime(all_data["DATE_TIME"])
group_samples = (all_data["DATE_TIME"].dt.minute > (all_data["DATE_TIME"].dt.minute.shift() + 5)).cumsum()
grouped = all_data["DATE_TIME"].dt.minute.groupby(group_samples)
group_list = [g for k,g in grouped]
group_list[2]
Out[]
1097 53
1100 53
1103 53
1106 54
1109 54
1112 54
1115 54
1118 54
1121 54
1124 54
1127 55
1130 55
...
非常感谢您的帮助!
grouped = all_data["DATE_TIME"].dt.minute.groupby(group_samples)
should just begrouped = all_data.groupby(group_samples)
- Asish M.