计算事件之间的时间差

3
我有一个数据框。
df = pd.DataFrame({'State': {0: "A", 1: "B", 2:"A", 3: "B", 4: "A", 5: "B", 6 : "A", 7: "B"}, 
               'date': {0: '2016-10-13T14:10:41Z', 1: '2016-10-13T14:10:41Z', 2:'2016-10-13T15:26:19Z',
                        3: '2016-10-14T15:26:19Z', 4: '2016-10-15T15:26:19Z', 5: '2016-10-18T15:26:19Z',
                        6 :'2016-10-17T15:26:19Z', 7: '2016-10-13T15:26:19Z'}}, columns=['State', 'date'])

我需要计算每个a事件和其后续b事件之间的平均时间。我尝试使用 shift 生成一系列差异进行平均值计算,但是我还没有成功。
谢谢!
1个回答

3

首先,将日期转换为datetime格式,然后使用DataFrame.diff函数:

df.date = pd.to_datetime(df.date)
df.date.diff()

产生如下结果:
0                 NaT
1     0 days 00:00:00
2     0 days 01:15:38
3     1 days 00:00:00
4     1 days 00:00:00
5     3 days 00:00:00
6   -1 days +00:00:00
7   -4 days +00:00:00
Name: date, dtype: timedelta64[ns]

如果您想要平均值,可以这样做:
df.date.diff().mean() # or possibly df.date.diff().abs().mean()
# Timedelta('0 days 00:10:48.285714')

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接