我一直在使用Pandas分析时间序列数据,但在将其集成到透视表中时遇到了困难。我手头上有一个CSV格式的数据:
gov start end
a 2015-12-08T16:05:00.980+03 2015-12-08T16:14:31.765+03
a 2015-12-08T16:07:53.356+03 2015-12-08T16:34:43.413+03
b 2015-12-08T16:08:43.371+03 2015-12-08T16:54:32.257+03
b 2015-12-08T15:56:12.006+03 2015-12-08T17:35:04.499+03
我有一组简单的数据,包括一个开始时间
和一个结束时间
,需要从中计算两者的时间差:
piv_t_subset = pd.read_csv('time_test.csv', parse_dates=['start','end'])
piv_t_subset['time_diff'] = piv_t_subset['end'] - piv_t_subset['start']
我可以计算时间的独立平均值,如下所示:
:
t = piv_t_subset['time_diff'].mean()
print t
0 days 00:18:53.703286
我想使用这个时间信息创建一个数据透视表,但是当我尝试时:
pd.pivot_table(piv_t_subset,index=["gov"],values=['time_diff'],aggfunc=[np.mean])
我遇到了以下错误:
DataError: 没有数值类型可以聚合
我需要进行更多的预处理才能将它从 timeseries
转换为 float
吗?