我有一个包含时间序列数据的numpy数组。我想将该数组分成给定长度的等分区间(如果最后一段不是相同大小则舍弃),然后计算每个区间的平均值。
我猜想numpy、scipy或pandas都可以实现这个功能。
示例:
data = [4,2,5,6,7,5,4,3,5,7]
对于 bin size 为 2:
bin_data = [(4,2),(5,6),(7,5),(4,3),(5,7)]
bin_data_mean = [3,5.5,6,3.5,6]
对于3个元素为一组的容器大小:
bin_data = [(4,2,5),(6,7,5),(4,3,5)]
bin_data_mean = [7.67,6,4]
pandas.rolling_mean
:http://pandas.pydata.org/pandas-docs/stable/computation.html#moving-rolling-statistics-moments - Joe Kington