在R中创建移动平均或滚动总和的最有效方法是什么?如何对“group by”进行滚动函数操作?
在R中创建移动平均或滚动总和的最有效方法是什么?如何对“group by”进行滚动函数操作?
虽然zoo很棒,但有时还有更简单的方法。如果您的数据表现良好且间隔均匀,则embed()函数可以有效地让您创建时间序列的多个滞后版本。如果您查看矢量自回归的VARS软件包内部,您将看到软件包作者选择了这种方法。
例如,要计算x的3期滚动平均值,其中x = (1 -> 20)^2:
> x <- (1:20)^2
> embed (x, 3)
[,1] [,2] [,3]
[1,] 9 4 1
[2,] 16 9 4
[3,] 25 16 9
[4,] 36 25 16
[5,] 49 36 25
[6,] 64 49 36
[7,] 81 64 49
[8,] 100 81 64
[9,] 121 100 81
[10,] 144 121 100
[11,] 169 144 121
[12,] 196 169 144
[13,] 225 196 169
[14,] 256 225 196
[15,] 289 256 225
[16,] 324 289 256
[17,] 361 324 289
[18,] 400 361 324
> apply (embed (x, 3), 1, mean)
[1] 4.666667 9.666667 16.666667 25.666667 36.666667 49.666667
[7] 64.666667 81.666667 100.666667 121.666667 144.666667 169.666667
[13] 196.666667 225.666667 256.666667 289.666667 324.666667 361.666667
我从r列表中获得了Achim Zeileis的很好的答案。这是他说的:
library(zoo)
## create data
x <- rnorm(365)
## transform to regular zoo series with "Date" index
x <- zooreg(x, start = as.Date("2004-01-01")) plot(x)
## add rolling/running/moving average with window size 7
lines(rollmean(x, 7), col = 2, lwd = 2)
## if you don't want the rolling mean but rather a weekly ## time series of means you can do
nextfri <- function(x) 7 * ceiling(as.numeric(x - 1)/7) + as.Date(1) xw <- aggregate(x, nextfri, mean)
## nextfri is a function which computes for a certain "Date" ## the next friday. xw is then the weekly series.
lines(xw, col = 4)
Achim接着说:
请注意,滚动平均和聚合序列之间的差异是由于不同的对齐方式造成的。可以通过在
rollmean()
函数中更改'align'参数或在聚合调用中使用nextfri()
函数来更改这种情况。
所有这些都来自Achim,而不是我:http://tolstoy.newcastle.edu.au/R/help/05/06/6785.html