R中的累积和、移动平均和SQL的"group by"等价物

8

在R中创建移动平均或滚动总和的最有效方法是什么?如何对“group by”进行滚动函数操作?

2个回答

10

虽然zoo很棒,但有时还有更简单的方法。如果您的数据表现良好且间隔均匀,则embed()函数可以有效地让您创建时间序列的多个滞后版本。如果您查看矢量自回归的VARS软件包内部,您将看到软件包作者选择了这种方法。

例如,要计算x的3期滚动平均值,其中x = (1 -> 20)^2:

> x <- (1:20)^2
> embed (x, 3)
      [,1] [,2] [,3]
 [1,]    9    4    1
 [2,]   16    9    4
 [3,]   25   16    9
 [4,]   36   25   16
 [5,]   49   36   25
 [6,]   64   49   36
 [7,]   81   64   49
 [8,]  100   81   64
 [9,]  121  100   81
[10,]  144  121  100
[11,]  169  144  121
[12,]  196  169  144
[13,]  225  196  169
[14,]  256  225  196
[15,]  289  256  225
[16,]  324  289  256
[17,]  361  324  289
[18,]  400  361  324
> apply (embed (x, 3), 1, mean)
 [1]   4.666667   9.666667  16.666667  25.666667  36.666667  49.666667
 [7]  64.666667  81.666667 100.666667 121.666667 144.666667 169.666667
[13] 196.666667 225.666667 256.666667 289.666667 324.666667 361.666667

1

我从r列表中获得了Achim Zeileis的很好的答案。这是他说的:

library(zoo)
## create data

x <- rnorm(365)
## transform to regular zoo series with "Date" index

x <- zooreg(x, start = as.Date("2004-01-01")) plot(x)

## add rolling/running/moving average with window size 7 

lines(rollmean(x, 7), col = 2, lwd = 2)

## if you don't want the rolling mean but rather a weekly ## time series of means you can do
nextfri <- function(x) 7 * ceiling(as.numeric(x - 1)/7) + as.Date(1) xw <- aggregate(x, nextfri, mean)

## nextfri is a function which computes for a certain "Date" ## the next friday. xw is then the weekly series. 

lines(xw, col = 4)

Achim接着说:

请注意,滚动平均和聚合序列之间的差异是由于不同的对齐方式造成的。可以通过在rollmean()函数中更改'align'参数或在聚合调用中使用nextfri()函数来更改这种情况。

所有这些都来自Achim,而不是我:http://tolstoy.newcastle.edu.au/R/help/05/06/6785.html


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接