在R中进行滚动加权平均(多个观测值)

4

有没有一种快速的函数能够计算加权滚动平均值?这是必要的,因为我每个数据点(秒数变化)有多个观测值(不总是相同数量),我需要对其进行平均。当我进行滚动平均时,我想重新加权以获得无偏的滚动平均。

到目前为止,我想出了这个解决方案(在这个例子中使用3秒的窗口)。

sam <- data.table(val_mean=c(1:15),N=c(11:25))

sam[,weighted:=val_mean*N]

sam[,rollnumerator:=rollapply(weighted,3,sum,fill=NA,align="left")]

sam[,rolldenominator:=rollapply(N,3,sum,fill=NA,align="left")]

sam[,rollnumerator/rolldenominator]

我找不到任何已经解决这个问题的问题。

这不是关于数据间距不均匀的问题:我可以通过将我的数据表扩展为包括每秒钟的NAs来解决这个问题(上面的示例是等间隔的)。此外,我不想在RcppRoll的roll_mean中包含权重:在那里,权重对于所有时间窗口是固定的(“一个长度为n的向量,给出窗口内每个元素的权重”),而在我的情况下,权重根据当前处理的值而改变。 第三,我不想要自适应窗口大小,它应该保持不变(比如3秒钟)。

1个回答

5

1) 使用 by.column = FALSE

library(data.table)
library(zoo)

wmean <- function(x) weighted.mean(x[, 1], x[, 2])
sam[, rollapplyr(.SD, 3, wmean, by.column = FALSE, fill = NA, align = "left")]

2)另一种方法是将值和权重编码成一个复向量:

wmean_cmplx <- function(x) weighted.mean(Re(x), Im(x))
sam[, rollapply(complex(real = val_mean, imag = N), 3, wmean_cmplx, 
  fill = NA, align = "left")]

  1. 这是一个好的解决方案,我完全忽略了这个选项,对于我的使用情况来说速度不应该是什么问题。
- maxpe

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接