我在使用 dplyr do
时,向 forecast.lm
传递数据时遇到了一些问题。我想基于一个因素 - hour
- 建立多个模型,并使用新数据对这些模型进行预测。
在之前的优秀示例的基础上,这是我的数据示例:
require(dplyr)
require(forecast)
# Training set
df.h <- data.frame(
hour = factor(rep(1:24, each = 100)),
price = runif(2400, min = -10, max = 125),
wind = runif(2400, min = 0, max = 2500),
temp = runif(2400, min = - 10, max = 25)
)
# Forecasting set
df.f <- data.frame(
hour = factor(rep(1:24, each = 10)),
wind = runif(240, min = 0, max = 2500),
temp = runif(240, min = - 10, max = 25)
)
# Bind training & forecasting
df <- rbind(df.h, data.frame(df.f, price=NA))
# Do a training model and then forecast using the new data
df <- rbind(df.h, data.frame(df.f, price=NA))
res <- group_by(df, hour) %>% do({
hist <- .[!is.na(.$price), ]
fore <- .[is.na(.$price), c('hour', 'wind', 'temp')]
fit <- Arima(hist$price, xreg = hist[,3:4], order = c(1,1,0))
data.frame(fore[], price=forecast.Arima(fit, xreg = fore[ ,2:3])$mean)
})
res
这个方法在时间序列模型中表现出色,但是使用lm
模型时,在传递数据到预测部分时遇到了问题。
我的相应lm
示例如下:
res <- group_by(df, hour) %>% do({
hist <- .[!is.na(.$price), ]
fore <- .[is.na(.$price), c('hour', 'wind', 'temp')]
fit <- lm(hist$price ~ wind + temp, data = hist)
data.frame(fore[], price = forecast.lm(fit, newdata = fore[, 2:3])$mean)
})
问题在于我无法将数据输入到
newdata =
函数中。如果在拟合部分添加hist$
,则无法引用预测数据,而且出于某种原因,如果添加data = fore
,它会找不到它 - 但是在时间序列示例中可以找到它。