lm()返回的对象是否有函数或包可以模拟预测?

9

是否有一个类似于“runif”、“rnorm”等函数的单一函数,可以为线性模型生成模拟预测?我能够自己编写代码,但是代码很丑陋,我认为肯定有人做过这样的事情。

slope = 1.5
intercept = 0
x = as.numeric(1:10)
e = rnorm(10, mean=0, sd = 1)
y = slope * x + intercept + e
fit = lm(y ~ x, data = df)
newX = data.frame(x = as.numeric(11:15))

我感兴趣的是一个类似下面这行代码的函数:

functionName(parameter1, parameter2) {

sims = rlm(1000, fit, newX)

该函数将基于新的x变量返回1000个y值模拟结果。

1
你问题中的最后一行让我有点困惑。x 是固定的,你是不是想为新的 x 数据模拟 y(响应)? - Gavin Simpson
抱歉,Gavin,你是正确的。我想说的是响应将被模拟。这已经被编辑过了。 - PirateGrunt
2
好的,你可以查看?simulate,但它只适用于当前的x。但是你可以修改它(simulate.lm()),调用模型对象上的predict(),并使用newdata = newX而不是当前对fitted()的调用,然后允许它按照正常代码进行。假设没有使用weights,因为那会使事情变得复杂... - Gavin Simpson
2
我看到这刚刚来自stats.stackexchange。就其编写方式而言,该问题适用于此处。但我认为,如果以更一般的方式在那里提问,而非涉及具体编程细节,会更有意思。仅是我的想法。 - Seth
1个回答

12

展示了Gavin Simpson修改stats:::simulate.lm的建议是可行的。

## Modify stats:::simulate.lm by inserting some tracing code immediately
## following the line that reads "ftd <- fitted(object)" 
trace(what = stats:::simulate.lm,
      tracer = quote(ftd <- list(...)[["XX"]]),
      at = list(6))

## Prepare the data and 'fit' object 
df <- data.frame(x =x<-1:10, y = 1.5*x + rnorm(length(x)))
fit <- lm(y ~ x, data = df)

## Define new covariate values and compute their predicted/fitted values
newX <- 8:1
newFitted <- predict(fit, newdata = data.frame(x = newX))

## Pass in fitted via the argument 'XX'
simulate(fit, nsim = 4, XX = newFitted)
#        sim_1     sim_2       sim_3     sim_4
# 1 11.0910257 11.018211 10.95988582 13.398902
# 2 12.3802903 10.589807 10.54324607 11.728212
# 3  8.0546746  9.925670  8.14115433  9.039556
# 4  6.4511230  8.136040  7.59675948  7.892622
# 5  6.2333459  3.131931  5.63671024  7.645412
# 6  3.7449859  4.686575  3.45079655  5.324567
# 7  2.9204519  3.417646  2.05988078  4.453807
# 8 -0.5781599 -1.799643 -0.06848592  0.926204

那个方法可以用,但这是更为简洁(也可能更好)的做法:

## A function for simulating at new x-values
simulateX <- function(object, nsim = 1, seed = NULL, X, ...) {
    object$fitted.values <- predict(object, X)
    simulate(object = object, nsim = nsim, seed = seed, ...)
}
    
## Prepare example data and a fit object
df <- data.frame(x =x<-1:10, y = 1.5*x + rnorm(length(x)))
fit <- lm(y ~ x, data = df)

## Supply new x-values in a data.frame of the form expected by
## the newdata= argument of predict.lm()
newX <- data.frame(x = 8:1)
   
## Try it out
simulateX(fit,  nsim = 4, X = newX)
#       sim_1     sim_2     sim_3     sim_4
# 1 11.485024 11.901787 10.483908 10.818793
# 2 10.990132 11.053870  9.181760 10.599413
# 3  7.899568  9.495389 10.097445  8.544523
# 4  8.259909  7.195572  6.882878  7.580064
# 5  5.542428  6.574177  4.986223  6.289376
# 6  5.622131  6.341748  4.929637  4.545572
# 7  3.277023  2.868446  4.119017  2.609147
# 8  1.296182  1.607852  1.999305  2.598428

太棒了。第二个解决方案很好、干净。第一个使用了一些我不曾学过的调试技巧。非常好,谢谢。 - PirateGrunt
@PirateGrunt -- 很高兴你欣赏 trace() 的例子 -- 它是 R 开发和代码探索的真正强大工具。如果你经常使用它,你可能会喜欢这个问题的答案,它使得查找与所需代码插入点对应的 at= 值变得更加容易(尝试一下 Michael Hoffman 回答中的 print.func(),例如 print.func(stats:::simulate.lm))。享受吧! - Josh O'Brien
这个函数如果有多个预测变量会是什么样子? - ego_
2
我知道这篇文章已经七年了(StackOverflow 真是疯狂),但是这里有一个错误。你正在向 simulateX 函数提供新的协变量数据,但是你需要提供的是新的响应数据。如果你在 simulateX 函数调用中将 X = newX 替换为 X = predict(fit, new_data = newX),那么它就可以正常工作了。 - Dalton Hance
@DaltonHance 没错,我已经编辑了我的回答的两个部分来纠正错误。谢谢! - Josh O'Brien

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接