我能在R中为Cox比例风险模型执行所有子集的变量选择吗?

5

我正在尝试使用类似于“regsubsets”的函数,如果不是真的,在R程序中选择最佳Cox比例风险模型来处理我的数据。这是否可行?如果是,是否已存在此类函数?


2
你应该首先认真质疑这是否是一个好主意。 - IRTFM
你推荐哪种模型选择程序?在接受一个模型为“最佳”之前,看看竞争模型有多接近不合适吗? - marcellt
你应该首先考虑调查领域的基础科学。除非目标明确,否则不可能推荐“最佳程序”。 - IRTFM
1
我阅读了您提供的链接,他们似乎都非常批评逐步变量选择。这正是我试图寻找另一种变量选择方法(所有子集)的原因。 - marcellt
1
据我所知,没有这种功能。您可能想要使用 glmulti 这样的工具。这里有一篇很好的子集回归综述文章。如果您只有少量候选模型,可以使用循环生成替代模型并将感兴趣的结果存储在数据框中,然后进行排序。正如您所看到的,即使是数量适中的预测因子,计算上也变得相当苛刻。您可能需要考虑一种使这样的循环并行运行的方法。另一种选择是将回归的密集部分重写为编译语言... - dardisco
显示剩余2条评论
1个回答

0

我猜你已经熟悉以下内容了... 如果你使用AIC作为“最佳模型”的标准,那么这将是一个合理的起点:

library(survival)
data(colon)
c1 <- coxph(Surv(time=time, event=status) ~
     as.factor(extent) + age + sex, data=colon)
step(c1)

如果你有缺失值(NA),请小心使用此方法。当然,可能存在更好的模型,但是在潜在预测因子数量较少的情况下,你不太可能错过它。关于使用数值方法而不是可靠的知情意见,请注意上述警告(感谢 @DWin)。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接