我有一个分层Cox模型,并希望基于该模型预测特定配置文件的生存曲线。
现在,由于我正在使用大型数据集和许多层,我只想为非常特定的层进行预测,以节省时间和内存。
survfit.coxph
的帮助页面指出:... 如果newdata包含分层变量,则结果将根据原始模型的指定分层包含newdata的每一行的一个曲线。
当我运行下面的代码时,其中newdata确实包含分层变量,我仍然会得到两个层的预测,这与帮助页面相矛盾。
df <- data.frame(X1 = runif(200),
X2 = sample(c("A", "B"), 200, replace = TRUE),
Ev = sample(c(0,1), 200, replace = TRUE),
Time = rexp(200))
testfit <- coxph( Surv(Time, Ev) ~ X1 + strata(X2), df)
out <- survfit(testfit, newdata = data.frame(X1 = 0.6, X2 = "A"))
我是否在这里看漏或理解有误?