我正在对超过1000个样本数据运行多次逻辑回归。我的问题是什么是展示结果的最佳方式?怎样可以绘制拟合和预测曲线的输出?
以下是我所做的一个示例,使用来自R的棒球数据集。例如,我想要拟合并预测模型5次。每次我从中取出一个样本(用于预测),并使用另一个样本进行拟合。
library(corrgram)
data(baseball)
#Exclude rows with NA values
dataset=baseball[complete.cases(baseball),]
#Create vector replacing the Leage (A our N) by 1 or 0.
PA=rep(0,dim(dataset)[1])
PA[which(dataset[,2]=="A")]=1
#Model the player be league A in function of the Hits,Runs,Errors and Salary
fit_glm_list=list()
prd_glm_list=list()
for (k in 1:5){
sp=sample(seq(1:length(PA)),30,replace=FALSE)
fit_glm<-glm(PA[sp[1:15]]~baseball$Hits[sp[1:15]]+baseball$Runs[sp[1:15]]+baseball$Errors[sp[1:15]]+baseball$Salary[sp[1:15]])
prd_glm<-predict(fit_glm,baseball[sp[16:30],c(6,8,20,21)])
fit_glm_list[[k]]=fit_glm;prd_glm_list[[k]]=fit_glm
}
corrgram
? - Sethfit_glm$family
返回的是“高斯分布”。 - Tomas