我在论坛中搜寻了许多像这样的文章,但没有一个可以解决我的问题。
现在,我求助于您。
我有类似于以下数据:
ontime currency incoterms price month
1 USD FOB 234.2 01
1 CAD FOB 92.4 01
0 USD DAP 238.9 02
0 EUR FOB 100 03
1 CNY DAP 739.8 04
我有这段代码:
g = df$ontime #binary
a = df$currency #String
b = df$INCOTERMS #String
c = df$price #float
f = df$month #string
mod1 <- glm(g~a+b+c,family=binomial(link="logit"), data=df[f=="01",])
pred_ontime1 <- predict(mod1,df[f%in%c("02","03","04"),],type="response")
我的愿望是在01月的数据上训练模型,然后将其应用于02、03和04月的数据以进行测试。
然而我的结果却是这样的:
Warning message:
'newdata' had 16623 rows but variables found have 22488 rows
我曾经尝试在01月进行训练并在01、02、03和04月进行测试,没有出现错误信息,但是在训练集中测试数据似乎不太合适。
16623是02、03和04月行数的总和,而22488是01、02、03和04月行数的总和。
我该怎么办?
pur8
? - conv3d