我正在处理一个预测问题,在R中构建决策树,我的数据有几个分类变量,我想在训练集和测试集中一致的进行独热编码。我已经成功的在训练集上使用如下代码完成了独热编码:
temps <- X_train
tt <- subset(temps, select = -output)
oh <- data.frame(model.matrix(~ . -1, tt), CLASS = temps$output)
但我找不到在测试集上应用相同编码的方法,我该怎么做?
但是我无法找到一种在我的测试集上应用相同编码的方法,我该怎么做?