所以,我试图为我的数据集拟合一个随机森林分类器。我对R非常陌生,我想这应该是一个简单的格式问题。
我读取一个文本文件并转换我的数据集,使其采用以下格式:(省略机密信息)
然而,通过查看我的训练集,我可以清楚地找到该列,例如使用以下方法:
我读取一个文本文件并转换我的数据集,使其采用以下格式:(省略机密信息)
>head(df.train,2)
GOLGA8A ITPR3 GPR174 SNORA63 GIMAP8 LEF1 PDE4B LOC100507043 TGFB1I1 SPINT1
Sample1 3.726046 3.4013711 3.794364 4.265287 -1.514573 7.725775 2.162616 -1.514573 -1.5145732 -1.514573
Sample2 4.262779 0.9261892 4.744096 7.276971 -1.514573 4.694769 4.707387 2.031476 -0.8325444 2.615991
...
...
CD8B FECH PYCR1 MGC12916 KCNA3 resp
Sample1 -1.514573 2.099336 3.427928 1.542951 -1.514573 1
Sample2 -1.145806 1.204241 2.846832 1.523808 1.616791 1
本质上,列是我的特征,行是我的样本,最后一列是我的响应向量,它是一个因素列,resp。
然后我使用:
set.seed(1) #Set the seed in order to gain reproducibility
RF1 = randomForest(resp~., data=df.train,ntree=1000,importance=T,mtry=3)
我试图使用其他列作为特征,对我的列 resp
进行 RF 训练。
但是我收到了错误信息:
Error in eval(expr, envir, enclos) : object 'PCNA-AS1' not found
然而,通过查看我的训练集,我可以清楚地找到该列,例如使用以下方法:
sort(unique(colnames(df.train))
所以我真的不理解这个错误,也不知道该从哪里继续下去。如果我没有正确地提出问题,请谅解,并感谢您的所有帮助!
df.train
样本数据)? - josliber