线性回归中的R分类变量

7

我希望在R中对一个有3个级别的分类变量进行线性回归。具体来说,我的数据如下:

Y = 1, X= "Type 1", A=0.5

Y = 2, X= "Type 2", A=0.3

Y =0.5,X= "Type 3", A=2

我只需要简单地执行以下操作吗? lm(Y~ X+ A)

1
我建议引入3个虚拟变量(每种类型0-1个)。或者如果它们是名义变量,您可以将它们建模为1、2、3。 - M--
1
是的,lm(Y ~ X + A) 可以正常工作。如果 X 还不是一个因子但是是一个字符串向量,lm 将把它视为因子,在模型中使用第一个值作为参考类别,并包括每个其他水平的虚拟变量。如果 X 是一个因子,那就没问题了。 - ulfelder
1个回答

1
将X转换为因子,然后使用lm(Y ~ X + A)。或者您可以使用caret包中的dummyvars。
dummy_train<-dummyVars(" ~ .",data=<insert_data_name>)
dummy_train<-data.frame(predict(dummy_train,newdata=<insert_the_same_data_name>))

你可以对此进行回归分析。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接