我在data[2-90]中存储了大约90个变量。我怀疑其中有4个变量与data[1]呈现抛物线相关性。我想要确定哪些变量具有这种相关性。是否有一种简单快捷的方法来实现这一点?
我已经尝试构建了这样一个模型(我可以针对每个变量i = 2:90循环执行):
y <- data$AvgRating
x <- data$Hamming.distance
x2 <- x^2
quadratic.model = lm(y ~ x + x2)
然后查看R^2 / 系数,以了解相关性的想法。有没有更好的方法?
也许R可以使用90个变量构建回归模型,并选择自身显著的变量?这样有可能吗?我可以在JMP中进行线性回归,但我不确定我是否可以使用R进行所有变量的非线性回归。因此,我手动尝试着看看哪些变量事先是相关的。如果有一个函数可用于此,那将会很有帮助。
data
是一个data.frame
,那么data[1]
将给出一个只有一列的data.frame
,而lm
函数期望一个向量。使用data[[1]]
可以获取向量。 - snaut