我对R非常陌生,看其他人的问题也很吃力。我认为我的问题非常简单,所以没有人费心去问它。
最简单的代码是什么,可以创建一个新的数据框,该数据框在其条件下排除了单变量离群值(我将其定义为距离其条件平均值3 SD的点)?
我很尴尬地展示了自己尝试过的方法,以下是:
greaterthan <- mean(dat$var2[dat$condition=="one"]) +
2.5*(sd(dat$var2[dat$condition=="one"]))
lessthan <- mean(dat$var2[dat$condition=="one"]) -
2.5*(sd(dat$var2[dat$condition=="one"]))
withoutliersremovedone1 <-dat$var2[dat$condition=="one"] < greaterthan
我已经卡住了,需要帮助。
谢谢
dat$var1
中的值将数据框dat
拆分为块,每个块都被传递给在此定义的函数function(x)
,该函数返回一个没有异常值的数据框,然后调用rbind
函数将来自每个data$var1
类别的所有数据帧作为参数合并 - 这就是“do.call”的神奇之处。 - Spacedman