好的,我已经阅读了这里的很多帖子,我有点尴尬,因为我以为我理解了基本的dplyr
函数。
我无法使用group_by
形成分组,我感到困惑。
我有数据框test
。我只想按变量ID
分组,然后计算每个组中两个变量之间的相关性。
我不知道发生了什么,因为它没有分组,并且只输出一个相关性,而我应该有127个组和127个相关性。为什么?
test
长这样:
我写的内容:
library(dplyr)
library(magrittr)
test%>%
mutate(ID=as.character(ID))%>%
group_by(ID)%$%
cor(sulfate,nitrate,use="complete.obs")
我得到的是:
[1] 0.0568084
。
%>%
运算符,但也使用了曝光%$%
运算符,该运算符未预装在dplyr
中。 - delcastby(test, test$ID, function(X) cor(X$sulfate, X$nitrate, use = "p"))
。也许甚至可以复制到(但不是dplyr
解决方案):在R中按组计算Spearman相关性。 - pogibas%$%
运算符。感谢您的问题,因为我们都得到了CalumYou的非常好的答案。 - Emil