我有一个相关矩阵,我把它放在一个数据框中,如下所示:
row | var1 | var2 | cor
1 | A | B | 0.6
2 | B | A | 0.6
3 | A | C | 0.4
4 | C | A | 0.4
这些结果被复制成了两行,包含了"var1"和"var2"的所有组合。我只需要其中一个,最好是把较小的变量放在前面(例如第1行和第3行)。
我已经尝试使用dplyr函数库和查询相关主题,但没有找到所需的内容。
# get correlation of every concept versus every concept
data.cor <- data.jobs %>%
select(-y,-X) %>%
as.matrix %>%
cor %>%
as.data.frame %>%
rownames_to_column(var = 'var1') %>%
gather(var2, value, -var1)
我希望输出的结果如下所示:
row | var1 | var2 | cor
1 | A | B | 0.6
3 | A | C | 0.4
我试图在不使用循环的情况下完成此操作。