我有一个包含两个列的数据框,分别是ID编号和品牌:
我要找到最常出现的三个品牌组合,与id号相关:
我尝试过: library(dplyr)
X1 X2
1234 A89
1234 A87
1234 A87
1234 A32
1234 A27
1234 A27
1235 A12
1235 A14
1235 A14
1236 A32
1236 A32
1236 A27
1236 A12
1236 A12
1236 A14
1236 A89
1236 A87
1237 A99
1237 A98
我要找到最常出现的三个品牌组合,与id号相关:
A89, A87
A32, A27
A12, A14
我尝试过: library(dplyr)
df %>%
group_by(X1,X2) %>%
mutate(n = n()) %>%
group_by(X1) %>%
slice(which.max(n)) %>%
select(-n)
但它无法正确工作。我会感激任何想法或建议!
df = df[sapply(df, function(x) length(unique(x))) > 1]
进行子集划分来实现这一点。 - Mike S