我有一个特定的 R 数据框问题,目前还没有找到解决方案。
我有一个包含相同信息(重复或 Id1/Id2 组合)的数据框,形式如下:
df_test <- data.frame(Id1= c("1", "1", "2", "3", "11", "5", "6", "7"),
Id2= c("4", "4", "6", "11", "3", "6", "2", "9" ))
df_test
Id1 Id2
1 1 4
2 1 4
3 2 6
4 3 11
5 11 3
6 5 6
7 6 2
8 7 9
我想要实现的是一个数据框,其中包含所有重复和相同信息行的计数,并在单独的一列中保留一个重复的行。挑战在于不仅要识别重复项,还要识别相同的Id1/Id2组合。类似下面的方式:
df_sol
Id1 Id2 Sum
1 1 4 2
2 2 6 2
3 3 11 2
4 5 6 1
5 7 9 1
我尝试过使用
aggregate
和summarise
,但是我还没有找到解决方案。另一个想法是使用igraph
包并将其视为edgelist
,然后使用edge.attr.comb = list(weight= "sum")
?谢谢。 #dataframe for solution:
df_sol <- data.frame(Id1= c("1", "2", "3", "5", "7"),
Id2= c("4", "6", "11", "6", "9" ),
Sum =c("2", "2", "2", "1", "1"))