我有一个如下的数据框:请注意,
我希望输出结果如下所示:即
输出结果:
COL1
中有重复的条目。COL1 COL2 COL3
10 hai 2
10 hai 3
10 pal 1
我希望输出结果如下所示:即
COL1
应该只有独特的条目(10),COL2
应该包含其下的合并条目而无重复项(hai pal),COL3
应包含条目的总和(2+3+1=6)。输出结果:
COL1 COL2 COL3
10 hai pal 6
dplyr
,可以这样对数据框进行分组汇总:df %>% group_by(COL1) %>% summarise(COL2 = paste0(unique(COL2), collapse = " "), COL3 = sum(COL3))
。 - Ronak Shahdf2 <- setDT(df1)[,.(COL2 = paste(unique(COL2), collapse=" "), COL3= sum(COL3)) , by = COL1]
如果你需要转换为 data.frame,则使用setDT(df2)
。 - akrunlibrary(data.table)
。如果没有安装,则需要执行install.packages("data.table")
。 - akrun