我有一个包含许多变量的大数据集,看起来类似于这样:
> data.table(a=letters[1:10],b=LETTERS[1:10],ID=c(1,1,1,2,2,2,2,3,3,3))
a b ID
1: a A 1
2: b B 1
3: c C 1
4: d D 2
5: e E 2
6: f F 2
7: g G 2
8: h H 3
9: i I 3
10: j J 3
我希望你能为每个ID的值连接所有列值(之间用换行符分隔),但排除ID列,因此结果应该像这样:
a b ID
1: a A 1
b B
c C
2: d D 2
e E
f F
g G
3: h H 3
i I
j J
我发现了一个链接R Dataframe:在组内跨行聚合列中的字符串,它讲述了如何对一个列进行操作,如何将此扩展到.SD中的所有列?
为了清楚起见,我将分隔符从
\n
更改为,
,结果应该如下: a b ID
1: a,b,c A,B,C 1
2: d,e,f,g D,E,F,G 2
3: h,i,j H,I,J 3