我有一个类似于下面的数据集:
SSN Auto MtgHe Personal Other None
A 1 1 0 0 0
B 1 1 0 0 0
C 1 0 0 0 0
D 1 0 1 1 0
E 0 0 0 0 1
F 0 0 0 0 1
G 0 0 0 0 1
SSN是指个人社会安全号码,Auto、MtgHe、Personal和Other是贷款类别,“None”表示没有贷款。共有15种不同的贷款组合方式,另外还有一种可能性是“None”,代表没有任何贷款。例如,一个人可能只有汽车贷款,或者同时有汽车贷款和个人贷款,或者根本没有贷款。我想要统计每种不同组合方式的SSN数量。使用上面的表格,结果应该如下:
Cnt Auto MtgHe Personal Other None
2 1 1 0 0 0
1 1 0 0 0 0
1 1 0 1 1 0
3 0 0 0 0 1
有什么办法可以在R中完成这个任务?虽然我的数据集有数万个案例,但任何帮助都将不胜感激。
count
中指定的所有变量对数据进行分组(在数据集df
之后)。然后,它会计算每个组的行数,并将数据压缩为每个组的1行,并添加计数列“n”。 - talatdplyr
不是函数,而是一个包。通常你只需要加载library(dplyr)
然后运行count(...)
函数。 - thelatemail