我的数据看起来像这样:
ID Diagnosis_1 Diagnosis_2 Diagnosis_3 Diagnosis_4
A 1 0 0 0
A 1 0 0 0
A 1 0 0 0
B 0 1 0 0
C 0 0 0 1
C 0 1 0 0
D 0 0 0 1
E 0 0 1 0
E 0 1 0 0
E 0 0 1 0
Diagnosis_1:Diagnosis_4均为二进制,表示诊断的存在(1)或不存在(0)。我想要做的是创建一个数据框看起来像这样:
ID Diagnosis
A 1
A 1
A 1
B 2
C 4
C 2
D 4
E 3
E 2
E 3
无论我读了多少遍关于reshape/reshape2/tidyr的文档,我都无法理解它们的实现方式。
使用dplyr的mutate可以解决我的问题,但这是一种耗时而绕弯的方式来实现我的目标。
编辑:数据已经更改以更真实地表示我的实际数据框架。