我想使用R将从调查中输入的面板/纵向数据集从宽格式转换为长格式。这类似于我之前提出的问题,但也有所不同。 Wide to long format with several variables
以下是基本数据格式:
set.seed(1001)
df <- data.frame(
id = 1:2,
Q1_Choice = sample(1:3,2),
Q2_Choice = sample(1:3,2),
Q3_Choice = sample(1:3,2),
Q1_Status_Opt_1 = c(0,0),
Q1_Status_Opt_2 = sample(1:40, 2),
Q1_Status_Opt_3 = sample(1:40, 2),
Q2_Status_Opt_1 = c(0,0),
Q2_Status_Opt_2 = sample(1:40, 2),
Q2_Status_Opt_3 = sample(1:40, 2),
Q3_Status_Opt_1 = c(0,0),
Q3_Status_Opt_2 = sample(1:40, 2),
Q3_Status_Opt_3 = sample(1:40, 2),
Q1_Time_Opt_1 = c(5,5),
Q1_Time_Opt_2 = sample(100:200, 2),
Q1_Time_Opt_3 = sample(100:200, 2),
Q2_Time_Opt_1 = c(5,5),
Q2_Time_Opt_2 = sample(1:40, 2),
Q2_Time_Opt_3 = sample(1:40, 2),
Q3_Time_Opt_1 = c(5,5),
Q3_Time_Opt_2 = sample(1:40, 2),
Q3_Time_Opt_3 = sample(100:200, 2),
Age = c(45,67))
df
#> id Q1_Choice Q2_Choice Q3_Choice Q1_Status_Opt_1 Q1_Status_Opt_2
#> 1 1 3 3 3 0 11
#> 2 2 1 1 2 0 38
#> Q1_Status_Opt_3 Q2_Status_Opt_1 Q2_Status_Opt_2 Q2_Status_Opt_3
#> 1 36 0 28 29
#> 2 12 0 4 40
#> Q3_Status_Opt_1 Q3_Status_Opt_2 Q3_Status_Opt_3 Q1_Time_Opt_1
#> 1 0 31 3 5
#> 2 0 10 28 5
#> Q1_Time_Opt_2 Q1_Time_Opt_3 Q2_Time_Opt_1 Q2_Time_Opt_2 Q2_Time_Opt_3
#> 1 100 149 5 30 32
#> 2 107 114 5 27 6
#> Q3_Time_Opt_1 Q3_Time_Opt_2 Q3_Time_Opt_3 Age
#> 1 5 1 189 45
#> 2 5 8 107 67
- 有2个被编号的个体。
- 每个个体回答3个问题。
- 每个问题有3个选项{1-3}。
- 对于每个问题,答案都表示为变量Q{1_3}_Choice。
- 在调查数据中选择的选项为1、2或3。应将它们转换为长格式中每个选项的0、1。
- 有两个附加变量(Status和Time),这些变量在每个问题的每个选项中都不同。
- 最后一个变量Age在每个id中都是恒定的。
- 我想使用tidyr(pivot_longer)或data.table将其从宽格式转换为长格式。
结果应如下所示:
result
#> id question option choice Status Time Age
#> 1 1 1 1 0 0 5 45
#> 2 1 1 2 0 11 100 45
#> 3 1 1 3 1 36 149 45
#> 4 1 2 1 0 0 5 45
#> 5 1 2 2 0 28 30 45
#> 6 1 2 3 1 29 32 45
#> 7 1 3 1 0 0 5 45
#> 8 1 3 2 0 31 1 45
#> 9 1 3 3 1 3 189 45
#> 10 2 1 1 1 0 5 67
#> 11 2 1 2 0 38 107 67
#> 12 2 1 3 0 12 114 67
#> 13 2 2 1 1 0 5 67
#> 14 2 2 2 0 4 27 67
#> 15 2 2 3 0 40 6 67
#> 16 2 3 1 0 0 5 67
#> 17 2 3 2 1 10 8 67
#> 18 2 3 3 0 28 107 67
由于某些原因,我很难处理这些更复杂的重塑问题,因此非常感谢任何帮助。