我有一个数据表 DT
set.seed(1)
DT <- data.table(x=rep(c(1,2,3),each=4), y=c("A","B"), v=sample(1:100,12))
DT
x y v
1: 1 A 29
2: 1 B 92
3: 1 A 100
4: 1 B 82
5: 2 A 28
6: 2 B 26
7: 2 A 18
8: 2 B 22
9: 3 A 30
10: 3 B 96
11: 3 A 15
12: 3 B 4
我希望将其扩展如下,为每个
x
值创建一个新列,并报告v
值,不应期望数据中的结构(不是按照下面的块)。 x y v.1 v.2 v.3
1: 1 A 29 NA NA
2: 1 B 92 NA NA
3: 1 A 100 NA NA
4: 1 B 82 NA NA
5: 2 A NA 28 NA
6: 2 B NA 26 NA
7: 2 A NA 18 NA
8: 2 B NA 22 NA
9: 3 A NA NA 30
10: 3 B NA NA 96
11: 3 A NA NA 15
12: 3 B NA NA 4
我曾在这里问过一个非常相似的问题here,但无法适应当时G Grothendieck给出的答案...
编辑: 像往常一样,在写帖子后,我几乎就得到了答案... 我只需要用NA替换那些0(我可能会在v中得到0,我想能够将v == 0与缺失项区分开来)
DT2 <- DT[, {SUM.<-factor(x); data.table(model.matrix(~ SUM.:v + 0))}]
txtR) DT2
SUM.1:v SUM.2:v SUM.3:v
1: 29 0 0
2: 92 0 0
3: 100 0 0
4: 82 0 0
5: 0 28 0
6: 0 26 0
7: 0 18 0
8: 0 22 0
9: 0 0 30
10: 0 0 96
11: 0 0 15
12: 0 0 4
NA
;而且行的顺序也不同,但除此之外,它们在我看来是一样的...顺便说一句,我没有读取OP的数据,而是用种子重新运行了生成代码。 - FrankDT[,paste0("v.",ux):=lapply(ux,function(i)v[x==i]),by="x"]
运行效果更好(可能也更快)。 - statquant