我有一个面板结构的数据框:每个单位有两年的两次观测:
library(tidyr)
mydf <- data.frame(
id = rep(1:3, rep(2,3)),
year = rep(c(2012, 2013), 3),
value = runif(6)
)
mydf
# id year value
#1 1 2012 0.09668064
#2 1 2013 0.62739399
#3 2 2012 0.45618433
#4 2 2013 0.60347152
#5 3 2012 0.84537624
#6 3 2013 0.33466030
我希望将这些数据转换为宽格式,可以使用tidyr::spread
轻松完成。但由于year
变量的值是数字,我的新变量名称也会变成数字,这使得它们更难以进一步使用。
spread(mydf, year, value)
# id 2012 2013
#1 1 0.09668064 0.6273940
#2 2 0.45618433 0.6034715
#3 3 0.84537624 0.3346603
我知道我可以轻松地重命名列。然而,如果我想在其他操作中与之链式重塑,那就变得不方便了。例如,下面的代码显然是没有意义的。
library(dplyr)
mydf %>% spread(year, value) %>% filter(2012 > 0.5)
以下方法可行,但不是那么简洁:
tmp <- spread(mydf, year, value)
names(tmp) <- c("id", "y2012", "y2013")
filter(tmp, y2012 > 0.5)
你有什么想法可以在 spread
中更改新变量名吗?
spread
函数中更改新变量的名称。 - janosdivenyi