假设我有一个数据框,其中包含两个变量和213005个观测值,它看起来像这样:
df <- data.frame(nr=c(233, 233, 232, 231, 234, 234, 205),
date=c("2012/01/02", "2012/01/01", "2012/01/01", "2012/01/02", "2012/01/01", "2012/01/01", "2012/01/05"))
我需要根据“日期”值为每个不同的“nr”值创建一个名为“new”的新列,它应该如下所示:
df <- data.frame(nr=c(233, 233, 232, 231, 234, 234, 205),
date=c("2012/01/02", "2012/01/01", "2012/01/01", "2012/01/02",
"2012/01/01", "2012/01/01", "2012/01/05"),
new=c(1, 2, 3, 4, 5, 5, 6))
(nr=233, date=2012/01/02) => (new=1)
(nr=233, date=2012/01/01) => (new=2) ...
对于(nr=234, date=2012/01/01),应该有两个相同的列,new=5,重复的行应该留在数据框中。
有人知道如何做到这一点吗?任何帮助都将不胜感激!谢谢!