我有一个 data.table
,格式如下:
data <- data.table(group = rep(1:3, each = 4),
year = c(2011:2014, rep(2011:2012, each = 2),
2012, 2012, 2013, 2014), value = 1:12)
这只是我的数据的摘要。
因此,群组2
在2011
和2012
有2个值。 而群组3在年份2012
有2
个值。 我只想保留所有重复年份的第一行。
因此,实际上,我的data.table
将变为以下内容:
data <- data.table(group = c(rep(1, 4), rep(2, 2), rep(3, 3)),
year = c(2011:2014, 2011, 2012, 2012, 2013, 2014),
value = c(1:5, 7, 9, 11, 12))
我该如何做到这一点?提前感谢。
duplicated.data.table
中的by
参数。谢谢。 - Henrik