我刚接触R语言,正在学习如何处理数据库数据,但遇到了问题。
我想根据两个条件从表格中删除重复的行/记录:一个用户ID字段和一个日期字段,该字段指示最近更改用户的时间,因此是最新日期的行。
我的缩小后的数据集应如下所示:
UID | DateLastChange
1 | 01/01/2016
1 | 01/03/2016
2 | 01/14/2015
3 | 02/15/2014
3 | 03/15/2016
我希望最终得到:
UID | DateLastChange
1 | 01/03/2016
2 | 01/14/2015
3 | 03/15/2016
我尝试使用重复或唯一,但它们似乎不完全支持选择性。我能构想出建立一个新表格的可能性,其中包括唯一的UID,然后通过左连接的方式仅匹配最近的日期。
如有建议,将不胜感激。 Scott
dat[!duplicated(dat$UID, fromLast=TRUE),]
。 - thelatemail