我有一个超过100列的数据框,我想通过仅比较其中两列来找到唯一的行。我希望这很容易,但我自己无法使用unique
或duplicated
让它正常工作。
在下面的代码中,我只想使用id
和id2
进行去重:
data.frame(id=c(1,1,3),id2=c(1,1,4),somevalue=c("x","y","z"))
id id2 somevalue
1 1 x
1 1 y
3 4 z
我想要获取以下内容之一:
id id2 somevalue
1 1 x
3 4 z
或者:
id id2 somevalue
1 1 y
3 4 z
我不在乎保留哪些唯一的行。
data.table
的替代方案:在 data.table 中过滤重复/非唯一行 - Henrik