我有一个由两个变量Date和Taxa构成的数据框,想要获取每个taxa第一次出现的日期。数据框中包含172行,9种不同的日期和40种不同的taxa,但我的答案应该只有40行。
Taxa是一个因子,Date是一个日期。
例如,我的数据框(称为'species')设置如下:
Date Taxa
2013-07-12 A
2011-08-31 B
2012-09-06 C
2012-05-17 A
2013-07-12 C
2012-09-07 B
我希望你能提供这样的答案:
Date Taxa
2012-05-17 A
2011-08-31 B
2012-09-06 C
我尝试使用:
t.first <- species[unique(species$Taxa),]
它为我提供了正确的行数,但是有重复的分类。如果我只使用unique(species$Taxa),似乎可以给出正确的答案,但是我不知道它第一次出现的日期。
感谢任何帮助。
species[with(species, order(Date)), ]
来完成排序,具体演示可以参考这里。 - Serenthia