ID Cat1 Cat2 Cat3 Cat4
A0001 358 11.25 37428 0
A0001 279 14.6875 38605 0
A0013 367 5.125 40152 1
A0014 337 16.3125 38624 0
A0020 367 8.875 37797 0
A0020 339 9.625 39324 0
我需要帮助学习如何删除文件中的唯一行,同时保留重复行或三重行。例如,输出应该像下面这样:
ID Cat1 Cat2 Cat3 Cat4
A0001 358 11.25 37428 0
A0001 279 14.6875 38605 0
A0020 367 8.875 37797 0
A0020 339 9.625 39324 0
如果您能给我建议,告诉我如何处理这个问题,非常感谢。
谢谢大家的建议。我想计算不同类别(即Cat2、Cat3)在重复测量(按独特ID)之间的价值差异。欢迎任何建议。
base
解决方案比其他答案中的解决方案快得多(没有尝试任何data.table
解决方案)。比ave
快6倍,比dplyr
快14倍。 - hmhensen