我有一个名为DF的数据,格式如下(这只是一个简化的示例):
eval.num, eval.count, fitness, fitness.mean, green.h.0, green.v.0, offset.0 random
1 1 1500 1500 100 120 40 232342
2 2 1000 1250 100 120 40 11843
3 3 1250 1250 100 120 40 981340234
4 4 1000 1187.5 100 120 40 4363453
5 1 2000 2000 200 100 40 345902
6 1 3000 3000 150 90 10 943
7 1 2000 2000 90 90 100 9304358
8 2 1800 1900 90 90 100 284333
然而,eval.count列是不正确的,我需要修复它。它应该报告具有相同值 (green.h.0、green.v.0 和 offset.0) 的行的数量,仅查看前面的行。
上面的示例使用了预期值,但假设它们是不正确的。
如何添加一个新列(比如"count"),它将计算所有先前具有指定变量相同值的行?
我已经得到了类似问题的帮助,只需选择具有特定列相同值的所有行,所以我认为我可以在其周围编写一个循环,但我觉得这样效率低下。