在R中按组删除数据末尾

3

我有一个类似于数据框的数据结构

df <- data.frame(group=c("a", "b"), value=1:16,trim=rep(1:2))

我正在尝试找出如何删除每个组的最后几行。从每个组中删除的行数由"trim"变量定义。
我已经找出了如何从所有组中删除指定数量的行,方法如下:

x<-do.call("rbind", lapply(split(df, df$group), head,-2))

然而,我似乎无法弄清楚如何从“ trim”列指定的组中删除行数。换句话说,我想要将a组的最后一行修剪掉,并将b组的最后两行修剪掉。

3个回答

5
尝试获取组内的第一个值:
x<-do.call("rbind", lapply(split(df, df$group), function(d) head(d,-d$trim[1]) ) )

通常我会测试我的答案,但现在我正在一辆颠簸的火车上,使用iPhone进行操作。


2

使用 dplyr

library(dplyr)

df %>% group_by(group) %>% slice(1:(n() - trim[1]))  # Per @42-, this is faster than unique(trim)
    group value  trim
1       a     1     1
2       a     3     1
3       a     5     1
4       a     7     1
5       a     9     1
6       a    11     1
7       a    13     1
8       b     2     2
9       b     4     2
10      b     6     2
11      b     8     2
12      b    10     2
13      b    12     2

2

以下是使用data.table实现的方法(参考 @42):

library(data.table)
setDT(df)
df[, head(.SD, -trim[1]), by=group]

这将输出:

    group value trim
 1:     a     1    1
 2:     a     3    1
 3:     a     5    1
 4:     a     7    1
 5:     a     9    1
 6:     a    11    1
 7:     a    13    1
 8:     b     2    2
 9:     b     4    2
10:     b     6    2
11:     b     8    2
12:     b    10    2
13:     b    12    2

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接