使用dplyr删除列

11

我希望能够简化使用dplyr(版本>= 0.7)删除列的方法。假设我有一个名称的字符向量。

drop <- c("disp", "drat", "gear", "am")

选择列

使用当前版本的dplyr,您可以使用以下方法进行选择:

dplyr::select(mtcars, !! rlang::quo(drop))

或者更简单的使用基本R:

mtcars[, drop]

删除列

删除列名是另一回事。我们可以使用每个未加引号的列名来删除它们:

dplyr::select(mtcars, -disp, -drat, -gear, -am)

但是,如果你有一个包含几百列的数据框,这并不是一个好的解决方案。我所知道的最好的解决方案是使用:

dplyr::select(mtcars, -which(names(mtcars) %in% drop))

这是一个相当简单的方法,适用于dplyr和base R。但我想知道是否有一种方法不涉及查找数据框中每个列名的整数位置。
2个回答

8

使用modify_at并将列设置为NULL,这将删除它们:

mtcars %>% modify_at(drop,~NULL)
#                    mpg cyl  hp    wt  qsec vs carb
# Mazda RX4         21.0   6 110 2.620 16.46  0    4
# Mazda RX4 Wag     21.0   6 110 2.875 17.02  0    4
# Datsun 710        22.8   4  93 2.320 18.61  1    1
# Hornet 4 Drive    21.4   6 110 3.215 19.44  1    1
# Hornet Sportabout 18.7   8 175 3.440 17.02  0    2
# Valiant           18.1   6 105 3.460 20.22  1    1
# ...

更接近于您尝试的操作,您可以尝试使用magrittr::extract代替dplyr::select
extract(mtcars,!names(mtcars) %in% drop) # same output

2
谢谢你的提示!那是一个我从未使用过的 purrr 函数。 - detroyejr

7
您可以在 select 中使用 -one_of(drop):
drop <- c("disp", "drat", "gear", "am")
select(mtcars, -one_of(drop)) %>% names()
# [1] "mpg"  "cyl"  "hp"   "wt"   "qsec" "vs"   "carb"

one_of函数将字符向量中的列名转换成整数,类似于which(... %in% ...)函数:

one_of(drop, vars = names(mtcars))
# [1]  3  5 10  9

which(names(mtcars) %in% drop)
# [1]  3  5  9 10

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接