如何使用dplyr基于字符串选择列

4
我可以轻松选择和重命名列名,就像这样:


library(tidyverse)
iris <- as.tibble(iris)
iris %>% select(sepal_ln = Sepal.Length, sepal_wd = Sepal.Width)
#> # A tibble: 150 × 2
#>    sepal_ln sepal_wd
#>       <dbl>    <dbl>
#> 1       5.1      3.5
#> 2       4.9      3.0
#> 3       4.7      3.2
#> 4       4.6      3.1
#> 5       5.0      3.6
#> 6       5.4      3.9
#> 7       4.6      3.4
#> 8       5.0      3.4
#> 9       4.4      2.9
#> 10      4.9      3.1
#> # ... with 140 more rows

但是我想做的是从字符串中调用列而不是列名。我尝试了以下方法,但失败了:
> wanted <- "Sepal"
> iris %>% select(sepal_ln = !! paste0(wanted,".Length"), 
+                 sepal_wd = !! paste0(wanted,".Width"), 
+ )
Error: "Sepal.Length", "Sepal.Width": must resolve to integer column positions, not string
> 

怎样才是正确的做法呢?

1个回答

3
我们可以使用select_
 iris %>% 
   select_(sepal_ln = paste0(wanted, ".Length"), paste0(wanted, ".Width"))

此外,在 select 中还有一些包装器可以更轻松地完成这个操作,例如 one_ofcontainsmatches 等等,可用于从数据中选择所需的列。
iris %>% 
  select(setNames(one_of(paste0(wanted, c(".Length", ".Width"))),
                 c("sepal_ln", "sepal_wd"))) %>%
  head(2)
# A tibble: 2 × 2
#   sepal_ln sepal_wd
#     <dbl>    <dbl>
#1      5.1      3.5
#2      4.9      3.0

注意: 目前尚不清楚 dplyr 下一个版本(0.6.0)是否会弃用 select_ 方法。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接