使用dplyr的mutate()函数进行编程

5

我试图使用mutate将一列的名称赋值给一个变量。

df <-data.frame(x = sample(1:100, 50), y = rnorm(50))

new <- function(name){
     df%>%mutate(name = ifelse(x <50, "small", "big"))
}

当我运行时,
new(name = "newVar")

这段代码无法正常工作。我知道mutate_()可以帮助解决问题,但是我在将其与ifelse一起使用时遇到了困难。

如果有任何帮助,将不胜感激。


你在 mutate 结尾处缺少一个 ),而且 mutate 拼写错误。此外,在函数中调用全局变量 df 时要小心。最好将 df 作为参数传递给函数。 - juan
mutate_ is getting phased out. Update dplyr and type vignette('programming', 'dplyr') - Axeman
我的软件包都是最新的。 - Kay
3个回答

9
使用 dplyr 0.7.1 及其 NSE 的进展,您需要对 mutate 的参数进行 UQ,然后在赋值时使用 :=。有关使用 dplyr 和 NSE 进行编程的大量信息,请参见此处:https://cran.r-project.org/web/packages/dplyr/vignettes/programming.html 我已将函数参数的名称更改为 myvar,以避免混淆。如果您有更多类别需要重新编码,则可以使用 dplyr 中的 case_when 而不是 ifelse
df <- data.frame(x = sample(1:100, 50), y = rnorm(50))

new <- function(myvar){
    df %>% mutate(UQ(myvar) := ifelse(x < 50, "small", "big"))
}

new(myvar = "newVar")

这段代码返回:

这将返回

     x        y newVar
1   37  1.82669  small
2   63 -0.04333    big
3   46  0.20748  small
4   93  0.94169    big
5   83 -0.15678    big
6   14 -1.43567  small
7   61  0.35173    big
8   26 -0.71826  small
9   21  1.09237  small
10  90  1.99185    big
11  60 -1.01408    big
12  70  0.87534    big
13  55  0.85325    big
14  38  1.70972  small
15   6  0.74836  small
16  23 -0.08528  small
17  27  2.02613  small
18  76 -0.45648    big
19  97  1.20124    big
20  99 -0.34930    big
21  74  1.77341    big
22  72 -0.32862    big
23  64 -0.07994    big
24  53 -0.40116    big
25  16 -0.70226  small
26   8  0.78965  small
27  34  0.01871  small
28  24  1.95154  small
29  82 -0.70616    big
30  77 -0.40387    big
31  43 -0.88383  small
32  88 -0.21862    big
33  45  0.53409  small
34  29 -2.29234  small
35  54  1.00730    big
36  22 -0.62636  small
37 100  0.75193    big
38  52 -0.41389    big
39  36  0.19817  small
40  89 -0.49224    big
41  81 -1.51998    big
42  18  0.57047  small
43  78 -0.44445    big
44  49 -0.08845  small
45  20  0.14014  small
46  32  0.48094  small
47   1 -0.12224  small
48  66  0.48769    big
49  11 -0.49005  small
50  87 -0.25517    big

:= 是来自于 data.table 吗? - BENY
1
@Wen 不,我认为 := 来自于 rlang,它被 0.7.1 版本的 dplyr 使用。更多信息请参见此处:https://cran.r-project.org/web/packages/dplyr/vignettes/programming.html - meenaparam

8

参考 dlyr编程文档,请按以下方式定义您的函数:

new <- function(name)
{
    nn <- enquo(name) %>% quo_name()
    df %>% mutate( !!nn := ifelse(x <50, "small", "big"))
}

enquo接受一个表达式参数并引用它,然后是quo_name将其转换为字符串。由于现在nn已经被引用,我们需要告诉mutate不要再引用它一次。这就是!!的作用。最后,:=是一个辅助运算符,使其成为有效的R代码。请注意,使用此定义,您可以直接传递newVar而不是"newVar"给您的函数,保持dplyr风格。

> new( newVar ) %>% head
    x           y newVar
 1 94 -1.07642088    big
 2 85  0.68746266    big
 3 80  0.02630903    big
 4 74  0.18323506    big
 5 86  0.85086915    big
 6 38  0.41882858  small

我接受了meenaparam的答案,但是你的答案也无疑是非常好的,这将有助于我编写另一个函数。谢谢。 - Kay
同意,我认为这也是一个非常有用的答案! - meenaparam
最终,经过数个小时的研究,这篇文章解决了我的问题! - M4hd1

1
基于R语言的解决方案。
df <-data.frame(x = sample(1:100, 50), y = rnorm(50))

new <- function(name){
    df[,name]='s'
    df[,name][df$x>50]='b'
    return(df)
}

我正在使用 dplyr 0.5,因此我将基础 R 与 mutate 结合使用。
new <- function(Name){

    df=mutate(df,ifelse(x <50, "small", "big"))
    names(df)[3]=Name
    return(df)
}

new("newVar")

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接