在R中使用波浪号（~）和句点（.）的方法

Question

在R中使用波浪号（~）和句点（.）的方法

rfor-loopr-formula

7

我正在使用Hadley的R4DS书籍学习tidyverse和purrr中的循环，并且对于波浪号~符号和句点符号的确切使用有些困惑。

因此，在编写for循环或使用map()时，您似乎可以使用波浪线符号~代替function()。

这只适用于for循环吗？

如下所示...

models <- mtcars %>% 
  split(.$cyl) %>% 
  map(~lm(mpg ~ wt, data = .))

此外，我被告知可以使用“period i”来指代当前列表元素。但我不确定这是什么意思。这是不是只有在循环时，“period i”才表示它指的是正在循环的列表中的元素？这与管道有何不同？当您使用管道时，您将一行代码的结果传输到下一行代码中。

因此，在上面的例子中，mtcars被输入到split()函数的第二行，但是使用了一个点。为什么？

下面的例子总结了我的困惑：

x <- c(1:10)

detect(x, ~.x > 5)

使用detect函数可以找到第一个匹配项，我认为我只需要使用

detect(x, x >5)

但是我收到一个错误，说x>5不是一个函数。所以我添加了一个波浪符。

detect(x, ~ x > 5)

你会得到一个错误，说它期望一个单独的TRUE或FALSE，而不是10。因此，如果你添加一个句号

detect(x, ~.x >5)

突然之间它像是循环一样工作了。那么这里的 ~ 和 . 有什么关系/用法，以及点号与简单管道符 | 相比如何？

- Kevin Lee

相关：https://dev59.com/L6_la4cB1Zd3GeqPvZpz - Artem Sokolov

一些相关的帖子：purrr::map中第一个波浪号的含义是什么？; dplyr中的句点“.”代表什么？; 使用%>%管道和点（.）符号; dplyr数据管道 - .x和.之间的区别 - Henrik

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Ian Campbell · Accepted Answer

这整体被称为tidyverse非标准评估（NSE）。您可能已经发现〜也在公式中用于表示左侧取决于右侧。

在tidyverse NSE中，〜表示function(...)。因此，这两个表达式是等价的。

x %>% detect(function(...) ..1 > 5)
#[1] 6

x %>% detect(~.x > 5)
#[1] 6

~自动将函数的每个参数分配给.；.x、.y和..1、..2、..3这些特殊符号。请注意，只有第一个参数变成了.。

map2(1, 2, function(x,y) x + y)
#[[1]]
#[1] 3

map2(1, 2, ~.x + .y)
#[[1]]
#[1] 3

map2(1, 2, ~..1 + ..2)
#[[1]]
#[1] 3

map2(1, 2, ~. + ..2)
#[[1]]
#[1] 3

map2(1, 2, ~. + .[2])
#[[1]]
#[1] NA

当变量很多时，这种自动分配非常有帮助。

mtcars %>% pmap_dbl(~ ..1/..4)
# [1] 0.19090909 0.19090909 0.24516129 0.19454545 0.10685714 0.17238095 0.05836735 0.39354839 0.24000000 0.15609756
#[11] 0.14471545 0.09111111 0.09611111 0.08444444 0.05073171 0.04837209 0.06391304 0.49090909 0.58461538 0.52153846
#[21] 0.22164948 0.10333333 0.10133333 0.05428571 0.10971429 0.41363636 0.28571429 0.26902655 0.05984848 0.11257143
#[31] 0.04477612 0.19633028

除了上述所有特殊符号之外，参数还分配给...。就像R中的所有内容一样，...有点像参数的命名列表，因此您可以与with一起使用它：

mtcars %>% pmap_dbl(~ with(list(...), mpg/hp))
# [1] 0.19090909 0.19090909 0.24516129 0.19454545 0.10685714 0.17238095 0.05836735 0.39354839 0.24000000 0.15609756
#[11] 0.14471545 0.09111111 0.09611111 0.08444444 0.05073171 0.04837209 0.06391304 0.49090909 0.58461538 0.52153846
#[21] 0.22164948 0.10333333 0.10133333 0.05428571 0.10971429 0.41363636 0.28571429 0.26902655 0.05984848 0.11257143
#[31] 0.04477612 0.19633028

另一种理解这个操作的方式是，因为 data.frame 实际上就是带有行名称的 list：

a <- list(a = c(1,2), b = c("A","B"))
a
#$a
#[1] 1 2
#$b
#[1] "A" "B"
attr(a,"row.names") <- as.character(c(1,2))
class(a) <- "data.frame"
a
#  a b
#1 1 A
#2 2 B