在ggplot中函数内的aes(...)变量范围问题

7
考虑在函数内部使用ggplot(...)的情况。
x  <- seq(1,10,by=0.1)
df <- data.frame(x,y1=x, y2=cos(2*x)/(1+x))

library(ggplot2)
gg.fun <- function(){
  i=2
  plot(ggplot(df,aes(x=x,y=df[,i]))+geom_line())
}

if(exists("i")) remove(i)
gg.fun()
# Error in `[.data.frame`(df, , i) : object 'i' not found
i=3
gg.fun()   # plots df[,3] vs. x

看起来 ggplot 在函数内没有识别出定义的变量 i,但如果在全局环境中定义 i,则可以识别。为什么会这样呢?
请注意,这会得到预期的结果。
gg.new <- function(){
  i=2
  plot(ggplot(data.frame(x=df$x,y=df[,i]),aes(x,y)) + geom_line())
}
if(exists("i")) remove(i)
gg.new()   # plots df[,2] vs. x
i=3
gg.new()   # also plots df[,2] vs. x

你能使用 aes_string 来传递参数吗? - Roman Luštrik
@RomanLuštrik - 谢谢,但我从不像这样使用aes(...); 我会选择第二种方式。我正在尝试理解发生了什么。这是一个错误吗?还是有一个很好的原因来解释这种行为?或者我只是做错了什么? - jlhoward
这与我的问题有关吗?http://stackoverflow.com/questions/23482036/ggplot-inside-function-treating-subsetdf-differently-resulting-geom-step-is-w 我在那儿尝试了你的方法,但不能解决它。 - smci
1个回答

6

让我们返回一个未渲染的ggplot对象,看看发生了什么:

gg.str <- function() {
     i=2
     str(ggplot(df,aes(x=x,y=df[,i]))+geom_line())
}

gg.str()
List of 9
 $ data       :'data.frame':    91 obs. of  3 variables:
  ..$ x : num [1:91] 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 ...
  ..$ y1: num [1:91] 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 ...
  ..$ y2: num [1:91] -0.208 -0.28 -0.335 -0.373 -0.393 ...
 $ layers     :List of 1
  ..$ :Classes 'proto', 'environment' <environment: 0x0000000009886ca0> 
 $ scales     :Reference class 'Scales' [package "ggplot2"] with 1 fields
  ..$ scales: list()
  ..and 21 methods, of which 9 are possibly relevant:
  ..  add, clone, find, get_scales, has_scale, initialize, input, n, non_position_scales
 $ mapping    :List of 2
  ..$ x: symbol x
  ..$ y: language df[, i]
 $ theme      : list()
 $ coordinates:List of 1
  ..$ limits:List of 2
  .. ..$ x: NULL
  .. ..$ y: NULL
  ..- attr(*, "class")= chr [1:2] "cartesian" "coord"
 $ facet      :List of 1
  ..$ shrink: logi TRUE
  ..- attr(*, "class")= chr [1:2] "null" "facet"
 $ plot_env   :<environment: R_GlobalEnv> 
 $ labels     :List of 2
  ..$ x: chr "x"
  ..$ y: chr "df[, i]"
 - attr(*, "class")= chr [1:2] "gg" "ggplot"

我们可以看到,ymapping 只是一个未计算的表达式。当我们要进行实际绘图时,该表达式在全局变量 plot_env 中进行计算。我不知道为什么要这样做;我相信这样做是有原因的。

以下是一个演示,可以覆盖此行为:

gg.envir <- function(envir=environment()) {
    i=2
    p <- ggplot(df,aes(x=x,y=df[,i]))+geom_line()
    p$plot_env <- envir
    plot(p)
}
# evaluation in local environment; ok
gg.envir() 
# evaluation in global environment (same as default); fails if no i
gg.envir(environment())

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接