看起来一些程序员正在使用:
a = {}
a$foo = 1
a$bar = 2
使用a = list(foo = 1, bar = 2)
有什么好处?
为什么应该使用{}
?这个表达式只返回NULL
,所以一个NULL
赋值会做同样的事情,不是吗?
为什么应该使用
{}
,这个表达式只返回NULL
,所以NULL
赋值会产生相同的效果,是吗?
是的,a <- NULL
会产生相同的效果。使用{}
很可能是个人风格。
NULL
NULL
可能是最多才多艺且令人困惑的R对象。根据R语言定义中对NULL的描述:
当需要指示或说明对象不存在时,使用它。不要将其与长度为零的向量或列表混淆。
NULL
对象没有类型和可修改属性。在R中只有一个NULL对象,所有实例都引用它。要测试是否为NULL
,请使用is.null
。您无法对NULL
设置属性。
严格来说,NULL
就是NULL
。而且它是唯一一个使is.null
返回TRUE
的东西。但是,根据?NULL
:
值为NULL的对象可以通过替换运算符进行更改,并将强制转换为右侧的类型。
因此,虽然它与具有合法模式的长度为0的向量不完全相同(R中并不允许所有模式用于向量;请阅读?mode
获取完整的模式列表,以及?vector
获取向量的合法内容),但这种灵活的强制转换通常使它的行为类似于长度为0的向量:
## examples of atomic mode
integer(0) ## vector(mode = "integer", length = 0)
numeric(0) ## vector(mode = "numeric", length = 0)
character(0) ## vector(mode = "character", length = 0)
logical(0) ## vector(mode = "logical", length = 0)
## "list" mode
list() ## vector(mode = "list", length = 0)
## "expression" mode
expression() ## vector(mode = "expression", length = 0)
您可以进行向量拼接:
c(NULL, 0L) ## c(integer(0), 0L)
c(NULL, expression(1+2)) ## c(expression(), expression(1+2))
c(NULL, list(foo = 1)) ## c(list(), list(foo = 1))
a <- NULL; a[1] <- 1; a[2] <- 2
## a <- numeric(0); a[1] <- 1; a[2] <- 2
a <- NULL; a[1] <- TRUE; a[2] <- FALSE
## a <- logical(0); a[1] <- TRUE; a[2] <- FALSE
a <- NULL; a$foo <- 1; a$bar <- 2
## a <- list(); a$foo <- 1; a$bar <- 2
a <- NULL; a[1] <- expression(1+1); a[2] <- expression(2+2)
## a <- expression(); a[1] <- expression(1+1); a[2] <- expression(2+2)
使用{}
生成NULL
与使用expression()
类似。虽然它们不完全相同,但在稍后进行操作时的运行时强制转换使它们几乎无法区分。例如,在扩展列表时,以下任何一种方法都可以:
a <- NULL; a$foo <- 1; a$bar <- 2
a <- numeric(0); a$foo <- 1; a$bar <- 2 ## there is a warning
a <- character(0); a$foo <- 1; a$bar <- 2 ## there is a warning
a <- expression(); a$foo <- 1; a$bar <- 2
a <- list(); a$foo <- 1; a$bar <- 2
对于一个长度为0且具有原子模式的向量,在运行时强制转换时会产生警告(因为从“原子”到“递归”的变化太大):
#Warning message:
#In a$foo <- 1 : Coercing LHS to a list
?expression
:
嗯,它不是通常意义上的“列表”;它类似于列表的是一个抽象语法树。作为模式‘"expression"’的对象是一个列表...
使用
a = list(foo = 1, bar = 2)
有什么好处吗?
没有优势。你应该已经在其他地方读到过,在R中增长对象是一种不好的做法。在谷歌上随机搜索可以得到:增长对象和循环内存预分配。
如果你知道向量的长度以及每个元素的值,直接创建它,如 a = list(foo = 1, bar = 2)
。
如果你知道向量的长度,但其元素的值需要计算(例如通过循环),则设置一个向量并填充,如 a <- vector("list", 2); a[[1]] <- 1; a[[2]] <- 2; names(a) <- c("foo", "bar")
。
我实际上查了一下
?mode
,但它没有列出可能的模式。它指向?typeof
,然后指向在src/main/util.c
中列出的结构TypeTable中列出的可能值。我甚至找不到这个文件,也找不到文件夹(OSX)。你知道在哪里可以找到吗?
它指的是R分发的源代码,这是CRAN上的一个“.tar.gz”文件。另一种方法是查看https://github.com/wch/r-source。无论哪种方式,这就是表格:
TypeTable[] = {
{ "NULL", NILSXP }, /* real types */
{ "symbol", SYMSXP },
{ "pairlist", LISTSXP },
{ "closure", CLOSXP },
{ "environment", ENVSXP },
{ "promise", PROMSXP },
{ "language", LANGSXP },
{ "special", SPECIALSXP },
{ "builtin", BUILTINSXP },
{ "char", CHARSXP },
{ "logical", LGLSXP },
{ "integer", INTSXP },
{ "double", REALSXP }, /*- "real", for R <= 0.61.x */
{ "complex", CPLXSXP },
{ "character", STRSXP },
{ "...", DOTSXP },
{ "any", ANYSXP },
{ "expression", EXPRSXP },
{ "list", VECSXP },
{ "externalptr", EXTPTRSXP },
{ "bytecode", BCODESXP },
{ "weakref", WEAKREFSXP },
{ "raw", RAWSXP },
{ "S4", S4SXP },
/* aliases : */
{ "numeric", REALSXP },
{ "name", SYMSXP },
{ (char *)NULL, -1 }
};
a <- {}
本质上“返回”空对象,因此等同于 a <- NULL
,它建立了一个可以被视为列表的空变量。function(x) {
y <- x * 2
return(y)
}
等同于:
function(x) {
y <- x * 2
y
}
function(x) {
y <- x * 2
}
函数的最后一行是一个赋值,它抑制了在控制台中打印结果,但如果将其保存到变量中,则该函数肯定会返回预期的值。
{}
返回最后一个被评估的表达式,但那不是我的问题。我的问题是,为什么有人更喜欢写{}
而不是NULL
。没有人会写a = {1}
而不是a = 1
。只是因为节省了三个字符吗?我猜想这样做可能会有一些缺点,比如对于直接赋值NULL
的情况,解析器速度更快。 - petres
<- {}
的SO实例。 (http://symbolhound.com/?q=&l=&e=%3C-+%7B%7D&n=&u=) - smci