我有一个与使用data.table和:=函数相关的非常简单的问题,我不太理解:=的行为,经常遇到类似的问题。这里是一些示例数据。
mat <- structure(list(
col1 = c(NA, 0, -0.015038, 0.003817, -0.011407),
col2 = c(0.003745, 0.007463, -0.007407, -0.003731, -0.007491)),
.Names = c("col1", "col2"),
row.names = c(NA, 10L),
class = c("data.table", "data.frame"))
提供
> mat
col1 col2
1: NA 0.003745
2: 0.000000 0.007463
3: -0.015038 -0.007407
4: 0.003817 -0.003731
5: -0.011407 -0.007491
我想创建一个名为col3的列,它给出了col1和col2的总和。如果我使用
mat[,col3 := col1 + col2]
# col1 col2 col3
#1: NA 0.003745 NA
#2: 0.000000 0.007463 0.007463
#3: -0.015038 -0.007407 -0.022445
#4: 0.003817 -0.003731 0.000086
#5: -0.011407 -0.007491 -0.018898
我发现在第一行得到了一个NA,但我希望忽略NA。因此我尝试使用以下方法。
mat[,col3 := sum(col1,col2,na.rm=TRUE)]
# col1 col2 col3
#1: NA 0.003745 -0.030049
#2: 0.000000 0.007463 -0.030049
#3: -0.015038 -0.007407 -0.030049
#4: 0.003817 -0.003731 -0.030049
#5: -0.011407 -0.007491 -0.030049
这不是我想要的,因为它给出了col1和col2所有元素的总和。我似乎并没有理解:=
的含义...如何忽略NA值获取col1和col2的元素总和?
不确定这是否相关,但以下是我的sessionInfo:
> sessionInfo()
R version 2.15.1 (2012-06-22)
Platform: x86_64-apple-darwin9.8.0/x86_64 (64-bit)
locale:
[1] en_AU.UTF-8/en_AU.UTF-8/en_AU.UTF-8/C/en_AU.UTF-8/en_AU.UTF-8
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] data.table_1.8.3
na.rm=TRUE
的情况下计算行总和。 - Joshua Ulrich