我正在对R中的sample
函数进行基准测试,并将其与igraph:sample_seq
进行比较,结果遇到了奇怪的结果。
当我运行类似以下的代码时:
library(microbenchmark)
library(igraph)
set.seed(1234)
N <- 55^4
M <- 500
(mbm <- microbenchmark(v1 = {sample(N,M)},
v2 = {igraph::sample_seq(1,N,M)}, times=50))
我得到了这样的结果:
Unit: microseconds
expr min lq mean median uq max neval
v1 21551.475 22655.996 26966.22166 23748.2555 28340.974 47566.237 50
v2 32.873 37.952 82.85238 81.7675 96.141 358.277 50
但是当我运行时,例如:
set.seed(1234)
N <- 100^4
M <- 500
(mbm <- microbenchmark(v1 = {sample(N,M)},
v2 = {igraph::sample_seq(1,N,M)}, times=50))
我对sample
得到了更快的结果:
Unit: microseconds
expr min lq mean median uq max neval
v1 52.165 55.636 64.70412 58.2395 78.636 88.120 50
v2 39.174 43.504 62.09600 53.5715 73.253 176.419 50
似乎当N
是10的某个次方(或其他特殊数字?)时,sample
比那些不是10的某个次方的较小N
要快得多。这是期望的行为吗,还是我漏掉了什么?