在R igraph中,迭代且高效地向顶点列表属性添加元素

5

我正在使用igraph(一个用于随机图的库)在R中开发一个信号传播算法,其中涉及使用2级嵌套列表。

Igraph允许将属性附加到顶点(图的节点),这些属性可以是向量或列表,但在我的应用程序中,我需要嵌套列表。

为了查看,请尝试:

library("igraph")
g <- graph.full(10) # create a fully connected graph with 10 vertices
V(g)$letters <- list(NULL) # adds a list called "letters" to every vertex
V(g)$letters # results in a nested list

我希望在不同的阶段将存储在向量中的一些预定元素添加到给定的第二级列表子集中,其中子集列表的大小与向量相同。

问题是找到一种有效的方法将元素添加到第二级列表中。

目前唯一的更简单的方法是编写循环:

set.seed(1234)

# every iteration represents a "round" of element addition ,
# followed by other operations. 
# So the attribute "letters" should not be populated in one sitting.
for (i in 1:10){

  # select randomly five 2nd-level lists (vertices) from the 1st-level list
  # the selected vertices are generated randomly for exposition, 
  # but I need to be able to select them from a well-defined vector (sel.ver)

  sel.vert <- sample(1:10, 5)

  # generate elements to add to the lists in the 2nd-level list (vertices)
  # again, i generate them randomly just to fill the vector, 
  #but the vector could be pre-determined

  add.elem <- sample(letters, 5)

  # now add add each element to its own list
  # notice that the first ELEMENT of add.elem (add.elem[1]) is added
  # to the attribute of the first SELECTED vertex (V(g)[sel.vert[1]]$letters,
  # the second element of add.elem with the second SELECTED vertex, and so on..

  for (l in 1:5){
    V(g)[sel.vert[l]]$letters <- list(c(V(g)[sel.vert[l]]$letters, add.elem[l]))    
  }
}

如果这是一场糟糕的编程实践表演,对有经验的读者表示歉意。

随着初始网络的规模越来越大,并且每次迭代选择更多的顶点(而不是5个),循环会变得非常缓慢。这应该是一个“工作马”,所以我想加快它的速度。

我阅读了给出的答案“Efficiently adding or removing elements to a vector or list in R?”,即尽可能使用向量并预先分配其大小,但我认为这不适用于我的情况,因为:

  1. 我认为使用igraph时我别无选择,只能使用列表(至少在第一层)
  2. 在第二层中,列表的最终长度将不同,这取决于随机选择哪些顶点。因此,很难预先分配正确大小的向量。即使我在第二级放置非常大的向量,最初填充为NAs(导致一个向量列表),我也不知道要添加元素的位置(因为任何迭代的列表长度都是随机的),更不用说我需要稍后删除NAs了。

这应该是向嵌套列表中添加元素的特殊情况。因此,我认为,通过在plyr中替换内部循环中的ddplydo.call可以实现更快的实现,但我无法编写要应用的函数:获取(内部)列表的元素并添加此新元素(它本身是向量的子集)

任何评论或建议都将不胜感激。希望文章清晰明了。


1
你需要在每次迭代中对 g 执行一些 igraph 操作(即,做一些除了填充 V(g)$letters 之外的事情),还是先填充所有的 V(g)$letters 数据就可以了? - lockedoff
我需要在一轮加法和另一轮之间执行其他操作,因此无法一次性填充嵌套列表。 循环有点模糊,但我需要说明顶点属性是逐层填充的。对于造成的困惑,我感到抱歉。 - MatteoS
1个回答

2
# number of vertices to add elements to at a time
nv <- 5

# selected vertices and elements
sel.ver <- sample(V(g), nv)
add.elem <- sample(letters, nv)

V(g)$letters[sel.ver] <- lapply(1:nv, function(x) {
  c(add.elem[x], unlist(V(g)$letters[sel.ver[x]]))
})

是的,我注意到(并提到)我可以将向量分配给属性,而不是列表。然而,由于每个顶点的最终字母数量都不同(参见我的问题和相关点中的代码),我认为列表是正确的选择,但我可能是错误的。 - MatteoS
太好了,这非常接近我想要的。我能问一下吗:如果我想确定性地选择顶点,而不是随机选择,我需要如何更改代码? - MatteoS
1
lapply 的第一个参数是正在迭代的内容。在这种情况下,它是 1:length(V(g)),或者说是顶点的索引。您可以将其更改为您想要选择的顶点,并删除 runif 部分。 - Andy
1
由于您正在分配一个长度较小的列表,它会循环使用元素。您必须明确地分配它们,例如 V(g)$letters[sel.ver] <- ... - Andy
好的,非常有用。最后一件事:正如我在编辑中解释的那样,sel.veradd.elem都是确定性(预先存在的)向量,我随机生成它们以进行阐述。(对于造成的混乱我很抱歉。) 因此,我需要将add.elem的第一个元素添加到第一个选择的顶点属性中,将第二个add.elem添加到第二个选择的顶点属性中,依此类推... 您如何在您的函数中对add.elem进行子集操作? add.elem[sel.ver]add.elem[x]不起作用,因为它们是指顶点的位置,而不是元素的位置。 (这就是为什么我最初采用循环的原因) - MatteoS
显示剩余6条评论

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接