TL;DR:生成静态网络列表比将这些静态网络合并成单个动态网络快十倍。为什么会这样?
在this answer的基础上,我尝试使用NetworkX和DyNetx生成随机动态图。
当处理中等规模的网络(大约1000个节点和1000个时间戳)时,会出现内存崩溃的问题。在较小的规模(约100个节点和300个时间戳)上,该过程非常缓慢。我相信我已经确定了障碍,但我不确定如何处理它。
以下是生成随机时间网络的简单代码示例:
如果我们运行以下命令:
相比之下,如果我们在没有合并网络的情况下运行代码,将会得到显著更好的结果:
我们可以在不运行合并部分的情况下处理具有1000个节点的网络而不会出现内存崩溃。
所以,我想看一下DyNetx源代码,试图弄清楚
该函数很短且简单,但我很好奇为什么它需要这么多时间和内存,并且如何改进它。你有什么想法?
我想循环结构可能是所有问题的根源。 链接到
在this answer的基础上,我尝试使用NetworkX和DyNetx生成随机动态图。
当处理中等规模的网络(大约1000个节点和1000个时间戳)时,会出现内存崩溃的问题。在较小的规模(约100个节点和300个时间戳)上,该过程非常缓慢。我相信我已经确定了障碍,但我不确定如何处理它。
以下是生成随机时间网络的简单代码示例:
import dynetx as dnx
import networkx as nx
import itertools
from random import random
def dynamic_random_graph(n, steps, up_rate, seed=42):
# Create list of static graphs
list_of_snapshots = list()
for t in range(0, steps):
G_t = nx.Graph()
edges = itertools.combinations(range(n), 2)
G_t.add_nodes_from(range(n))
for e in edges:
if random() < up_rate:
G_t.add_edge(*e)
list_of_snapshots.append(G_t)
# Merge the static graphs into dynamic one
dynamic_graph = dnx.DynGraph()
for t, graph in enumerate(list_of_snapshots):
dynamic_graph.add_interactions_from(graph.edges(data=False), t=t)
return dynamic_graph
如果我们运行以下命令:
%timeit dynamic_random_graph(300, 100, 0.5) # Memory was crahsed on larger networks.
>> 1 loop, best of 5: 15.1 s per loop
相比之下,如果我们在没有合并网络的情况下运行代码,将会得到显著更好的结果:
%timeit dynamic_random_graph_without_merge(300, 100, 0.5) # Ignore the merge part in the function
>> 1 loop, best of 5: 15.1 s per loop
我们可以在不运行合并部分的情况下处理具有1000个节点的网络而不会出现内存崩溃。
所以,我想看一下DyNetx源代码,试图弄清楚
add_interactions_from
方法有什么问题。该函数很短且简单,但我很好奇为什么它需要这么多时间和内存,并且如何改进它。你有什么想法?
这是源代码:
def add_interactions_from(self, ebunch, t=None, e=None):
"""Add all the interaction in ebunch at time t.
Parameters
----------
ebunch : container of interaction
Each interaction given in the container will be added to the
graph. The interaction must be given as as 2-tuples (u,v) or
3-tuples (u,v,d) where d is a dictionary containing interaction
data.
t : appearance snapshot id, mandatory
e : vanishing snapshot id, optional
See Also
--------
add_edge : add a single interaction
Examples
--------
>>> import dynetx as dn
>>> G = dn.DynGraph()
>>> G.add_edges_from([(0,1),(1,2)], t=0)
"""
# set up attribute dict
if t is None:
raise nx.NetworkXError(
"The t argument must be a specified.")
# process ebunch
for ed in ebunch:
self.add_interaction(ed[0], ed[1], t, e)
我想循环结构可能是所有问题的根源。 链接到
add_interaction
实现。