我有一个数据集,是一个csv/txt文件,表示一个网络。文件中的每一行都包含两个以逗号分隔的节点名称。我的数据文件包含大约330k个节点和550k条边。我正在尝试使用以下代码创建一个非常基本的图形(是的,我知道它会很杂乱):
import networkx as nx
import matplotlib.pyplot as plt
import sys
import numpy as np
f = open('dataFile.txt', 'rb')
G = nx.read_edgelist(f, delimiter=',', nodetype=str)
f.close()
print(nx.number_of_nodes(G))
print(nx.number_of_edges(G))
plt.figure(1)
nx.draw(G)
plt.savefig("graph.pdf")
我正在AWS EC2 m4.4xlarge实例上运行此程序,CPU利用率已到达100%,但内存使用率只有1%。这让我感到怀疑,因为我认为networkx对内存要求很高,而不是CPU。现在它在nx.draw命令上一直卡住,有没有办法监测生成图形的进度?