我正在处理一个拥有数亿个节点的超大型NetworkX图形对象,希望能够将其写入文件以避免占用所有计算机内存。但是,我需要不断地搜索现有节点、更新边缘等。
有没有好的解决方案?我不确定这将如何与http://networkx.lanl.gov/reference/readwrite.html上提供的任何文件格式一起使用。
我所能想到的唯一解决方案是将每个节点存储为单独的文件,并在文件系统中引用其他节点 - 这样,打开一个节点进行检查就不会超载内存。是否有一个现有的大数据文件系统(例如PyTables)可以做到这一点,而不需要自己编写模板代码?
HIGHEST_PROTOCOL
。这将以更高效的二进制格式保存它。 - Maarten(cnetworkx.classes.digraph)
)。 - user