从DataFrame中加载带有属性和边的节点到NetworkX。

Question

从DataFrame中加载带有属性和边的节点到NetworkX。

20

我是新手，正在使用Python处理图形：NetworkX。到目前为止，我一直在使用Gephi。那里的标准步骤（但不是唯一可能的步骤）是：

从表格/电子表格中加载节点信息；其中一个列应为ID，其余列为有关节点的元数据（节点是人，因此性别、群组等通常用于着色）。例如：

id;NormalizedName;Gender
per1;Jesús;male
per2;Abraham;male
per3;Isaac;male
per4;Jacob;male
per5;Judá;male
per6;Tamar;female
...

Target;Source;Weight;Type
per1;per2;3;Undirected
per3;per4;2;Undirected
...

- José

3个回答

11

这里基本上是相同的答案，但更新了一些详细信息。我们将从基本上相同的设置开始，但这里不会有节点的索引，只有名称来解决@LancelotHolmes的评论并使其更加通用。

import networkx as nx
import pandas as pd

linkData = pd.DataFrame({'source' : ['Amy', 'Bob'],
                  'target' : ['Bob', 'Cindy'],
                  'weight' : [100, 50]})

nodeData = pd.DataFrame({'name' : ['Amy', 'Bob', 'Cindy'],
                  'type' : ['Foo', 'Bar', 'Baz'],
                  'gender' : ['M', 'F', 'M']})

G = nx.from_pandas_edgelist(linkData, 'source', 'target', True, nx.DiGraph())

这里的True参数告诉 NetworkX 保留 linkData 中的所有属性作为链接属性。在这种情况下，我将其设置为 DiGraph 类型，但如果不需要，可以用另一种方式设置它。

现在，由于你需要通过从 linkData 生成的节点名称来匹配 nodeData，因此需要将 nodeData 数据帧的索引设置为 name 属性，然后将其转换为字典，以便 NetworkX 2.x 可以将其加载为节点属性。

nx.set_node_attributes(G, nodeData.set_index('name').to_dict('index'))

这将整个nodeData数据框加载到一个字典中，其中键是名称，其他属性是该键内的键值对（即节点索引为其名称的普通节点属性）。

- Aaron Bramson

8

一个小提示：

from_pandas_dataframe在nx 2中不可用，可以使用这个。

G = nx.from_pandas_dataframe(edges, 'source', 'target', 'weight')

我认为在nx 2.0中应该是这样的：

G = nx.from_pandas_edgelist(edges, source = "Source", target = "Target")

- Ioanna

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- harryscholes · Accepted Answer

使用nx.from_pandas_dataframe从边表创建加权图：

import networkx as nx
import pandas as pd

edges = pd.DataFrame({'source' : [0, 1],
                      'target' : [1, 2],
                      'weight' : [100, 50]})

nodes = pd.DataFrame({'node' : [0, 1, 2],
                      'name' : ['Foo', 'Bar', 'Baz'],
                      'gender' : ['M', 'F', 'M']})

G = nx.from_pandas_dataframe(edges, 'source', 'target', 'weight')

然后使用set_node_attributes函数，从字典中添加节点属性：

nx.set_node_attributes(G, 'name', pd.Series(nodes.name, index=nodes.node).to_dict())
nx.set_node_attributes(G, 'gender', pd.Series(nodes.gender, index=nodes.node).to_dict())

或者遍历图形以添加节点属性：

for i in sorted(G.nodes()):
    G.node[i]['name'] = nodes.name[i]
    G.node[i]['gender'] = nodes.gender[i]

更新:

从 nx 2.0 开始，nx.set_node_attributes 的参数顺序已经更改: (G, values, name=None)

使用上面的例子:

nx.set_node_attributes(G, pd.Series(nodes.gender, index=nodes.node).to_dict(), 'gender')

截至 nx 2.4 版本，G.node[] 被替换为 G.nodes[]。详见。