我有一些数据以pandas dataframe的形式呈现,其中列代表离散的技能,行代表离散的职位。只有当该技能是工作所必需的时,才会出现1,否则为0。
我想使用networkx创建一个图来可视化职位和技能之间的关系。我尝试了两种方法,一个是在数据帧本身上使用
但由于这是一个非方阵矩阵,因此产生了错误。这很有道理,因为networkx可能会将列和行都解释为同一组节点。然而,在这里,列和节点代表着完全不同的事物。两个职位通过他们所共享的技能相互连接,而两个技能则通过他们所共享的职位相互连接,但是任何两个技能或任何两个职位之间都没有直接的边缘连接。
如何将我的数据导入到networkx中,考虑到我的行和列是不同的节点集?
skill_1, skill_2,
job_1 1, 0,
job_2 0, 0,
job_3 1, 1,
我想使用networkx创建一个图来可视化职位和技能之间的关系。我尝试了两种方法,一个是在数据帧本身上使用
nx.from_pandas_adjacency
,另一个是应用于数据帧的numpy表示形式的nx.from_numpy_matrix
,其中删除了列和行名称。但由于这是一个非方阵矩阵,因此产生了错误。这很有道理,因为networkx可能会将列和行都解释为同一组节点。然而,在这里,列和节点代表着完全不同的事物。两个职位通过他们所共享的技能相互连接,而两个技能则通过他们所共享的职位相互连接,但是任何两个技能或任何两个职位之间都没有直接的边缘连接。
如何将我的数据导入到networkx中,考虑到我的行和列是不同的节点集?