我有一个数据框 df1,其中包含一组列 (col1,col2,col3)。
我有另一个数据框 df2,其中包含一组列 (col4,col5,col6)。
假设这两个数据框具有相同的行数。
如何生成一个相关性表格,对 df1 和 df2 进行成对相关性计算?
该表格将如下所示:
col1 col2 col3
col4 .. .. ..
col5 .. .. ..
col6 .. .. ..
我使用
df1.corrwith(df2)
,但它似乎没有生成所需的表格。我在这里提出了一个类似的问题:如何在具有不同列名称的两个数据框之间执行相关性,但现在我正在处理分类列。
如果不能直接比较,是否有一种标准方法使它们可比较(例如使用get_dummies)?并且是否有更快的自动处理所有字段(假设所有字段都是分类的)并计算它们的相关性的方法?