我将尝试连接多个Pandas DataFrames,其中一些使用多级索引,另一些使用单个索引。例如,让我们考虑以下单个索引数据帧:
现在我希望将这两个数据框连接起来。当我尝试使用
如果我将一个单独的列添加到多级索引数据框
我该如何使用
> import pandas as pd
> df1 = pd.DataFrame({'single': [10,11,12]})
> df1
single
0 10
1 11
2 12
随着多索引数据框:
> level_dict = {}
> level_dict[('level 1','a','h')] = [1,2,3]
> level_dict[('level 1','b','j')] = [5,6,7]
> level_dict[('level 2','c','k')] = [10, 11, 12]
> level_dict[('level 2','d','l')] = [20, 21, 22]
> df2 = pd.DataFrame(level_dict)
> df2
level 1 level 2
a b c d
h j k l
0 1 5 10 20
1 2 6 11 21
2 3 7 12 22
现在我希望将这两个数据框连接起来。当我尝试使用
concat
时,它会将多重索引压平,如下所示:> df3 = pd.concat([df2,df1], axis=1)
> df3
(level 1, a, h) (level 1, b, j) (level 2, c, k) (level 2, d, l) single
0 1 5 10 20 10
1 2 6 11 21 11
2 3 7 12 22 12
如果我将一个单独的列添加到多级索引数据框
df2
中,操作如下:> df2['single'] = [10,11,12]
> df2
level 1 level 2 single
a b c d
h j k l
0 1 5 10 20 10
1 2 6 11 21 11
2 3 7 12 22 12
我该如何使用
concat
、merge
或 join
从 df1
和 df2
生成这个数据框?