Pandas 合并不同索引的数据框

3
我有两个数据框,分别是df_1df_2,它们的索引和列不完全相同,但有一些重叠。我创建了一个数据框df,它包含了索引和列的并集,因此没有重复的索引或列。我希望以以下方式填充数据框df:
for x in df.index:
  for y in df.columns:
    df.loc[x,y] = df_1.loc[x,y] if (x,y) in (df_1.index,df_1.columns) else df_2.loc[x,y]

有人能告诉我一个高效的方法吗?

谢谢!

1个回答

3

我认为你需要使用DataFrame.combine_first函数:

df_1 = pd.DataFrame({'A':[1,2,3],
                     'E':[4,5,6],
                     'V':[7,8,9],
                     'D':[1,3,5]}, 
                     index=pd.to_datetime(['2017-01-05', '2017-01-04', '2017-01-01']))

print (df_1)
            A  D  E  V
2017-01-05  1  1  4  7
2017-01-04  2  3  5  8
2017-01-01  3  5  6  9

df_2 = pd.DataFrame({'A':[1,2,3],
                     'B':[4,5,6],
                     'C':[7,8,9]}, index=pd.date_range('2017-01-01', periods=3)) * 10

print (df_2)
             A   B   C
2017-01-01  10  40  70
2017-01-02  20  50  80
2017-01-03  30  60  90

df = df_1.combine_first(df_2)
print (df)
               A     B     C    D    E    V
2017-01-01   3.0  40.0  70.0  5.0  6.0  9.0
2017-01-02  20.0  50.0  80.0  NaN  NaN  NaN
2017-01-03  30.0  60.0  90.0  NaN  NaN  NaN
2017-01-04   2.0   NaN   NaN  3.0  5.0  8.0
2017-01-05   1.0   NaN   NaN  1.0  4.0  7.0

太棒了!索引和列会自动排序吗?因为我的索引是日期索引。 - riccio777
1
我认为是的,但不是100%确定,所以如果不是,请添加.sort_index() - jezrael
1
我测试了一下,它可以很好地对DateTimeIndex进行排序。同时,我也用它来更改样本。 - jezrael

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接