我想使用两个数据框的相似列'A'来合并它们:
>>> df1
A B
0 I 1
1 I 2
2 II 3
>>> df2
A C
0 I 4
1 II 5
2 III 6
为了做到这一点,我尝试使用以下代码:
这将返回如下结果:merged = pd.merge(df1, df2, on='A', how='outer')
>>> merged
A B C
0 I 1.0 4
1 I 2.0 4
2 II 3.0 5
3 III NaN 6
不过,由于 df2 只包含 A == 'I' 的一个值,我不希望在合并的 dataframe 中重复该值。相反,我希望得到以下输出:
>>> merged
A B C
0 I 1.0 4
1 I 2.0 NaN
2 II 3.0 5
3 III NaN 6
怎样做才是最好的?我对Python还很陌生,对于所有的join/merge/concatenate/append操作仍然有些困惑。