我正在尝试向pandas数据框(df1)中添加一列,该列具有来自另一个数据框(df2)的唯一标识符('sameid')列的唯一标识符('id')。我已经尝试了合并,但我只需要添加一个特定的列('addthiscolumn')而不是所有列。最好的方法是什么?
print df1
'id' 'column1'
0 aaa randomdata1
1 aab randomdata2
2 aac randomdata3
3 aad randomdata4
print df2
'sameid' 'irrelevant' 'addthiscolumn'
0 aaa irre1 1234
1 aab irre2 2345
2 aac irre3 3456
3 aad irre4 4567
4 aae irre5 5678
5 aad irre6 6789
期望结果
print df1
'id' 'column1' 'addthiscolumn'
0 aaa randomdata1 1234
1 aab randomdata2 2345
2 aac randomdata3 3456
3 aad randomdata4 4567
df1.merge(df2, left_on='id', right_on='sameid')
。这将合并df1
和df2
两个数据框,使用id
列和sameid
列作为连接键。 - EdChum