我对pandas数据框还很陌生,正在尝试将两个表格连接起来时遇到了一些问题。
第一个数据框只有3列:
DF1
:
item_id position document_id
336 1 10
337 2 10
338 3 10
1001 1 11
1002 2 11
1003 3 11
38 10 146
第二个表格与第一个表格有完全相同的两列(还有许多其他列):
DF2
:
item_id document_id col1 col2 col3 ...
337 10 ... ... ...
1002 11 ... ... ...
1003 11 ... ... ...
我所需要的是执行一个操作,在SQL中看起来应该像这样:
DF1 join DF2 on
DF1.document_id = DF2.document_id
and
DF1.item_id = DF2.item_id
因此,我希望看到DF2,其中包括'position'列:
item_id document_id position col1 col2 col3 ...
使用pandas有什么好的方法可以做到这一点?