将一个pandas数据框的列映射到另一个数据框中。

4

我有一个这样的数据框:

df_1 = pd.DataFrame({'players.name': ['John', 'Will' ,'John', 'Jim', 'Tim', 'John', 'Will', 'Tim'],
                     'players.diff': [0, 0, 0, 0, 0, 0, 0, 0],
                            'count': [3, 2, 3, 1, 2, 3, 2, 2]})

“count”值是恒定不变的。


我有一个形状不同且以不同顺序排序的数据框,如下所示:

df_2 = pd.DataFrame({'players.name': ['Will', 'John' ,'Jim'],
                     'players.diff': [0, 0, 0]})

我该如何映射df_1的值,并在df_2上填充一个“count”值,最终得到以下结果:
  players.name  players.diff  counts
0         Will             0       2
1         John             0       3
2          Jim             0       1

你的数据框中是否有多行具有相同的名称?如果有,那么这些列的值(计数、差异)在每一行中是否都是唯一的? - Ranika Nisal
3个回答

3

由于您只是想创建一个计数列,因此更有意义的方法是使用map将玩家名称映射到计数:

df_2['counts'] = df_2['players.name'].map(
    df_1.groupby('players.name')['count'].first())

df_2 

  players.name  players.diff  counts
0         Will             0       2
1         John             0       3
2          Jim             0       1

1
您的样本 df_1 中有重复的 players.name,计数相同,因此您需要进行左合并和去重。
new_df_2 = df_2.merge(df_1[['players.name','count']], on='players.name', how='left').drop_duplicates()

Out[89]:
  players.name  players.diff  count
0         Will             0      2
2         John             0      3
5          Jim             0      1

df_1 存在重复值。 - Rm4n
@siamaksafari:这是个打字错误 :) - Andy L.

1
这可能起作用:

pd.merge(df_1, df_2, on=["players.name", "players.diff"]).drop_duplicates()

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接