将一个pandas数据框的列映射到另一个数据框中。

Question

将一个pandas数据框的列映射到另一个数据框中。

4

我有一个这样的数据框：

df_1 = pd.DataFrame({'players.name': ['John', 'Will' ,'John', 'Jim', 'Tim', 'John', 'Will', 'Tim'],
                     'players.diff': [0, 0, 0, 0, 0, 0, 0, 0],
                            'count': [3, 2, 3, 1, 2, 3, 2, 2]})

“count”值是恒定不变的。

我有一个形状不同且以不同顺序排序的数据框，如下所示：

df_2 = pd.DataFrame({'players.name': ['Will', 'John' ,'Jim'],
                     'players.diff': [0, 0, 0]})

我该如何映射df_1的值，并在df_2上填充一个“count”值，最终得到以下结果：

  players.name  players.diff  counts
0         Will             0       2
1         John             0       3
2          Jim             0       1

- 8-Bit Borges

你的数据框中是否有多行具有相同的名称？如果有，那么这些列的值（计数、差异）在每一行中是否都是唯一的？ - Ranika Nisal

3个回答

1

您的样本 df_1 中有重复的 players.name，计数相同，因此您需要进行左合并和去重。

new_df_2 = df_2.merge(df_1[['players.name','count']], on='players.name', how='left').drop_duplicates()

Out[89]:
  players.name  players.diff  count
0         Will             0      2
2         John             0      3
5          Jim             0      1

- Andy L.

是 df_1 存在重复值。 - Rm4n

@siamaksafari：这是个打字错误 :) - Andy L.

1

这可能起作用：

pd.merge(df_1, df_2, on=["players.name", "players.diff"]).drop_duplicates()

- Active_Learner

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- cs95 · Accepted Answer

由于您只是想创建一个计数列，因此更有意义的方法是使用map将玩家名称映射到计数：

df_2['counts'] = df_2['players.name'].map(
    df_1.groupby('players.name')['count'].first())

df_2 

  players.name  players.diff  counts
0         Will             0       2
1         John             0       3
2          Jim             0       1