将嵌套字典值映射到数据框列 - pandas

5

我将延伸这个问题,它与将字典值映射到数据框有关。 我有一个简单的数据框df:

U,id
111,01
112,02
112,03
113,04
113,05
113,06
114,07

我希望在一个新列上映射以下嵌套字典:

d = {112: {'en': 1, 'es': 2}, 113: {'zh': 1, 'ja': 1, 'es': 2}, 114: {'es': 1}, 111: {'ar': 2, 'en': 1}}

只考虑最频繁的L值,即112:'es',113:'es',114:'es',111:'ar'。

在简单的字典情况下,我可以使用 df ['C'] = df ['U']。map(d)。如何仅考虑以前的最高值?生成的数据框将显示为:

U,id,C
111,01,ar
112,02,es
112,03,es
113,04,es
113,05,es
113,06,es
114,07,es
1个回答

6
我会将字典压缩成一个新的字典,然后您可以像之前一样调用map
In [44]:

max_d={}
for k,v in d.items():
    max_d[k] = max(v, key=v.get)
max_d
Out[44]:
{111: 'ar', 112: 'es', 113: 'es', 114: 'es'}
In [45]:

df['C'] = df['U'].map(max_d)
df  
Out[45]:
     U  id   C
0  111   1  ar
1  112   2  es
2  112   3  es
3  113   4  es
4  113   5  es
5  113   6  es
6  114   7  es

正是我所寻找的! - O.rka

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接