我将延伸这个问题,它与将字典值映射到数据框有关。 我有一个简单的数据框df:
U,id
111,01
112,02
112,03
113,04
113,05
113,06
114,07
我希望在一个新列上映射以下嵌套字典:
d = {112: {'en': 1, 'es': 2}, 113: {'zh': 1, 'ja': 1, 'es': 2}, 114: {'es': 1}, 111: {'ar': 2, 'en': 1}}
只考虑最频繁的L
值,即112:'es',113:'es',114:'es',111:'ar'。
在简单的字典情况下,我可以使用 df ['C'] = df ['U']。map(d)
。如何仅考虑以前的最高值?生成的数据框将显示为:
U,id,C
111,01,ar
112,02,es
112,03,es
113,04,es
113,05,es
113,06,es
114,07,es