我本以为我对map和applymap的理解很好,但现在遇到了问题(如果您感兴趣,请查看这里获取更多背景信息)。
一个简单的例子:
df = pd.DataFrame( [[1,2],[1,1]] )
dct = { 1:'python', 2:'gator' }
df[0].map( lambda x: x+90 )
df.applymap( lambda x: x+90 )
这个结果如预期一样 -- 两者都是基于元素操作的,map用在series上,applymap用在dataframe上(在这里很好地解释了 这里)。
如果我使用字典而不是lambda函数,map仍然可以正常工作:
df[0].map( dct )
0 python
1 python
但不适用于 applymap:
df.applymap( dct )
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-100-7872ff604851> in <module>()
----> 1 df.applymap( dct )
C:\Users\johne\AppData\Local\Continuum\Anaconda\lib\site-packages\pandas\core\frame.pyc in applymap(self, func)
3856 x = lib.map_infer(_values_from_object(x), f)
3857 return lib.map_infer(_values_from_object(x), func)
-> 3858 return self.apply(infer)
3859
3860 #----------------------------------------------------------------------
C:\Users\johne\AppData\Local\Continuum\Anaconda\lib\site-packages\pandas\core\frame.pyc in apply(self, func, axis, broadcast, raw, reduce, args, **kwds)
3687 if reduce is None:
3688 reduce = True
-> 3689 return self._apply_standard(f, axis, reduce=reduce)
3690 else:
3691 return self._apply_broadcast(f, axis)
C:\Users\johne\AppData\Local\Continuum\Anaconda\lib\site-packages\pandas\core\frame.pyc in _apply_standard(self, func, axis, ignore_failures, reduce)
3777 try:
3778 for i, v in enumerate(series_gen):
-> 3779 results[i] = func(v)
3780 keys.append(v.name)
3781 except Exception as e:
C:\Users\johne\AppData\Local\Continuum\Anaconda\lib\site-packages\pandas\core\frame.pyc in infer(x)
3855 f = com.i8_boxer(x)
3856 x = lib.map_infer(_values_from_object(x), f)
-> 3857 return lib.map_infer(_values_from_object(x), func)
3858 return self.apply(infer)
3859
C:\Users\johne\AppData\Local\Continuum\Anaconda\lib\site-packages\pandas\lib.pyd in pandas.lib.map_infer (pandas\lib.c:56990)()
TypeError: ("'dict' object is not callable", u'occurred at index 0')
所以,我的问题是为什么map和applymap在这里不能像类似的方式工作?这是applymap的一个bug吗,还是我做错了什么?
编辑添加:我已经发现可以通过以下方法轻松解决这个问题:
df.applymap( lambda x: dct[x] )
0 1
0 python gator
1 python python
更好的方法是通过这个答案,不需要使用lambda。
df.applymap( dct.get )
所以这两种方法基本上是完全等价的,对吧?可能是applymap函数解析语法的方式有些问题,使用函数或方法形式比字典更好。无论如何,现在似乎已经没有实际问题了,但如果有人想回答这里发生了什么,我仍然很感兴趣。