假设我有一个包含国家的数据框,如下:
cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
我知道有一个pd.get_dummies函数可以将国家转换为“one-hot encodings”。然而,我希望将它们转换为索引,以便我可以得到cc_index = [1,2,1,3]
。
我假设有比使用get_dummies和numpy where子句更快的方法,如下所示:
[np.where(x) for x in df.cc.get_dummies().values]
在R中使用'factors'会更容易,因此我希望Pandas有类似的东西。
cc_index = [0,1,0,2]
吗? - juanpa.arrivillaga