我正在寻找一种在Stata中复制encode行为的方法,该方法将把一个分类字符串列转换为数字列。
x = pd.DataFrame({'cat':['A','A','B'], 'val':[10,20,30]})
x = x.set_index('cat')
导致的结果是:
val
cat
A 10
A 20
B 30
我想将“cat”列从字符串转换为整数,将每个唯一的字符串映射到一个(任意)一对一的整数。结果如下:
val
cat
1 10
1 20
2 30
或者,同样好:
cat val
0 1 10
1 1 20
2 2 30
有什么建议吗?
一如既往地感谢, 罗布
encode
所做的。它会产生一对一的映射。 - Nick Cox'A'
变成1
,每个实例的'B'
变成2
等等。 - LondonRob