我有一个数据框:
import pandas as pd
d = {'user': ['bob','alice','bob'], 'item':
['apple','coconut','pear']}
df = pd.DataFrame(data=d)
user item
0 bob apple
1 alice coconut
2 bob pear
我的目标是将每个列中的字符串映射到一个递增的ID(从0开始),如下:
user item
0 0 0
1 1 1
2 0 2
例如,对于列
user
,[bob,alice]
将映射为[0,1]
。目标是为了节省数据框的内存。此外,是否可能指定要映射的列?例如,仅映射
user
列。谢谢。