我有一个包含产品及其特征的数据框。
我希望对于每个特征列中唯一的值,创建一个新的虚拟变量。如果该特定特征值存在于该特定产品中,则该变量为1,否则为0。
例如:
import pandas as pd
df = pd.DataFrame({'id':['prod_A','prod_A','prod_B','prod_B'],
'color':['red','green','red','black'],
'size':[1,2,3,4]})
我希望您最终能得到这样一个数据框:
data frame
。df_f = pd.DataFrame({'id': ['prod_A', 'prod_B'],
'color_red': [1, 1],
'color_green': [1, 0],
'color_black': [0, 1],
'size_1': [1, 0],
'size_2': [1, 0],
'size_3': [0, 1],
'size_4': [0, 1]})
有什么想法吗?