如何在pandas中将对象数据类型转换为浮点数

Question

如何在pandas中将对象数据类型转换为浮点数

3

我有一个数据框，其中一列是"object"数据类型。我使用pd.to_numeric() 和 errors='coerce' 将其转换为"float"数据类型。但是，转换后的列中所有条目都显示为NaN。如果我将errors='ignore'，则不会将任何条目转换为浮点数。我是否遗漏了什么？以下是代码片段：

pd.to_numeric(df['gender'],errors = 'coerce')

列 df['gender'] 包含 'Male' 和 'Female' 条目。我想将它们转换为 'float' 数据类型。

谢谢！

- Nanda

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- tdy · Accepted Answer

"to_numeric" 只能将数值化的东西转换。例如，它可以将字符串 '10' 转换为数字 10，但它无法将像 'Male' 这样的东西转换为数字。

请使用 pd.factorize 替代：

df['gender'] = pd.factorize(df['gender'])[0].astype(float)

或者 Series.factorize：

df['gender'] = df['gender'].factorize()[0].astype(float)

< p > factorize函数的第一个元素包含整数代码，所以我们将它们转换为astype(float)

或者如你所评论的那样，Series.map 也可以使用：

df['gender'] = df['gender'].map({'Male': 0, 'Female': 1}).astype(float)