我有一个包含域名的数据:
url var1
www.CNN.com xsd
www.Nbc.com wer
www.BBc.com xyz
www.fOX.com zyx
....
数据是序列类型。我正在使用以下内容将url变量转换为小写:
数据是序列类型。我正在使用以下内容将url变量转换为小写:
df.apply(lambda x: x.astype(str).str.lower())
然而,它们仍然是一样的。
我做错了什么?
df['url'] = df['url'].str.lower()
应该对这个系列进行操作,并将其替换为小写版本。
df.column_name.str.lower()
df['column_name'].str.lower()
我认为你需要将输出赋回,如果仅与列url
一起工作,则最好省略apply
:
df = pd.DataFrame({'url': ['www.CNN.com', 'www.Nbc.com', 'www.BBc.com', 'www.fOX.com'],
'var1': ['XSD', 'wer', 'xyz', 'zyx']})
print (df)
url var1
0 www.CNN.com XSD
1 www.Nbc.com wer
2 www.BBc.com xyz
3 www.fOX.com zyx
#if types of column is str, astype is not necessary
df.url = df.url.astype(str).str.lower()
print (df)
url var1
0 www.cnn.com XSD
1 www.nbc.com wer
2 www.bbc.com xyz
3 www.fox.com zyx
但是如果需要将df
的所有列转换为小写字符串
:
df = df.astype(str).apply(lambda x: x.str.lower())
print (df)
url var1
0 www.cnn.com xsd
1 www.nbc.com wer
2 www.bbc.com xyz
3 www.fox.com zyx
df['url'] = df.loc[:,'url'].str.lower()
,但我同意David的看法,在这里是不必要的。 - Sergey Bushmanovdf.loc[:, 'url'] = df.loc[:, 'url'].str.lower()
最终起作用了。 - izkeros