基于我对pandas的有限了解,pandas.Series.str.contains可以在pd.Series中搜索特定字符串。但是如果数据框很大,而我只想在做任何操作之前浏览其中所有种类的str元素怎么办?
例如像这样的示例:
我需要一个函数来返回
例如像这样的示例:
pd.DataFrame({'x1':[1,2,3,'+'],'x2':[2,'a','c','this is']})
x1 x2
0 1 2
1 2 a
2 3 c
3 + this is
我需要一个函数来返回
['+','a','c','this is']
。
df.apply(lambda x:pd.to_numeric(x,errors='ignore'))
将类似于'1.23'
的字符串数字转换为1.23
,所以我可以告诉你的函数在这个例子上会起作用。但是如果数据框中有列表元素,np.unique()
可能会失败。我会投票支持你。 - Garveynp.unique
应该被省略,它不是必要的。 - jezraelerrors='ignore'
,如何检查数字?因为如果使用errors='coerce'
,它会创建NaN并且可以检查它。 - jezraelerrors=ignore
来先将像'1.23'
这样的内容转换为1.23
,这与问题无关。之后,我意识到有必要查看数据框中仍包含哪些字符串类型。 - Garvey