我的问题是上面这个链接中很好回答的问题的扩展:
我在下面发布了答案,其中当字符串包含单词 "ball" 时过滤掉它们:
In [3]: df[df['ids'].str.contains("ball")]
Out[3]:
ids vals
0 aball 1
1 bball 2
3 fball 4
我的问题是:如果我的数据中有很长的句子,并且我想要识别包含“球”和“场地”这两个词的字符串,那该怎么办呢?这样可以丢弃只包含一个单词“球”或“场地”的数据,但保留同时包含这两个单词的内容。
df['ids'].str.contains("ball", regex=False)
来获得一些速度提升。 - Alex Riley