df(Pandas数据帧)有三行。
我想提取包含“is”和“small”的行。
如果我这样做:
然后它也捕捉了“His”,而我不想要。
以下查询是否是在 df.series 中捕获整个单词的正确方式?
col_name
"This is Donald."
"His hands are so small"
"Why are his fingers so short?"
我想提取包含“is”和“small”的行。
如果我这样做:
df.col_name.str.contains("is|small", case=False)
然后它也捕捉了“His”,而我不想要。
以下查询是否是在 df.series 中捕获整个单词的正确方式?
df.col_name.str.contains("\bis\b|\bsmall\b", case=False)
r
才能使其正常工作:有人知道为什么吗?我没有找到任何参考资料。 - mccc|
字符会隐式地转换为正则表达式,而\b
则不会。 - mccc