数据框中的'str.contains'未返回值

3

我正在清理一些文本数据,但是我找不到包含某些字符串的行。如果我进行简单的布尔运算,我会得到:

'<! [CDATA[! function( d,s, id){varjs, fjs=d. getElementsByTagName( s)[0],p= ^' in articles.loc[25111, 'content']

True

但是,如果我选择具有完全相同字符串的行,则会得到一个空数据框:

articles[articles['content'].str.contains('<! [CDATA[! function( d,s, id){varjs, fjs=d. getElementsByTagName( s)[0],p= ^')]

id  title   author  date    content year    month   publication category    digital section url stems

为什么会发生这种情况?
1个回答

7

我认为有些值会被识别为正则表达式,所以在str.contains中需要参数regex=False

s = '<! [CDATA[! function( d,s, id){varjs, fjs=d. getElementsByTagName( s)[0],p= ^'
articles[articles['content'].str.contains(s, regex=False)]

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接