在Pyspark中,如何在Pyspark数据框中使用类似于pandas的str.contains函数?

6
请建议我如何在Spark DataFrame的一列上实现字符串包含,对于pandas,我曾经这样做:
df1 = df[df['col1'].str.contains('anystring_to_match')]
1个回答

12

尝试:

df['col1'].like('%anystring_to_match%')

1
df[df['col1'].like('%任意匹配字符串%')]有效。谢谢。 - Satya
这是一个精确匹配,与.str.contains的工作方式不同。 - Max
1
@Max:它与 str.contains 有什么具体的不同之处?在我看来,语义应该是相同的。 - abeboparebop

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接