有人可以解释一下为什么我对这两个表达式的过滤结果不同吗?我正在尝试在两个日期之间进行筛选:
df.filter("act_date <='2017-04-01'" and "act_date >='2016-10-01'")\
.select("col1","col2").distinct().count()
结果:37M
对比:
df.filter("act_date <='2017-04-01'").filter("act_date >='2016-10-01'")\
.select("col1","col2").distinct().count()
结果:25M
它们有什么不同?对我来说,它们应该产生相同的结果