我有一个数据框
date, string, string
我想选择某个时间段之前的日期。我尝试了以下方法,但没有成功。
data.filter(data("date") < new java.sql.Date(format.parse("2015-03-14").getTime))
我收到了以下错误提示
org.apache.spark.sql.AnalysisException: resolved attribute(s) date#75 missing from date#72,uid#73,iid#74 in operator !Filter (date#75 < 16508);
我猜测查询语句不正确。有人能展示一下查询语句应该如何格式化吗?
我检查了数据框中的所有条目都有值 - 它们确实有。
lit
,请查看pyspark.sql.functions
。 - ijoseph