我想要统计一列中的NULL、空值和NaN值。我尝试了以下方法:df.filter( (df["ID"] == "") | (df["ID"].isNull()) | ( df["ID"].isnan()) ).count() 但我总是收到这个错误消息:TypeError: 'Column' object is not callable 有人知道问题可能是什么吗? 非常感谢提前!
isnan不是Column类的方法,您需要导入它: from pyspark.sql.functions import isnan 并像这样使用: df.filter((df["ID"] == "") | df["ID"].isNull() | isnan(df["ID"])).count()
functools.reduce
,请参见我在这里的回答。 - Psidom