假设我们有一个简单的数据框:
问题是如何检测空值?我尝试了以下方法:
我知道以下内容是可行的:
from pyspark.sql.types import *
schema = StructType([
StructField('id', LongType(), False),
StructField('name', StringType(), False),
StructField('count', LongType(), True),
])
df = spark.createDataFrame([(1,'Alice',None), (2,'Bob',1)], schema)
问题是如何检测空值?我尝试了以下方法:
df.where(df.count == None).show()
df.where(df.count is 'null').show()
df.where(df.count == 'null').show()
发生错误:
condition should be string or Column
我知道以下内容是可行的:
我知道以下内容是可行的:
df.where("count is null").show()
但是有没有一种方法可以在不使用完整字符串的情况下实现呢?例如 df.count
...?