我正在处理不同的Spark
我尝试使用
我还尝试找到是否有任何列都具有所有
DataFrames
,其中许多列都有很多空值。我想从每个列中获取任何一个非空值,以查看该值是否可以转换为日期时间。我尝试使用
df.na.drop().first()
,希望它会删除所有具有任何空值的行,并且在剩余的DataFrame
中,我将只获取所有非空值的第一行。但是,许多DataFrames
有许多包含很多空值的列,因此df.na.drop()
返回空的DataFrame
。我还尝试找到是否有任何列都具有所有
null
值,以便我可以在尝试上述方法之前简单地删除该列,但这仍然没有解决问题。有什么好的办法可以高效地完成此操作?因为这段代码将在大型DataFrames
上运行多次。
TypeError:_()得到了一个意外的关键字参数'ignorenulls'
- anwartheravianignorenulls
不可用作参数。有什么解决方法吗? - anwartheravian