使用pyspark dataframe,如何执行与Pandas中的
我想列出pyspark dataframe列中所有唯一的值。
不使用SQL(注册模板,然后对不同值进行SQL查询)。
也不需要
df ['col'] .unique()
等效的操作?我想列出pyspark dataframe列中所有唯一的值。
不使用SQL(注册模板,然后对不同值进行SQL查询)。
也不需要
groupby
然后使用countDistinct
,相反,我想检查该列中的唯一值。