我有一个包含许多列的数据框。我的目标是生成一个数据框,其中列名及其该列中空值的数量被列出。
例如:
+-------------+-------------+
| Column_Name | NULL_Values |
+-------------+-------------+
| Column_1 | 15 |
| Column_2 | 56 |
| Column_3 | 18 |
| ... | ... |
+-------------+-------------+
我已成功获取了一个列的空值数量,代码如下:
df.agg(F.count(F.when(F.isnull(c), c)).alias('NULL_Count'))
c
是数据框中的一列。然而,它不显示列的名称。输出如下:
+------------+
| NULL_Count |
+------------+
| 15 |
+------------+
有什么想法吗?
*
是用于进行参数解包的。该语法可以将列表的内容“解包”以便作为函数参数传递。 - pault