假设数据框 df
如下:
df.show()
输出:
+------+----------------+
|letter| list_of_numbers|
+------+----------------+
| A| [3, 1, 2, 3]|
| B| [1, 2, 1, 1]|
+------+----------------+
我想要做的是在列list_of_numbers
中计数特定元素的数量。就像这样:
+------+----------------+----+
|letter| list_of_numbers|ones|
+------+----------------+----+
| A| [3, 1, 2, 3]| 1|
| B| [1, 2, 1, 1]| 3|
+------+----------------+----+
我迄今为止尝试创建udf
并且它完美的工作了,但我想知道是否可以在不定义任何udf
的情况下实现。
join
将结果与原始的df
合并。否则我会失去那些没有one
的行 :) - Ala Tarighati