我的 data.csv 文件有三列,如下所示。我已将此文件转换为Python的Spark DataFrame。
A B C
| 1 | -3 | 4 |
| 2 | 0 | 5 |
| 6 | 6 | 6 |
我想在Spark DataFrame中添加另一列D,其值根据以下条件为Yes或No:如果B列对应的值大于0,则为Yes,否则为No。
A B C D
| 1 | -3 | 4 | No |
| 2 | 0 | 5 | No |
| 6 | 6 | 6 | Yes |
我无法通过PySpark数据框架操作来实现这个。