我如何使用多个条件实现以下目标。
from pyspark.sql import functions as F
df = spark.createDataFrame([(5000, 'US'),(2500, 'IN'),(4500, 'AU'),(4500, 'NZ')],["Sales", "Region"])
df.withColumn('Commision',
F.when(F.col('Region')=='US',F.col('Sales')*0.05).\
F.when(F.col('Region')=='IN',F.col('Sales')*0.04).\
F.when(F.col('Region')in ('AU','NZ'),F.col('Sales')*0.04).\
otherwise(F.col('Sales'))).show()
F.when
更改为when
。 - jxcin
转换为.isin('AU', 'NZ')
- murtihash