我尝试按照这个答案的方法操作,但我的问题略有不同。
我有两个pyspark数据框df2和bears2。它们都有一个整数变量,我想创建一个布尔变量,如下伪代码所示:
基本上,如果
我尝试了其他问题中的
我有两个pyspark数据框df2和bears2。它们都有一个整数变量,我想创建一个布尔变量,如下伪代码所示:
df3 = df2.withColumn("game", (df2.week_id.isin(bears2.week_if), 1,0))
基本上,如果
df2
的值存在于 bears2
相应的列中,则我想要一个 1
,否则是 0
。我尝试了其他问题中的
expr()
方法,但无法使其正常工作。它看起来像这样:new_column_1 = F.expr(
"""IF(df2.week_id IN(bears2.week_if), 1, 0))"""
)
withColumn(...., when(condition, value).otherwise(another_value))
。 - vvgIN
在数据框中不起作用 - 您必须使用 join。我正在更新答案。 - pault