I have a pySpark dataframe in python as -
from pyspark.sql.functions import col
dataset = sqlContext.range(0, 100).select((col("id") % 3).alias("key"))
列名为key,我希望能使用一个变量选择这一列。
myvar = "key"
现在,我想使用myvar
变量在select语句中选择这一列。
我尝试了以下代码:
dataset.createOrReplaceTempView("dataset")
spark.sql(" select $myvar from dataset ").show
但是它返回了一个错误
在输入“select $”时没有可行的替代方法(第1行,位置8)
我该如何在pySpark中实现这一点?
请注意,未来可能会有不同的列,并且我想传递多个变量或者可能是一个list
到SELECT
子句中。
select
。您也可以传递列表。在此处阅读更多信息:https://dev59.com/QlMI5IYBdhLWcg3w4Po_。 - pault