我在Python/Pyspark中有一个数据框,其列包括id
、time
、city
、zip
等。
现在我向这个数据框添加了一个新的列name
。
现在我需要按照一定顺序重新排列这些列,使得name
列在id
列之后。
我已经像下面这样操作:
change_cols = ['id', 'name']
cols = ([col for col in change_cols if col in df]
+ [col for col in df if col not in change_cols])
df = df[cols]
我遇到了这个错误
pyspark.sql.utils.AnalysisException: u"Reference 'id' is ambiguous, could be: id#609, id#1224.;"
为什么会出现这个错误,我该如何纠正它。
df.select(["id", "name", "time", "city"])
也可以使用。 - Powers