我有:
我想要:
由如何在Pyspark中将列表拆分为多个列?提供的解决方案。
“工作正常,但我的一些数组非常长(最大为332)。
我该如何编写代码以考虑所有长度的数组?”
+---+-------+-------+
| id| var1| var2|
+---+-------+-------+
| a|[1,2,3]|[1,2,3]|
| b|[2,3,4]|[2,3,4]|
+---+-------+-------+
我想要:
+---+-------+-------+-------+-------+-------+-------+
| id|var1[0]|var1[1]|var1[2]|var2[0]|var2[1]|var2[2]|
+---+-------+-------+-------+-------+-------+-------+
| a| 1| 2| 3| 1| 2| 3|
| b| 2| 3| 4| 2| 3| 4|
+---+-------+-------+-------+-------+-------+-------+
由如何在Pyspark中将列表拆分为多个列?提供的解决方案。
df1.select('id', df1.var1[0], df1.var1[1], ...).show()
“工作正常,但我的一些数组非常长(最大为332)。
我该如何编写代码以考虑所有长度的数组?”
df2.select('key', 'value.*').show()
这一行代码;这有帮助吗? - Cleb