我在网上查找了许多不同的解决方案,但没有找到我想要实现的内容。请帮助我。
我正在使用Scala的Apache Spark 2.1.0。以下是我的数据框架:
+-----------+-------+
|COLUMN_NAME| VALUE |
+-----------+-------+
|col1 | val1 |
|col2 | val2 |
|col3 | val3 |
|col4 | val4 |
|col5 | val5 |
+-----------+-------+
我希望将这个转置为以下内容:
+-----+-------+-----+------+-----+
|col1 | col2 |col3 | col4 |col5 |
+-----+-------+-----+------+-----+
|val1 | val2 |val3 | val4 |val5 |
+-----+-------+-----+------+-----+
COLUMN_NAME
但不同的VALUE
,那该怎么办?那么值应该是什么?如果您知道没有这样的重复项,则数据框架要么非常小(在这种情况下,您可以只需收集它并使用普通Scala进行转换),要么结果将具有太多列。 - Tzach Zohar