我有以下PySpark DataFrame:
id col1 col2
A 2 3
A 2 4
A 4 6
B 1 2
我想要将
col1
和col2
叠加在一起,以便获得如下的单列:id col3
A 2
A 3
A 4
A 6
B 1
B 2
我该如何做到呢?
df = (
sc.parallelize([
(A, 2, 3), (A, 2, 4), (A, 4, 6),
(B, 1, 2),
]).toDF(["id", "col1", "col2"])
)
col3
中,你只有6个元素,而在原始的两个中总共有8个元素。 - Sergey Ronin