我有一个类似于以下示例的DataFrame:
我想通过“word”列的值将此数据帧拆分,以获得DataFrame的“列表”(在下一步中绘制一些图形)。例如:
DF1
DF2
DF3
这个可以用 PySpark(1.6)实现吗?
Timestamp | Word | Count
30/12/2015 | example_1 | 3
29/12/2015 | example_2 | 1
28/12/2015 | example_2 | 9
27/12/2015 | example_3 | 7
... | ... | ...
我想通过“word”列的值将此数据帧拆分,以获得DataFrame的“列表”(在下一步中绘制一些图形)。例如:
DF1
Timestamp | Word | Count
30/12/2015 | example_1 | 3
DF2
Timestamp | Word | Count
29/12/2015 | example_2 | 1
28/12/2015 | example_2 | 9
DF3
Timestamp | Word | Count
27/12/2015 | example_3 | 7
这个可以用 PySpark(1.6)实现吗?