我有一些数据,看起来像这样:
([('01','A','2016-01-01','8701','123','2016-10-23'),('01','A','2016-
01-01','8701','123','2016-11-23'),('01','A','2016-01-01','8701','123','2016-12-23')])
我的目标是在PySpark中按('01', 'A', '2016-01-01', '8701', '123') 进行分组,并使其看起来像:
[('01','A','2016-01-01''8701','123', ('2016-10-23', '2016-11-23',
'2016-12-23'))]
我尝试使用groupByKey,但对我没有用。
谢谢。