我有一个RDD(字符串数组)
org.apache.spark.rdd.RDD[String] = MappedRDD[18]
,想把它转换成具有唯一ID的映射。我使用了'val vertexMAp = vertices.zipWithUniqueId
',但这给了我另一个类型为'org.apache.spark.rdd.RDD[(String, Long)]'
的RDD,但我想要一个'Map[String, Long]
'。如何将我的'org.apache.spark.rdd.RDD[(String, Long)]
'转换为'Map[String, Long]
'?谢谢。
lookup
可以在完整分布式RDD
上工作。 - maasg