将Dataset转换为RDD的Spark操作

14

我有一个Dataset[String]需要转换成RDD[String],应该怎么做?

注:我最近从Spark 1.6迁移到了Spark 2.0。我的一些客户原本期望得到RDD,但现在Spark给我提供的是Dataset。

2个回答

28

如在scala API文档中所述,您可以在数据集上调用.rdd

val myRdd : RDD[String] = ds.rdd

1

数据集是强类型的数据框架,因此数据集和数据框架都可以使用 .rdd 将其转换为 RDD。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接