你好,我正在尝试使用Spark从文本文件中读取特定行。
SparkConf conf = new SparkConf().setAppName(appName).setMaster(master);
sc = new JavaSparkContext(conf);
JavaRDD<String> lines = sc.textFile("data.txt");
String firstLine = lines.first();
可以使用 .first() 命令获取 data.text 文档的第一行。如何访问文档的第 N 行?我需要 Java 解决方案。
lines.take(n).apply(n-1)
。 - Josiah Yodern
th" 是从零开始的 :).lines
应该是一个JavaRDD
,因此take
返回一个 JavaList<String>
,因此需要使用get
而不是apply
。 - Daniel Darabos