我有一些数据存储在HDFS的/user/Cloudera/Test/*
路径下。通过运行hdfs -dfs -cat Test/*
命令,我可以很好地查看记录。
现在,我需要将同样的文件作为RDD在Scala中读取。我已经在Scala shell中尝试了以下操作。
val file = sc.textFile("hdfs://quickstart.cloudera:8020/user/Cloudera/Test")
我编写了一些过滤器和for循环来读取单词。但是当我最后使用Println
时,它会显示文件未找到。
请问有人可以帮我确定在这种情况下HDFS的URL是什么吗? 注意:我正在使用Cloudera CDH5.0虚拟机。
/user/Cloudera/Test/
是一个文本文件吗?看起来更像是一个文件夹。 - Raphael Roth