我正在伪分布式模式下运行Hadoop。我希望通过将HDFS抽象化来从本地文件系统读写任务。我使用file:///
参数。
我遵循了这个链接的指示。
这是core-site.xml
文件的内容,
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value> /home/abimanyu/temp</value>
</property>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:54310</value>
</property>
</configuration>
这是
mapred-site.xml
文件的内容。<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:54311</value>
</property>
<property>
<name>fs.default.name</name>
<value>file:///</value>
</property>
<property>
<name>mapred.tasktracker.map.tasks.maximum</name>
<value>1</value>
</property>
<property>
<name>mapred.tasktracker.reduce.tasks.maximum</name>
<value>1</value>
</property>
</configuration>
这是
hdfs-site.xml
文件的内容。<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
当我尝试启动守护进程(使用start-dfs或start-all)时,会出现以下错误:
localhost: Exception in thread "main" java.lang.IllegalArgumentException: Does not contain a valid host:port authority: file:///
localhost: at org.apache.hadoop.net.NetUtils.createSocketAddr(NetUtils.java:164)
localhost: at org.apache.hadoop.hdfs.server.namenode.NameNode.getAddress(NameNode.java:212)
localhost: at org.apache.hadoop.hdfs.server.namenode.NameNode.getAddress(NameNode.java:244)
localhost: at org.apache.hadoop.hdfs.server.namenode.NameNode.getServiceAddress(NameNode.java:236)
localhost: at org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode.initialize(SecondaryNameNode.java:194)
localhost: at org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode.<init>(SecondaryNameNode.java:150)
localhost: at org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode.main(SecondaryNameNode.java:676)
对我来说奇怪的是,这个从本地文件系统读取的操作在hadoop-0.20.2
中完全正常,但在hadoop-1.2.1
中却不行。从最初版本到后来的版本有什么变化吗?请告诉我如何为Hadoop JAR从本地文件系统读取。
/home/abimanyu/binaries
安装了Hadoop,因此我认为这是我的HADOOP_HOME。 - Learner