当我运行命令
链接数据库目录已存在,但不包含“current”目录。该目录归属于root用户,因此不应出现权限问题。由于进程由于错误而退出,链接数据库目录中包含“.locked”和“..locked.crc”文件。如果再次运行命令,这些锁定文件将导致它在同一位置退出。删除“TestCrawl2”目录,重复操作即可。请注意,Nutch和Solr的安装本身以前在“TestCrawl”实例中运行时没有任何问题。只有当我尝试新的实例时才会出现问题。您对解决此问题有什么建议吗?
nutch 1.10
时,假设TestCrawl2
以前并不存在需要创建...sudo -E bin/crawl -i -D solr.server.url=http://localhost:8983/solr/TestCrawlCore2 urls/ TestCrawl2/ 20
我在索引时收到一个错误,错误信息如下:
Indexer: org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: file:/opt/apache-nutch-1.10/TestCrawl2/linkdb/current
链接数据库目录已存在,但不包含“current”目录。该目录归属于root用户,因此不应出现权限问题。由于进程由于错误而退出,链接数据库目录中包含“.locked”和“..locked.crc”文件。如果再次运行命令,这些锁定文件将导致它在同一位置退出。删除“TestCrawl2”目录,重复操作即可。请注意,Nutch和Solr的安装本身以前在“TestCrawl”实例中运行时没有任何问题。只有当我尝试新的实例时才会出现问题。您对解决此问题有什么建议吗?