Solr和网站索引创建网站搜索

7
我正在尝试在一个简单的http网站上构建“站点搜索”功能。
我有一个纯html的网站,假设它叫做www.mycompany.com。
是否有一种简单的方法可以使用solr对整个网站进行索引,并将solr用作引擎来构建全文搜索?
我谷歌了一下,但没有找到任何特定类型的东西: 做A 做B ... 获利!
如果我的solr理解有误,请告诉我。
提前感谢。
3个回答

6
Solr仅用于索引和搜索文本,它没有爬虫,因为这超出了项目的范围。
但是,可以看一下Nutch,它是一个爬虫,初始设置也不太难。
如果您需要一些Solr特定功能来搜索索引,则可以将Nutch和Solr集成

我没有理解的一件事是,他们在http://nutch.apache.org/网站上使用Google站点搜索进行搜索。 - Anthony

4
$ bin/solr create -c corename
$ bin/post -c corename https://siteurl.com -recursive 2 -delay 1

这将对网站进行基本索引,但并不是最好的选择。如果您想要简单的话,那就可以使用它。这是可行的。

我认为这只适用于solr 5+。


1

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接