ASP.NET搜索引擎

6

我正在建设一家公司网站。我们正在寻找基于ASP.NET的任何开源或付费搜索引擎。它应该能够:

  1. 搜索网站所有页面的内容。
  2. 所有办公文件等。
  3. 如果我们有一些基于用户类型和员工的搜索结果过滤。

请告诉我需要考虑哪些工具或软件。

2个回答

7

尝试使用Lucene.NET

Apache Lucene是一个高性能、全功能的文本搜索引擎库,完全用Java编写。它是适用于几乎任何需要全文搜索的应用程序,特别是跨平台的技术。

Lucene.Net是Java Lucene搜索引擎的源代码、逐类、API和算法移植到C#和.NET平台,利用Microsoft .NET Framework。

以下是一些入门教程链接:


2
Solr是另一个很棒的选择,它实际上是在Lucene之上提供了一个漂亮的REST/url API的外观。也有一个可用、成熟的.Net库与它一起使用。

http://lucene.apache.org/solr/

http://code.google.com/p/solrnet/

从您的问题中可以看出,您是在寻找实际的底层引擎,还是在寻找能够爬行/遍历您的内容并建立所选搜索引擎索引的工具?

--

编辑以回复原帖者的评论。
你有两个方程式要解决。
首先是选择一个能够响应输入(关键词)并查询其索引并返回相关匹配项的搜索引擎。其次是找到一种机制来填充您选择的引擎的搜索索引。
就引擎而言,Lucene已经被建议了,我建议使用一种提供(可以说)改进的开发人员界面的Lucene变体。在构建搜索语料库方面,情况有所不同。在这里,您可以选择编写自己的软件,将内容添加到索引中。优点在于您可以对进入搜索引擎的内容进行精细控制。缺点是您需要编写新代码,幸运的是,现代搜索引擎如Lucene / Solr使它变得非常容易。
第二个选择是使用某些工具自动爬取您的内容并将其添加到索引中。问题在于识别和学习配置适当选项。根据您选择的爬虫,它可能会或可能不会很好地索引存储在文件系统上的文档(例如企业Sharepoint网站中的文档)。
Nutch是Apache(Lucene和Solr的制造商)的网络爬虫,如果您选择不编写自己的代码,可能会使用它。http://wiki.apache.org/nutch/

我们正在建设一家企业网站。任何访问者都应该能够搜索所有的网页内容。 - user171523

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接