Java - TF-IDF 实现？

Question

3

我基本上正在创建一个搜索引擎，我想通过实现tf*idf根据搜索查询对我的xml文档进行排名。如何实施？我该如何开始？感激不尽任何帮助。

- Aravind Chinta

这可能作为一个起点有所帮助 http://stackoverflow.com/questions/1960333/any-tutorial-or-code-for-tf-idf-in-java - Danny

4个回答

1

我以前做过这个，使用了Lucene来获取TD*IDF数据。

虽然需要一些调试，但是如果有其他更容易的解决方案，那么请使用它们。

- daveb

1

tfidf 是一个独立的 Java 包，用于计算 Tf-Idf。

- W.P. McNeill

1

Apache Mahout：

我认为这需要一个Hadoop文件系统，这需要一些额外的工作。但是它的效果非常好。

- Sridhar Sarnobat

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- shark8me · Accepted Answer

令人惊讶的是这里没有提到Weka库。Weka的StringToWordVector类实现了TF-IDF。