Java - TF-IDF 实现?

3

我基本上正在创建一个搜索引擎,我想通过实现tf*idf根据搜索查询对我的xml文档进行排名。如何实施?我该如何开始?感激不尽任何帮助。


这可能作为一个起点有所帮助 http://stackoverflow.com/questions/1960333/any-tutorial-or-code-for-tf-idf-in-java - Danny
4个回答

2

1

我以前做过这个,使用了Lucene来获取TD*IDF数据。

虽然需要一些调试,但是如果有其他更容易的解决方案,那么请使用它们。

首先看看TermFreqVectororg.apache.lucene.index中的其他类。


1

tfidf 是一个独立的 Java 包,用于计算 Tf-Idf。


1

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接