机器学习算法

7

我希望研究一个适合我的目的的算法,有人能为以下场景建议一个好的学习算法吗:

用户可以在一组句子中搜索某个单词。然后,我将基于该关键字返回前10个句子。我希望该算法允许用户输入,即用户可以点击最佳句子,这些信息将帮助搜索算法在未来返回更合适的结果。


1
任何关于搜索与句子之间关系的更多信息都会有所帮助。 - BCoates
1
你正在从文本、查询和用户的点击中提取或计算哪些特征? - Ron
一个很好的起点:Apache Lucene - rwong
1
@rwong,我已经使用了Lucene,并且使用了逆文档频率和查询扩展来根据给定的关键字对句子进行排名。这个方法很有效。然而,一旦它们基于这种方法排名,我希望用户能够选择最适合他们的句子。也就是说,允许用户训练搜索,搜索将从那些相关的句子中学习,并在未来使用这些知识。 - Neutralise
3个回答

2

看起来您想利用用户反馈来改进某种搜索结果。如果是这样,您应该查看Rocchio

此外,您可以为每个关键词维护一个“点击”的语句列表。这样,您就可以提高“已点击”语句在排名中的位置。


1
你可能会发现 Qi II 手册中的这一章很有用: 6.3 属性列表 该章节讨论了使用语义网络存储和排序数据。我还建议完成章节末尾的练习,无论你写什么语言,它们都可能给你一些思路。

0

研究一些矩阵分解技术,例如奇异值分解非负矩阵分解


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接