Python中的语义搜索用于爱好和最新消息。

15

我想实现一个基于Python的语义搜索功能,用于一组关键词(主要是业余爱好、最新新闻等人们可能感兴趣的话题)。我想知道是否有相应的本体数据库以及开源的搜索算法/实现。

例如,我的集合= {聊天、喝酒、发推特、卡特琳娜·凯芙、卡特琳娜飓风、收集石头、收集硬币}。

因此,在搜索“积累”时,我可能会得到石头收集和硬币收集作为输出。

编辑: 这些术语可能包含多个单词。例如,“美国总统巴拉克·奥巴马”是一个有效的查询。


你能详细解释一下输入集和输出集吗? - shibly
@guru 首先,我们需要建立一个爱好/话题或任何人们想要谈论的数据库。如果数据库能够自动更新,那就更好了,但用户也可以随时添加他们自己的内容。有了这个数据库,我们想要对它们实现语义搜索。因此,给定这些术语,我应该能够在它们上面执行语义搜索,并返回与搜索兴趣相匹配的用户列表。 - w2lame
2个回答

4
你可能想使用“随机索引”。它可以完全满足你的需求,为每个单词计算一个特征向量,并定义两个单词之间语义相似性的度量。
你只需要获取《随机索引简介》semanticvectors包就可以开始了...
希望这能帮到你,如果需要进一步建议,请留言...

1

我希望这对你有所帮助,但我不确定。

Gnowsys

  • 仍在积极开发中

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接