7得票2回答
使用Python NLTK查找两个网页之间的相似性?

我想要找出两个网页是否相似。有人能够建议一下,Python中的nltk和wordnet相似度函数是否有帮助?如果有,最好使用哪种相似度函数呢?

7得票2回答
使用Perl的Wordnet同义词集

我安装了Wordnet::Similarity和Wordnet::QueryData这两个模块,以便轻松计算与之相关的信息内容得分和概率。但我卡在了这个基本问题上:给定一个单词,打印出n个相似的单词——这应该不难,只需遍历同义词集并执行join操作即可。 使用wn命令,并通过大量的tr、so...

7得票1回答
为什么NLTK词形归并即使verb.exc添加了正确值,输出仍然错误?

当我打开verb.exc时,我可以看到: saw see 尽管我在代码中使用了词形还原 >>>print lmtzr.lemmatize('saw', 'v') saw 这怎么会发生?我在修改WordNet时有误解吗?

7得票1回答
WordNet - n和数字代表什么?

我的问题与WordNet接口有关。 >>> wn.synsets('cat') [Synset('cat.n.01'), Synset('guy.n.01'), Synset('cat.n.03'), Synset('kat.n.01')...

7得票4回答
在Python中分割没有空格的句子(使用NLTK?)

我是一个有用的助手,可以翻译文本。 将以下英文句子翻译成中文: 我有一组连接的单词,我想将它们拆分成数组。 例如: split_word("acquirecustomerdata") => ['acquire', 'customer', 'data'] 我找到了 pyench...

7得票1回答
使用Wordnet词形还原器获取词根

我需要找到一个通用的根词,以匹配关键字提取器中所有相关单词。 如何使用Python nltk词形还原器将单词转换为相同的词根? 例如: - generalized, generalization -> general - optimal, optimized -> optimize(也许)...

7得票3回答
Java中的Wordnet相似度:JAWS、JWNL还是Java WN::Similarity?

我需要在基于Java的应用程序中使用Wordnet。 我想要: 搜索同义词集 查找同义词集之间的相似性/相关性 我的应用程序使用RDF图形,我知道有带有Wordnet的SPARQL端点,但我认为最好拥有数据集的本地副本,因为它不太大。 我找到了以下JAR文件: 通用库 - JAWS...

7得票2回答
NLTK - 自动翻译相似单词

大局目标:我正在使用NLTK和Gensim在Python中制作产品评论的LDA模型。我想对不同的n-grams运行此模型。 问题:当我使用bigrams运行时,与unigrams相比都很棒,但我开始得到一些带有重复信息的主题。例如,主题1可能包含:['good product', 'good...

7得票5回答
如何使用Python NLTK在WordNet Synset中仅打印单词本身?

有没有办法在Python 2.7中使用NLTK只获取单词,而不包括“synset”、括号和“n.01”等额外格式? 例如,如果我执行以下操作: wn.synsets('dog') 我的结果看起来像这样: [Synset('dog.n.01'), Synset('fru...

7得票1回答
WordNet与ElasticSearch集成-如何添加新的同义词

我使用的是 ElasticSearch 1.2.3 版本。 我将 WordNet 3.0 集成为 ElasticSearch 同义词分析器的同义词数据库。(完整的 WordNet 安装:配置、编译和安装) 我已经在 ElasticSearch 索引设置(索引名称为 local_es)中添加...