24得票4回答
用支持同义词的txt或xml文件作为英语字典

请问有人能告诉我在哪里可以下载英语词典的txt或xml文件吗? 我正在为自己建立一个简单的应用程序,希望找到一些可以立即使用而无需学习复杂API的东西。 如果支持同义词将非常好,也就是说,应该更容易检索特定单词的所有同义词。 如果词典可以列出英式和美式拼写不同的单词,那真是太棒了。 即使...

23得票6回答
在自然语言处理中合并相关词汇

我希望定义一个新词,它包含来自两个(或更多)不同单词的计数值。例如:Words Frequency 0 mom 250 1 2020 151 2 the 124 3 19 82 4 mother 81 ... ... ... 10 London 6 11 l...

22得票8回答
如何使用WordNet查找英语单词的频率计数?

使用WordNet或NLTK与Python,有没有一种方法可以查找英语单词的使用频率? 注意:我不想要给定输入文件中单词的计数频率。我希望根据今天的用法,得到一个单词在一般情况下的计数频率。

21得票4回答
如何根据偏移ID获取WordNet同义词集?

我有一个WordNet词汇集(synset)的偏移量(例如id="n#05576222")。使用Python,如何通过这个偏移量获取词汇集?

20得票2回答
测量两个短语之间的语义相似度

我想要测量两个短语/句子之间的语义相似度,有没有可以直接使用且可靠的框架? 我已经查看了 这个问题,但它太旧了,我在那里找不到真正有用的答案。有一个链接,但我发现这个不可靠。 例如: 我有一个短语:感到压垮了 我有几个选择:向内施加力、粉碎、感情上毁灭、重新塑造等。 我想找到与第一个短语具...

19得票2回答
在WordNet synsets中,“s”代表哪个词性?

我有一个GRE单词列表,我正在获取这个列表的词义集合。for word in words: synsets = wordnet.synsets(word['name']) for synset in synsets: print synset.pos #pri...

19得票2回答
Wordnet Lemmatizer能否加速?

我正在使用NLTK的Wordnet Lemmatizer来分析Brown语料库中的名词是更多地用单数形式还是复数形式。 例如:from nltk.stem.wordnet import WordNetLemmatizer l = WordnetLemmatizer() 我注意到即使是最简单的...

18得票2回答
在NLTK中导入WordNet

我想导入wordnet词典,但当我从wordnet导入Dictionary时,出现以下错误: for l in open(WNSEARCHDIR+'/lexnames').readlines(): IOError: [Errno 2] No such file or directory: 'C...

18得票2回答
找到与特定单词相关的词语(具体是物体名称)

我正在尝试寻找与一个单词相关的词语(具体是物理对象)。例如: 网球:网球拍、网球、网球鞋 斯诺克:斯诺克球杆、斯诺克球、粉笔 国际象棋:国际象棋棋盘、棋子 书柜:书 我已经尝试使用WordNet,特别是meronym语义关系;但是如下结果表明,这种方法并不一致: 网球:发球、截击、...

16得票3回答
在setup.py脚本中安装nltk数据依赖项

我的项目中使用了NLTK和wordnet。我在电脑上手动安装了它们,用pip命令:pip3 install nltk --user 然后在python shell 中运行nltk.download()来下载wordnet。 我希望能够通过setup.py文件自动安装这些依赖,但我不知道如何很...