11得票2回答
Python的NLTK与相关的Java库相比如何?

我以前的Java项目专注于对大量英文文本进行文本(预)处理(索引,XML标记,主题检测等),并使用了LingPipe、斯坦福的NER、RiTa和各种句子相似度库。也许我是一个糟糕的Java程序员,但当我切换到不同的语料库时,我发现自己要输入很多代码并使用很多库。总之,我感觉可能有更好的工具来完...

10得票3回答
如何使用NLTK打印Wordnet的全部内容?

NLTK提供了在Brown(或Gutenberg)语料库中打印所有单词的函数。但是等效的函数似乎在Wordnet上无法工作。 是否有一种通过NLTK完成此操作的方法?如果没有,该如何实现? 这个可以运行:from nltk.corpus import brown as b print b.wo...

10得票5回答
如何利用语义自动标记一组单词的聚类?

上下文如下:我已经有了聚类的短语,这些短语是通过对互联网搜索查询应用kmeans并使用搜索引擎结果中的常见url作为距离(如果我简化��的话,就是url的共现而不是单词)得到的。 我希望能够使用语义自动标记这些聚类,换句话说,我想提取围绕一组短语的主要概念。例如 - 对于我的例子主题很抱歉 ...

10得票2回答
如何在Python的nltk和wordnet中获取一个单词/同义词集的所有下位词?

我现在有一个WordNet中所有名词的列表,我想只保留车辆相关的单词并删除其他单词。如何实现呢?以下是我想要编写的伪代码,但我不知道如何让它工作。 for word in wordlist: if not "vehicle" in wn.synsets(word): wordli...

10得票2回答
如何使用Python在WordNet中生成形容词反义词列表

我希望在Python中实现以下功能(我有NLTK库,但我对Python不是很熟悉,所以我用一种奇怪的伪代码编写了以下内容):from nltk.corpus import wordnet as wn #Import the WordNet library for each adjective...

10得票2回答
重写句子时保留语义意思

使用WordNet可以重写一个句子,使得句子的语义含义保持不变(或大部分相同)吗?假如我有这个句子:Obama met with Putin last week. 使用WordNet将句子改写成其他选项是否可能:Obama and Putin met the previous week. O...

10得票2回答
如何将“WordNet Domains”集成到WordNet数据库中?

我正在使用 WordNet 2.1 工具,并通过 JAWS(Java API for WordNet Searching)以编程方式访问它。 今天我遇到了一个新东西叫做 WordNet Domains,它为 WordNet 中的每个单词分配了 DOMAIN 标签。 链接:- http://...

9得票5回答
在R中加载wordnet包出现问题

我在将WordNet加载到R中遇到了困难。我使用的是R x64 2.14.1版本。我安装了wordnet包,然后尝试加载该包。 > library(wordnet) Warning message: In initDict() : cannot find WordNet 'dict...

9得票2回答
如何在NLTK中获取一个同义词集的WordNet语义频率?

根据文档,我可以在nltk中加载一个带有sense标记的语料库,方法如下: >>> from nltk.corpus import wordnet_ic >>> brown_ic = wordnet_ic.ic('ic-brown.dat') >&g...

9得票2回答
WordNet 3.1和WordNet 3.0有什么区别?

在wordnet.princeton.edu上似乎没有可用的更改日志或类似信息。