13得票2回答
如何使用Python和NLTK从Penn Treebank获取一组语法规则?

我对NLTK和Python比较新。我一直在使用例子中提供的玩具语法创建句子解析,但是我想知道是否可以使用从Penn Treebank的一部分学习到的语法,而不是仅仅编写自己的或使用玩具语法?(我在Mac上使用Python 2.7)

12得票4回答
在文本中查找所有位置/城市/地点

如果我有一篇加泰罗尼亚语报纸文章的文本,我该如何从中找出所有城市? 我已经查看了Python的nltk软件包,并下载了加泰罗尼亚语(nltk.corpus.cess_cat)的语料库。 目前我的情况: 我已经安装了所有必要的nltk.download()内容。以下是我当前的一个示例:te ...

9得票3回答
自由标注语料库用于命名实体识别

我正在寻找一个免费的标注语料库,用于训练命名实体识别系统。我发现大部分语料库(如纽约时报)都很昂贵且不开放。有人能提供帮助吗?

8得票2回答
NLTK - TypeError: tagged_words()收到了一个意外的关键字参数'simplify_tags'。

我刚刚在跟随NLTK书中的第5章,发现tagged_words()函数中的'simplify_tags'参数并不是很预期。我使用的是Python 3.4版本、PyCharm IDE以及标准的NLTK包。 In[4]: nltk.corpus.brown.tagged_words() Out[...