79得票6回答
使用NLTK进行停用词去除

我正在使用nltk工具包尝试通过去除停用词来处理用户输入的文本,但是在去除停用词后,“and”、“or”、“not”等单词也被删除了。由于这些单词是查询文本时需要的运算符,我希望在停用词去除过程后它们仍然存在。我不知道哪些单词可以作为查询文本中的运算符,同时我还想从我的文本中删除不必要的单词。

78得票4回答
SSL错误下载NLTK数据

我想在Mac OS X 10.7.5上使用Python 3.6下载NLTK 3.0,但是出现了SSL错误:import nltk nltk.download() 我使用pip3命令下载了NLTK: sudo pip3 install -U nltk。 更改NLTK下载器中的索引可显示所有NL...

78得票3回答
实用的NLTK使用示例

我正在尝试使用自然语言工具包(Natural Language Toolkit,NLTK)。 它的文档(Book和HOWTO)相当冗长,而且示例有时稍微有些高级。 有没有关于NLTK用法/应用的好的基础示例?我在想像Stream Hacker博客上的NTLK文章那样的东西。

77得票8回答
Python中的WordNet词形还原和词性标注

我想在Python中使用WordNet词形还原器,了解到默认的词性标记是NOUN,并且除非将词性标记明确指定为VERB,否则它不会输出动词的正确词形还原结果。 我的问题是,如何最好地准确执行上述词形还原操作? 我使用了nltk.pos_tag进行了词性标注,但我不知道如何将树库词性标记集成...

76得票1回答
Python NLTK:文件中的非ASCII字符'\xc3'(情感分析-NLP)出现语法错误。

我正在使用NLTK进行情感分析的作业实践。我使用的是Python 2.7版本,NLTK 3.0和NumPy 1.9.1版本。 以下是代码: __author__ = 'karan' import nltk import re import sys def main(): pr...

76得票8回答
NLTK中用于解析的英语语法

有没有一个现成的英语语法可以直接加载到NLTK中使用?我在NLTK的解析示例中搜索了一下,但似乎在句子解析之前必须手动指定语法。 非常感谢!

73得票4回答
如何从一系列文本条目中提取常见/重要短语

我有一系列文本条目-来自MySQL数据库的原始HTML。我想找到这些条目中最常见的短语(不是单个最常见的短语,并且理想情况下,不强制逐字匹配)。 我的示例是Yelp.com上的任何评论,它显示给定餐厅数百条评论中的3个片段,格式为: “试试汉堡”(在44篇评论中) 例如,此页面的“评论亮...

69得票15回答
如何下载NLTK数据?

更新的答案:NLTK在2.7上可以很好地运行。 我之前使用的是3.2版本。 我卸载了3.2并安装了2.7版本。 现在它可以工作了! 我已经安装了NLTK并尝试下载NLTK数据。 我所做的就是按照这个网站上的说明进行操作:http://www.nltk.org/data.html 我下载了N...

68得票7回答
NLTK和停用词失效 #lookuperror

我正在尝试启动一个情感分析的项目,我将使用停用词方法。我进行了一些研究,并发现nltk有停用词,但是当我执行命令时出现了错误。我的做法是,为了知道nltk使用哪些单词(就像你可能在这里找到的http://www.nltk.org/book/ch02.html的4.1节中所发现的内容一样):fr...

66得票2回答
如何在NLTK中对字符串句子进行分词?

我正在使用nltk,因此我想创建自己的自定义文本,就像nltk.books上的默认文本一样。但是,我只能到达类似于以下方法的步骤: my_text = ['This', 'is', 'my', 'text'] 我希望找到一种将“文本”作为输入的任何方式: my_text = "This...