我是自然语言处理方面的新手,对此不太了解,请帮忙。
从nltk.book导入* * NLTK书籍的介绍性示例 *
正在加载text1、...、text9和sent1、...、sent9
输入文本或句子的名称以查看它。
输入"texts()"或"sents()"以列出材料。
Traceback (most recent call last): File "", line 1, in
from nltk.book import *
文件 "C:\Program Files (x86)\Python 3.5\lib\site-packages\nltk\book.py",第19行。
text1 = Text(gutenberg.words('melville-moby_dick.txt'))
文件"C:\Program Files (x86)\Python 3.5\lib\site-packages\nltk\text.py"的第295行,初始化
tokens = list(tokens)
文件"C:\Program Files (x86)\Python 3.5\lib\site-packages\nltk\corpus\reader\util.py",第233行len函数。
for tok in self.iterate_from(self._toknum[-1]): pass
文件 "C:\Program Files (x86)\Python 3.5\lib\site-packages\nltk\corpus\reader\util.py" 的第 291 行,迭代自:
tokens = self.read_block(self._stream)
文件“C:\ Program Files(x86)\ Python 3.5 \ lib \ site-packages \ nltk \ corpus \ reader \ plaintext.py”,第117行,_read_word_block函数中:
words.extend(self._word_tokenizer.tokenize(stream.readline()))
文件“C:\ Program Files(x86)\ Python 3.5 \ lib \ site-packages \ nltk \ tokenize \ regexp.py”,第126行,tokenize函数中:
self._check_regexp()
文件“C:\ Program Files(x86)\ Python 3.5 \ lib \ site-packages \ nltk \ tokenize \ regexp.py”,第121行,_check_regexp函数中:
self._regexp = compile_regexp_to_noncapturing(self._pattern,self._flags)
文件“C:\ Program Files(x86)\ Python 3.5 \ lib \ site-packages \ nltk \ internals.py”,第56行,compile_regexp_to_noncapturing函数中:
return sre_compile.compile(convert_regexp_to_noncapturing_parsed(sre_parse.parse(pattern)),flags = flags)
文件“C:\ Program Files(x86)\ Python 3.5 \ lib \ site-packages \ nltk \ internals.py”,第52行,convert_regexp_to_noncapturing_parsed函数中:
parsed_pattern.pattern.groups = 1
属性错误:无法设置属性