我正在使用nltk,但我面临的问题似乎与nltk无关。
我有一个名为
util.tokenize
的模块,在其中有一些类,第一行如下:
util/tokenizer.py
from nltk.tokenize.regexp import RegexpTokenizer
...
class SentTokenizer(object):
def __init__(self, stem=False, pattern='[^\w\-\']+'):
self.alg = RegexpTokenizer(pattern, gaps=True)
def __call__(self, text):
return self.alg.tokenize(text)
....
if __name__ == '__main__':
s_t = SentTokenizer()
s_t('blah blah')
当我从另一个模块调用这些类,比如说test.py
时,一切似乎都正常,但是直接运行tokenize.py
模块会导致ImportError错误。
File "tokenize.py", line 1, in <module>
...
File "Python27\lib\site-packages\nltk\corpus\reader\util.py", line 28, in <module>
from nltk.util import AbstractLazySequence, LazySubsequence, LazyConcatenation, py25
ImportError: cannot import name AbstractLazySequence
可能的问题是什么?从其他模块调用时为什么会有效?
test.py
from util.tokenize import SentTokenizer
s_t = SentTokenizer()
print s_t('blah blah')
操作系统平台为Windows。