我刚刚下载了最新的NLTK版本以及相关资源。
我发现could
和would
没有列入停用词列表。但是should
被视为停用词。
这是否是一些已知的bug或者其他什么原因?
In [7]: import nltk
In [8]: "shouldn't" in nltk.corpus.stopwords.words("english")
Out[8]: True
In [9]: "couldn't" in nltk.corpus.stopwords.words("english")
Out[9]: True
In [10]: "wouldn't" in nltk.corpus.stopwords.words("english")
Out[10]: True
In [11]: "should" in nltk.corpus.stopwords.words("english")
Out[11]: True
In [12]: "could" in nltk.corpus.stopwords.words("english")
Out[12]: False
In [13]: "would" in nltk.corpus.stopwords.words("english")
Out[13]: False