俄语单词列表的雪球词干提取器

8

我知道如何对单个单词执行SnowballStemmer(在我的情况下,是俄语)。具体操作如下:

from nltk.stem.snowball import SnowballStemmer 

stemmer = SnowballStemmer("russian") 
stemmer.stem("Василий")
'Васил'

如果我有一个像 ['Василий', 'Геннадий', 'Виталий'] 这样的单词列表,我该如何执行以下操作?
使用 for 循环的方法似乎不起作用 :(
l=[stemmer.stem(word) for word in l]

你遇到了哪个错误? - ettanany
使用Python 3,我得到了这个:['васил', 'геннад', 'витал'] - ettanany
1个回答

8
您的变量l未被预定义,导致出现名称错误。请参考我的最后两行代码进行修复。
>>> from nltk.stem.snowball import SnowballStemmer
>>> stemmer = SnowballStemmer("russian") 
>>> my_words = ['Василий', 'Геннадий', 'Виталий']
>>> l=[stemmer.stem(word) for word in l]
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
NameError: name 'l' is not defined
>>> l=[stemmer.stem(word) for word in my_words]
>>> l
['васил', 'геннад', 'витал']

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接