我正在尝试使用NLTK对单词进行词形还原。
目前我发现可以使用 stem
包将"cars"转换为"car","women" 转换为 "woman"等,但是无法对带有词缀的单词如 "acknowledgement" 进行词形还原。
如果在 "acknowledgement" 上使用 WordNetLemmatizer()
,它会返回 "acknowledgement";如果使用.PorterStemmer()
,它会返回 "acknowledg" 而不是 "acknowledge"。
有没有人能告诉我如何去除单词的词缀?
比如,当输入为 "acknowledgement" 时,输出应该是 "acknowledge"。
nltk
中的其他词形还原器? - inspectorG4dget