我希望在Spacy中使用德语词形还原器,但是我对结果感到非常惊讶:
import spacy
nlp = spacy.load("de_dep_news_trf")
[token.lemma_ for token in nlp('ich du er sie mein dein sein ihr unser')]
提供
['ich', 'du', 'ich', 'ich', 'meinen', 'mein', 'mein', 'mein', 'sich']
我不确定我能使用那个:
vielen dank für deinen sehr guten tweet
变成
viel danken für mein sehr gut tweet
这显然改变了句子的意思。
这是预期的吗?我是否遗漏了可以使该词形还原器不那么“过度”的调整/配置?