OpenNLP词形还原示例

7

有没有人知道在OpenNLP库中如何使用SimpleLemmatizer()类的示例,以及我可以找到样本英语词典?文档中好像缺少这些内容。

2个回答

10
您可以从此处下载词典 - en-lemmatizer.dict 示例:
import opennlp.tools.lemmatizer.SimpleLemmatizer;

private static SimpleLemmatizer lemmatizer;

private String lemmatize(String word, String postag) throws IOException {
    if (lemmatizer == null) {
        InputStream is = getClass().getResourceAsStream("/models/en-lemmatizer.dict");
        lemmatizer = new SimpleLemmatizer(is);
        is.close();
    }
    String lemma = lemmatizer.lemmatize(word, postag);
    return lemma;
}

参考自这里的示例代码 - DocumentTaggerService


谢谢!这真的很有帮助! - pYr0

3

RAVI并没有完全回答这个问题:

你看不到SimpleLemmatizer在autodoc中的原因是因为它实际上不存在。

请使用DictionaryLemmatizer。

opennlp.tools.lemmatizer.DictionaryLemmatizer


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接