如何在NLTK中使用西班牙语Wordnet?

5
我刚从项目GRIAL下载了一个西班牙Wordnet,格式为XML。我该如何在Python NLTK中使用它?
此外,在同一页上,您还可以下载一个标记的西班牙语语料库。我该如何将其合并?

为什么不直接使用NLTK内置的西班牙语功能呢? - James Tobin
@JamesTobin 内置的问题在于它非常深入,并且不是很精确。你有任何整合的想法吗? - nanounanue
我的西班牙语很有限,所以尝试浏览您列出的网站对我来说很困难。但考虑到您拥有XML文件,我相信您可以使用NLTK的语料库阅读器进行一些操作。它们可以读取XML文件,使用http://nltk.googlecode.com/svn/trunk/doc/api/nltk.corpus.reader.xmldocs-module.html 即可。 - James Tobin
这个问题已经出现了链接失效的情况。 - Luke
1个回答

3
使用XMLCorpusReader将XML数据加载为语料库
以下是实现的代码
from nltk.corpus.reader import XMLCorpusReader
reader = XMLCorpusReader(dir, file)

这里提供一个使用XMLCorpusReader的完整示例链接在此处


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接