有没有任何地方可以免费或少于100美元下载英语短语的树库?我需要包含大量句法分析句子(> 1000)的训练数据,格式不限。基本上,我所需的只是这些句子中被识别为词性的单词。
有没有任何地方可以免费或少于100美元下载英语短语的树库?我需要包含大量句法分析句子(> 1000)的训练数据,格式不限。基本上,我所需的只是这些句子中被识别为词性的单词。
以下是一些免费提供的(英文)语言树库:
美国国家语料库:MASC
问题树库:QuestionBank 和 斯坦福的修正版
英国新闻:BNC
TED演讲:NAIST-NTT TED Treebank
乔治城大学多层语料库:GUM
生物医学:
还可以参考维基百科上的大量列表。
关于Penn Treebank怎么样?我希望它是免费的或者至少价格合理。 http://www.cis.upenn.edu/~treebank/cdrom2.html