如果您能帮助我了解关于Spacy的一些基本概念,那将对我非常有帮助。
我知道一些Spacy模型具有一些预定义的静态向量,例如对于西班牙语模型,这些向量是由FastText生成的。 我还知道,有一个tok2vec层可以从令牌生成向量,并且将其用作模型的NER组件的输入。
如果以上是正确的话,那么我有一些问题:
- NER组件是否也使用静态向量?
- 如果是,那么tok2vec层在哪里发挥作用?
- 如果不是,那么如果您只打算为NER组件使用模型,使用lg或md模型是否有任何优势?
- 预训练下载的模型(例如西班牙语)是否已经训练好了tok2vec层?
- 如果我替换预训练模型的NER组件,它是否保持不变,即学习了权重的tok2vec层?
- 当我训练NER模型时,tok2vec层是否也会被训练?
- pretrain命令是否有助于tok2vec层学习一些可能是OOV的特定领域词语?
非常感谢!