如何将现有的huggingface-transformers模型用于spacy？

Question

如何将现有的huggingface-transformers模型用于spacy？

spacyhuggingface-transformersbert-language-modelspacy-transformers

9

我在这里想问大家，是否可以将现有的huggingface-transformers训练模型与spacy一起使用。

我的第一个天真尝试是通过spacy.load('bert-base-uncased')加载它，但由于spacy要求特定的结构，因此它无法正常工作，这是可以理解的。

现在我正在尝试弄清楚如何使用spacy-transformers库加载模型，创建spacy结构，并从那一点开始将其用作正常的spacy感知模型。

我不知道它是否可能，因为我找不到任何有关该主题的信息。我已经尝试阅读文档，但我发现所有指南、示例和帖子都是从类似spacy/en_core_web_sm的spacy结构化模型开始的，但是该模型最初是如何创建的呢？我相信有人需要再次使用spacy进行训练。

我可以从你这里得到一些帮助吗？

谢谢。

- rdemorais

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- polm23 · Accepted Answer

您需要在管道中添加一个Transformer组件，并将您的HuggingFace模型名称作为参数传递给它。这在文档中有所涵盖，尽管人们可能会有找不到的问题。重要的是要理解Transformer只是spaCy管道的一部分，并且您应该了解它如何配合使用。

从文档中提取，以下是如何在配置文件中指定自定义模型的方法：

[components.transformer.model]
@architectures = "spacy-transformers.TransformerModel.v3"
# XXX You can change the model name here
name = "bert-base-cased"
tokenizer_config = {"use_fast": true}

回到为什么需要了解spaCy的结构，理解在spaCy中，Transformers只是特征的来源非常重要。如果您的HuggingFace模型有一个NER头或其他它将不起作用。因此，如果您使用自定义模型，则需要在其上训练其他组件，例如NER。

另请注意，spaCy具有各种内置模型，这些模型不是Transformers。这些模型的训练速度非常快，在许多情况下，性能与Transformers相当；即使它们不够准确，您也可以使用内置模型来配置管道，然后只需切换到Transformer。

我找到的所有指南、示例和文章都从类似于spacy/en_core_web_sm的spaCy结构化模型开始，但是该模型最初是如何创建的？

您看过quickstart了吗？预训练模型是使用类似于您从其中获得的配置创建的。