得票数最多 'distilbert' 问题

41得票5回答

ValueError: TextEncodeInput必须是Union[TextInputSequence，Tuple[InputSequence，InputSequence]] - 对BERT / Distilbert进行分词时出现错误。

def split_data(path): df = pd.read_csv(path) return train_test_split(df , test_size=0.1, random_state=100) train, test = split_data(DATA_DIR) ...

tokenizebert-language-modelhuggingface-transformershuggingface-tokenizersdistilbert

7得票1回答

使用Huggingface的DistilBERT模型生成文本

我一直在努力使用Hugging Face的DistilBERT模型，但文档非常不清晰，他们的示例（例如https://github.com/huggingface/transformers/blob/master/notebooks/Comparing-TF-and-PT-models-MLM...

machine-learningnlppytorchhuggingface-transformersdistilbert

7得票2回答

“Using bos_token，but it is not set yet.” 的意思是什么？

当我运行demo.py时 from transformers import AutoTokenizer, AutoModel tokenizer = AutoTokenizer.from_pretrained("distilbert-base-multilingual-cased"...

multilingualhuggingface-transformershuggingface-tokenizersdistilbert