我使用分布式word2vec算法创建了单词向量。现在我有单词及其对应的向量。如何使用这些单词和向量构建gensim word2vec模型?
我使用分布式word2vec算法创建了单词向量。现在我有单词及其对应的向量。如何使用这些单词和向量构建gensim word2vec模型?
我不确定您是使用gensim
还是其他工具创建了word2vec模型,但如果我正确理解您的问题,您只想使用gensim加载word2vec模型。这可以通过以下方式完成:
import gensim
w2v_file = codecs.open(WORD2VEC_PATH, encoding='utf-8')
model = gensim.models.KeyedVectors.load_word2vec_format(w2v_file, binary=True) # or binary=False if the model is not compressed
然而,如果您想要从头开始训练word2vec模型(即从原始文本开始)并且仅使用gensim
,这里有一个使用gensim训练word2vec模型的教程。
from gensim.models import word2vec model = word2vec.Word2Vec.load_word2vec_format('path/to/GoogleNews-vectors-negative300.bin', binary=False)
重要的部分是binary=False
。 - sophros