在构建Python Gensim Word2Vec model时,是否有一种方法可以查看文档到词矩阵?
使用输入
使用输入
sentences = [['first', 'sentence'], ['second', 'sentence']]
,我希望能看到类似以下的内容*: first second sentence
doc0 1 0 1
doc1 0 1 1
我已经说明了“可读性高”,但我正在寻找一个基于model.wv.index2word
索引的scipy(或其他)矩阵。
那么,它能转换成一个单词到单词的矩阵吗(以查看共现关系)?类似于:
first second sentence
first 1 0 1
second 0 1 1
sentence 1 1 2
我已经使用CountVectorizer实现了类似词-词共现矩阵的东西。它运行良好。但是,我已经在我的流程中使用gensim,速度/代码简洁对我的用例很重要。