如何将单词向量连接成句子向量

4

我在一些文章中了解到(Tomas Mikolov ...),更好地形成句子向量的方法是将单词向量连接起来。

但由于我对数学的笨拙,我仍然不确定细节。

例如,

假设单词向量的维度为m; 一个句子有n个单词。

连接操作的正确结果应该是什么?

它是一个1 x m*n的行向量吗?还是一个m x n的矩阵?


2
Mikolov在哪里提到过?提供论文等参考资料会很有用。回答你的问题,连接只是将向量放在彼此之后。因此,如果您有3个大小为1x100的向量,则句子向量将为1x300。 - user3639557
1个回答

5
至少有三种将嵌入向量组合的常见方法:(a)求和,(b)求和并平均,或(c)连接。所以在您的情况下,使用连接,这将给您一个 1 x m*a 向量,其中 a 是句子的数量。在其他情况下,向量长度保持不变。请参见 gensim.models.doc2vec.Doc2Vecdm_concatdm_mean——它允许您使用这三个选项中的任何一个 [1,2]。
[1] http://radimrehurek.com/gensim/models/doc2vec.html#gensim.models.doc2vec.LabeledLineSentence [2] https://github.com/piskvorky/gensim/blob/develop/gensim/models/doc2vec.py

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接