word2vec中的负向量是什么意思?

3

我正在研究旅游评论,并使用word2vec对评论进行分析。然而,当我向我的导师展示输出结果时,他说我的许多单词具有负向的向量值,只有具有正向值的单词才是合理的。

这些负向的数值可能意味着什么?是否有方法确保在我的分析中得到的所有向量数值都是正数?

1个回答

1
一些其他的词模型算法确实会将单词建模为维度为0或正数的空间,而且这些正数维度可能对人类来说具有明显的意义,但是原始的、经典的“word2vec”算法不是这种情况。任何一个word2vec单词向量的正负性——在特定的维度或净大小上——都没有强烈的意义。有意义的单词将从原点向各个方向散布。在这个空间中,与可识别的类别松散相关的方向或邻域可能出现在任何地方,并且相对于任何维度轴都会倾斜。(这里有一个相关的算法,它确实使用了非负约束——https://www.cs.cmu.edu/~bmurphy/NNSE/。但是大多数关于“word2vec”的引用都指的是维度在所有实数范围内有用的经典方法。)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接