我正在尝试计算两个单词之间的语义相似度。我正在使用基于Wordnet的相似度度量,即Resnik度量(RES),Lin度量(LIN),Jiang和Conrath度量(JNC)以及Banerjee和Pederson度量(BNP)。
为了做到这一点,我正在使用nltk和Wordnet 3.0。接下来,我想将从不同度量得到的相似性值组合起来。为此,我需要规范化相似性值,因为某些度量给出介于0和1之间的值,而其他度量给出大于1的值。
那么,我的问题是如何规范化从不同度量获得的相似性值。
额外的细节:我有一组词。我计算词之间的成对相似度,并删除与集合中其他词不强相关的词。
为了做到这一点,我正在使用nltk和Wordnet 3.0。接下来,我想将从不同度量得到的相似性值组合起来。为此,我需要规范化相似性值,因为某些度量给出介于0和1之间的值,而其他度量给出大于1的值。
那么,我的问题是如何规范化从不同度量获得的相似性值。
额外的细节:我有一组词。我计算词之间的成对相似度,并删除与集合中其他词不强相关的词。