情感分析 - WordNet,SentiWordNet词典

7
我需要一份包括积极和消极词汇的列表,同时列出每个单词的权重,根据它们的强度和弱点进行分配。 我已经得到了以下内容:
1.) WordNet- 它为每个单词提供+或-分数。
2.) SentiWordNet - 在[0,1]范围内给出正面和负面值。
我在一些单词上进行了检查,
爱- WordNet对名词和动词都给出0.0分,我不知道为什么,我认为至少应该是积极的。
镇压- WordNet给出-9.93分。SentiWordNet在pos和neg两方面均为0.0(应该是消极的)。
安歇- WordNet - 2.488,SentiWordNet - {pos - 0.125,neg - 0.5}(应该是积极的)。
我需要一些帮助来决定哪一个更好用。 谢谢。

1
给出更好结果的那一个。 :-) - Reactormonk
3
你从哪里获取了WordNet的积极和消极得分? - justhalf
3个回答

3

在某些情况下,程度和/或极性可能取决于领域和/或上下文,因此单词本身并不足以做出决定。

如果您有一些注释过的数据,我建议使用两个资源提供的分数作为特征对其进行分类器训练。如果没有,一个选择是使用与问题领域相匹配的可用情感标注语料库。如果完全没有任何数据,整个任务就变得有点棘手,尽管我相信有大量关于无监督情感分类方法的工作,例如查看无监督情感分析


关于上下文/领域,我认为如果一个词有不同的情感色彩,它应该是一个不同的Wordnet意义。例如,love#5(网球领域)与http://sentiwordnet.isti.cnr.it/search.php?q=love中的其他含义相比。您是否有反例,其中一个词可以在不同的上下文中具有不同的含义,但不能拥有自己的Wordnet意义? - Darren Cook

1

如果您认为SentiWordNet中的不同意见是错误的,那么有一个接口可以提供意见: http://sentiwordnet.isti.cnr.it/search.php?q=repose

我下载了最新的Wordnet 3.1,并检查了文件格式文档,没有看到您提到的情感数值的任何提及。它也没有显示在在线搜索中。

因此,出于这两个原因,我建议选择SentiWordNet!

(我看到您的问题已经一年了,所以也许您可以告诉我们您最终选择了什么,以及为什么选择它?)


0

极性的程度不仅取决于单词本身,还取决于句子或短语的上下文。因此,如果同一单词有不同的结果,则是由于上下文的差异。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接