在情感分析中,如何计算一个句子的极性?

3

如何计算语句中单词的极性...例如

"我成功完成了任务,但是徒劳无功"

每个单词得分如何?(例如 - 成功 - 0.7 完成 - 0.8 但是 - -0.5 徒劳无功 - 0.8)如何计算?每个单词如何获得值或评分?背后发生了什么事情?由于我正在进行情感分析,因此需要澄清一些事情,如果有人能帮助就太好了。提前致谢。

2个回答

1

感谢Tom Winch...我想知道的不仅是方法,还有极性如何计算...每个句子中的每个单词得分是如何确定的。例如,您提供的链接中的示例为:“我不会说这部电影令人震惊,也不会声称这部电影太平凡。” 复合词:0.4215,负面:0.0,中性:0.851,正面:0.149。 - pskumar
在这种情况下,我建议您在谷歌上搜索NLTK和情感分析。 - Tom Winch

0

单词的分数可以来自预定义的单词列表,例如ANEW、General Inquirer、SentiWordNet、LabMT或我的AFINN。这些分数可能是由个人专家、学生或亚马逊机械土耳其工人评分的。显然,这些分数并不是终极真相。

单词分数也可以通过带注释文本的监督学习来计算,或者可以从单词本体论或共现模式中估计单词分数。

至于个别单词的聚合,有各种各样的方法。一种方法是将所有个别分数(价值)相加,另一种方法是在单词中取最大价值,第三种方法是归一化(除以)单词数量或得分单词数量(即获得平均分数),- 或者除以该数字的平方根。结果可能会有所不同。 我使用我的AFINN单词列表进行了一些评估:http://www2.imm.dtu.dk/pubdb/views/edoc_download.php/6028/pdf/imm6028.pdf

另一种方法是使用递归模型,例如Richard Socher的模型。个别单词的情感值被聚合在类似树形结构的形式中,并且应该发现你例子中的“但徒劳无功”部分应该具有最大的权重。


感谢Finn Arup Nielsen。那么我们不能知道单词是如何被赋值和极性是如何计算的吗? - pskumar
我做的方法是根据我对丹麦语和英语的先验知识以及观察它在特别是Twitter上的使用来为单词打分,分数范围在-5到5之间。通常在与单词列表相关联的研究论文中会找到关于值分配的详细说明。通常情况下没有什么魔法可言。 - Finn Årup Nielsen

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接