情感分析:超过3种情绪

3
我的应用需要情感分析功能。我已经找到了许多可以帮助完成这项任务的服务和库。但是大部分都有“三维”的输出:文本可能被分类为“积极的”,“消极的”或“中性的”。
但是如果我需要更多的选项呢?例如:“自信/怀疑”,“冷静/警觉”,“亲切/攻击性”或类似的选项。
这样的分类是否可能?也许已经有一些可用的服务/框架/库了吗?

如果你想要更精细的分析,可能需要进行一些机器学习,并训练你的分析器识别哪些事情是“自信/怀疑”的等等。 - Vivin Paliath
有没有可用于这种机器学习的训练集/语料库? - Dmytro Titov
我对这个领域还比较新,所以不能说得很确定。你可以试着去寻找,但如果这些是你自己的分类,你就必须自行训练它。 - Vivin Paliath
2个回答

1
你应该尝试使用WordNet-Affect。这个资源提供了一个情感树。由于这是一个相当古老的资源,所以你需要手动解析它,并将ID映射到WordNet 1.6同义词集(我在这里用Python完成了这项工作here)。

0

你可以使用机器学习算法。我曾经用过“支持向量机”(https://en.wikipedia.org/wiki/Support_vector_machine)进行情感分析。

支持向量机是一种监督式算法,所以你需要用之前分类好的数据(自信、怀疑、冷静、警觉、友善、攻击性)来训练算法。最后,你会得到一个模型,可以用来对新的文本进行分类。

我曾经使用过LibSVM库和Python(https://www.csie.ntu.edu.tw/~cjlin/libsvm/),效果不错。我认为你也可以在Java中使用它。


有什么想法在哪里获取相应的训练集? - Dmytro Titov
很难找到适合您需求的训练集。我使用了这个数据集:http://www.cs.cornell.edu/people/pabo/movie-review-data/(我的目标是分析关于电影的情感)。另一个选择是手动分类您的数据。 - Walter

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接