我有一些未标记的微博帖子,想要创建一个情感分析模块。为此,我尝试了Stanford library和Alchemy Api网络服务,但结果并不是很好。目前,我不想训练我的分类器。
所以我想请你建议一些关于此事的库或者网络服务。我更喜欢经过测试的库。这些帖子的语言是英语。同时预处理已经完成。
附言:
我使用的编程语言是Java EE。
所以我想请你建议一些关于此事的库或者网络服务。我更喜欢经过测试的库。这些帖子的语言是英语。同时预处理已经完成。
附言:
我使用的编程语言是Java EE。
情感分析未能跟上夸大的承诺。
参见:
情感分析的糟糕状态
2013年12月26日,作者:Angela Hausman
http://www.hausmanmarketingletter.com/sad-state-sentiment-analysis/
最近的实验表明,情感分析数据的准确性比硬币扔出来的结果还低(准确率为50%)。如果你的品牌基于情感分析做战略决策,那真的很可怕。
...
这些工具在预测60%到80%的话语方面是准确的,但当中立的话语被排除(占话语的80%)时,准确性惊人地下降了。
换句话说,每个人都在作弊,过度拟合(例如,推特上有大量重复和近似重复的内容——转发——如果包括这些内容,则会高估实际表现)。
情感分析
命名实体识别
聚类
主题分类
语言识别