情感分析的种子数据

10

我正在尝试情感分析,并且正在寻找一些种子数据。有免费的字典可用吗?

可以非常简单:三组文本/句子,对应“积极”,“消极”和“中性”。它不必很大。

最终,我可能会为我的特定用例生成自己的种子数据,但在构建该工具时,如果有东西可以使用,那将是很棒的。


我有Bing Lui和Minqing Hu的数据集(来自亚马逊网站上大约9种产品的7000条评论),我将它们放在Excel表格中,并计算了它们的综合平均得分。我还添加了来自网络上3个不同的免费情感分析API(ViralHeat、AlchemyAPI、repustate API)的得分。如果您需要这个Excel表格,我可以提供给您。 - smohamed
1
http://www.cs.uic.edu/~liub/FBS/sentiment-analysis.html#lexicon - zengr
@SherifMaherEaid:如何从文章中创建自己的字典? - user123
@user123 可能会将不同评论中使用的单词和短语分类为好、坏或中性。 - Bhargav Nanekalva
+1 感谢您提出问题 :) - Bhargav Nanekalva
4个回答

4

康奈尔的数据看起来能解决问题。谢谢! - Ken

3
如果您对情感词典感兴趣,许多作者已经提出了基于手工构建列表和其他半自动方法来获取带有观点的术语列表的工作。一个好的方法是从WordNet数据库中派生它,通过使用同义词等关系扩展正/负单词的核心。
一个手工构建列表的好例子是General Inquirer
对于一种半自动方法,可以查看Esuli和Sebastiani的SentiWordNet派生列表。
我相信这些通常可用于研究,但您可能需要与作者联系,以了解这些资源在非研究目的下的使用。

1
您可以在此处使用AFINN词汇表:

http://www2.imm.dtu.dk/pubdb/views/publication_details.php?id=6010

AFINN是一份包含英文单词情感价值的列表,每个单词都被赋予一个介于负五到正五之间的整数。这些单词是由Finn Årup Nielsen在2009-2011年手动标记的,并且文件以制表符分隔。有两个版本:AFINN-111是最新版本,包含2477个单词和短语;AFINN-96是1468个唯一单词和短语,共1480行。请注意,由于某些单词被列两次,因此有1480行。该单词列表并非完全按字母顺序排列。

1

感谢AFINN单词得分数据库。+1 - Bhargav Nanekalva

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接