我正在尝试情感分析,并且正在寻找一些种子数据。有免费的字典可用吗?
可以非常简单:三组文本/句子,对应“积极”,“消极”和“中性”。它不必很大。
最终,我可能会为我的特定用例生成自己的种子数据,但在构建该工具时,如果有东西可以使用,那将是很棒的。
我正在尝试情感分析,并且正在寻找一些种子数据。有免费的字典可用吗?
可以非常简单:三组文本/句子,对应“积极”,“消极”和“中性”。它不必很大。
最终,我可能会为我的特定用例生成自己的种子数据,但在构建该工具时,如果有东西可以使用,那将是很棒的。
UIC的Bing Liu和Minqing Hu拥有多个数据集:
庞博来自康奈尔大学,有更多信息。
http://www2.imm.dtu.dk/pubdb/views/publication_details.php?id=6010
AFINN是一份包含英文单词情感价值的列表,每个单词都被赋予一个介于负五到正五之间的整数。这些单词是由Finn Årup Nielsen在2009-2011年手动标记的,并且文件以制表符分隔。有两个版本:AFINN-111是最新版本,包含2477个单词和短语;AFINN-96是1468个唯一单词和短语,共1480行。请注意,由于某些单词被列两次,因此有1480行。该单词列表并非完全按字母顺序排列。我维护一个情感分析语料库和词汇表的列表(其中包括我的AFINN):
http://neuro.compute.dtu.dk/wiki/Sentiment_analysis#Corpora
http://neuro.compute.dtu.dk/wiki/Sentiment_analysis#Affective_word_lists