我想知道是否有人知道我可以获取正面和负面词汇的字典。 我正在研究情感分析,这是其中的一个关键部分。
我想知道是否有人知道我可以获取正面和负面词汇的字典。 我正在研究情感分析,这是其中的一个关键部分。
资料来源:
稍微晚了一点,我想指出字典在情感分析中的贡献是有限的。
一些带有情感色彩的句子不包含任何"情感"词 - 例如,"读这本书"可以在书评中是积极的,但在电影评论中则是消极的。
同样地,情感词"不可预测的"在惊悚片的背景下可能是积极的,但用来描述丰田汽车的制动系统时则是消极的。
还有许多其他的例子...
这篇2002年的论文描述了一种从文本样本中自动派生这样一个词典的算法,仅使用两个单词作为种子集。
您可以在此处找到AFINN,也可以动态创建它。例如,每当出现未知的正面单词时,将其与+1相加。例如,香蕉是新的正面单词,并且出现了两次,则会变成+2。
您爬取的文章和数据越多,您的词典就会变得越强大!
from nltk.sentiment.vader import SentimentIntensityAnalyzer
sentence='APPle is good for health'
sid = SentimentIntensityAnalyzer()
ss = sid.polarity_scores(sentence)
print(ss)
它将给出句子的极性。
输出:
{'compound': 0.4404, 'neu': 0.58, 'pos': 0.42, 'neg': 0.0}