如何解决情感分析中的歧义问题?

3

我对文本挖掘还很陌生,今天想尝试一下情感分析。但是在进行情感分析时遇到了问题。 在我的语言中,一个词可能有不同的意思。比如,“setan”的意思可能是:1)魔鬼 2)咒骂。如何解决情感分析中的歧义问题? 另外,我使用的算法是朴素贝叶斯分类器,并使用RapidMiner工具。 希望能得到你的帮助。任何提示都将不胜感激。谢谢!

1个回答

3
在朴素贝叶斯分类器上对数据进行训练,使模型为您尝试分类的每个不同类别的每个单词分配一个概率。在您的情况下,由于这是情感分析,如果您有正面和负面作为两个类,则会得到“setan”为正面和负面的概率。
请记住,如果一个单词具有多种可能解释,可以说明积极和消极情感,建议确保在数据中包含这两种实例,以便在训练模型时,相应的概率用于将新文本分类为积极或消极类别。
在您的情况下,似乎“setan”的两种含义都带有负面意义,这真的不应该成为问题。像“the”、“a”这样同时出现在积极和消极实例中的常见停用词应该被删除,因为它们并不真正对分类起作用。

如果您正在尝试使用单词的含义来训练模型,您可以参考这篇论文https://pdfs.semanticscholar.org/fc01/b42df3077a512620456d8a2714951eccbd67.pdf


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接