在进行情感分析时,我该如何让机器理解我所指的是苹果公司(iPhone),而不是苹果这种水果?
谢谢您的建议!
在进行情感分析时,我该如何让机器理解我所指的是苹果公司(iPhone),而不是苹果这种水果?
谢谢您的建议!
嗯,有几种方法,我会从检查大写字母开始,通常在涉及姓名时,第一个字母是大写的。
在进行情感分析之前,我会使用一些词性标注和命名实体识别来标记相关单词。
Stanford CoreNLP 是一个很好的文本分析项目,它将教你基本概念。
CoreNLP 的示例:
您可以看到标记如何帮助您。
并且请查看更多信息
这个问题已经被许多开源的预训练NER模型解决了。无论如何,您可以尝试重新训练现有的NER模型,以微调它们来解决此问题。 您可以在Spacy NER 这里找到一个NER结果的演示。
在处理日期、知名品牌、vip或历史人物时,可以使用命名实体识别算法(Named Entity Recognition,NER);在这种情况下,正如Ofiris建议的那样,Stanford CoreNLP提供了一个很好的命名实体识别器。
对于多义词的更普遍消歧(即,具有多个意义的词,例如“好”),您可以使用词性标注器结合词义消歧(Word Sense Disambiguation,WSD)算法。后者的示例可以在此处找到,但我不知道是否有任何可免费下载的库可用于此目的。