Java文本分析库

13
我正在寻找一种使用Java进行句子分析的解决方案,以记录关键词是否被积极或消极地使用。
例如,关键词可能是“卷心菜”,而句子可能是:“我喜欢卷心菜但不喜欢豌豆”。
我希望有一种Java文本分析器可以将其记录为积极的。Lucene(Hibernate-Search)库是否可用于此目的?
有什么想法吗?
3个回答

16

1
这里有大量的内容。需要一些时间来筛选它们。我会报告我的发现 - 但非常感谢你给出的指引。 - jaseFace
如果你发现了任何有用的东西,请务必回报。 - ishnid

1

我怀疑没有这样的东西。Lucene肯定不能直接做到。

你甚至如何“定义”“关键字是以积极的还是消极的方式使用”,以一种可编程评估的方式呢?要正确地做到这一点,您必须分析文本的实际含义,这是一个尚未得到解决的AI问题。

我想你可以通过对关键字是否更经常出现在积极(例如好,极好,精彩)或消极(坏,憎恨,糟糕,该死)的关键字旁边进行统计分析来近似解决它,但即使如此,否定,讽刺和复杂的句子结构也会带来问题。


我想起了一个翻译器,它以“精神愿意,肉体虚弱”开始,但返回的是“酒好肉烂”。 - Andrew Thompson

0

看一下Mahout Taste,它基于Lucene构建,但是在开箱即用方面添加了很多你需要的功能。(编辑)我应该补充说明,Mahout Taste仅仅是与你寻找的相关,并不是完全匹配。


3
口味是一种协同过滤引擎。封装口味项目的麻糬关注更普遍的数据挖掘,但不包括情感分析。 - Sean Owen

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接