有没有一种算法可以帮助检测英语句子的“主题”?

33

我正在尝试找出是否有一种已知的算法能够检测一个句子的“关键概念”。

使用案例如下:

  1. 用户输入一个查询句子(鸡肉的味道像火鸡吗?)
  2. 我们的系统识别句子的概念(鸡肉,火鸡)
  3. 然后它运行搜索我们语料库内容的过程

我们欠缺的是确定句子真正涉及什么核心“主题”的能力。句子“鸡肉的味道像火鸡吗?”的主要主题是“鸡肉”,因为用户询问的是鸡肉的味道。而“火鸡”是次要的辅助主题。

所以……我正在尝试找出是否有一种算法可以帮助我确定一个句子的主要主题……如果你知道任何这样的算法,请告诉我!!!


1
语言严格限定为英语吗? - biziclop
26
果蝇喜欢香蕉。 - porges
2
@belisarius 只有一个是有意义的。 - biziclop
2
@biziclop:关键是两种意思都有语法上的合理性。Porges的评论很好地证明了一个句子的语法结构不能仅仅通过语法规则来推断:要做到这一点需要(大量的)领域知识。如果你甚至无法确定一个句子的语法结构,那么你如何确定它的预期含义呢? - j_random_hacker
1
你可能想要了解免费的OpenCalais服务:http://opencalais.com - user3188544
显示剩余5条评论
12个回答

0

一种选择是首先研究类似于这样的东西:

http://www.abisource.com/projects/link-grammar/

然而,如何从这些链接中获取主题是另一个问题。但由于Abiword正在尝试检测语法问题,你可能可以使用它来确定主题。


-3

在“主要话题”中,您指的是所谓的句子主语

通过自然语言处理,可以识别出句子的主语。

这个问题的答案与如何确定主语、宾语和其他单词?相同- 这是一个目前未解决的问题。


它已经非常接近被解决了,就是对于研究充分的语言来说,解析器已经与专业语言学家不相上下了。 - Fred Foo
可能吧。但你所链接的问题更为概括,只有回答者指引提问者做更多研究的答案。 - rockit
1
一个句子的语法主语和它的主题绝对不是同一个东西。 - jogojapan

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接