成分句法分析器和依存句法分析器的区别

128

成分分析器依存句法分析器有什么区别?它们的不同用途是什么?

1个回答

203
一个语法分析树将一段文本分解成子短语。树中的非终端是短语类型,终端是句子中的单词,边缘没有标签。对于一个简单的句子 "John sees Bill",语法分析树如下:
                  Sentence
                     |
       +-------------+------------+
       |                          |
  Noun Phrase                Verb Phrase
       |                          |
     John                 +-------+--------+
                          |                |
                        Verb          Noun Phrase
                          |                |
                        sees              Bill

依存句法分析根据单词之间的关系连接它们。树中的每个顶点表示一个单词,子节点是依赖于父节点的单词,边缘由关系标记。 "John sees Bill" 的依存句法分析如下:
              sees
                |
        +--------------+
subject |              | object
        |              |
      John            Bill

你应该使用最接近目标的解析器类型。如果你对句子中的子短语感兴趣,那么你可能需要使用组成结构解析器。如果你对单词之间的依赖关系感兴趣,那么你可能需要使用依存解析器。

斯坦福解析器可以提供这两种解析器类型(在线演示)。实际上,它的工作方式是始终使用组成结构解析器来解析句子,然后(如果需要),对组成结构解析树执行确定性(基于规则)转换以将其转换为依存树。

更多信息请参见此处:

http://en.wikipedia.org/wiki/Phrase_structure_grammar

http://en.wikipedia.org/wiki/Dependency_grammar


关于自然语言处理,组成成分分析的应用在哪里?依存句法分析非常有用,但是我在哪里可以使用组成成分分析的输出呢? - arjun
4
基于成分的句法分析方法提供了类似的信息,但通常需要通过技术手段(例如第11章讨论的头部查找规则)从树结构中提取。 - gkiko
1
@arjun,成分句法分析有许多应用。举个例子,在从文本中提取信息/关系时,您可能只需要从文本中提取VPs/NPs/Clauses,然后将这些短语/从句的一对分类为是否表示某种关系类型。因此,在这种情况下,我不一定需要短语/从句内部的细粒度关系信息,而只需要从文本中获取短语/从句跨度。这就是成分句法分析器派上用场的时候。 - Pedram

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接