我现在正在使用一些自然语言处理库,包括Stanford和nltk。我看了Stanford的演示部分,但我想问一下是否有可能使用它识别更多类型的实体。
目前,Stanford NER系统(如演示所示)可以将实体识别为人(姓名)、组织或位置。但识别的组织仅限于大学或某些大型组织。我想知道是否可以使用其API编写更多类型实体的程序,例如如果我的输入是“苹果”或“广场”,它就能将其识别为公司。
我需要制作自己的训练数据集吗?
此外,如果我想提取实体及其之间的关系,我觉得我应该使用Stanford依赖解析器。也就是说,首先提取命名实体和其他标记为“名词”的部分,并找到它们之间的关系。
我的理解正确吗?
谢谢。