我正在尝试使用Stanford CoreNLP库从自然语言内容中提取信息。我的目标是从句子中提取“主语-谓语-宾语”(简化)对。以以下句子为例:John Smith only eats an apple and a banana for lunch. He's on a diet and his mother told him that it would be very healthy to eat less for lunch. John doesn't like it at all but since he's very serious with his diet, he doesn't want to stop. 我想要的结果如下所示:
- John Smith - 吃 - 只有一个苹果和一个香蕉的午餐
- 他 - 是 - 节食
- 他的母亲 - 告诉 - 他 - 减少午餐摄入量非常健康
- 约翰 - 不喜欢 - 它(一点也不)
- 他 - 对他的节食非常认真
如何实现这一点?或者更具体地说,如何解析依赖树(或更适合的树),以获得上述指定的结果?如果能提供任何提示、资源或代码片段,将不胜感激。顺便提一下:我成功地用其代表性提及替换了代词,这会将“他”和“他的”更改为相应的实体(在这种情况下为约翰·史密斯)。
如何实现这一点?或者更具体地说,如何解析依赖树(或更适合的树),以获得上述指定的结果?如果能提供任何提示、资源或代码片段,将不胜感激。顺便提一下:我成功地用其代表性提及替换了代词,这会将“他”和“他的”更改为相应的实体(在这种情况下为约翰·史密斯)。