如何使用Spacy检查一个句子是否是一个问句?

7

我正在使用spacy库构建聊天机器人。 我如何检查一个文档是否是一个具有一定置信度的问题? 我知道如何进行相关性计算,但不确定如何从问题中过滤语句。

我正在寻找类似下面的东西:

spacy.load('en_core_web_lg')('Is this a question?').is_question
1个回答

5

我的第一反应是建议查找句子末尾的问号。

否则,大多数问题以 {is, does, do, what, when, where, who, why, what, how} 开始。

还有一个更复杂的答案,涉及助动词的包含和它们相对于动词的位置,但如果您的数据格式良好,这可能就足够了(而且速度较快)。


1
我有点猜测。我希望spaCy提供了一个开箱即用的统计解决方案。 - Iliiazbek Akhmedov
是的,这里似乎需要一些语言学或计算语言学的知识。我猜我们不能依赖库完成所有事情。 - information_interchange

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接