11得票4回答
匹配两个独立短语的正则表达式

我正在寻找一个正则表达式,可以确保两个短语同时出现在网页上。 我需要在网页上确保的两个短语是Current QPS(最近10秒,忽略0)和Average Latency(最近100次查询) 网页看起来像这样(查询时间可能不同,但文本不会改变):Query Statistics Average...

10得票1回答
预测短语而不仅仅是下一个单词

对于我们构建的应用程序,我们使用了一个简单的统计模型来进行单词预测(类似于Google自动完成),以引导搜索。 它使用从大量相关文本文档中收集的ngram序列。通过考虑前N-1个单词,它建议按概率降序显示五个最可能的“下一个单词”,使用Katz后退模型。 我们希望将此扩展为预测短语(多个单...

8得票1回答
Python:使用Spacy等工具实现除名词短语以外的块分析(例如介词短语)。

自从有人告诉我Spacy是自然语言处理方面非常强大的 Python 模块之后,我现在正在拼命寻找一种将单词组合成不仅是名词短语,更重要的是介词短语的方法。 我怀疑是否有 Spacy 函数可以做到这一点,但这可能是最简单的方法(已经在我的项目中导入了 SpacySpaCy)。 尽管如此,我也愿意...