12得票4回答
Aho-Corasick算法的可扩展性

我希望能从一个关键词短语的数据库中(这些短语是从维基百科文章标题中提取的)搜索文本文档中的关键词短语。(例如,给定一个文档,我想知道是否存在任何对应的维基百科文章)。我了解到了Aho-Corasick算法。我想知道为数百万个条目构建Aho-Corasick自动机是否高效且可扩展。

11得票1回答
在Haskell中的Knuth-Morris-Pratt算法

我对Haskell中的Knuth-Morris-Pratt算法实现有些困惑。 http://twanvl.nl/blog/haskell/Knuth-Morris-Pratt-in-Haskell 我特别不理解自动机的构造。我知道它使用了"绕过循环"的方法来构建,但我并不清楚它的原理,也不...

7得票3回答
Aho-Corasick和Proper子串

我正在尝试理解Aho-Corasick字符串匹配算法。假设我们的模式是abcd和bc,我们最终得到这样一棵树: [] /\ [a]..[b] / : | [b].: [c] | : [c]..... | ...