Attoparsec 解析失败，但使用正确的回溯应该不会失败。

Question

3

我正在使用Attoparsec，据说它默认采用回溯。但是下面这行代码：

parseOnly  (string "foo" *> many1 anyChar <* string "bar") "fooxxxbar"

出现以下错误：

Left "not enough input"

为什么会这样？如果many1 anyChar决定只解析三个字符(xxx)，它应该是成功的。因为回溯的缘故，它应该在某个时候考虑这样做，不是吗？

如何使用Attoparsec实现等效于/foo(.*)bar/正则表达式的正确方法？

- Iguana Bob

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Alec · Accepted Answer

我正在使用Attoparsec，据说它默认会回溯。

并不完全是这样。Attoparsec确实支持回溯，但仅在某些明确的情况下（文档中指出的情况）才支持。它的目的是高性能解析，可想而知，这与回溯不太兼容。

你需要使用manyTill或manyTill'。请注意，回溯行为在文档中有所提及。

ghci> manyTill1 p e = (:) <$> p <*> manyTill p e 
ghci> parseOnly (string "foo" *> manyTill1 anyChar (string "bar")) "fooxxxbar"
Right "xxx"