如何对Boost Spirit Parser进行基准测试？

Question

如何对Boost Spirit Parser进行基准测试？

c++benchmarkingboost-spiritboost-spirit-qiboost-spirit-lex

15

我正在开发一个编译器，希望提高其性能。我发现约50％的时间用于解析源文件。由于源文件非常小，而且在此之后我进行了许多转换，所以我认为它是可以改进的。

我的解析器是使用Boost Spirit解析器和词法分析器（使用lexer :: pos_iterator）构建的，并且我有一个中等规模的语法。我将源代码解析成AST。

我的问题是，我不知道在解析过程中哪部分耗时最长：AST节点的复制，词法分析器，解析器规则还是内存。

我不认为这是I/O问题，因为我正在使用SSD工作，而且一开始就完全读取文件，然后只使用内存版本。

我尝试使用分析器，但需要花费时间的方法是来自Boost的一些具有数百个字符名称的方法，我不确定它们确切的作用...

那么，有没有首选方法来基准测试Boost Spirit解析器及其语法？或者是否有一些规则可用于验证某些特定点的效率？

谢谢

对于有兴趣的人，以下是源代码：

- Baptiste Wicht

4

这里是ApochiQ写的一篇文章，他使用Boost.Spirit作为Epoch语言的解析器。在第10版和第11版之间，他大大提高了解析器的性能，并记录下了他所关注的内容[此处]（http://code.google.com/p/scribblings-by-apoch/wiki/OptimizingBoostSpirit）。 - Matthieu M.

@MatthieuM。是的，我知道这篇文章。很久以前我已经遵循了这篇优秀文章中的几条建议。但我不知道接下来该遵循哪些建议。 - Baptiste Wicht

1

你介意分享被测试的代码吗？我自己很感兴趣。 - sehe

1

你在代码上运行过分析器吗？ - Mats Petersson

是的@MatsPetersson，正如我在问题中所说的，我对代码进行了分析。问题在于作为热点的函数名称有数百个字符长，而我不知道它们确切的作用...这并不能给我足够的信息...对于not-sehe，我已经添加了源代码链接，但它相当大。 - Baptiste Wicht

显示剩余3条评论

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- sehe · Accepted Answer

我已经快速浏览了一下。

我的分析器很快告诉我，构建语法和（特别是）词法分析器对象需要相当多的资源。

实际上，在SpiritParser.cpp中仅更改一行就¹节省了40%的执行时间（从约28秒降至约17秒）：

    lexer::Lexer lexer;

进入

    static const lexer::Lexer lexer;

现在，

使语法静态化需要使其无状态。我通过以下方式实现：
- 将 position_begin 移动到 qi::_a 中（使用 qi::locals），并且
- 在适当的时候将其作为继承属性传递。
  - 例如，在 EDDIGrammar 和 ValueGrammar 语法中进行传递。
```
start %= qi::eps [ qi::_a = qi::_r1 ] >> program;
```
  - 还有从ValueGrammar中被外部使用的个别规则。
这会带来许多次优的副作用：
- 由于lexer::pos_iterator_type没有默认输出流重载，因此规则调试已被注释掉。
- 使用了非常复杂的替代方式来 '伪造' qi::position(position_begin) 表达式：