使用pyparsing解析数学表达式

Question

使用pyparsing解析数学表达式

7

我在尝试使用pyparsing解析数学表达式。我知道我可以直接复制pyparsing网站上的计算器示例，但我想理解它，以便以后可以添加功能。我来这里是因为我尝试理解这个示例，但我无法做到，所以我尽力了，最终写出了下面的代码：

symbol = (
    pp.Literal("^") |
    pp.Literal("*") |
    pp.Literal("/") |
    pp.Literal("+") |
    pp.Literal("-")
)
operation = pp.Forward()
atom = pp.Group(
    pp.Literal("(").suppress() + operation + pp.Literal(")").suppress()
) | number
operation << (pp.Group(number + symbol + number + pp.ZeroOrMore(symbol + atom)) | atom)
expression = pp.OneOrMore(operation)


print(expression.parseString("9-1+27+(3-5)+9"))

这将打印出：

[[9, '-', 1, '+', 27, '+', [[3, '-', 5]], '+', 9]]

它能够工作，但不是很好。我希望能按照组的优先级和排序方式进行排序，但是经过多次尝试，我无法找到方法来实现。大致上就像这样：

[[[[9, '-', 1], '+', 27], '+', [3, '-', 5]], '+', 9]

我希望保持AST的样子，我想从中生成代码。

我确实看到了operatorPrecedence类？类似于Forward，但我不认为我理解它的工作原理。

编辑：

更深入地尝试了operatorPrecedence，我得到了这个结果：

expression = pp.operatorPrecedence(number, [
    (pp.Literal("^"), 1, pp.opAssoc.RIGHT),
    (pp.Literal("*"), 2, pp.opAssoc.LEFT),
    (pp.Literal("/"), 2, pp.opAssoc.LEFT),
    (pp.Literal("+"), 2, pp.opAssoc.LEFT),
    (pp.Literal("-"), 2, pp.opAssoc.LEFT)
])

我需要处理括号，因为当前程序不能处理括号（我不确定是否需要对结果进行后处理）。

- gcq

1

operatorPrecedence 处理 () 内部，测试一下就知道了。 - PaulMcG

真的 ;) 我用一个复杂的表达式进行了测试，但是它太嵌套了，实际上看不出它是否有效。 - gcq

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- PaulMcG · Accepted Answer

这个解析问题的实际名称是“中缀表示法”（在pyparsing的最新版本中，我正在将operatorPrecedence重命名为infixNotation）。要查看中缀表示法解析的典型实现，请查看pyparsing wiki上的fourFn.py示例。在那里，您将看到一个实现此简化的BNF以执行四则运算的操作优先级的示例：

operand :: integer or real number
factor :: operand | '(' expr ')'
term :: factor ( ('*' | '/') factor )*
expr :: term ( ('+' | '-') term )*

所以一个表达式是由一个或多个项通过加减运算符分隔而成。

一个项是由一个或多个因子通过乘除运算符分隔而成。

一个因子可以是一个最低级操作数（在这种情况下，只是整数或实数），或者是用()括起来的表达式。

注意，这是一个递归解析器，因为因子在表达式的定义中间接使用，但表达式也用于定义因子。

在pyparsing中，大致看起来是这样的（假设整数和实数已经被定义）：

LPAR,RPAR = map(Suppress, '()')
expr = Forward()
operand = real | integer
factor = operand | Group(LPAR + expr + RPAR)
term = factor + ZeroOrMore( oneOf('* /') + factor )
expr <<= term + ZeroOrMore( oneOf('+ -') + term )

现在使用expr，您可以解析这些任何一个：

3
3+2
3+2*4
(3+2)*4

infixNotation是pyparsing的辅助方法，它处理所有递归定义和分组，并允许您将其定义为：

expr = infixNotation(operand,
        [
        (oneOf('* /'), 2, opAssoc.LEFT),
        (oneOf('+ -'), 2, opAssoc.LEFT),
        ])

但这样会掩盖所有的基础理论，所以如果您想了解如何实现它，请查看fourFn.py中的原始解决方案。

[编辑-2022年12月18日] 对于那些寻找预定义解决方案的人，我已经将infixNotation封装成了一个名为plusminus的可安装pip包。 plusminus定义了一个BaseArithmeticParser类，用于创建一个准备运行的解析器和支持以下运算符的求值器：

  **   ÷   >=  ∈  in   ?:
  *    +   ==  ∉  not  |absolute-value|
  //   -   !=  ∩  and
  /    <   ≠   ∪  ∧
  mod  >   ≤   &  or
  ×    <=  ≥   |  ∨

还有这些函数：

  abs    ceil   max
  round  floor  str
  trunc  min    bool

“BaseArithmeticParser” 类允许您为特定领域的表达式定义其他运算符和函数，示例展示了如何为掷骰子、零售价格折扣等定义具有自定义函数和运算符的解析器。”