作为纯粹的学术练习,我正在从零开始编写一个递归下降解析器 -- 不使用ANTLR或lex/yacc。
我正在编写一个简单的函数,将数学表达式转换为它们等效的AST。 我有以下代码:
// grammar
type expr =
| Lit of float
| Add of expr * expr
| Mul of expr * expr
| Div of expr * expr
| Sub of expr * expr
// tokens
type tokens =
| Num of float
| LParen | RParen
| XPlus | XStar | XMinus | XSlash
let tokenize (input : string) =
Regex.Matches(input.Replace(" ", ""), "\d+|[+/*\-()]")
|> Seq.cast<Match>
|> Seq.map (fun x -> x.Value)
|> Seq.map (function
| "+" -> XPlus
| "-" -> XMinus
| "/" -> XSlash
| "*" -> XStar
| "(" -> LParen
| ")" -> RParen
| num -> Num(float num))
|> Seq.to_list
所以,tokenize "10 * (4 + 5) - 1"
返回以下标记流:
[Num 10.0; XStar; LParen; Num 4.0; XPlus; Num 5.0; RParen; XMinus; Num 1.0]
此时,我想根据运算符优先级将令牌流映射到其AST。
Sub(
Mul(
Lit 10.0
,Add(Lit 4.0, Lit 5.0)
)
,Lit 1.0
)
然而,我一片空白。我从未从头开始编写解析器,也不知道如何开始。
如何将令牌流转换为其表示的AST?