获取Python正则表达式解析树以调试你的正则表达式。
正则表达式是Python的一个很棒的特性,但是调试它们可能会很麻烦,而且很容易出错。
幸运的是,Python可以通过向re.compile
传递未记录的、实验性的、隐藏的标志re.DEBUG
(实际上是 128)来打印正则表达式解析树。
>>> re.compile("^\[font(?:=(?P<size>[-+][0-9]{1,2}))?\](.*?)[/font]",
re.DEBUG)
at at_beginning
literal 91
literal 102
literal 111
literal 110
literal 116
max_repeat 0 1
subpattern None
literal 61
subpattern 1
in
literal 45
literal 43
max_repeat 1 2
in
range (48, 57)
literal 93
subpattern 2
min_repeat 0 65535
any None
in
literal 47
literal 102
literal 111
literal 110
literal 116
一旦你理解了语法,就能够发现错误。在这里我们可以看到,我忘记在[/font]
中转义[]
。
当然,你可以与任何你想要的标志组合在一起,比如注释的正则表达式:
>>> re.compile("""
^ # start of a line
\[font # the font tag
(?:=(?P<size> # optional [font=+size]
[-+][0-9]{1,2} # size specification
))?
\] # end of tag
(.*?) # text between the tags
\[/font\] # end of the tag
""", re.DEBUG|re.VERBOSE|re.DOTALL)
(< 1 x 10)
。你甚至可以把它们应用于单个参数,像(= 10)
一样:http://www.cs.cmu.edu/Groups/AI/html/hyperspec/HyperSpec/Body/fun_eqcm_sleq__lteqcm_gteq.html - Ken