我正在阅读一本书,看到很多像这样的例子:
我正在阅读一本书,看到很多像这样的例子:
(?P<email>
[\w\d.+-]+ # username
@
([\w\d.]+\.)+ # domain name prefix
(com|org|edu) # limit the allowed top-level domains
)
由于\w
表示[a-zA-Z0-9_]
,\d
表示[0-9]
,所以\d
是\w
的子集。
因此,这些\d
是否冗余呢?请有经验的人确认我理解的正确性,因为这让我烦恼。
\d
标记放在分组之外,而不是内部。 - R Nar(text with "strings) and \"quotes in strings\")")
中查找匹配的关闭括号,您必须考虑引号和反斜杠转义(这不是常见的解析情况)。真正适合这种情况的正确工具是词法分析器,但手写状态机解析器要比等效的正则表达式简单得多。jwz的引用语句不应该被愚蠢地“应用”,但它本身并不愚蠢。 - rmunn