如何在Lua中精确匹配n次重复的模式?

3

我正在编写一个语法规则,其中仅包含三个字母字符。以下是我的代码:

local l = require "lpeg"

l.locale(l)

local date = l.digit^1 * l.P'/' * l.digit^1 * l.P'/' * l.digit^1
local time = l.digit^1 * l.P':' * l.digit^1 * l.P':' * l.digit^1 * l.P':' * l.digit^1  
local timezone = l.alpha^3
local stamp = l.P'[' * date * l.P' ' * time * l.P' ' * timezone * l.P']'

grammar = l.C(stamp)

我要翻译的内容如下:

我要匹配的输入是这样的:

[4/23/15 4:49:49:371 CDT]

我该如何让表达式仅匹配时区中的三个字母字符?目前代码的工作方式是匹配三个或更多个字母字符。


奇怪!这样行吗?

local timezone = l.alpha*2

看起来是这样,但我找不到任何地方参考该语法:

http://www.inf.puc-rio.br/~roberto/lpeg/lpeg.html

1个回答

3

l.alpha*2 是指 l.alpha 乘以 l.P(2)

所以,不,这与[a-z]..匹配不上。

查看 lpeg.print(timezone) 的输出结果来确认此内容。(请注意我使用了ll作为区域设置数据的变量名。将其放在同一个表中会丢失原始的print调试函数。)

> l=require"lpeg"
> ll=lpeg.locale()
> p=ll.alpha*2
> l.print(p)
[]
00: set [(41-5a)(61-7a)]-> FAIL
05: any * 2-> FAIL
06: end
> =p.match("099")
nil
> =p.match("EST")
4
> =p.match("E99")
4

你需要的模式是:
> function patcount(pat, min, max)
>>  return -pat^(max + 1) * pat^min
>> end
> p=patcount(ll.alpha, 3, 3)
> lpeg.print(p)
[]
00: set [(41-5a)(61-7a)]-> 27
05: choice -> 27 (1)
06: set [(41-5a)(61-7a)]-> FAIL
11: set [(41-5a)(61-7a)]-> FAIL
16: set [(41-5a)(61-7a)]-> FAIL
21: span [(41-5a)(61-7a)]
26: failtwice
27: set [(41-5a)(61-7a)]-> FAIL
32: set [(41-5a)(61-7a)]-> FAIL
37: set [(41-5a)(61-7a)]-> FAIL
42: span [(41-5a)(61-7a)]
47: end
> =p:match("EST")
4
> return p:match("ES")
nil
> return p:match("ESTT")
nil
> return p:match("099")
nil
> return p:match("E99")
nil

相关文档位于-patt

至于l.alpha*2语法,这是由手册中的以下引用解释的。

所有需要模式作为参数的操作也可以接收字符串、表、数字、布尔值或函数,它们根据函数lpeg.P的规则转换为模式。

也就是说,当其中一个操作数已经是模式时,运算符将非模式转换为模式。

还有“匹配固定重复次数的模式”部分(和链接)在LpegRecipes lua-users.org维基页面上。(但我还没有仔细研究过那个实现,看起来比我上面的更复杂。)


2
或将负模式移到第二个位置,像这样return pat^min - pat^(max+1) - wqw

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接