Perl正则表达式与Raku正则表达式,引擎上的区别是什么?

10

我试图将一个基于正则表达式的背包问题解决方案从Perl转换到raku。有关详情请参见Perlmonks

Perl解决方案创建了这个正则表达式:

(?<P>(?:vvvvvvvvvv)?)
(?<B>(?:vv)?)
(?<Y>(?:vvvv)?)
(?<G>(?:vv)?)
(?<R>(?:v)?)
0
(?=
(?(?{ $1 })wwww|)
(?(?{ $2 })w|)
(?(?{ $3 })wwwwwwwwwwww|)
(?(?{ $4 })ww|)
(?(?{ $5 })w|)
)

它与vvvvvvvvvvvvvvvvvvv0wwwwwwwwwwwwwww进行匹配。之后,匹配哈希%+包含要放入袋子中的物品。

我的Raku转换如下:

$<B> = [ [ vv ]? ]
$<P> = [ [ vvvvvvvvvv ]? ]
$<R> = [ [ v ]? ]
$<Y> = [ [ vvvv ]? ]
$<G> = [ [ vv ]? ]
0
<?before
[ { say "B"; say $/<B>; say $0; say $1; $1 } w || { "" } ]
[ { say "P"; say $/<P>; say $0; say $1; $2 } wwww || { "" } ]
[ { say "R"; say $/<R>; say $0; say $1; $3 } w || { "" } ]
[ { say "Y"; say $/<Y>; say $0; say $1; $4 } wwwwwwwwwwww || { "" } ]
[ { say "G"; say $/<G>; say $0; say $1; $5 } ww || { "" } ]

这也匹配上了vvvvvvvvvvvvvvvvvvv0wwwwwwwwwwwwwww。但是匹配对象$/没有包含任何有用的信息。此外,我的调试输出say都显示为Nil,所以在那个时候反向引用似乎不起作用?

以下是我的测试脚本:

my $max-weight = 15;
my %items      =
    'R' => { w =>  1, v =>  1 },
    'B' => { w =>  1, v =>  2 },
    'G' => { w =>  2, v =>  2 },
    'Y' => { w => 12, v =>  4 },
    'P' => { w =>  4, v => 10 }
;

my $str = 'v' x  %items.map(*.value<v>).sum ~
          '0' ~
          'w' x  $max-weight;

say $str;

my $i = 0;
my $left = my $right = '';

for %items.keys -> $item-name
{
    my $v = 'v' x %items{ $item-name }<v>;
    my $w = 'w' x %items{ $item-name }<w>;

     $left  ~= sprintf( '$<%s> = [ [ %s ]? ] ' ~"\n", $item-name, $v );
     $right ~= sprintf( '[ { say "%s"; say $/<%s>; say $0; say $1; $%d } %s || { "" } ]' ~ "\n", $item-name, $item-name, ++$i, $w );
}
use MONKEY-SEE-NO-EVAL;

my $re = sprintf( '%s0' ~ "\n" ~ '<?before ' ~ "\n" ~ '%s>' ~ "\n", $left, $right );

say $re;
dd $/ if $str ~~ m:g/<$re>/;

1
FYI,PerlMonks 上允许 Raku 相关的问题。 - ikegami
你能解释一下你的前瞻中 || { "" } 部分的作用吗? - jubilatious1
1个回答

1
这个答案仅涵盖了问题出在哪里,没有提供解决方案。我还没有提交相应的错误报告,甚至还没有搜索错误队列以查找与我提出的这两个问题相对应的报告。
my $lex-var;

sub debug { .say for ++$, :$<rex-var>, :$lex-var }

my $regex = / $<rex-var> = (.) { $lex-var = $<rex-var> } <?before . { debug }> / ;

'xx' ~~   $regex;     say $/;
'xx' ~~ / $regex /;   say $/;

显示:

1
rex-var => Nil
lex-var => 「x」
「x」
 rex-var => 「x」
2
rex-var => Nil
lex-var => 「x」
「x」

首先关注debug的第一次调用(从以1开头到以rex-var => 「x」结尾的行),我们可以看到:
  • 在调用debug期间出了些问题:报告$<rex-var>的值为Nil

  • 当正则表达式匹配完成并返回到主线时,say $/报告一个完整且正确填充的结果,其中包括命名为rex-var的匹配。

为了开始感受出错的原因,请考虑阅读我对另一个SO问题的回答的大部分内容。您可以安全地跳过使用~。脚注1、2和6对您的情况也可能完全无关。

对于第二个匹配,我们发现不仅在debug调用期间报告$<rex-var>Nil,而且在主线程中使用第二个say $/返回的最终匹配变量也缺少rex-var匹配。唯一的区别是正则表达式$regex是从外部正则表达式中调用的。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接