如何使用正则表达式在Perl中限制匹配结果？

Question

如何使用正则表达式在Perl中限制匹配结果？

7

在进行了大量研究后，我来寻求您的帮助：

我正在尝试限制Perl正则表达式在大文本中执行的替换次数。我在谷歌上搜索并发现其格式为{2,3}（最小值，最大值），然而这似乎是针对不同于我使用的语法的形式。

$replaced=~s/$var/$var2/g; # replaces all ocurrences
$replaced=~s/$var/$var2/;  # replaces only first one

我的非最优解决方案：

for($i=0; $i<8; $i++){

    $replaced=~s/$var/$var2/;
}

我尝试过的方法：

$replaced=~s/$var/$var2/{8};
$replaced=~s/$var/$var2{8}/;

任何帮助都将不胜感激！

编辑：好的，基本上需要涉及循环，是不是很奇怪没有内置参数来限制它？

- isJustMe

1

你为什么认为你的解决方案不够优化？ - Vlad

2

如果我正在解析一个100MB的文件，并且出现在块的后半部分，那么每次都需要读取前50MB，如果可以限制这个范围，那么只需要一次读取。 - isJustMe

1

这只是一个例子，数据集是随机生成的，出现位置可能在文件的任何地方。 - isJustMe

3

@James_R_Ferguson - 为什么这很像 Perl？ - Leonardo Herrera

2

一个更加 Perl 风格的循环是 for (1..8)。 - Ven'Tatsu

显示剩余6条评论

3个回答

4

我不太擅长Perl，但我相信你想使用"\G断言"(更多信息在这里)，它将继续在前一次匹配结束的地方搜索新的匹配：

for($i=0; $i<8; $i++){

    $replaced=~s/\G$var/$var2/;
}

我不确定它是否确实更有效率，但它似乎是为此而设计的...

- Code Jockey

1

$i变量在这里没有任何作用。更优雅的写法是s/\G$var/$var2/ for 1 .. 8;。 - Zaid

@Zaid：但在这种情况下，您不能省略$replaced=~，因为for 1..8会设置$_。 - choroba

正确，应该以 $replaced =~ 开始。 - Zaid

1

答案：http://codenode.com/2010/06/24/single-pass-replace-with-perl-regex-g-anchor/ 带有计数器修改的摘录：

my $cnt = 0;
if ( $query =~ m/\bORDER BY /gi ) {
   while ($query =~ s/\G(.+?)\s+ASC/$1/gmsi && pos $query) {
       $cnt++; last if $cnt >= 8;
   }
}

- Victor Bruno

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- hobbs · Accepted Answer

使用\G的答案可能是实现您想要的功能的最实用方法，但只是为了好玩、增长见识或其他原因，这里提供另一种方法（需要perl 5.10或更高版本），使用代码断言和回溯控制动词(*COMMIT)和(*FAIL)：

my $str = "Bananas in pajamas are coming down the stairs";
my $limit = 3;
my $count;

$str =~ s/(*COMMIT)(?(?{ $count++ >= 3 })(*FAIL))a/A/g;
say $str;

这会将文本“BAnAnAs in Pajamas are coming down the stairs”放在$str中 - 只有前三个“a”受到影响，并且在第三个后停止扫描字符串以查找更多匹配项。