问题:
暂时忘记下面的内容,因为我的细节看起来让人感到困惑(或者这确实很复杂)。
我想使用正则表达式匹配“除了这个(任何)捕获组匹配的内容之外的所有内容”。
我尝试过:
我看到了这个问题,但是答案和问题都只谈到了一个情况,没有解释语法如何/为什么工作,所以我无法理解它是如何实现的。
我看了一下使用?!
的“负向先行断言”,但不太明白它如何实现我要做的事情。
我试图匹配除了一个捕获组之外的所有内容,例如("[a-z]*",)
。
例如,在这个多行列表中:
"buckeye",
"buckeye"
,
."
,"
"fbfdb
"feve,
如何使用正则表达式选择除捕获组之外的所有内容(在我的情况下应该匹配"buckeye",
或任何一组"
+任何数字a-z字符+",
)?
我需要这样做的原因是因为我有一个文件,里面有很多条目,例如:
"aidman",
"aidmen",
"aids",
"aiglet",
"aiglets",
"aigret",
"aigrets",
"aigrette",
"aigrettes",
"aiguille",
"aiguilles",
"aikido",
我在文本编辑器中对其进行了一些替换以更改格式,但是在100,000行中的约20行发生了许多随机事件(一个错误)。因此,我需要找到格式不正确的行。
澄清:
我的目标只是要理解如何说“我想匹配除了这个捕获组之外的所有内容”。