我有一个正则表达式模式,我在一大段文本(单个字符串)上使用它。原始文本中的多个不连续区域与正则表达式匹配。现在,我正在尝试构建一个状态机,遍历文本并根据位置处的字符以及该位置是否在正则表达式匹配的范围内执行不同的操作。
使用 RE.finditer(text),我可以找到所有子字符串,并提取它们的范围,因此我有一个元组列表可供使用,例如:
(1, 5) (10, 15) (20, 55) 等等。
有了这些信息,给定字符串中的字符索引,我可以编写算法来查看该字符是否是正则表达式字符串的一部分。例如,给定字符6,我可以遍历跨度列表并确定它不是匹配的子字符串的一部分。
有更好的方法吗?
提前感谢您,
JW
使用 RE.finditer(text),我可以找到所有子字符串,并提取它们的范围,因此我有一个元组列表可供使用,例如:
(1, 5) (10, 15) (20, 55) 等等。
有了这些信息,给定字符串中的字符索引,我可以编写算法来查看该字符是否是正则表达式字符串的一部分。例如,给定字符6,我可以遍历跨度列表并确定它不是匹配的子字符串的一部分。
有更好的方法吗?
提前感谢您,
JW
bbbb/,ccccc
*作为一个令牌捕获还是三个令牌? - smci