Python正则表达式 - 如何从通配符表达式中捕获多个组?

37

我有一个Python正则表达式,其中包含一个可以出现零次或多次的组 - 但是当我之后检索组列表时,只有最后一个存在。例如:

re.search("(\w)*", "abcdefg").groups()

这会返回列表 ('g',)

我需要它返回('a','b','c','d','e','f','g',)

这可能吗? 我该怎么做?

2个回答

41
re.findall(r"\w","abcdefg")

2
+1:你不能只用一个正则表达式捕获来做到这一点,你必须另寻他法。 - S.Lott

33

除了Douglas Leeder的解决方案,这里给出解释:

在正则表达式中,组数是固定的。在组后面放置量词不会增加组数(想象一下所有其他组索引因为之前的某个组匹配多次而递增)。

带有量词的组是使复杂子表达式成为原子的方式,当需要多次匹配时。正则表达式引擎没有其他方法,只能将最后一个匹配保存到组中。简而言之:没有办法用单个“无武装”的正则表达式实现您想要的结果,您必须找到另一种方法。


2
作为补充:现代正则表达式实现(例如.NET中的实现)允许您访问组的先前出现,而不仅仅是最后一个。因此,上述语句并非普遍适用,但对于大多数实现仍然成立。 - Tomalak
4
据记录,Python有一个正则表达式实现,它还允许访问捕获组的所有匹配项:http://pypi.python.org/pypi/regex - MRAB

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接