Python复杂正则表达式字符串扩展

3
假设我有一个以下形式的字符串:
ABCDEF_(0-100;1)(A|B)_GHIJ_(A-F)

我希望能将其扩展到以下内容:
ABCDEF_0A_GHIJ_A
ABCDEF_1A_GHIJ_A
ABCDEF_2A_GHIJ_A
...
ABCDEF_100A_GHIJ_A

ABCDEF_0B_GHIJ_A
ABCDEF_1B_GHIJ_A
ABCDEF_2B_GHIJ_A
...
ABCDEF_100B_GHIJ_A

ABCDEF_0A_GHIJ_B
ABCDEF_1A_GHIJ_B
ABCDEF_2A_GHIJ_B
...
ABCDEF_100A_GHIJ_B

ABCDEF_0B_GHIJ_B
ABCDEF_1B_GHIJ_B
ABCDEF_2B_GHIJ_B
...
ABCDEF_100B_GHIJ_B

ABCDEF_0A_GHIJ_C
ABCDEF_1A_GHIJ_C
ABCDEF_2A_GHIJ_C
...
ABCDEF_100A_GHIJ_C

..and so on

第二行的字符串是以下缩写:

STRING_(START-END;INC)_STRING(A OR B)_STRING(A THRU F)

然而,正则表达式的符号可以出现在字符串的任何位置。例如,字符串也可以是:

ABCDEF_(A|B)_(0-100;1)_(A-F)_GHIJ

以下是我尝试过的:

trend = 'ABCDEF_(0-100;1)(A|B)_GHIJ_(A-F)'

def expandDash(trend):
    dashCount = trend.count("-")
    for dC in range(0, dashCount):
        dashIndex = trend.index("-")-1
        trendRange = trend[dashIndex:]
        bareTrend = trend[0:trend.index("(")]
        beginRange = trendRange[0:trendRange.index("-")]
        endRange = trendRange[trendRange.index("-"):trendRange.index(";")]
        trendIncrement = trendRange[-1]
        expandedTrendList = []


def regexExpand(trend):

    for regexTrend in trend.split(')'):
        if "-" in regexTrend:
            print trend
            expandDash(regexTrend)

我显然陷入了困境...

是否有使用正则表达式进行字符串扩展的简单方法?


1
(关于关闭投票的事,没有个人恩怨。这并不是一个容易找到的重复问题——我只知道它是因为以前见过——如果你找不到它,那也是可以理解的。如果你不同意关闭投票,请在评论中解释为什么那个链接不相关。) - Andrew Cheong
1个回答

1
你可以很容易地使用正则表达式解析你的小型表达式语言。但你不能使用正则表达式来实际进行扩展:
TREND_REGEX = re.compile('(^.*?)(?:\((?:([^-)])-([^)])|(\d+)-(\d+);(\d+)|([^)|]+(?:\|[^)|]+)*))\)(.*))?$')

def expand(trend):
    m = TREND_REGEX.match(trend)
    if m.group(8):
        suffixes = expand(m.group(8))
    else:
        suffixes = ['']
    if m.group(2):
        for z in suffixes:
            for i in range(ord(m.group(2)), ord(m.group(3))+1):
                yield m.group(1) + chr(i) + z
    elif m.group(4):
        for z in suffixes:
            for i in range(int(m.group(4)), int(m.group(5))+1, int(m.group(6))):
                yield m.group(1) + str(i) + z
    elif m.group(7):
        for z in suffixes:
            for s in m.group(7).split('|'):
                yield m.group(1) + s + z
    else:
        yield trend

这非常有帮助……除了for z in expand(m.group(8)),NoneType对象不可迭代。 - Mark Kennedy
糟糕,编辑后希望问题得到解决。 - pobrelkey

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接