我的应用程序的用户可以通过格式字符串配置某些文件的布局。
例如,用户指定的配置值可能是:
然而,现在来了困难的部分:给定glob结果列表,我需要获取所有与给定占位符匹配的文件名部分,例如所有不同的“locale”值。
我想生成一个格式字符串的正则表达式,然后将其与glob结果列表进行匹配(或者跳过glob并自己进行所有匹配)。
但我找不到一种好的方法来创建正则表达式,既要捕获正确的组,又要转义输入的其余部分。
例如,这可能会给我一个匹配区域设置的正则表达式:
例如,用户指定的配置值可能是:
layout = '%(group)s/foo-%(locale)s/file.txt'
现在我需要找到所有已经存在的这样的文件。使用 glob 模块似乎很容易:
glob_pattern = layout % {'group': '*', 'locale': '*'}
glob.glob(glob_pattern)
然而,现在来了困难的部分:给定glob结果列表,我需要获取所有与给定占位符匹配的文件名部分,例如所有不同的“locale”值。
我想生成一个格式字符串的正则表达式,然后将其与glob结果列表进行匹配(或者跳过glob并自己进行所有匹配)。
但我找不到一种好的方法来创建正则表达式,既要捕获正确的组,又要转义输入的其余部分。
例如,这可能会给我一个匹配区域设置的正则表达式:
regex = layout % {'group': '.*', 'locale': (.*)}
为了确保正则表达式有效,我需要通过re.escape()将其传递,这样也会转义我刚插入的正则表达式语法。先调用re.escape()会破坏格式字符串。
我知道有fnmatch.translate(),它甚至可以给我一个正则表达式 - 但不会返回正确的组。
有没有一种好的方法可以做到这一点,而不需要像用一个正则表达式安全的唯一值替换占位符等hack操作?
可能有一些方法(第三方库?)可以以更灵活的方式解析格式字符串,例如在占位符位置分割字符串吗?