文件路径通配符(glob)的BNF语法定义

7
我正在寻找一些被广泛使用的方言(例如这个https://github.com/vmeurisse/wildmatch+globstar **),并用BFN规则进行描述。任何格式或语言都可以,OMeta或PEG会很好。
1个回答

2
我不确定是否理解您的问题,因为文件路径通配符的语法可以简化为一个简单的正则表达式。这个语法是由Unix Shell定义的。
您可以在这里找到Bash的BNF:http://my.safaribooksonline.com/book/operating-systems-and-server-administration/unix/1565923472/syntax/lbs.appd.div.3 在Python编程语言中,glob.glob()函数的定义可在文档中找到。该函数使用fnmatch.fnmatch()函数执行模式匹配。文档在此处提供:https://docs.python.org/2/library/fnmatch.html#fnmatch.fnmatchfnmatch.fnmatch函数将文件路径通配符模式转换为经典正则表达式,如下所示:
def translate(pat):
    """Translate a shell PATTERN to a regular expression.

    There is no way to quote meta-characters.
    """

    i, n = 0, len(pat)
    res = ''
    while i < n:
        c = pat[i]
        i = i+1
        if c == '*':
            res = res + '.*'
        elif c == '?':
            res = res + '.'
        elif c == '[':
            j = i
            if j < n and pat[j] == '!':
                j = j+1
            if j < n and pat[j] == ']':
                j = j+1
            while j < n and pat[j] != ']':
                j = j+1
            if j >= n:
                res = res + '\\['
            else:
                stuff = pat[i:j].replace('\\','\\\\')
                i = j+1
                if stuff[0] == '!':
                    stuff = '^' + stuff[1:]
                elif stuff[0] == '^':
                    stuff = '\\' + stuff
                res = '%s[%s]' % (res, stuff)
        else:
            res = res + re.escape(c)
    return res + '\Z(?ms)'

这可以帮助你编写BNF语法...

编辑

这里有一个非常简单的语法:

wildcard : expr
         | expr wildcard

expr : WORD
     | ASTERIX
     | QUESTION
     | neg_bracket_expr
     | pos_bracket_expr

pos_bracket_expr : LBRACKET WORD RBRACKET

neg_bracket_expr : LBRACKET EXCLAMATION WORD RBRACKET

这里提供了一个流行的语法列表,由著名的ANTLR工具解析:http://www.antlr3.org/grammar/list.html。请注意保留HTML标签,不做任何解释。

文件路径通配符的语法可以简化为一个简单的正则表达式。实际上是可以的。有一种方法可以编写正则表达式,将模式转换为另一个可以匹配路径的正则表达式。但是这种解决方案在模式中缺乏错误处理。此外,我需要丰富的语法实现来制作自己的方言。 - Ev_genus

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接